軟件介紹
Weka是一款功能十分強大的專業的數據挖掘工具,采用先進的算法進行處理,將數據采集預處理、評估方法等融為一體,不僅提高了數據的精確性,還節省了時間、成本等各項指標,極大地提高了效率。
軟件特色
1、可以處理一個數據庫的查詢結果
2、weka軟件支持相同功能的命令行,或是一種基于組件的知識流接口
3、集成自己的算法甚至借鑒它的方法自己實現可視化工具都很簡單
4、技術基于假設數據是以一種單個文件或關聯的
5、使用Java的數據庫鏈接能力可以訪問SQL數據庫
軟件功能
【原理與實現】
聚類分析中的“類”(cluster)和前面分類的“類”(class)是不同的,對cluster更加準確的翻譯應該是“簇”。聚類的任務是把 所有的實例分配到若干的簇,使得同一個簇的實例聚集在一個簇中心的周圍,它們之間距離的比較近;而不同簇實例之間的距離比較遠。對于由數值型屬性刻畫的實 例來說,這個距離通常指歐氏距離。
【模型應用】
現在我們要用生成的模型對那些待預測的數據集進行預測了。注意待預測數據集和訓練用數據集各個屬性的設置必須是一致的。即使你沒有待預測數據集的Class屬性的值,你也要添加這個屬性,可以將該屬性在各實例上的值均設成缺失值。
在“Test Opion”中選擇“Supplied test set”,并且“Set”成你要應用模型的數據集,這里是“bank-new.arff”文件。
現在,右鍵點擊“Result list”中剛產生的那一項,選擇“Re-evaluate model on current test set”。右邊顯示結果的區域中會增加一些內容,告訴你該模型應用在這個數據集上表現將如何。如果你的Class屬性都是些缺失值,那這些內容是無意義 的,我們關注的是模型在新數據集上的預測值。
現在點擊右鍵菜單中的“Visualize classifier errors”,將彈出一個新窗口顯示一些有關預測誤差的散點圖。點擊這個新窗口中的“Save”按鈕,保存一個Arff文件。打開這個文件可以看到在倒 數第二個位置多了一個屬性(predictedpep),這個屬性上的值就是模型對每個實例的預測值。
【建模結果】
OK,選上“Cross-validation”并在“Folds”框填上“10”。點“Start”按鈕開始讓算法生成決策樹模型。很快,用文 本表示的一棵決策樹,以及對這個決策樹的誤差分析等等結果出現在右邊的“Classifier output”中。同時左下的“Results list”出現了一個項目顯示剛才的時間和算法名稱。如果換一個模型或者換個參數,重新“Start”一次,則“Results list”又會多出一項。
Weka怎么使用
1、在啟動WEKA時,會彈出GUI選擇器,讓您選擇使用WEKA和數據的四種方式。選擇Explorer選項已經足夠。
VRYeaAjuS5iOS9v+eUqA==" src="http://img.kxdw.com/2020/1026/20201026095239901.jpg" style="width: 359px; height: 243px;">
2、weka是基于java,用于數據挖掘和知識分析一個平臺。從海量數據中發掘其背后隱藏的種種關系。
3、數據創建完成后,就可以開始創建我們的回歸模型了。啟動 WEKA,然后選擇 Explorer。將會出現 Explorer 屏幕,其中 Preprocess 選項卡被選中。選擇 Open File 按鈕并選擇在上一節中創建的 ARFF 文件。
- 精選留言 來自山東濟寧移動用戶 發表于: 2023-7-23
- 軟件很不錯啊,最新版本新增的功能簡直不要太厲害,以后會不會有更驚喜的功能。
- 精選留言 來自廣西防城港聯通用戶 發表于: 2023-8-27
- 好的軟件給需要它的人,頂
- 精選留言 來自云南麗江移動用戶 發表于: 2023-12-24
- 確實好用,謝謝樓主了
- 精選留言 來自吉林通化電信用戶 發表于: 2023-5-25
- 如何下載安裝呢
- 精選留言 來自新疆烏魯木齊電信用戶 發表于: 2023-1-10
- 好東西,下載了