您好,登錄后才能下訂單哦!
小編給大家分享一下python數據挖掘中的分類算法是什么,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
一、KNN算法
二、算法過程
1.讀取數據集
2.處理數據集數據 清洗,采用留出法hold-out拆分數據集:訓練集、測試集
三、實現KNN算法類:
1)遍歷訓練數據集,離差平方和計算各點之間的距離
2)對各點的距離數組進行排序,根據輸入的k值取對應的k個點
3)k個點中,統計每個點出現的次數,權重為距離的導數,得到最大的值,該值的索引就是我們計算出的判定類別
四、kNN的python實現
import numpy as np #一個最簡單的KNN class KNN(): def __init__(self): self.model = {}#存儲各個類別的訓練樣本的特征,key為類別標簽,value是一個list,元素為樣本的特征向量 self.training_sample_num = {}#存儲訓練數據中,各個類別的數量 #訓練模型,輸入是標簽列表,和對應的輸入數據列表 def fit(self, X, Y): for i in range(len(Y)): #將訓練數據按照類別分組 if Y[i] in self.model: self.model[Y[i]].append(X[i]) else: self.model[Y[i]] = [X[i]] #各個類別的樣本總數 self.training_sample_num[Y[i]] = self.training_sample_num.get(Y[i], 0) + 1 #預測/判斷一個樣本的類別。這里模仿sklearn的風格,允許輸入單個樣本,也允許輸入多個樣本
看完了這篇文章,相信你對python數據挖掘中的分類算法是什么有了一定的了解,想了解更多相關知識,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。