溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python數據挖掘中的分類算法是什么

發(fā)布時間:2020-11-16 09:30:52 來源:億速云 閱讀:216 作者:小新 欄目:編程語言

小編給大家分享一下python數據挖掘中的分類算法是什么,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

一、KNN算法

二、算法過程

1.讀取數據集

2.處理數據集數據 清洗,采用留出法hold-out拆分數據集:訓練集、測試集

三、實現KNN算法類:

1)遍歷訓練數據集,離差平方和計算各點之間的距離

2)對各點的距離數組進行排序,根據輸入的k值取對應的k個點

3)k個點中,統計每個點出現的次數,權重為距離的導數,得到最大的值,該值的索引就是我們計算出的判定類別

四、kNN的python實現

import numpy as np
 
#一個最簡單的KNN
class KNN():
    
    def __init__(self):
        self.model = {}#存儲各個類別的訓練樣本的特征,key為類別標簽,value是一個list,元素為樣本的特征向量
        self.training_sample_num = {}#存儲訓練數據中,各個類別的數量
    
    #訓練模型,輸入是標簽列表,和對應的輸入數據列表
    def fit(self, X, Y):
        for i in range(len(Y)):
            #將訓練數據按照類別分組
            if Y[i] in self.model:
                self.model[Y[i]].append(X[i])
            else:
                self.model[Y[i]] = [X[i]]
            #各個類別的樣本總數
            self.training_sample_num[Y[i]] = self.training_sample_num.get(Y[i], 0) + 1
    
#預測/判斷一個樣本的類別。這里模仿sklearn的風格,允許輸入單個樣本,也允許輸入多個樣本

看完了這篇文章,相信你對python數據挖掘中的分類算法是什么有了一定的了解,想了解更多相關知識,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI