您好,登錄后才能下訂單哦!
本篇文章為大家展示了Python中怎么構建一個FP-growth算法,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
FP算法發(fā)現(xiàn)頻繁項集的過程是:
(1)構建FP樹;
(2)從FP樹中挖掘頻繁項集
FP表示的是頻繁模式,其通過鏈接來連接相似元素,被連起來的元素可看成是一個鏈表
將事務數(shù)據(jù)表中的各個事務對應的數(shù)據(jù)項,按照支持度排序后,把每個事務中的數(shù)據(jù)項按降序依次插入到一棵以 NULL為根節(jié)點的樹中,同時在每個結點處記錄該結點出現(xiàn)的支持度。
假設存在的一個事務數(shù)據(jù)樣例為,構建FP樹的步驟如下:
結合Apriori算法中最小支持度的閾值,在此將最小支持度定義為3,結合上表中的數(shù)據(jù),那些不滿足最小支持度要求的將不會出現(xiàn)在***的FP樹中。
據(jù)此構建FP樹,并采用一個頭指針表來指向給定類型的***個實例,快速訪問FP樹中的所有元素,構建的帶頭指針的FP樹如圖:
結合繪制的帶頭指針表的FP樹,對表中數(shù)據(jù)進行過濾,排序如下:
在對數(shù)據(jù)項過濾排序了之后,就可以構建FP樹了,從NULL開始,向其中不斷添加過濾排序后的頻繁項集。過程可表示為:
上述內(nèi)容就是Python中怎么構建一個FP-growth算法,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業(yè)資訊頻道。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。