Pandas中怎么挖掘數(shù)據(jù)的關(guān)聯(lián)規(guī)則

小億
84
2024-05-13 11:18:52

在Pandas中,可以使用pd.crosstab()函數(shù)創(chuàng)建交叉表來(lái)挖掘數(shù)據(jù)的關(guān)聯(lián)規(guī)則。交叉表可以用來(lái)計(jì)算兩個(gè)或多個(gè)變量之間的頻數(shù)或比例關(guān)系,并且可以幫助我們發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)規(guī)則。

以下是一個(gè)簡(jiǎn)單的示例,演示如何使用pd.crosstab()函數(shù)創(chuàng)建交叉表來(lái)挖掘數(shù)據(jù)的關(guān)聯(lián)規(guī)則:

import pandas as pd

# 創(chuàng)建一個(gè)示例數(shù)據(jù)集
data = {
    'A': [1, 0, 1, 0, 1],
    'B': [1, 1, 0, 1, 0],
    'C': [1, 0, 1, 1, 0]
}

df = pd.DataFrame(data)

# 創(chuàng)建交叉表
cross_tab = pd.crosstab(df['A'], [df['B'], df['C']])

print(cross_tab)

輸出結(jié)果將顯示兩個(gè)變量之間的頻數(shù)或比例關(guān)系,可以幫助我們發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)規(guī)則。通過(guò)分析交叉表,我們可以發(fā)現(xiàn)不同變量之間的關(guān)聯(lián)關(guān)系,從而挖掘出數(shù)據(jù)的關(guān)聯(lián)規(guī)則。

0