Pandas本身并沒有提供層次聚類算法的實現(xiàn),但可以使用scikit-learn庫中的AgglomerativeClustering來實現(xiàn)層次聚類算法。下面是一個使用Pandas和scikit-learn來進行層次聚類的示例代碼:
import pandas as pd
from sklearn.cluster import AgglomerativeClustering
# 創(chuàng)建一個示例數(shù)據(jù)集
data = {
'X': [1, 2, 3, 4, 5],
'Y': [6, 7, 8, 9, 10]
}
df = pd.DataFrame(data)
# 使用AgglomerativeClustering進行層次聚類
clustering = AgglomerativeClustering(n_clusters=2)
df['cluster'] = clustering.fit_predict(df)
# 打印聚類結(jié)果
print(df)
在上面的示例中,我們首先創(chuàng)建了一個示例數(shù)據(jù)集,然后使用AgglomerativeClustering來進行層次聚類,最后將聚類結(jié)果添加到數(shù)據(jù)集中并打印出來。
需要注意的是,層次聚類是一種無監(jiān)督學習方法,需要根據(jù)具體的數(shù)據(jù)集和問題來選擇合適的參數(shù)(如n_clusters)來進行聚類。在實際使用中,可以根據(jù)需要對層次聚類進行調(diào)參來獲得更好的聚類效果。