溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

發(fā)布時(shí)間:2021-03-24 09:52:49 來(lái)源:億速云 閱讀:259 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法的內(nèi)容。小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過(guò)來(lái)看看吧。

一、功能介紹

本文主要介紹利用網(wǎng)頁(yè)端微信獲取數(shù)據(jù),實(shí)現(xiàn)個(gè)人微信好友數(shù)據(jù)的獲取,并進(jìn)行一些簡(jiǎn)單的數(shù)據(jù)分析,功能包括:

1.爬取好友列表,顯示好友昵稱、性別和地域和簽名, 文件保存為 xlsx 格式

2.統(tǒng)計(jì)好友的地域分布,并且做成詞云和可視化展示在地圖上

二、依賴庫(kù)

1、Pyecharts:一個(gè)用于生成echarts圖表的類庫(kù),echarts是百度開(kāi)源的一個(gè)數(shù)據(jù)可視化庫(kù),用echarts生成的圖可視化效果非常棒,使用pyechart庫(kù)可以在python中生成echarts數(shù)據(jù)圖。

2、Itchat:一個(gè)開(kāi)源的微信個(gè)人號(hào)接口,使用python調(diào)用微信從未如此簡(jiǎn)單。

3、Jieba:簡(jiǎn)單的分詞操作庫(kù)。

4、Numpy:NumPy 系統(tǒng)是 Python 的一種開(kāi)源的數(shù)值計(jì)算擴(kuò)展。這種工具可用來(lái)存儲(chǔ)和處理大型矩 陣。

5、Pandas:pandas 是基于 NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。

6、Pillow:圖像處理。

7、wxpy:wxpy 在 itchat 的基礎(chǔ)上,通過(guò)大量接口優(yōu)化提升了模塊的易用性,并進(jìn)行豐富的功能 擴(kuò)展。 (微信本身提供)

注:Pyecharts可能安裝0.5.*的版本比較好

以上的三方庫(kù)可以通過(guò)命令符(cmd)來(lái)實(shí)現(xiàn)安裝,具體命令:pip install ***

三,操作

from wxpy import *   #導(dǎo)入模塊
 bot = Bot(cache_path=True) #初始化機(jī)器人,選擇掃碼登錄
 friend_all = bot.friends() #獲取微信好友信息

首先出現(xiàn)的是一張二維碼,然后掃描登錄

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

成功登錄好了就是這種顯示

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

之后就可以進(jìn)行操作了,好友數(shù)量,個(gè)人信息

print(len(friend_all)) #好友的數(shù)量
 print(friend_all[0].raw) #輸出個(gè)人信息

顯示的結(jié)果

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

四、接下來(lái)把全部的好友信息轉(zhuǎn)化為一個(gè)xlsx文件

獲取全部好友信息

for a_friend in friend_all:
 NickName = a_friend.raw.get('NickName', None)
 #昵稱
 #Sex = a_friend.raw.get('Sex', None)
 Sex = {1: "男", 2: "女", 0: "其它"}.get(a_friend.raw.get('Sex', None), None)
 #性別(優(yōu)化)
 City = a_friend.raw.get('City', None)
 #城市
 Province = a_friend.raw.get('Province', None)
 #省份
 Signature = a_friend.raw.get('Signature', None)
 #個(gè)性簽名
 HeadImgUrl = a_friend.raw.get('HeadImgUrl', None)
 #頭像地址
 HeadImgFlag = a_friend.raw.get('HeadImgFlag', None)
 #小Flag
 list_0=[NickName, Sex, City, Province, Signature, HeadImgUrl, HeadImgFlag]
 #存為一維數(shù)組
 lis.append(list_0)
 #疊加數(shù)據(jù)

存為xlsx文件

def list_excel(filename,lis):
 '''
 將列表寫入excel中,其中列表中的元素是列表.
 filename:保存的文件名(含路徑)
 lis:元素為列表的列表,如下:
 lis = [["名稱", "價(jià)格", "出版社", "語(yǔ)言"],
 ["暗時(shí)間", "32.4", "人民郵電出版社", "中文"],
 ["拆掉思維里的墻", "26.7", "機(jī)械工業(yè)出版社", "中文"]]
 '''
 import openpyxl
 wb = openpyxl.Workbook() #激活worksheet
 sheet = wb.active
 sheet.title = 'sheet1'  #創(chuàng)建一個(gè)表格
 file_name = filename +'.xlsx'
 for i in range(0, len(lis)):
  for j in range(0, len(lis[i])):
   sheet.cell(row=i+1, column=j+1, value=str(lis[i][j]))
   #每行每列的存入數(shù)據(jù)
 wb.save(file_name)
 print("寫入數(shù)據(jù)成功!")
list_excel('wechat',lis)

效果如下:

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

可以看到其好友基本分布再?gòu)V東省,個(gè)性簽名也是非常的殺馬特

五、實(shí)現(xiàn)詞云圖(我們也可以從存儲(chǔ)在本地的 excel 中讀取數(shù)據(jù)進(jìn)行分析,并查看數(shù)據(jù)形式。在執(zhí)行以 下代碼之前,我們需要先把 excel 文件加一個(gè)列標(biāo)題行)

例如nickname sex city province signature headImgUrl headImgFlag

#導(dǎo)入模塊
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import pandas as pd
from pandas import DataFrame
word_list= df['city'].fillna('0').tolist()
#將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用“0”替換
new_text = ' '.join(word_list)
wordcloud = WordCloud(font_path='simhei.ttf', background_color="black").generate(new_text)
#設(shè)計(jì)圖背景顏色,字體
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

還可以將詞云圖存為HTML形式

#利用 pyechart 做詞云
import pandas as pd
#count = df.city.value_counts() #對(duì) dataframe 進(jìn)行全頻率統(tǒng)計(jì),排除了 nan
city_list = df['city'].fillna('NAN').tolist()#將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用“NAN” 替換
count_city = pd.value_counts(city_list)#對(duì) list 進(jìn)行全頻率統(tǒng)計(jì) 
from pyecharts.charts.wordcloud import WordCloud #設(shè)置對(duì)象
name = count_city.index.tolist()
value = count_city.tolist()
wordcloud = WordCloud(width=1300, height=620)
wordcloud.add("", name, value, word_size_range=[20, 100])
wordcloud.show_config()
wordcloud.render(r'D:\python\wechatcloud.html')

再看看效果:

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

六、轉(zhuǎn)化為地圖形式

注:安裝地圖數(shù)據(jù)包:pip install echarts-china-provinces-pypkg pip install echarts-countries-pypkg

province_list = df['province'].fillna('NAN').tolist()
#將 dataframe 的列轉(zhuǎn)化為 list,其中的 nan 用 “NAN”替換
count_province = pd.value_counts(province_list)
#對(duì) list 進(jìn)行全頻率統(tǒng)計(jì)

from pyecharts import Map
value =count_province.tolist()
attr =count_province.index.tolist()
map=Map("各省微信好友分布", width=1300, height=700)
map.add("", attr, value, maptype='china', is_visualmap=True,visual_text_color='#000',is_label_show = True)
#顯示地圖上的省份
map.show_config()
map.render(r'D:\python\wechatProMap.html')

效果:

基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法

感謝各位的閱讀!關(guān)于“基于python實(shí)現(xiàn)微信好友數(shù)據(jù)分析的方法”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI