溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么利用Python讀取微信朋友圈的內(nèi)容

發(fā)布時(shí)間:2021-08-22 14:00:11 來(lái)源:億速云 閱讀:168 作者:chen 欄目:開(kāi)發(fā)技術(shù)

本篇內(nèi)容主要講解“怎么利用Python讀取微信朋友圈的內(nèi)容”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“怎么利用Python讀取微信朋友圈的內(nèi)容”吧!

目錄
  • 背景

  • 法1,不適用

  • 法2,已不能用

  • 法3:Appnium

  • 法4:模擬操作

  • 整體代碼

  • 后續(xù)工作及擴(kuò)展


背景

由于課題需要爬取朋友圈的內(nèi)容作為研究數(shù)據(jù),稍微研究了一下。

目前爬取有四種方法,我們一一來(lái)分析一下。

法1,不適用

加某個(gè)微信號(hào)為好友,給這個(gè)微信號(hào)查看自己朋友圈的權(quán)限,然后那個(gè)微信號(hào)會(huì)把你自己朋友圈生成一個(gè)鏈接給你。一來(lái)這個(gè)和我需求不同,我是要爬取我好友的朋友圈,不是我自己的朋友圈,二來(lái)這個(gè)套路明顯是公眾號(hào)吸粉的套路,這個(gè)方法舍棄。。。

法2,已不能用

原理是在PC上操作,然后打開(kāi)網(wǎng)頁(yè)版的微信,掃碼后進(jìn)行操作。

但是試了一下,現(xiàn)在微信已經(jīng)關(guān)閉網(wǎng)頁(yè)版了,因此該方法也不能用,一小段代碼放上來(lái):

import itchat
import os
import math
from PIL import Image

# 獲取數(shù)據(jù)
def download_image():
    # 掃描二維碼登陸微信,即通過(guò)網(wǎng)頁(yè)版微信登陸
    itchat.auto_login()
    # 返回一個(gè)包含用戶信息字典的列表
    friends = itchat.get_friends(update=True)
    #  在當(dāng)前位置創(chuàng)建一個(gè)用于存儲(chǔ)頭像的目錄wechatImages
    base_path = 'wechatImages'
    if not os.path.exists(base_path):
        os.mkdir(base_path)

    # 獲取所有好友頭像
    for friend in friends:
        # 獲取頭像數(shù)據(jù)
        img_data = itchat.get_head_img(userName = friend['UserName'])
        #判斷備注名是否為空
        if friend['RemarkName'] != '':
            img_name = friend['RemarkName']
        else :
            img_name = friend['NickName']
         #   在實(shí)際操作中如果文件名中含有*標(biāo)志,會(huì)報(bào)錯(cuò)。則直接可以將其替換掉
        if img_name is "*":
            img_name = ""
        #通過(guò)os.path.join()函數(shù)來(lái)拼接文件名
        img_file = os.path.join(base_path, img_name + '.jpg')
        print(img_file)
        with open(img_file, 'wb') as file:
            file.write(img_data)


# 拼接頭像
def join_image():
    base_path = 'headImages'
    files = os.listdir(base_path) #返回指定的文件或文件夾的名字列表
    print(len(files))
    each_size = int(math.sqrt(float(6400 * 6400) / len(files)))#計(jì)算每個(gè)粘貼圖片的邊長(zhǎng)
    lines = int(6400 / each_size)#計(jì)算總共有多少行
    print(lines)
    image = Image.new('RGB', (6400, 6400))# new(mode, size, color=0) 定義一張大小為640*640大小的圖片,不給出第三個(gè)參數(shù)默認(rèn)為黑色
    x = 0 #定義橫坐標(biāo)
    y = 0 #定義縱坐標(biāo)
    for file_name in files:
        img = Image.open(os.path.join(base_path, file_name)) #找到/打開(kāi)圖片
        img = img.resize((each_size, each_size), Image.ANTIALIAS)#實(shí)現(xiàn)圖片同比例縮放,Image.ANTIALIAS添加濾鏡效果
        image.paste(img, (x * each_size, y * each_size))#將縮放后的照片放到對(duì)應(yīng)的坐標(biāo)下
        x += 1
        if x == lines:#如果每行的粘貼內(nèi)容夠了,則換行
            x = 0
            y += 1
    image.save('jointPic.jpg')#最后將全部的照片保存下來(lái)

if __name__ == '__main__':
    download_image()
    join_image()

如果你微信還能玩網(wǎng)頁(yè)版可以試試,上面代碼只是把你朋友聯(lián)系人讀取出來(lái),拼成一個(gè)大的圖片。操作朋友圈代碼我沒(méi)試,自己百度可以找到。

法3:Appnium

沒(méi)試,但是理論上可以的,是在PC上裝手機(jī)的模擬器,然后裝微信,然后用工具Appnium模擬操作,讀取朋友圈數(shù)據(jù)。但是Appnium不是一個(gè)庫(kù),是一套軟件,安裝需要java環(huán)境等,還有配置,非常麻煩,因此沒(méi)有上手試,可以百度,有例子。

法4:模擬操作

這個(gè)簡(jiǎn)單,但是不是完整例子,后續(xù)還要自己寫(xiě),先記錄一下吧。

思路很簡(jiǎn)單,就是利用PC上的微信,然后讀取窗口信息,模擬手工操作,打開(kāi)朋友圈窗口,然后讀取顯示朋友圈內(nèi)容的控件,就可以看到內(nèi)容。

先在電腦上打開(kāi)并登錄微信,沒(méi)有運(yùn)行就沒(méi)法找到微信進(jìn)程號(hào)。

import psutil# 用于獲取微信電腦版的進(jìn)程信息;
import pywinauto# 用于自動(dòng)化控制微信電腦版
from pywinauto.application import Application

沒(méi)裝用pip install安裝一下,很快。

然后在main函數(shù)里面寫(xiě)代碼

	PID = 0#用來(lái)保存微信的進(jìn)程號(hào)

    for proc in psutil.process_iter():#循環(huán)電腦上的進(jìn)程,獲取進(jìn)程號(hào)和名稱
        try:
            pinfo = proc.as_dict(attrs=['pid', 'name'])
        except psutil.NoSuchProcess:#沒(méi)有運(yùn)行微信程序
            pass
        else:
            if 'WeChat.exe' == pinfo['name']:#當(dāng)進(jìn)程名為WeChat.exe的時(shí)候,把進(jìn)程號(hào)記下來(lái)
                PID = pinfo['pid']
#進(jìn)程ID用來(lái)提供給 PyWinAuto.application 以連接微信電腦版,connect是要已經(jīng)運(yùn)行微信才行
    app = Application(backend='uia').connect(process=PID)
    #獲得微信窗口實(shí)例
    Win_wechat = app['微信']

接下來(lái)是關(guān)鍵一步,由于微信新版窗口的布局有更改,因此下一步是關(guān)鍵,如果不會(huì)變通,就會(huì)失敗,先調(diào)用下面語(yǔ)句,以樹(shù)形方式打印窗口上所有控件

Win_wechat.print_control_identifiers()#以樹(shù)形方式打印窗口上所有控件

然后觀察,【title=“朋友圈”, control_type=“Button”】這句話在哪個(gè)控件下面,目前這個(gè)版本是在【Pane6】下面,因此用下面代碼獲取朋友圈按鈕

怎么利用Python讀取微信朋友圈的內(nèi)容

#獲取微信窗口上朋友圈按鈕實(shí)例
    Button_pyq = Win_wechat['Pane6'].child_window(title="朋友圈", control_type="Button")

然后打開(kāi)朋友圈窗口

	#獲取按鈕坐標(biāo)
    cords = Button_pyq.rectangle()
    # 接著控制微信電腦版,模擬鼠標(biāo)點(diǎn)擊,把朋友圈窗口打開(kāi)
    pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top + 10))

運(yùn)行到這里,朋友圈窗口就打開(kāi)了,接下來(lái)獲取朋友圈窗口實(shí)例,然后把當(dāng)前窗口內(nèi)容以樹(shù)形顯示出來(lái)

	Win_pyq = app['朋友圈']#獲取朋友圈窗口實(shí)例

    Win_pyq.draw_outline(colour = 'red',thickness = 2)# 在當(dāng)前定位到的窗口圍畫(huà)出一條邊界線,方便我們看出定位到了哪個(gè)控件
    Win_pyq.dump_tree()

整體代碼

import psutil# 用于獲取微信電腦版的進(jìn)程信息;
import pywinauto# 用于自動(dòng)化控制微信電腦版
from pywinauto.application import Application

if __name__ == '__main__':
    PID = 0#用來(lái)保存微信的進(jìn)程號(hào)

    for proc in psutil.process_iter():#循環(huán)電腦上的進(jìn)程,獲取進(jìn)程號(hào)和名稱
        try:
            pinfo = proc.as_dict(attrs=['pid', 'name'])
        except psutil.NoSuchProcess:#沒(méi)有運(yùn)行微信程序
            pass
        else:
            if 'WeChat.exe' == pinfo['name']:#當(dāng)進(jìn)程名為WeChat.exe的時(shí)候,把進(jìn)程號(hào)記下來(lái)
                PID = pinfo['pid']

    #進(jìn)程ID用來(lái)提供給 PyWinAuto.application 以連接微信電腦版,connect是要已經(jīng)運(yùn)行微信才行
    app = Application(backend='uia').connect(process=PID)
    #獲得微信窗口實(shí)例
    Win_wechat = app['微信']
    #win.print_control_identifiers()#以樹(shù)形方式打印窗口上所有控件

    #獲取微信窗口上朋友圈按鈕實(shí)例
    Button_pyq = Win_wechat['Pane6'].child_window(title="朋友圈", control_type="Button")
    #獲取按鈕坐標(biāo)
    cords = Button_pyq.rectangle()
    # 接著控制微信電腦版,把朋友圈窗口打開(kāi)
    pywinauto.mouse.click(button='left', coords=(cords.left + 10, cords.top + 10))

    Win_pyq = app['朋友圈']#獲取朋友圈窗口實(shí)例

    Win_pyq.draw_outline(colour = 'red',thickness = 2)# 在當(dāng)前定位到的窗口圍畫(huà)出一條邊界線,方便我們看出定位到了哪個(gè)控件
    Win_pyq.dump_tree()#樹(shù)形打印

后續(xù)工作及擴(kuò)展

1.可以看到,目前只打印當(dāng)前窗口的內(nèi)容,后續(xù)要將窗口滑動(dòng),然后再次讀取,另外還需要對(duì)數(shù)據(jù)進(jìn)行處理,因?yàn)閿?shù)據(jù)比較亂:

怎么利用Python讀取微信朋友圈的內(nèi)容

2.可以借鑒模擬鼠標(biāo)點(diǎn)擊的操作,自動(dòng)操作微信進(jìn)行消息的發(fā)送和回復(fù),自動(dòng)聊天機(jī)器人可以了解一下。

到此,相信大家對(duì)“怎么利用Python讀取微信朋友圈的內(nèi)容”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI