您好,登錄后才能下訂單哦!
小編給大家分享一下如何使用Python爬取某乎手機(jī)APP數(shù)據(jù),希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
1.安裝軟件
本文選擇的抓包工具:Fiddler
具體的下載安裝這里不詳細(xì)贅述?。ňW(wǎng)上搜Fiddler安裝,一大堆教程),本文以實(shí)戰(zhàn)為例,就不再這里浪費(fèi)時(shí)間了!
2.配置Fiddler
安裝好之后,接下來(lái)就開(kāi)始配置Fiddler工具(這里是關(guān)鍵,仔細(xì)閱讀!)
配置Connections
打開(kāi)Fiddler后,點(diǎn)擊Tools->Options
點(diǎn)擊Connections
勾選上對(duì)應(yīng)的選項(xiàng)
配置HTTPS
由于目前大部分APP都是https加密,包括本文實(shí)戰(zhàn)『某乎』案例也是https加密,因此配置HTTPS,來(lái)抓取https數(shù)據(jù)包!
勾選上對(duì)應(yīng)的選項(xiàng)
最后抓包工具Fiddler就配置好了
記得重啟Fiddler!重啟Fiddler!重啟Fiddler!不然可能不生效
1.設(shè)置代理
準(zhǔn)備工作
首先看一下安裝Fiddler主機(jī)ip(電腦和手機(jī)必須處于同一局域網(wǎng))
查看ip命令
window:ipconfig
開(kāi)始配置
目標(biāo)代理主機(jī)信息
ip:192.168.31.195
端口:8888
在wifi無(wú)線網(wǎng)處進(jìn)去,點(diǎn)擊配置代理
填寫(xiě)好相關(guān)代理信息
2.安裝證書(shū)
在瀏覽器輸入:
http://192.168.31.195:8888
點(diǎn)擊下載證書(shū)后,下面就開(kāi)始安裝(看圖操作)
ok,這樣手機(jī)端就配置完成,下面開(kāi)始抓取數(shù)據(jù)?。。?/p>
1.打開(kāi)某乎app
2.查看數(shù)據(jù)包列表
打開(kāi)app之后,F(xiàn)iddler就已經(jīng)抓取到數(shù)據(jù)了
這里可以看到app發(fā)送和接收了哪些數(shù)據(jù)包
為了更加精準(zhǔn)定位到某乎(只看目標(biāo)的數(shù)據(jù)包),添加一個(gè)過(guò)濾條件
這樣我們獲取的數(shù)據(jù)包列表就都是過(guò)濾條件內(nèi)的目標(biāo)網(wǎng)址
3.查找數(shù)據(jù)包
比如點(diǎn)擊熱榜
對(duì)應(yīng)的https加密數(shù)據(jù)包如下:
數(shù)據(jù)包中的數(shù)據(jù)如下:
提取出url鏈接
https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0
拿到url之后,接著開(kāi)始編程爬取保存數(shù)據(jù)。
4.編寫(xiě)爬蟲(chóng)程序
# -*- coding: utf-8 -*-
ok這樣就可以將數(shù)據(jù)獲取下來(lái)!
1.配置抓包工具Fiddler(重點(diǎn))。
2.ios蘋果手機(jī)配置證書(shū)和設(shè)置代理(安卓手機(jī)也類似)。
3.簡(jiǎn)單使用Fiddler(過(guò)濾數(shù)據(jù)包、查看數(shù)據(jù)包等)。
4.本文以某乎為實(shí)戰(zhàn),實(shí)現(xiàn)了python爬取手機(jī)app數(shù)據(jù)
看完了這篇文章,相信你對(duì)“如何使用Python爬取某乎手機(jī)APP數(shù)據(jù)”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。