溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

發(fā)布時間:2020-07-21 16:07:47 來源:億速云 閱讀:152 作者:小豬 欄目:開發(fā)技術(shù)

小編這次要給大家分享的是詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密,文章內(nèi)容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

前言

通過Python實(shí)現(xiàn)對大麥網(wǎng)近期全國演唱會數(shù)據(jù)進(jìn)行爬取,通過分析,我們發(fā)現(xiàn)大麥網(wǎng)屬于Python爬蟲策略中“中等型”難度網(wǎng)站,演唱會數(shù)據(jù)封裝在json文件中。因此,我們簡單的通過requests、json就可以將數(shù)據(jù)爬取出來,后期通過pandas進(jìn)行數(shù)據(jù)篩選并保存至Excel文件中。

1.目標(biāo)網(wǎng)站分析

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

檢查一下看xhr中有沒有我們需要的數(shù)據(jù)。

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

很好,就在xhr中用json封裝了數(shù)據(jù)。

2.構(gòu)造相應(yīng)的Request URL

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

request url中只有一個參數(shù)變化,那就是“Page=”這個選項變了,簡單了😄,一共6頁,直接循環(huán)構(gòu)造了。

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
# print(url)

3.requests爬蟲走起

直接上代碼:

def crawl(url): 
 headers={
 'cookie': 'cna=J7K2Fok5AXECARu7QWn6+cxu; isg=BCcnDiP-NfKV5bF-OctWuXuatl3xrPuOyBVJJfmQLrZn6ESqAX0y3jrhCuj2ANMG; l=eBSmWoPRQeT6Zn3iBO5whurza77O1CAf1sPzaNbMiIncC6BR1AvOCJxQLtyCvptRR8XcGLLB4nU7C5eTae7_7CDmndLHuI50MbkyCef..',
 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response=requests.get(url,headers=headers)
 json_text=json.loads(response.text)
 # print(json_text.keys())
 rdata=json_text['pageData']['resultData']
 # print(rdata)
 return(rdata)

加一個headers,簡單做一個防反爬。

4.保存至excel文件

基本思路是將每頁數(shù)據(jù)保存成pandas的DataFrame結(jié)構(gòu),然后進(jìn)行拼接,拼接完后再保存到Excel文件中。

inidata=pd.DataFrame(columns=('name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic'))
for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
 # print(url)
 # print(crawl(url))
 data=pd.DataFrame(crawl(url))
 data1=data[['name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic']]
 inidata=inidata.append(data1)
# print(inidata)
inidata.to_excel('大麥網(wǎng)演唱會.xlsx',index=0)

5.看看效果

詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密

看完這篇關(guān)于詳解python如何實(shí)現(xiàn)愛奇藝登陸密碼RSA加密的文章,如果覺得文章內(nèi)容寫得不錯的話,可以把它分享出去給更多人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI