溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python中怎么使用requests獲取網(wǎng)頁

發(fā)布時間:2021-07-05 16:13:42 來源:億速云 閱讀:307 作者:Leah 欄目:云計算

今天就跟大家聊聊有關(guān)Python中怎么使用requests獲取網(wǎng)頁,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

1、使用pycharm新建項目,新建的時候記得勾選“Inherit global site-packages”否則可能找不到requests類庫

2、編寫代碼,我們看到網(wǎng)頁上的數(shù)據(jù)量是101行,如下所示:

Python中怎么使用requests獲取網(wǎng)頁

代碼如下:

項目結(jié)構(gòu)(不重要):

Python中怎么使用requests獲取網(wǎng)頁

程序代碼:

首先我們要分析網(wǎng)頁的源碼,在瀏覽器按F12可以查看到源碼,把源碼全選復(fù)制到一個pycharm新建的HTML文檔,可以看到對應(yīng)的樹形結(jié)構(gòu)。

Python中怎么使用requests獲取網(wǎng)頁

我們可以看到,在左邊的編輯框這里,凡是有“-”號的,都是在樹形結(jié)構(gòu)內(nèi)的。由此我們可以知道,如果想要獲取到td,則完整的樹形結(jié)構(gòu)是:

html-body-div-table-tr-td

但是tr是多個的,并且第一個是表頭,所以第一個不是我們想要的,所以我們要對第一個的表頭拋棄掉。

另外td也是多個的,并且我們只需要每個tr里面的第二個td,所以我們可以采用下標(biāo)的方式來獲取。

最終完整的樹形結(jié)構(gòu)是:/html/body/div/table/tr[postion()>1]/td[2]

所以,代碼如下:

Python中怎么使用requests獲取網(wǎng)頁

最后,運行結(jié)果:

Python中怎么使用requests獲取網(wǎng)頁

看完上述內(nèi)容,你們對Python中怎么使用requests獲取網(wǎng)頁有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI