溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python中urllib的使用方法

發(fā)布時間:2020-09-03 09:21:28 來源:億速云 閱讀:265 作者:小新 欄目:編程語言

小編給大家分享一下python中urllib的使用方法,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

python中urllib的使用方法

在python3中,urllib和urllib2進行了合并,現(xiàn)在只有一個urllib模塊,urllib和urllib2的中的內(nèi)容整合進了urllib.request,urlparse整合進了urllib.parse。

urlparse  將urlstr解析成各個組件

import urllib.request
import urllib.parse
url = "http://www.baidu.com"
parsed = urllib.parse.urlparse(url)
print(parsed)
#輸出:ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='', fragment='')

urljoin(baseurl,newurl,allowFrag=None)  將url的根域名和新url拼合成一個完整的url

import urllib.parse
url = "http://www.baidu.com"
new_path = urllib.parse.urljoin(url,"index.html")
print(new_path)
#輸出:http://www.baidu.com/index.html

urlopen(url,data,timeout)  打開一個url的方法,返回一個文件對象,然后可以進行類似文件對象的操作

import urllib.request
req = urllib.request.urlopen('http://www.baidu.com')
print(req.read())

read() , readline() , readlines() , fileno() , close() 

info():返回一個httplib.HTTPMessage 對象,表示遠程服務(wù)器返回的頭信息。
getcode():返回Http狀態(tài)碼,如果是http請求,200表示請求成功完成;404表示網(wǎng)址未找到。
geturl():返回請求的url。

urlretrieve(url,filename,reporthook,data)  下載url定位到的html文件,不寫路徑filename則會被存為臨時文件可以用 urllib.urlcleanup() 來清理緩存

file_name = urllib.request.urlretrieve('http://www.baidu.com','%s/baidu.html'%BASE_DIR)

urlencode()   將dict中的鍵值對以連接符&劃分

import urllib.parse
dic = {'name':'melon','age':18}
data = urllib.parse.urlencode(dic)

print(data)     #age=18&name=melon

GET請求

GET請求 和我們平常get訪問方式一樣,直接把參數(shù)寫到網(wǎng)址上面就好了

import urllib.request
import urllib.parse

dic = {'name':'melon','age':18}
data = urllib.parse.urlencode(dic)

req = urllib.request.urlopen('http://127.0.0.1:8000/index?%s'%data)
content = req.read()

POST請求

import urllib.request
import urllib.parse
import json

dic = {'name':'melon','age':18}
data = urllib.parse.urlencode(dic)

req = urllib.request.Request('http://127.0.0.1:8000/index', data.encode())
opener = urllib.request.urlopen(req)
content = json.loads(opener.read().decode())

當你 urllib.urlopen一個 https 的時候會驗證一次 SSL 證書,當目標使用的是自簽名的證書時就會出現(xiàn)一個URLError,如果是這樣可以在開頭加上

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

以上是python中urllib的使用方法的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI