溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python中Pycurl屬性與方法的示例分析

發(fā)布時(shí)間:2021-09-05 14:57:08 來源:億速云 閱讀:193 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下Python中Pycurl屬性與方法的示例分析,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

Pycurl包是一個(gè)libcurl的Python接口,由C語言編寫的,功能強(qiáng)大,速度快。由于pycurl的屬性和方法太多了,寫這篇博文記錄一下pycurl的屬性和方法。

正常安裝

pip install pycurl

如果出現(xiàn)問題,可以按照系統(tǒng)版本搜索安裝方法,比如centos7.1 安裝pycurl

通用請(qǐng)求方法

import pycurl,urllib
from io import BytesIO
 
url = 'http://www.baidu.com'
 
headers = [
	"User-Agent:Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3",
]
 
data = {
	"cityListName":"",
	"trade": ""
	}
 
c = pycurl.Curl()	#通過curl方法構(gòu)造一個(gè)對(duì)象
#c.setopt(pycurl.REFERER, 'http://www.baidu.com/')	#設(shè)置referer
c.setopt(pycurl.FOLLOWLOCATION, True)	#自動(dòng)進(jìn)行跳轉(zhuǎn)抓取
c.setopt(pycurl.MAXREDIRS,5)			#設(shè)置最多跳轉(zhuǎn)多少次
c.setopt(pycurl.CONNECTTIMEOUT, 60)		#設(shè)置鏈接超時(shí)
c.setopt(pycurl.TIMEOUT,120)			#下載超時(shí)
c.setopt(pycurl.ENCODING, 'gzip,deflate')	#處理gzip內(nèi)容
# c.setopt(c.PROXY,ip)	# 代理
c.fp = BytesIO()	
c.setopt(pycurl.URL, url)	#設(shè)置要訪問的URL
c.setopt(pycurl.HTTPHEADER,headers)		#傳入請(qǐng)求頭
c.setopt(pycurl.POST, 1)
c.setopt(pycurl.POSTFIELDS, urllib.urlencode(data))		#傳入POST數(shù)據(jù)
c.setopt(c.WRITEFUNCTION, c.fp.write)	#回調(diào)寫入字符串緩存
c.perform()		
 
code = c.getinfo(c.HTTP_CODE)	#返回狀態(tài)碼
html = c.fp.getvalue()	#返回源代碼
 
print c.getinfo(c.TOTAL_TIME)

GET請(qǐng)求方法

c = pycurl.Curl()   #通過curl方法構(gòu)造一個(gè)對(duì)象
c.setopt(pycurl.FOLLOWLOCATION, True)   #自動(dòng)進(jìn)行跳轉(zhuǎn)抓取
c.setopt(pycurl.MAXREDIRS,5)            #設(shè)置最多跳轉(zhuǎn)多少次
c.setopt(pycurl.CONNECTTIMEOUT, 60)     #設(shè)置鏈接超時(shí)
c.setopt(pycurl.TIMEOUT,120)            #下載超時(shí)
c.setopt(pycurl.ENCODING, 'gzip,deflate')   #處理gzip內(nèi)容
# c.setopt(c.PROXY,ip)  # 代理
c.fp = BytesIO()  
c.setopt(pycurl.URL, url)   #設(shè)置要訪問的URL
c.setopt(pycurl.USERAGENT,ua) #傳入ua
# c.setopt(pycurl.HTTPHEADER,self.headers)     #傳入請(qǐng)求頭
c.setopt(c.WRITEFUNCTION, c.fp.write)   #回調(diào)寫入字符串緩存
c.perform()     
code = c.getinfo(c.HTTP_CODE)   #返回狀態(tài)碼
html = c.fp.getvalue()  #返回源代碼

POST請(qǐng)求方法

c = pycurl.Curl()   #通過curl方法構(gòu)造一個(gè)對(duì)象
c.setopt(pycurl.FOLLOWLOCATION, True)   #自動(dòng)進(jìn)行跳轉(zhuǎn)抓取
c.setopt(pycurl.MAXREDIRS,5)            #設(shè)置最多跳轉(zhuǎn)多少次
c.setopt(pycurl.CONNECTTIMEOUT, 60)     #設(shè)置鏈接超時(shí)
c.setopt(pycurl.TIMEOUT,120)            #下載超時(shí)
c.setopt(pycurl.ENCODING, 'gzip,deflate')   #處理gzip內(nèi)容
# c.setopt(c.PROXY,ip)  # 代理
c.fp = BytesIO()  
c.setopt(pycurl.URL, url)   #設(shè)置要訪問的URL
c.setopt(pycurl.USERAGENT,ua ) #傳入U(xiǎn)ser-Agent
# c.setopt(pycurl.HTTPHEADER,headers)     #傳入請(qǐng)求頭
c.setopt(pycurl.POST, 1)
c.setopt(pycurl.POSTFIELDS, urllib.parse.urlencode(data))
c.setopt(c.WRITEFUNCTION, c.fp.write)   #回調(diào)寫入字符串緩存
c.perform()     
code = c.getinfo(c.HTTP_CODE)   #返回狀態(tài)碼
html = c.fp.getvalue()  #返回源代碼

windows訪問https

windows 訪問https的方法,需要證書

import certifi
c.setopt(pycurl.CAINFO, certifi.where())

獲取網(wǎng)頁多重跳轉(zhuǎn)之后的地址

c.getinfo(pycurl.EFFECTIVE_URL) 獲取網(wǎng)頁的最終地址

記錄Cookie

c.setopt(pycurl.COOKIEFILE, "cookie_file_etherscan") #讀取cookie
c.setopt(pycurl.COOKIEJAR, "cookie_file_etherscan") #設(shè)置cookie

其他屬性

pycurl的部分API:

pycurl.Curl() #創(chuàng)建一個(gè)pycurl對(duì)象的方法
pycurl.Curl(pycurl.URL, http://www.google.com.hk) #設(shè)置要訪問的URL
pycurl.Curl().setopt(pycurl.MAXREDIRS, 5) #設(shè)置最大重定向次數(shù)
pycurl.Curl().setopt(pycurl.CONNECTTIMEOUT, 60)
pycurl.Curl().setopt(pycurl.TIMEOUT, 300) #連接超時(shí)設(shè)置
pycurl.Curl().setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)") #模擬瀏覽器
pycurl.Curl().perform() #服務(wù)器端返回的信息
pycurl.Curl().getinfo(pycurl.HTTP_CODE) #查看HTTP的狀態(tài) 類似urllib中status屬性
 
 
pycurl.NAMELOOKUP_TIME 域名解析時(shí)間
pycurl.CONNECT_TIME 遠(yuǎn)程服務(wù)器連接時(shí)間
pycurl.PRETRANSFER_TIME 連接上后到開始傳輸時(shí)的時(shí)間
pycurl.STARTTRANSFER_TIME 接收到第一個(gè)字節(jié)的時(shí)間
pycurl.TOTAL_TIME 上一請(qǐng)求總的時(shí)間
pycurl.REDIRECT_TIME 如果存在轉(zhuǎn)向的話,花費(fèi)的時(shí)間
pycurl.HTTP_CODE HTTP 響應(yīng)代碼
pycurl.REDIRECT_COUNT 重定向的次數(shù)
pycurl.SIZE_UPLOAD 上傳的數(shù)據(jù)大小
pycurl.SIZE_DOWNLOAD 下載的數(shù)據(jù)大小
pycurl.SPEED_UPLOAD 上傳速度
pycurl.HEADER_SIZE 頭部大小
pycurl.REQUEST_SIZE 請(qǐng)求大小
pycurl.CONTENT_LENGTH_DOWNLOAD 下載內(nèi)容長度
pycurl.CONTENT_LENGTH_UPLOAD 上傳內(nèi)容長度
pycurl.CONTENT_TYPE 內(nèi)容的類型
pycurl.RESPONSE_CODE 響應(yīng)代碼
pycurl.SPEED_DOWNLOAD 下載速度
pycurl.INFO_FILETIME 文件的時(shí)間信息
pycurl.HTTP_CONNECTCODE HTTP 連接代碼

以上是“Python中Pycurl屬性與方法的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI