溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python requests發(fā)送post請(qǐng)求的一些疑點(diǎn)

發(fā)布時(shí)間:2020-09-01 07:25:28 來源:腳本之家 閱讀:288 作者:七夜的故事 欄目:開發(fā)技術(shù)

前言

在Python爬蟲中,使用requests發(fā)送請(qǐng)求,訪問指定網(wǎng)站,是常見的做法。一般是發(fā)送GET請(qǐng)求或者POST請(qǐng)求,對(duì)于GET請(qǐng)求沒有什么好說的,而發(fā)送POST請(qǐng)求,有很多朋友不是很清楚,主要是因?yàn)槿菀谆煜?POST提交的方式 。今天在微信交流群里,就有朋友遇到了這種問題,特地講解一下。

在HTTP協(xié)議中,post提交的數(shù)據(jù)必須放在消息主體中,但是協(xié)議中并沒有規(guī)定必須使用什么編碼方式,從而導(dǎo)致了 提交方式 的不同。服務(wù)端根據(jù)請(qǐng)求頭中的 Content-Type 字段來獲知請(qǐng)求中的消息主體是用何種方式進(jìn)行編碼,再對(duì)消息主體進(jìn)行解析。具體的編碼方式包括如下:

  1. application/x-www-form-urlencoded:以form表單形式提交數(shù)據(jù),最常見也是大家最熟悉的
  2.  application/json :以json串提交數(shù)據(jù)。

下面使用requests來發(fā)送上述三種編碼的POST請(qǐng)求。

1.提交Form表單

requests提交Form表單,一般存在于網(wǎng)站的登錄,用來提交用戶名和密碼。以http://httpbin.org/post 為例,在requests中,以form表單形式發(fā)送post請(qǐng)求,只需要將請(qǐng)求的參數(shù)構(gòu)造成一個(gè)字典,然后傳給requests.post()的data參數(shù)即可。代碼如下:

url = 'http://httpbin.org/post'
d = {'key1': 'value1', 'key2': 'value2'}
r = requests.post(url, data=d)
print r.text

輸出效果如下:

{
"args":{},
"data":"",
"files":{},
"form":{"key1":"value1","key2":"value2"},
"headers":{"Accept":"*/*","Accept-Encoding":"gzip, deflate",
"Connection":"close",
"Content-Length":"23",
"Content-Type":"application/x-www-form-urlencoded",
"Host":"httpbin.org",
"User-Agent":"python-requests/2.12.3"},
"json":null,
"origin":"113.140.11.122",
"url":http://httpbin.org/post}

httpbin.org網(wǎng)站可以顯示你提交請(qǐng)求的內(nèi)容,大家注意一下輸出的"Content-Type":"application/x-www-form-urlencoded",證明這是提交Form的方式。大家在登錄一個(gè)網(wǎng)站時(shí),可以觀察一下Content-Type是什么。

2.提交json串

對(duì)于提交json串,主要是用于發(fā)送ajax請(qǐng)求中,動(dòng)態(tài)加載數(shù)據(jù)。以拼多多網(wǎng)站為例,加載商品的方式為ajax,商品的內(nèi)容在響應(yīng)中。

Python requests發(fā)送post請(qǐng)求的一些疑點(diǎn)

下面把請(qǐng)求頭和請(qǐng)求實(shí)體列舉一下:

Python requests發(fā)送post請(qǐng)求的一些疑點(diǎn) 

一些初學(xué)者根據(jù)請(qǐng)求頭寫爬蟲,就會(huì)犯requests的使用錯(cuò)誤。

錯(cuò)誤寫法

import requests
__author__ = 'qiye'
__date__ = '2018/5/19 21:59'

url = "http://jinbao.pinduoduo.com/network/api/common/goodsList"
data ={"pageSize":60,"pageNumber":1,"withCoupon":0,"sortType":0}
headers = {
  'Content-Type':'application/json; charset=UTF-8',
  'Host':'jinbao.pinduoduo.com',
  'Origin':'http://jinbao.pinduoduo.com',
  'Referer':'http://jinbao.pinduoduo.com/',
  'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Mobile Safari/537.36',
  'Accept': 'application/json, text/javascript, */*; q=0.01',
}
r = requests.post(url=url,data =data,headers=headers)
print(r.text)

打印的內(nèi)容如下:

{"success":false,"errorCode":4000000,"errorMsg":"System Error","result":null}

返回出錯(cuò)了,這時(shí)候百思不得其解,請(qǐng)求頭我都保持一致了呀,'Content-Type':'application/json; charset=UTF-8'都加上了,為什么會(huì)出錯(cuò)呀?

答案在于,你的請(qǐng)求實(shí)體的格式錯(cuò)了,服務(wù)端無法解碼。

正確寫法1

正確代碼是把data進(jìn)行json編碼,再發(fā)送。代碼如下:

r = requests.post(url=url,data =json.dumps(data),headers=headers)

這個(gè)時(shí)候再看一下打印內(nèi)容,已經(jīng)正確返回商品內(nèi)容了。

{"success":true,"errorCode":1000000,"errorMsg":null,"result":{"total":2271278,"goodsList":[{"goodsId":998422995,"goodsName":"【4液+1器】皎潔電熱蚊香液 孕婦寶寶驅(qū)蚊兒童嬰無味防蚊液體","goodsImageUrl":"http://t11img.yangkeduo.com/images/2018-04-12/0292b5e75053dfa748b9762d3f3e74ef.jpeg","soldQuantity":175,"minGroupPrice":24890,"categoryId":4,"categoryName":"母嬰","hasCoupon":true,"couponMinOrderAmount":5000,"couponDiscount":5000,"couponTotalQuantity":5000,"couponRemainQuantity":3940,"couponStartTime":1526572800,"couponEndTime":1527782399,"promotionRate":280},
...

正確寫法2

處理將data主動(dòng)編碼為json發(fā)送之外,requests還提供了一個(gè)json參數(shù),自動(dòng)使用json方式發(fā)送,而且在請(qǐng)求頭中也不用顯示聲明'Content-Type':'application/json; charset=UTF-8'。完整代碼如下:

import requests

__author__ = 'qiye'
__date__ = '2018/5/19 21:59'

url = "http://jinbao.pinduoduo.com/network/api/common/goodsList"
data ={"pageSize":60,"pageNumber":1,"withCoupon":0,"sortType":0}
headers = {
  'Host':'jinbao.pinduoduo.com',
  'Origin':'http://jinbao.pinduoduo.com',
  'Referer':'http://jinbao.pinduoduo.com/',
  'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Mobile Safari/537.36',
}
r = requests.post(url=url,json =data,headers=headers)
print(r.text)

3.上傳文件

上傳文件在爬蟲中使用的很少,不過還是使用requests講解一下使用方式。Content-Type類型為multipart/form-data,以multipart形式發(fā)送post請(qǐng)求,只需將一文件傳給requests.post()的files參數(shù)即可。還是以http://httpbin.org/post 為例,代碼如下:

url = 'http://httpbin.org/post'
files = {'file': open('upload.txt', 'rb')}
r = requests.post(url, files=files)
print(r.text)

以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI