溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

發(fā)布時(shí)間:2020-08-25 16:23:52 來(lái)源:億速云 閱讀:250 作者:Leah 欄目:編程語(yǔ)言

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie?很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。

cookie 的由來(lái)

大家都知道HTTP協(xié)議是無(wú)狀態(tài)的。

無(wú)狀態(tài)的意思是每次請(qǐng)求都是獨(dú)立的,它的執(zhí)行情況和結(jié)果與前面的請(qǐng)求和之后的請(qǐng)求都無(wú)直接關(guān)系,

它不會(huì)受前面的請(qǐng)求響應(yīng)情況直接影響,也不會(huì)直接影響后面的請(qǐng)求響應(yīng)情況。

一句有意思的話(huà)來(lái)描述就是人生只如初見(jiàn),對(duì)服務(wù)器來(lái)說(shuō),每次的請(qǐng)求都是全新的。

狀態(tài)可以理解為客戶(hù)端和服務(wù)器在某次會(huì)話(huà)中產(chǎn)生的數(shù)據(jù),那無(wú)狀態(tài)的就以為這些數(shù)據(jù)不會(huì)被保留。

會(huì)話(huà)中產(chǎn)生的數(shù)據(jù)又是我們需要保存的,也就是說(shuō)要“保持狀態(tài)”。因此Cookie就是在這樣一個(gè)場(chǎng)景下誕生。

cookie 定義

Cookie具體指的是一段小信息,它是服務(wù)器發(fā)送出來(lái)存儲(chǔ)在瀏覽器上的一組組鍵值對(duì),

下次訪(fǎng)問(wèn)服務(wù)器時(shí)瀏覽器會(huì)自動(dòng)攜帶這些鍵值對(duì),以便服務(wù)器提取有用信息。

1. 由服務(wù)器讓瀏覽器進(jìn)行設(shè)置的

2. 瀏覽器保存在瀏覽器本地

3. 下次訪(fǎng)問(wèn)時(shí)自動(dòng)攜帶

cookie的工作原理是:由服務(wù)器產(chǎn)生內(nèi)容,瀏覽器收到請(qǐng)求后保存在本地;當(dāng)瀏覽器再次訪(fǎng)問(wèn)時(shí),

瀏覽器會(huì)自動(dòng)帶上Cookie,這樣服務(wù)器就能通過(guò)Cookie的內(nèi)容來(lái)判斷這個(gè)是“誰(shuí)”了。

簡(jiǎn)單的來(lái)說(shuō):cookie就是保存在瀏覽器本地上的一組組鍵值對(duì)。

cookie 簡(jiǎn)單應(yīng)用

1. 登錄(只是cookie一種應(yīng)用)

2. 保存瀏覽習(xí)慣 如:分頁(yè)瀏覽器,顯示數(shù)據(jù)條數(shù)(只是cookie一種應(yīng)用)

3. 簡(jiǎn)單的投票 計(jì)數(shù)(只是cookie一種應(yīng)用)

當(dāng)我們關(guān)閉cookie的時(shí),登錄博客園效果

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

查看cookie

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

cookie設(shè)置

獲取Cookie

request.COOKIES['key']
request.get_signed_cookie('key', default=RAISE_ERROR, salt='', max_age=None)
get_signed_cookie方法的參數(shù):
- default: 默認(rèn)值
- salt: 加密鹽
- max_age: 后臺(tái)控制過(guò)期時(shí)間

設(shè)置Cookie

rep = HttpResponse(...)
rep = render(request, ...)
rep.set_cookie(key,value,...)
rep.set_signed_cookie(key,value,salt='加密鹽',...)

參數(shù):

- key, 鍵
- value='', 值
- max_age=None, 超時(shí)時(shí)間
- expires=None, 超時(shí)時(shí)間(IE requires expires, so set it if hasn't been already.)
- path='/', Cookie生效的路徑,/ 表示根路徑,特殊的:根路徑的cookie可以被任何url的頁(yè)面訪(fǎng)問(wèn)
- domain=None, Cookie生效的域名
- secure=False, https傳輸
- httponly=False 只能http協(xié)議傳輸,無(wú)法被JavaScript獲?。ú皇墙^對(duì),底層抓包可以獲取到也可以被覆蓋)

刪除Cookie

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

def logout(request):
    rep = redirect("/login/")
    rep.delete_cookie("user")  # 刪除用戶(hù)瀏覽器上之前設(shè)置的user的cookie值
    return rep

簡(jiǎn)單的創(chuàng)建一個(gè)django項(xiàng)目,使用cookie完成用戶(hù)登錄狀態(tài)的效驗(yàn)

1.login.html

<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <meta http-equiv="x-ua-compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
    <title>登錄</title>
</head>
<body>
<form action="" method="post">
{{% csrf_token %}}
    <p>
        用戶(hù)名: <input type="text" name="username">
    </p>
    <p>
        密碼: <input type="password" name="pwd">
    </p>
    <p>{{ error }}</p>
    <button>提交</button>
</form>
</body>
</html>

2.views.py

from django.views import View                        #導(dǎo)入基于類(lèi)的視圖模塊
from django.shortcuts import render, redirect, HttpResponse#導(dǎo)入響應(yīng)三劍客
class Login(View):                                   #登錄邏輯視圖函數(shù)
    def get(self, request, *args, **kwargs):         #處理get請(qǐng)求方法
        return render(request, 'login.html')         #如果是get請(qǐng)求(頁(yè)面刷新等操作),還是登錄頁(yè)面
    def post(self, request, *args, **kwargs):        #處理post請(qǐng)求方法
        username = request.POST.get('username')      #form表單提交的賬戶(hù)
        pwd = request.POST.get('pwd')                #form表單提交的密碼
        if username == 'gkf' and pwd == '318':       #賬戶(hù)密碼簡(jiǎn)單校驗(yàn)
            url = request.GET.get('return_url')      #獲取return_url,后面的路徑信息
            if url:                                  #如果有路徑信息
                ret = redirect(url)                  #重定向要訪(fǎng)問(wèn)的路徑
            else:
                ret = redirect('/index/')            #如果沒(méi)有,默認(rèn)重定向index頁(yè)面
            ret.set_cookie('is_login', '1')          #利用cookie標(biāo)識(shí)登錄狀態(tài)
            return ret                               #響應(yīng)請(qǐng)求
        return render(request, 'login.html', {'error': '用戶(hù)名或密碼錯(cuò)誤'})#密碼賬戶(hù)錯(cuò)誤,重定向login.html并提示
    
def login_required(func):                           #裝飾器函數(shù),用來(lái)判斷,訪(fǎng)客登錄狀態(tài)
    def inner(request, *args, **kwargs):
        is_login = request.COOKIES.get('is_login')  #獲取is_login的狀態(tài)值
        url = request.path_info                     #訪(fǎng)問(wèn)頁(yè)面的路徑信息
        if is_login != '1':                         #如果狀態(tài)值不為1表示未登錄
            return redirect('/login/?return_url={}'.format(url))#返會(huì)login頁(yè)面,并把之前訪(fǎng)問(wèn)頁(yè)面信息,拼接在路徑后面
        ret = func(request, *args, **kwargs)        #如果狀態(tài)值是1,執(zhí)行視圖函數(shù)
        return ret                                  #響應(yīng)請(qǐng)求
    return inner
@login_required                                     #判斷登錄狀態(tài)裝飾器
def index(request):                                 #處理index路由請(qǐng)求的視圖函數(shù)
    return HttpResponse('首頁(yè)')                     #簡(jiǎn)單模擬首頁(yè)
@login_required                                    #判斷登錄狀態(tài)裝飾器
def home(request):                                 #處理home路由請(qǐng)求的視圖函數(shù)
    return HttpResponse('home')                    # #簡(jiǎn)單模擬home頁(yè)

密碼賬戶(hù)錯(cuò)誤登錄失敗

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

訪(fǎng)問(wèn)home也 登錄成功跳轉(zhuǎn)home頁(yè)面

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

直接從login頁(yè)面直接登錄,默認(rèn)返回index頁(yè)面

什么是Python爬蟲(chóng)爬取資料時(shí)遇到的cookie

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI