溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

利用Python模擬GitHub登錄的示例

發(fā)布時(shí)間:2021-02-03 15:22:57 來源:億速云 閱讀:151 作者:小新 欄目:開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)利用Python模擬GitHub登錄的示例的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

Fiddler抓包分析

首先,我們想要模擬一個(gè)網(wǎng)站的登錄,我們必須要簡單了解其大致過程。
在這里,我通過Fiddler來抓取GitHub登錄的請求,從網(wǎng)頁上登錄的URL為:https://github.com/login ,抓包結(jié)果如下:

利用Python模擬GitHub登錄的示例

左邊的是會話列表,右邊的是請求和響應(yīng)的數(shù)據(jù)。一般情況下,登錄都是用POST請求,因?yàn)槲以谧筮叺臅捔斜碇性O(shè)置了顯示RequestMethod一列,因此能夠很方便的找到POST請求。當(dāng)然,F(xiàn)iddler默認(rèn)不顯示RequestMethod,如果沒有設(shè)置,還可以通過命令“=post”來快速過濾POST請求。

利用Python模擬GitHub登錄的示例

在GitHub登錄時(shí),我們通過抓包發(fā)現(xiàn),GitHub登錄的URL雖然時(shí)https://github.com/login,但發(fā)生了302重定向,其真正提交POST表單數(shù)據(jù)的URL是 https://github.com/session ,當(dāng)?shù)卿洺晒r(shí),則會跳轉(zhuǎn)到 https://github.com/ 首頁。

打開WebForm,我們可以看到POST表單數(shù)據(jù)提交的值,可以發(fā)現(xiàn),只有authenticity_token、login、password三個(gè)字段是會變化的,其余的每次登錄都是固定的值。而login、password分別是我們登錄的用戶和密碼,因此我們只需要分析出 authenticity_token 從何而來,便可以實(shí)現(xiàn)模擬登錄了。

至于如何確定 authenticity_token 從哪個(gè)頁面返回的,我們直接在響應(yīng)數(shù)據(jù)中搜索就行了,或者把數(shù)據(jù)復(fù)制出來再進(jìn)行搜索。最后我們會發(fā)現(xiàn),authenticity_token 是在 https://github.com/login 這個(gè)請求中返回的,只不過用 hidden 隱藏起來了。

利用Python模擬GitHub登錄的示例

好了,到目前大致流程我們已經(jīng)梳理清楚了,接下來我們便通過Python來實(shí)現(xiàn)模擬GitHub登錄。

代碼實(shí)現(xiàn)

本人環(huán)境:PyCharm 2018.2.4、Python3.7.0

1. 設(shè)置請求頭和Session

# 設(shè)置Session
    self.s = requests.session()
    # 設(shè)置請求頭
    self.headers = {
      "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:44.0) Gecko/20100101 Firefox/44.0"
    }
    # 在使用Fiddler時(shí)進(jìn)行請求,通過該代碼忽略SSLError錯(cuò)誤
    self.s.verify = False

在這里,我們設(shè)置了Session會話對象,Session相當(dāng)于1個(gè)微型瀏覽器,能夠自動幫我們保持請求中的某些參數(shù)(如cookies),有了它,我們一般不需要額外去處理cookies、header等。
假如我們是在Fiddler打開的狀態(tài)下,通過代碼進(jìn)行請求,那么將會遇到SSLError的錯(cuò)誤,而當(dāng)加上 self.s.verify = False 這行代碼后,我們便可以忽略該錯(cuò)誤。

requests.exceptions.SSLError: HTTPSConnectionPool(host='github.com', port=443): Max retries exceeded with url: /login (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1045)')))

注意:

我們通過上面的代碼忽略了SSLError的錯(cuò)誤后,再次運(yùn)行,這時(shí)仍然會出現(xiàn)2行警告,這2個(gè)警告并不影響我們的登錄,可以不管它。

D:\Python\installation\lib\site-packages\urllib3\connectionpool.py:847: InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
 InsecureRequestWarning)
D:\Python\installation\lib\site-packages\urllib3\connectionpool.py:847: InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
 InsecureRequestWarning)

如果我們想去掉這2行警告,也可以通過如下代碼來解決(針對Python3):

import urllib3
urllib3.disable_warnings()

2. 獲取authenticity_token

login_url = "https://github.com/login"
    r = self.s.get(login_url, headers = self.headers)
    authenticity_token = re.findall('<input type="hidden" name="authenticity_token" value="(.+?)" />', r.text)
    print("authenticity_token:{}".format(authenticity_token))
    return authenticity_token[1]

當(dāng)我們訪問 https://github.com/login 時(shí),登錄界面會生成隱藏參數(shù)authenticity_token,而這恰是我們在登錄提交表單時(shí)需要用到的參數(shù)。我們可通過正則表達(dá)式 re.findall 來獲取authenticity_token。另外,我們還會發(fā)現(xiàn),HTML界面中存在2個(gè)authenticity_token,因此通過正則返回的是一個(gè)長度為2的列表,經(jīng)過分析,GitHub在登錄時(shí)用到的是列表中的第二個(gè)元素,即authenticity_token[1]。

3. 模擬登錄

  def github_login(self, authenticity_token, username, password):
    session_url = "https://github.com/session"
    body = {
      "authenticity_token":authenticity_token,
      "commit":"Sign in",
      "login":username,
      "password":password,
      "utf8":"?",
      "webauthn-support":"unknown"
    }
    r = self.s.post(session_url, headers = self.headers, data = body)
    title = re.findall('<title>(.+?)</title>',r.text)
    print("title:%s" %title[0])
    return title[0]

我們在上面得到authenticity_token后,便可以來實(shí)現(xiàn)登錄了。通過POST請求提交表單后,我們需要判斷是否登錄成功。在這里,我是通過頁面的標(biāo)題來判斷GitHub是否登錄成功,當(dāng)然,還有許多方法可以用于判斷。

4. 通過 title 判斷是否登錄成功

  def is_login_success(self, title):
    if "GitHub" == title:
      return True
    else:
      return False

GitHub登錄成功后,界面的標(biāo)題會顯示"GitHub",而登錄失敗時(shí),一般顯示的標(biāo)題則是"Sign in to GitHub · GitHub"。

OK,以上就是通過Python模擬GitHub登錄的過程,難度不大,相信大多數(shù)人閱讀后都應(yīng)該可以進(jìn)行實(shí)踐。

附源碼:

import requests
import re
import urllib3
urllib3.disable_warnings()

class Github_Login():

  def __init__(self):
    # 設(shè)置Session
    self.s = requests.session()
    # 設(shè)置請求頭
    self.headers = {
      "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:44.0) Gecko/20100101 Firefox/44.0"
    }
    # 在使用Fiddler時(shí)進(jìn)行請求,通過該代碼忽略SSLError錯(cuò)誤
    self.s.verify = False

  # 獲取 authenticity_token
  def get_authenticity_token(self):
    login_url = "https://github.com/login"
    r = self.s.get(login_url, headers = self.headers)
    authenticity_token = re.findall('<input type="hidden" name="authenticity_token" value="(.+?)" />', r.text)
    print("authenticity_token:{}".format(authenticity_token))
    return authenticity_token[1]

  # 模擬登錄,并返回 title
  def github_login(self, authenticity_token, username, password):
    session_url = "https://github.com/session"
    body = {
      "authenticity_token":authenticity_token,
      "commit":"Sign in",
      "login":username,
      "password":password,
      "utf8":"?",
      "webauthn-support":"unknown"
    }
    r = self.s.post(session_url, headers = self.headers, data = body)
    title = re.findall('<title>(.+?)</title>',r.text)
    print("title:%s" %title[0])
    return title[0]

  # 通過 title 判斷是否登錄成功
  def is_login_success(self, title):
    if "GitHub" == title:
      return True
    else:
      return False

if __name__ == '__main__':
  github = Github_Login()
  authenticity_token = github.get_authenticity_token()
  title = github.github_login(authenticity_token, username = "用戶名", password = "密碼")
  login_result = github.is_login_success(title)
  print(login_result)

感謝各位的閱讀!關(guān)于“利用Python模擬GitHub登錄的示例”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI