python中如何爬取12306驗(yàn)證碼

發(fā)布時(shí)間：2021-07-26 11:41:02 來(lái)源：億速云閱讀：91 作者：小新欄目：開(kāi)發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)python中如何爬取12306驗(yàn)證碼，小編覺(jué)得挺實(shí)用的，因此分享給大家做個(gè)參考，希望大家閱讀完這篇文章后可以有所收獲。

在Python2.7環(huán)境下爬取網(wǎng)站驗(yàn)證碼：

思路就是獲取驗(yàn)證碼對(duì)應(yīng)的url，然后發(fā)起requst請(qǐng)求，讀取該URL對(duì)應(yīng)的內(nèi)容，然后寫(xiě)入到一個(gè)本地文件，實(shí)現(xiàn)一個(gè)驗(yàn)證碼的保存。大量下載可以把以上程序?qū)懭胍粋€(gè)死循環(huán)

代碼實(shí)現(xiàn)部分：

import ssl
import urllib2
i=1
import time
while(1):

 #不加的話(huà)，無(wú)法訪(fǎng)問(wèn)12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有時(shí)需要加延時(shí)，以防被封。
  i=i+1
  f.write(data)
  f.close()

關(guān)于“python中如何爬取12306驗(yàn)證碼”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，使各位可以學(xué)到更多知識(shí)，如果覺(jué)得文章不錯(cuò)，請(qǐng)把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

python中如何爬取12306驗(yàn)證碼

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽