您好,登錄后才能下訂單哦!
這篇文章將為大家詳細(xì)講解有關(guān)python中如何爬取12306驗(yàn)證碼,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
在Python2.7環(huán)境下爬取網(wǎng)站驗(yàn)證碼:
思路就是獲取驗(yàn)證碼對(duì)應(yīng)的url,然后發(fā)起requst請(qǐng)求,讀取該URL對(duì)應(yīng)的內(nèi)容,然后寫(xiě)入到一個(gè)本地文件,實(shí)現(xiàn)一個(gè)驗(yàn)證碼的保存。大量下載可以把以上程序?qū)懭胍粋€(gè)死循環(huán)
代碼實(shí)現(xiàn)部分:
import ssl import urllib2 i=1 import time while(1): #不加的話(huà),無(wú)法訪(fǎng)問(wèn)12306 ssl._create_default_https_context = ssl._create_unverified_context # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"} # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers) # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074") u=urllib2.urlopen(req) data = u.read() f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb') print i # time.sleep(1)#有時(shí)需要加延時(shí),以防被封。 i=i+1 f.write(data) f.close()
關(guān)于“python中如何爬取12306驗(yàn)證碼”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。