溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

發(fā)布時(shí)間：2020-08-02 04:43:00 來源：網(wǎng)絡(luò) 閱讀：362 作者：pengdongcheng 欄目：編程語言

前幾天小編帶大家學(xué)會(huì)了如何在Scrapy框架下創(chuàng)建屬于自己的第一個(gè)爬蟲項(xiàng)目（上），今天我們進(jìn)一步深入的了解Scrapy爬蟲項(xiàng)目創(chuàng)建，這里以伯樂在線網(wǎng)站的所有文章頁為例進(jìn)行說明。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

在我們創(chuàng)建好Scrapy爬蟲項(xiàng)目之后，會(huì)得到上圖中的提示，大意是讓我們直接根據(jù)模板進(jìn)行創(chuàng)建Scrapy項(xiàng)目。根據(jù)提示，我們首先運(yùn)行“cd article”命令，意思是打開或者進(jìn)入到article文件夾下，爾后執(zhí)行命令“scrapy genspider jobbole blog.jobbole.com”，代表通過Scrapy中自帶的basic模板進(jìn)行創(chuàng)建Scrapy項(xiàng)目，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

根據(jù)提示，該模板創(chuàng)建的位置為article.spiders.jobbole，此時(shí)再次輸入tree /f命令可以查看到除了之前創(chuàng)建Scrapy爬蟲項(xiàng)目的基礎(chǔ)文件之外，在spiders文件夾下確實(shí)是多了一個(gè)jobbole.py文件，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

當(dāng)然了，爬蟲模板不一定非得用Scrapy爬蟲項(xiàng)目自帶的模板，也可以自定義的進(jìn)行創(chuàng)建，但是基本上Scrapy提供的模板是足夠使用的了。

接下來，將整個(gè)爬蟲項(xiàng)目導(dǎo)入到Pycharm中去，點(diǎn)擊左上方“file”à“open”，找到爬蟲項(xiàng)目創(chuàng)建的文件夾，點(diǎn)擊確認(rèn)即可。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

如果在Pycharm中的spiders文件夾下看不到jobbole.py這個(gè)文件的話，則先選中spiders文件夾，爾后右鍵，點(diǎn)擊“Synchronize spider”，代表與spiders文件夾進(jìn)行同步的意思，爾后便可以看到jobbole.py就會(huì)被加載出來。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

點(diǎn)擊jobbole.py文件進(jìn)行查看內(nèi)容，如下圖所示?？梢钥吹皆撐募呀?jīng)默認(rèn)的填充了部分Python代碼，其實(shí)是從源模板中進(jìn)行復(fù)制創(chuàng)建的。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

可以看到該文件中有當(dāng)前Scrapy爬蟲項(xiàng)目的名字name，Scrapy爬蟲項(xiàng)目所允許的域名范圍allowed_domains，以及Scrapy爬蟲項(xiàng)目的起始URL，即start_urls。

接下來最后檢查一下該項(xiàng)目的Python解釋器，點(diǎn)擊Pycharm的setting，然后輸入“interpreter”，找到解釋器所在的位置，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

如果“Project Interpreter”顯示出來的解釋器不是當(dāng)前項(xiàng)目下的虛擬環(huán)境，則點(diǎn)擊“Project Interpreter”的右側(cè)的設(shè)置按鈕，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

然后點(diǎn)擊“Add local”，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

找到該項(xiàng)目對應(yīng)的虛擬環(huán)境Python解釋器，進(jìn)行添加即可，如下圖所示。

手把手教你如何新建scrapy爬蟲框架的第一個(gè)項(xiàng)目（下）

至此，Scrapy爬蟲虛擬環(huán)境創(chuàng)建、Scrapy爬蟲項(xiàng)目的創(chuàng)建以及Scrapy爬蟲項(xiàng)目導(dǎo)入到Pycharm中以及解釋器的配置已經(jīng)完成，接下來我們要開始寫入爬蟲邏輯，以及數(shù)據(jù)提取等，敬請期待~~

對爬蟲感興趣的小伙伴，歡迎來Github：https://github.com/cassieeric，喜歡的話記得給個(gè)star噢~~

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
php獲取xml文件內(nèi)容
下一篇新聞：
PHP--動(dòng)態(tài)生成sql查詢表格

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼

<i id="nofcj"></i>

<noscript id="nofcj"></noscript>

<nobr id="nofcj"></nobr>

<span id="nofcj"><label id="nofcj"></label></span><span id="nofcj"><del id="nofcj"><noscript id="nofcj"></noscript></del></span>

<strong id="nofcj"><pre id="nofcj"></pre></strong>