在Scrapy中設(shè)置爬蟲的起始URL可以通過修改Spider類的start_urls屬性來實(shí)現(xiàn)。在Spider類中添加start_urls屬性,將要爬取的URL鏈接添加到start_urls屬性中即可。
例如:
import scrapy
class MySpider(scrapy.Spider):
name = 'myspider'
start_urls = ['http://www.example.com']
def parse(self, response):
# 爬取邏輯
pass
在上面的示例中,我們定義了一個(gè)Spider類MySpider,并設(shè)置了start_urls屬性為[‘http://www.example.com’],這樣MySpider就會(huì)從’http://www.example.com’這個(gè)URL開始爬取數(shù)據(jù)。parse方法用于解析爬取到的網(wǎng)頁數(shù)據(jù),你可以在其中實(shí)現(xiàn)具體的爬取邏輯。