您好,登錄后才能下訂單哦!
小編給大家分享一下web爬蟲中怎么用Selenium操作瀏覽器抓數(shù)據(jù),希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
Selenium是一個基于Web的開源自動化工具。Python使用Selenium用于自動化測試。 特點是易于使用。Selenium可以將標準Python命令發(fā)送到不同的瀏覽器,盡管它們的瀏覽器設(shè)計有所不同。
使用Selenium自動打開谷歌瀏覽器然后訪問地址http://econpy.pythonanywhere.com/ex/001.html,并將改頁面中的購買者姓名和商品價格抓取下來打印,然后自動關(guān)閉瀏覽器的操作。
分析頁面源代碼可知 購買者姓名和商品價格的html代碼信息如下:
使用Selenium自動打開谷歌瀏覽器的時候需要下載谷歌的驅(qū)動程序,我的谷歌瀏覽器版本為74:
所以我們訪問驅(qū)動程序下載地址:
https://sites.google.com/a/chromium.org/chromedriver/downloads
進行下載:
然后我們要使用Selenium 需要進行安裝,這里使用pip install selenium。
接下來開始編碼部分:
#導(dǎo)入包
from selenium import webdriver
#打開谷歌瀏覽器 并訪問要抓取數(shù)據(jù)的地址
#注意:驅(qū)動chromedriver.exe與改python文件在同一個目錄
driver = webdriver.Chrome('chromedriver.exe')
driver.get("http://econpy.pythonanywhere.com/ex/001.html")
# 使用xpath找到購買者和商品價格元素列表
buyers = driver.find_elements_by_xpath('//div[@title="buyer-name"]')
prices = driver.find_elements_by_xpath('//span[@class="item-price"]')
# 打印所有信息
num_page_items = len(buyers)
for i in range(num_page_items):
print(buyers[i].text + " : " + prices[i].text)
#完成任務(wù)后 關(guān)閉瀏覽器
driver.close()
運行結(jié)果部分內(nèi)容為:
Carson Busses : $29.95Earl E. Byrd : $8.37Patty Cakes : $15.26Derri Anne Connecticut : $19.25Moe Dess : $19.25Leda Doggslife : $13.99Dan Druff : $31.57Al Fresco : $8.49。。。。。。
我簡單錄制了一下運行過程,由于單手操作錄制,畫面抖動,大家對付觀看一下,過程為:運行程序,自動打開谷歌瀏覽器,訪問地址,抓取數(shù)據(jù)打印,關(guān)閉瀏覽器完成
看完了這篇文章,相信你對“web爬蟲中怎么用Selenium操作瀏覽器抓數(shù)據(jù)”有了一定的了解,如果想了解更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。