Jmeter圖片爬蟲

發(fā)布時間：2020-08-10 19:05:39 來源：網(wǎng)絡(luò) 閱讀：423 作者：ufuhz2008 欄目：軟件技術(shù)

今天教大家用元件組合，做一個網(wǎng)頁圖片爬蟲。

需要用到的元件：循環(huán)控制器+計數(shù)器+xpath提前器+函數(shù)嵌套+beanshell代碼

首先我們確定一下要爬取的圖片網(wǎng)站：https://dp.pconline.com.cn/list/all_t5.html

Jmeter圖片爬蟲

通過F12觀察一下他的html代碼，發(fā)現(xiàn)這些圖片都是通過href鏈接跳轉(zhuǎn)之后，訪問的src圖片

那么我們可以考慮先對網(wǎng)站發(fā)起請求，通過xpath表達式提取到圖片的src，也就是圖片的訪問鏈接

Jmeter圖片爬蟲

然后再通過xpath提取出這些圖片的標(biāo)題

Jmeter圖片爬蟲

因為考慮到每一組圖片和標(biāo)題都是一一對應(yīng)的，因此這里提取出來的匹配數(shù)字也可以認為是一一對應(yīng)。

在dubug中我們可以看到，url和標(biāo)題都提取了50個，且一一對應(yīng)。

? Jmeter圖片爬蟲

Jmeter圖片爬蟲

在循環(huán)控制器中添加一個計數(shù)器，用來計算需要執(zhí)行爬取的次數(shù)

? Jmeter圖片爬蟲

添加一個http請求，在循環(huán)控制器下，循環(huán)對debug中獲取到的url發(fā)起請求，同時遍歷寫入圖片標(biāo)題 Jmeter圖片爬蟲

每一次發(fā)起請求之后，都把請求獲取的圖片通過代碼寫入本地，同時遍歷寫入圖片名稱

Jmeter圖片爬蟲

執(zhí)行腳本觀察響應(yīng)結(jié)果，觀察本地文件寫入結(jié)果

? Jmeter圖片爬蟲

Jmeter圖片爬蟲

友情提示：這一套爬蟲腳本，摒棄了以往通過foreach控制器遍歷進行爬蟲的方法。轉(zhuǎn)而通過函數(shù)嵌套的方式，同步遍歷多個參數(shù)進行文件寫入。難點就在于函數(shù)嵌套遍歷的理解和xpath元素定位，希望大家好好研究，有問題可以和我進行探討！

Jmeter圖片爬蟲

向AI問一下細節(jié)

猜你喜歡