溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python+BI怎么爬取車厘子數(shù)據(jù)

發(fā)布時間:2021-11-23 09:27:49 來源:億速云 閱讀:186 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“Python+BI怎么爬取車厘子數(shù)據(jù)”,在日常操作中,相信很多人在Python+BI怎么爬取車厘子數(shù)據(jù)問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Python+BI怎么爬取車厘子數(shù)據(jù)”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習吧!

我在淘寶上用python爬取了3000條數(shù)據(jù),然后導(dǎo)入到了FineBI中進行可視化分析,最終制作出了下面這樣一份可視化報告:

Python+BI怎么爬取車厘子數(shù)據(jù)

下面我展示一下操作過程:

一、數(shù)據(jù)獲取

用Python在淘寶上進行數(shù)據(jù)爬取是老生常談的操作了,直接在淘寶上搜索“車厘子”,在下面的商品頁中可以看到,我們這次主要爬取的標簽是“商品名稱”、“價格”、“付款人數(shù)”、“店鋪名稱”、“發(fā)貨地址”等:

Python+BI怎么爬取車厘子數(shù)據(jù)

按下F12,調(diào)出后臺查看源代碼,找到不同的商品標簽代碼,比如價格是“price g_price g_price-highlight">”,付款人數(shù)是“deal-cnt”等:

Python+BI怎么爬取車厘子數(shù)據(jù)

了解了網(wǎng)頁的代碼結(jié)構(gòu)之后,下一步就可以在python里直接編寫代碼了,具體過程不詳細介紹了,部分代碼如下:

Python+BI怎么爬取車厘子數(shù)據(jù)

爬取完數(shù)據(jù)之后導(dǎo)入到Excel里,然后在Excel里經(jīng)過簡單的數(shù)據(jù)清洗和處理,最終得到一份完成的數(shù)據(jù)表:

Python+BI怎么爬取車厘子數(shù)據(jù)

二、數(shù)據(jù)分析

python雖然也能實現(xiàn)數(shù)據(jù)分析的功能,但是需要敲代碼,學(xué)習成本和難度都比較大,不如直接利用專業(yè)的數(shù)據(jù)分析工具進行分析,比如常見的比如FineBI、Tableau、PowerBI等。

下面我直接以FineBI為例,F(xiàn)ineBI是國內(nèi)知名度比較高的本土數(shù)據(jù)分析工具,比起tableau這些國外工具最大的優(yōu)點就是簡單、靈活,只需要用鼠標拖拽就能實現(xiàn)各種分析操作,基本不需要寫代碼,對新手非常友好。

Python+BI怎么爬取車厘子數(shù)據(jù)

其實FineBI本質(zhì)上屬于企業(yè)級的業(yè)務(wù)數(shù)據(jù)分析平臺,除了數(shù)據(jù)分析之外,還能實現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)平臺搭建等功能,這里就不詳細介紹了,大家感興趣的話我下一篇再介紹。

有了excel源表,首先我們將Excel導(dǎo)入到FineBI中:

Python+BI怎么爬取車厘子數(shù)據(jù)

然后直接點擊頁面左上角的“創(chuàng)建儀表板”,就可以進入到可視化后臺:

Python+BI怎么爬取車厘子數(shù)據(jù)

下一步進入到儀表板進行可視化操作,基本步驟是“選擇圖表類型——選擇指標和維度——拖拽到指定坐標軸——美化細節(jié)”,比如我想要創(chuàng)建一張可視化地圖,首先要先選擇圖表類型為“區(qū)域地圖”,然后要選擇指標和維度,但是原數(shù)據(jù)表里沒有地理緯度,因此需要自己創(chuàng)建:

Python+BI怎么爬取車厘子數(shù)據(jù)

最后,我們再拖拽到指定坐標軸,然后美化細節(jié)就可以完成一張可視化地圖了:

Python+BI怎么爬取車厘子數(shù)據(jù)

以此類推,其他的可視化圖表也能夠按照我們自己的需求進行制作,這里不詳細講了。

三、數(shù)據(jù)可視化

1、車厘子銷量分布情況

Python+BI怎么爬取車厘子數(shù)據(jù)

可以看出來國內(nèi)車厘子最大的銷量來自上海,以及浙江、廣東兩省,西藏、青海、內(nèi)蒙古等省份都沒有銷量,基本上來說沿海地區(qū)的銷量要高于內(nèi)陸。

2、各省份銷量情況

Python+BI怎么爬取車厘子數(shù)據(jù)

通過條形圖就更明顯了,上海的銷量有20多萬,幾乎是浙江、廣東、四川的總和。

3、各城市的銷量情況

Python+BI怎么爬取車厘子數(shù)據(jù)

篩選出了銷量前十的城市,以及每個城市平均的車厘子價格,可以看出來上海的銷量和價格都是最高的,可以看出上海的購買力有多強了;

4、車厘子的價格區(qū)間情況

Python+BI怎么爬取車厘子數(shù)據(jù)

數(shù)據(jù)表里將價格區(qū)間分為“50以下”、“50-100”、“100-150”、“150-200”、“200-500”、“500以上”等,可以看出來占比最大的價格區(qū)間是“50-100”,這應(yīng)該屬于平民價格了;值得注意的是“200-500”的價格占比也高于“100-150”。

5、各門店的銷量與價格情況

Python+BI怎么爬取車厘子數(shù)據(jù)

Python+BI怎么爬取車厘子數(shù)據(jù)

可以看出銷量最高的基本都是旗艦店,最高的平均價格基本在600-800左右

到此,關(guān)于“Python+BI怎么爬取車厘子數(shù)據(jù)”的學(xué)習就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習,快去試試吧!若想繼續(xù)學(xué)習更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI