溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

發(fā)布時(shí)間:2021-11-25 11:48:25 來源:億速云 閱讀:150 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”吧!

數(shù)據(jù)獲取

美團(tuán)網(wǎng)很明顯是動(dòng)態(tài)網(wǎng)頁(yè),需要通過解析接口或用Selenium爬取,本文通過解析接口的方法爬取數(shù)據(jù)。

找到真實(shí)URL

美團(tuán)網(wǎng)URL:https://sz.meituan.com/

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

分析真實(shí)URL

主要參數(shù):

  • 30:城市id(30代表深圳)

  • limit:每頁(yè)店鋪數(shù)量

  • offset:翻頁(yè)參數(shù)(每增加32翻頁(yè)一次)

  • q:關(guān)鍵字(本例為烤肉)

按上述接口爬取只能獲得1024個(gè)店鋪數(shù)據(jù),為了獲得更全面數(shù)據(jù),還需找到areaId參數(shù)(子地區(qū)),然后遍歷子地區(qū),即可獲得完整數(shù)據(jù)。限于篇幅,僅給出核心代碼。

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

刪除重復(fù)數(shù)據(jù)

df = df.drop_duplicates()

缺失值處理

由上文可知,僅聯(lián)系方式字段含有缺失值,用文本填充。

df = df.fillna('暫無數(shù)據(jù)')

店鋪地址清洗

通過店鋪地址字段截取所屬區(qū)縣,另外,“南澳大”屬于龍崗區(qū),直接用replace()方法替換。

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

描述性統(tǒng)計(jì)

1.查看基本統(tǒng)計(jì)量

df.describe()

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

3.繪制回歸圖

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

通過繪制回歸圖,我們發(fā)現(xiàn)人均消費(fèi)與店鋪評(píng)分具有正相關(guān),評(píng)論人數(shù)和店鋪評(píng)分具有正相關(guān)。這與我們的常識(shí)也較為接近。

數(shù)據(jù)分析

本文數(shù)據(jù)可視化主要用到pyecharts庫(kù),它能輕松實(shí)現(xiàn)酷炫的圖表效果。

地區(qū)分布

深圳烤肉店主要分布在龍崗區(qū)、龍華區(qū)、南山區(qū)和福田區(qū),鹽田區(qū)和坪山區(qū)烤肉店較少??救獾甑倪x址一個(gè)重要因素就是人流量,龍崗區(qū)和龍華區(qū)為深圳主要的生活居住區(qū),而南山區(qū)和福田區(qū)為深圳的核心商業(yè)聚集地,巨大的需求為烤肉店的布局奠定了基礎(chǔ)。

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

所在商圈

僅僅知道烤肉店行政區(qū)分布,對(duì)于烤肉店選址作用其實(shí)不大。于是,我們進(jìn)一步細(xì)化到商圈,看看哪些商圈的烤肉店較多。在深圳所有商圈中,龍華區(qū)的民治和龍華、光明區(qū)的公明烤肉店數(shù)量都超過了150家。

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)

到此,相信大家對(duì)“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI