您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”吧!
數(shù)據(jù)獲取
美團(tuán)網(wǎng)很明顯是動(dòng)態(tài)網(wǎng)頁(yè),需要通過解析接口或用Selenium爬取,本文通過解析接口的方法爬取數(shù)據(jù)。
找到真實(shí)URL
美團(tuán)網(wǎng)URL:https://sz.meituan.com/
分析真實(shí)URL
主要參數(shù):
30:城市id(30代表深圳)
limit:每頁(yè)店鋪數(shù)量
offset:翻頁(yè)參數(shù)(每增加32翻頁(yè)一次)
q:關(guān)鍵字(本例為烤肉)
按上述接口爬取只能獲得1024個(gè)店鋪數(shù)據(jù),為了獲得更全面數(shù)據(jù),還需找到areaId參數(shù)(子地區(qū)),然后遍歷子地區(qū),即可獲得完整數(shù)據(jù)。限于篇幅,僅給出核心代碼。
刪除重復(fù)數(shù)據(jù)
df = df.drop_duplicates()
缺失值處理
由上文可知,僅聯(lián)系方式字段含有缺失值,用文本填充。
df = df.fillna('暫無數(shù)據(jù)')
店鋪地址清洗
通過店鋪地址字段截取所屬區(qū)縣,另外,“南澳大”屬于龍崗區(qū),直接用replace()方法替換。
描述性統(tǒng)計(jì)
1.查看基本統(tǒng)計(jì)量
df.describe()
3.繪制回歸圖
通過繪制回歸圖,我們發(fā)現(xiàn)人均消費(fèi)與店鋪評(píng)分具有正相關(guān),評(píng)論人數(shù)和店鋪評(píng)分具有正相關(guān)。這與我們的常識(shí)也較為接近。
本文數(shù)據(jù)可視化主要用到pyecharts庫(kù),它能輕松實(shí)現(xiàn)酷炫的圖表效果。
地區(qū)分布
深圳烤肉店主要分布在龍崗區(qū)、龍華區(qū)、南山區(qū)和福田區(qū),鹽田區(qū)和坪山區(qū)烤肉店較少??救獾甑倪x址一個(gè)重要因素就是人流量,龍崗區(qū)和龍華區(qū)為深圳主要的生活居住區(qū),而南山區(qū)和福田區(qū)為深圳的核心商業(yè)聚集地,巨大的需求為烤肉店的布局奠定了基礎(chǔ)。
所在商圈
僅僅知道烤肉店行政區(qū)分布,對(duì)于烤肉店選址作用其實(shí)不大。于是,我們進(jìn)一步細(xì)化到商圈,看看哪些商圈的烤肉店較多。在深圳所有商圈中,龍華區(qū)的民治和龍華、光明區(qū)的公明烤肉店數(shù)量都超過了150家。
到此,相信大家對(duì)“Python怎么爬取美團(tuán)烤肉商家數(shù)據(jù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。