您好,登錄后才能下訂單哦!
這篇文章主要講解了“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”吧!
土地市場數(shù)據(jù)一般會公示在當(dāng)?shù)氐?strong>公共資源交易中心,但經(jīng)常會出現(xiàn)只公示當(dāng)周或當(dāng)月數(shù)據(jù)的情況,因此,我們可以去找專業(yè)的土地網(wǎng)站獲取交易數(shù)據(jù)。
本文以土流網(wǎng)為例,這個網(wǎng)站結(jié)構(gòu)簡單,簡單的url翻頁構(gòu)造,然后用xpath解析數(shù)據(jù)即可。限于篇幅,爬蟲代碼不做贅述,僅提供核心代碼。
def main(): for page in range(1,46): #這里設(shè)置頁數(shù) url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) #print(response.status_code) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取第" + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) #解析網(wǎng)頁 items = parse.xpath('.//div[@class="land-l-cont"]/dl') parse_page(items) if len(items) < 10: print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
運(yùn)行爬蟲代碼,提取到廣州1238塊土地數(shù)據(jù)。以下為簡單清洗后部分?jǐn)?shù)據(jù):
土地成交狀態(tài)
近10年廣州土地招拍掛成交情況
2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規(guī)劃建筑面積僅為77.30萬㎡。2017年以后成交規(guī)模開始步入高潮,2018年成交規(guī)劃建筑面積達(dá)到1635.50萬㎡。
2019年以來廣州土地招拍掛成交面積(萬㎡)
近10年來廣州成交土地主要以工業(yè)用地、其他用地和住宅用地為主,工業(yè)用地占比高達(dá)41.19%,這也是廣州工業(yè)企業(yè)發(fā)達(dá)的重要動因。
土地成交區(qū)域
近10年廣州各區(qū)土地招拍掛成交面積(萬㎡)
從成交區(qū)域來看,南沙區(qū)和番禺區(qū)各年都有一定土地成交,越秀區(qū)和天河區(qū)成交土地較少。2020年以來,南沙區(qū)土地市場火熱,成交面積遠(yuǎn)高于廣州其他地區(qū)。
房產(chǎn)市場分析主要包括新房和二手房交易市場,由于一般的房產(chǎn)信息發(fā)布平臺二手房數(shù)量遠(yuǎn)大于新房,為盡可能獲取更大樣本數(shù)據(jù),提高分析的準(zhǔn)確性,本文以廣州二手房成交數(shù)據(jù)進(jìn)行房產(chǎn)市場分析。
本文通過Python獲取房天下公布的廣州二手房成交數(shù)據(jù)。房天下的爬蟲也較為簡單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當(dāng)遍歷完一個子地區(qū)后跳轉(zhuǎn)下一個子地區(qū)的處理。以下給出核心代碼:
def main(): #增城a080;番禺a(chǎn)078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075 district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075'] #地區(qū) for district in district_list: for page in range(1,101): #這里設(shè)置頁數(shù) url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取" + district +'第' + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) # 解析網(wǎng)頁 items = parse.xpath('.//div[@name="div_houselist"]/dl') parse_page(items) if len(items) < 30: #遍歷完子地區(qū)后跳轉(zhuǎn) print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
代碼運(yùn)行幾分鐘就提取下22170套廣州二手房數(shù)據(jù),簡單清洗后部分?jǐn)?shù)據(jù)展示如下:
量價走勢
近5年廣州二手房量價走勢
2020年1月至6月,廣州二手房均價與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產(chǎn)市場向好,6月份成交二手房1337套。
房價分布
2020年上半年廣州各區(qū)二手房均價(元/㎡)
從樓盤成交來看,2020年1月至6月廣州二手房成交數(shù)量最多的樓盤為位于增城區(qū)的錦繡天倫花園,共計成交78套,成交均價為18565.40元/㎡。
相關(guān)性分析
import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns %matplotlib inline sns.set_style('white') #設(shè)置圖形背景樣式為白色 df = pd.read_excel("D:\data\地產(chǎn)數(shù)據(jù)分析\廣州二手房.xlsx") df = df[['室','廳','面積(㎡)','層數(shù)','成交單價(元/㎡)']] #選擇需要的列 df.rename(columns={'室': 'room', '廳': 'hall', '面積(㎡)': 'area', '層數(shù)': 'floor', '成交單價(元/㎡)': 'price'}, inplace=True) fig,axes=plt.subplots(1,2,figsize=(12,5)) sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0]) sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])
感謝各位的閱讀,以上就是“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。