溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

發(fā)布時間:2021-11-23 16:35:52 來源:億速云 閱讀:439 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要講解了“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”吧!

獲取土地數(shù)據(jù)

土地市場數(shù)據(jù)一般會公示在當(dāng)?shù)氐?strong>公共資源交易中心,但經(jīng)常會出現(xiàn)只公示當(dāng)周或當(dāng)月數(shù)據(jù)的情況,因此,我們可以去找專業(yè)的土地網(wǎng)站獲取交易數(shù)據(jù)。

本文以土流網(wǎng)為例,這個網(wǎng)站結(jié)構(gòu)簡單,簡單的url翻頁構(gòu)造,然后用xpath解析數(shù)據(jù)即可。限于篇幅,爬蟲代碼不做贅述,僅提供核心代碼。

def main():
    for page in range(1,46):   #這里設(shè)置頁數(shù)
        url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page)
        print(url)
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',
        }
        response = requests.request("GET", url, headers = headers)
        #print(response.status_code)
        if response.status_code == 200:
            re = response.content.decode('utf-8')
            print("正在提取第" + str(page) + "頁")
            time.sleep(random.uniform(1,2))
            print("-" * 80)
            # print(re)
            parse = etree.HTML(re)  #解析網(wǎng)頁
            items = parse.xpath('.//div[@class="land-l-cont"]/dl')
            parse_page(items)
            if len(items) < 10:  
                print('獲取完成')
                break


if __name__ == '__main__':
    time.sleep(random.uniform(1,2))
    main()

運(yùn)行爬蟲代碼,提取到廣州1238塊土地數(shù)據(jù)。以下為簡單清洗后部分?jǐn)?shù)據(jù):

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

分析土地數(shù)據(jù)

土地成交狀態(tài)

近10年廣州土地招拍掛成交情況

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規(guī)劃建筑面積僅為77.30萬㎡。2017年以后成交規(guī)模開始步入高潮,2018年成交規(guī)劃建筑面積達(dá)到1635.50萬㎡。

2019年以來廣州土地招拍掛成交面積(萬㎡)

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

近10年來廣州成交土地主要以工業(yè)用地、其他用地和住宅用地為主,工業(yè)用地占比高達(dá)41.19%,這也是廣州工業(yè)企業(yè)發(fā)達(dá)的重要動因。

土地成交區(qū)域

近10年廣州各區(qū)土地招拍掛成交面積(萬㎡)

從成交區(qū)域來看,南沙區(qū)和番禺區(qū)各年都有一定土地成交,越秀區(qū)和天河區(qū)成交土地較少。2020年以來,南沙區(qū)土地市場火熱,成交面積遠(yuǎn)高于廣州其他地區(qū)。

廣州房產(chǎn)市場分析

房產(chǎn)市場分析主要包括新房和二手房交易市場,由于一般的房產(chǎn)信息發(fā)布平臺二手房數(shù)量遠(yuǎn)大于新房,為盡可能獲取更大樣本數(shù)據(jù),提高分析的準(zhǔn)確性,本文以廣州二手房成交數(shù)據(jù)進(jìn)行房產(chǎn)市場分析。

獲取二手房數(shù)據(jù)

本文通過Python獲取房天下公布的廣州二手房成交數(shù)據(jù)。房天下的爬蟲也較為簡單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當(dāng)遍歷完一個子地區(qū)后跳轉(zhuǎn)下一個子地區(qū)的處理。以下給出核心代碼:

def main():
    #增城a080;番禺a(chǎn)078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075
    district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075']  #地區(qū)
    for district in district_list:
        for page in range(1,101):   #這里設(shè)置頁數(shù)
            url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page)
            print(url)
            headers = {
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',
            }
            response = requests.request("GET", url, headers = headers)
            if response.status_code == 200:
                re = response.content.decode('utf-8')
                print("正在提取" + district +'第' + str(page) + "頁")
                time.sleep(random.uniform(1,2))
                print("-" * 80)
                # print(re)
                parse = etree.HTML(re)  # 解析網(wǎng)頁
                items = parse.xpath('.//div[@name="div_houselist"]/dl')
                parse_page(items)
                if len(items) < 30:  #遍歷完子地區(qū)后跳轉(zhuǎn)
                    print('獲取完成')
                    break

if __name__ == '__main__':
    time.sleep(random.uniform(1,2))
    main()

代碼運(yùn)行幾分鐘就提取下22170套廣州二手房數(shù)據(jù),簡單清洗后部分?jǐn)?shù)據(jù)展示如下:

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

分析二手房數(shù)據(jù)

量價走勢

近5年廣州二手房量價走勢

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

2020年1月至6月,廣州二手房均價與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產(chǎn)市場向好,6月份成交二手房1337套。

房價分布

2020年上半年廣州各區(qū)二手房均價(元/㎡)

怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場

從樓盤成交來看,2020年1月至6月廣州二手房成交數(shù)量最多的樓盤為位于增城區(qū)的錦繡天倫花園,共計成交78套,成交均價為18565.40元/㎡。

相關(guān)性分析

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
%matplotlib inline
sns.set_style('white')   #設(shè)置圖形背景樣式為白色
df = pd.read_excel("D:\data\地產(chǎn)數(shù)據(jù)分析\廣州二手房.xlsx")
df = df[['室','廳','面積(㎡)','層數(shù)','成交單價(元/㎡)']] #選擇需要的列
df.rename(columns={'室': 'room', '廳': 'hall', '面積(㎡)': 'area', '層數(shù)': 'floor', '成交單價(元/㎡)': 'price'}, inplace=True)
fig,axes=plt.subplots(1,2,figsize=(12,5))
sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0])
sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])

感謝各位的閱讀,以上就是“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI