您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python爬蟲(chóng)爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”,在日常操作中,相信很多人在Python爬蟲(chóng)爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”P(pán)ython爬蟲(chóng)爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
利用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)。讓我們愉塊地開(kāi)始吧~
requests模塊;
bs4模塊;
lxml模塊;
pyecharts模塊;
wordcloud模塊;
jieba模塊;
以及一些Python自帶的模塊。
安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。
目標(biāo)網(wǎng)站:
http://www.askci.com/reports/
需要爬取的數(shù)據(jù)如下圖所示:
懶得動(dòng)腦子了,直接借助BeautifulSoup提取的這些數(shù)據(jù),簡(jiǎn)單粗暴,源代碼如下:
完整源代碼詳見(jiàn)個(gè)人主頁(yè)或私信獲取相關(guān)文件中的Spider.py文件。
運(yùn)行效果截圖如下:
All done~
在數(shù)據(jù)爬取部分,我們共獲得了3573條A股公司數(shù)據(jù),下面我們就來(lái)簡(jiǎn)單地可視化分析一波吧~
首先讓我們來(lái)看看A股公司的區(qū)域分布吧:
其中A股公司超過(guò)三百家的省份有:
廣東
北京
浙江
江蘇
接下來(lái)再來(lái)看看A股公司的收入情況吧:
其中主營(yíng)業(yè)業(yè)務(wù)收入TOP10為:
再來(lái)看看A股公司的員工數(shù)量唄:
再來(lái)看看A股公司的上市時(shí)間分布唄:
其中,2013年上市的公司數(shù)量最少(2個(gè));2017年上市的公司數(shù)量最多(438個(gè))。
OK,要不我們?cè)賮?lái)看看A股公司所在的行業(yè)類(lèi)型占比TOP10吧:
Emmmm,很真實(shí)。
到此,關(guān)于“Python爬蟲(chóng)爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。