溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

發(fā)布時(shí)間:2022-05-18 11:39:58 來源:億速云 閱讀:315 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”吧!

開發(fā)工具

Python版本:3.6.4
相關(guān)模塊:

requests模塊;

bs4模塊;

lxml模塊;

pyecharts模塊;

wordcloud模塊;

jieba模塊;

以及一些Python自帶的模塊。

環(huán)境搭建

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

數(shù)據(jù)爬取

目標(biāo)網(wǎng)站:

http://www.askci.com/reports/

需要爬取的數(shù)據(jù)如下圖所示:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

懶得動(dòng)腦子了,直接借助BeautifulSoup提取的這些數(shù)據(jù),簡(jiǎn)單粗暴,源代碼如下:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

完整源代碼詳見個(gè)人主頁或私信獲取相關(guān)文件中的Spider.py文件。

運(yùn)行效果截圖如下:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

All done~

數(shù)據(jù)分析

在數(shù)據(jù)爬取部分,我們共獲得了3573條A股公司數(shù)據(jù),下面我們就來簡(jiǎn)單地可視化分析一波吧~

首先讓我們來看看A股公司的區(qū)域分布吧:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

其中A股公司超過三百家的省份有:

  • 廣東

  • 北京

  • 浙江

  • 江蘇

接下來再來看看A股公司的收入情況吧:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

其中主營業(yè)業(yè)務(wù)收入TOP10為:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

再來看看A股公司的員工數(shù)量唄:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

再來看看A股公司的上市時(shí)間分布唄:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

其中,2013年上市的公司數(shù)量最少(2個(gè));2017年上市的公司數(shù)量最多(438個(gè))。

OK,要不我們?cè)賮砜纯碅股公司所在的行業(yè)類型占比TOP10吧:

怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)

到此,相信大家對(duì)“怎么用Python爬取并簡(jiǎn)單分析A股公司數(shù)據(jù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI