溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何用Python詞云分析政府工作報(bào)告關(guān)鍵詞

發(fā)布時(shí)間:2020-07-22 09:13:01 來源:億速云 閱讀:295 作者:小豬 欄目:開發(fā)技術(shù)

小編這次要給大家分享的是如何用Python詞云分析政府工作報(bào)告關(guān)鍵詞,文章內(nèi)容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

前言

十三屆全國(guó)人大三次會(huì)議作了政府工作報(bào)告。這份政府工作報(bào)告僅有10500字左右,據(jù)悉是改革開放40年以來最短的一次。受到疫情影響,今年的兩會(huì)會(huì)議適當(dāng)縮短,政府工作報(bào)告也大幅壓縮,體現(xiàn)了“實(shí)干為要”的理念。那么,這份政府工作報(bào)告突出強(qiáng)調(diào)了哪些關(guān)鍵詞呢?我們其實(shí)可以基于Python技術(shù)進(jìn)行詞頻分析和詞云制作!

import matplotlib.pyplot as plt#繪圖庫(kù)
import jieba
from wordcloud import WordCloud

# 讀入文本數(shù)據(jù)
fp = open(r'D:\爬蟲下載\2020年政府工作報(bào)告.txt','r',encoding='utf-8')
content = fp.read()
# print(content)
#分詞
words = jieba.lcut(content)
# 詞頻分析操作
data = {}
for word in words:
  if len(word)>1:
    if word in data:
      data[word]+=1
    else:
      data[word]=1
# print(data)

#排序
hist = list(data.items())#轉(zhuǎn)成列表
hist.sort(key=lambda x:x[1],reverse=True)
# print(hist)

#調(diào)試輸出
for i in range(20):
  # print(hist[i])
  print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左對(duì)齊10,右對(duì)齊5個(gè)長(zhǎng)度

下表統(tǒng)計(jì)了今年的政府工作報(bào)告中出現(xiàn)次數(shù)最多的幾個(gè)關(guān)鍵詞。我們可以看到,今年的政府工作報(bào)告中提到“發(fā)展”的次數(shù)最多,一共出現(xiàn)了69次,“發(fā)展”一直都是政府工作報(bào)告中的重要關(guān)鍵詞;其次是“就業(yè)”,出現(xiàn)了39次,足以顯示新冠疫情之下就業(yè)問題的嚴(yán)峻性,以及黨中央、國(guó)務(wù)院對(duì)就業(yè)問題的高度重視,政府工作報(bào)告中沒有提出全年經(jīng)濟(jì)增速的具體目標(biāo),但仍然提出了就業(yè)目標(biāo)——城鎮(zhèn)新增就業(yè)900萬人以上、城鎮(zhèn)調(diào)查失業(yè)率6%左右、城鎮(zhèn)登記失業(yè)率5.5%左右;第三多的就是“疫情”,報(bào)告中多次提到疫情防控工作,并指出這次新冠肺炎疫情,是新中國(guó)成立以來我國(guó)遭遇的傳播速度最快、感染范圍最廣、防控難度最大的公共衛(wèi)生事件。

如何用Python詞云分析政府工作報(bào)告關(guān)鍵詞

“企業(yè)”作為市場(chǎng)經(jīng)濟(jì)的主體,出現(xiàn)的次數(shù)達(dá)到了30次,要想保障就業(yè)和民生,必須穩(wěn)住上億市場(chǎng)主體,盡力幫助企業(yè)特別是中小微企業(yè)、個(gè)體工商戶渡過難關(guān),報(bào)告提出要加大宏觀政策實(shí)施力度,著力穩(wěn)企業(yè)保就業(yè)。還有“支持”、“保障”、“加強(qiáng)”、“推進(jìn)”等鼓舞人心的關(guān)鍵詞出現(xiàn)次數(shù)也很多,相信大家看到政府工作報(bào)告中滿滿的政策“干貨”,信心和底氣也會(huì)更足了。

根據(jù)關(guān)鍵詞的出現(xiàn)次數(shù),我們可以使用Python繪制出政府工作報(bào)告詞云圖。Python的詞云功能相當(dāng)強(qiáng)大,你可以自己設(shè)定形狀、字體、大小!

result = ' '.join(words)
# print(result)
#生成詞云
wc = WordCloud(
  font_path=r'D:\PPT\ppt字體\思源宋體SC-Regular.otf',
  background_color = 'white',#背景顏色
  width=500,#圖片的寬
  height=300,
  max_font_size=50,
  min_font_size=12
)
wc.generate(result)
wc.to_file(r'.\wordcloud.png')#保存圖片
#顯示圖片
plt.figure('政府工作報(bào)告')
plt.imshow(wc)
plt.axis('off')#關(guān)閉坐標(biāo)軸
plt.show()

如何用Python詞云分析政府工作報(bào)告關(guān)鍵詞

看完這篇關(guān)于如何用Python詞云分析政府工作報(bào)告關(guān)鍵詞的文章,如果覺得文章內(nèi)容寫得不錯(cuò)的話,可以把它分享出去給更多人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI