溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python制作詞云圖代碼實(shí)例

發(fā)布時(shí)間:2020-08-19 18:50:21 來(lái)源:腳本之家 閱讀:690 作者:wx5d72071a58c07 欄目:開(kāi)發(fā)技術(shù)

詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關(guān)鍵詞。下面是詞云圖的python代碼~

#導(dǎo)入需要模塊
import jieba
import numpy as np 
import matplotlib.pyplot as plt 
from PIL import Image 
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

text_road=str(input('請(qǐng)輸入文章的路徑:'))
picture_road=str(input('請(qǐng)輸入圖片的路徑:'))

#加載需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()

#對(duì)文章進(jìn)行分詞
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)

#讀取照片通過(guò)numpy.array函數(shù)將照片等結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為np-array
mask=np.array(Image.open(picture_road))

#選擇屏蔽詞,不顯示在詞云里面
stopwords = set(STOPWORDS)
#可以加多個(gè)屏蔽詞
stopwords.add("<br/>")

#創(chuàng)建詞云對(duì)象
wc = WordCloud(
    background_color="white",
    font_path='/Library/Fonts/Arial Unicode.ttf',
    max_words=1000, # 最多顯示詞數(shù)
    mask=mask, 
    stopwords=stopwords,
    max_font_size=100 # 字體最大值
    )

#生成詞云
wc.generate(text)

#從背景圖建立顏色方案
image_colors =ImageColorGenerator(mask) 

#將詞云顏色設(shè)置為背景圖方案
wc.recolor(color_func=image_colors) 

#顯示詞云
plt.imshow(wc,interpolation='bilinear')

#關(guān)閉坐標(biāo)軸
plt.axis("off")

#顯示圖像
plt.show()

#保存詞云
wc.to_file('詞云圖.png')

下面這張圖是我爬了阿里巴巴招聘網(wǎng)站上所有數(shù)據(jù)分析職位需求,生成的詞云圖,大家可以看看阿里對(duì)數(shù)據(jù)分析師的要求~

Python制作詞云圖代碼實(shí)例

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI