您好,登錄后才能下訂單哦!
詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關(guān)鍵詞。下面是詞云圖的python代碼~
#導(dǎo)入需要模塊
import jieba
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_road=str(input('請(qǐng)輸入文章的路徑:'))
picture_road=str(input('請(qǐng)輸入圖片的路徑:'))
#加載需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()
#對(duì)文章進(jìn)行分詞
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)
#讀取照片通過(guò)numpy.array函數(shù)將照片等結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為np-array
mask=np.array(Image.open(picture_road))
#選擇屏蔽詞,不顯示在詞云里面
stopwords = set(STOPWORDS)
#可以加多個(gè)屏蔽詞
stopwords.add("<br/>")
#創(chuàng)建詞云對(duì)象
wc = WordCloud(
background_color="white",
font_path='/Library/Fonts/Arial Unicode.ttf',
max_words=1000, # 最多顯示詞數(shù)
mask=mask,
stopwords=stopwords,
max_font_size=100 # 字體最大值
)
#生成詞云
wc.generate(text)
#從背景圖建立顏色方案
image_colors =ImageColorGenerator(mask)
#將詞云顏色設(shè)置為背景圖方案
wc.recolor(color_func=image_colors)
#顯示詞云
plt.imshow(wc,interpolation='bilinear')
#關(guān)閉坐標(biāo)軸
plt.axis("off")
#顯示圖像
plt.show()
#保存詞云
wc.to_file('詞云圖.png')
下面這張圖是我爬了阿里巴巴招聘網(wǎng)站上所有數(shù)據(jù)分析職位需求,生成的詞云圖,大家可以看看阿里對(duì)數(shù)據(jù)分析師的要求~
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。