您好,登錄后才能下訂單哦!
詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關(guān)鍵詞。下面是詞云圖的python代碼~
#導(dǎo)入需要模塊 import jieba import numpy as np import matplotlib.pyplot as plt from PIL import Image from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator text_road=str(input('請(qǐng)輸入文章的路徑:')) picture_road=str(input('請(qǐng)輸入圖片的路徑:')) #加載需要分析的文章 text = open(text_road,'r',encoding='utf-8').read() #對(duì)文章進(jìn)行分詞 wordlist_after_jieba = jieba.cut(text, cut_all=False) wl_space_split = " ".join(wordlist_after_jieba) #讀取照片通過(guò)numpy.array函數(shù)將照片等結(jié)構(gòu)數(shù)據(jù)轉(zhuǎn)化為np-array mask=np.array(Image.open(picture_road)) #選擇屏蔽詞,不顯示在詞云里面 stopwords = set(STOPWORDS) #可以加多個(gè)屏蔽詞 stopwords.add("<br/>") #創(chuàng)建詞云對(duì)象 wc = WordCloud( background_color="white", font_path='/Library/Fonts/Arial Unicode.ttf', max_words=1000, # 最多顯示詞數(shù) mask=mask, stopwords=stopwords, max_font_size=100 # 字體最大值 ) #生成詞云 wc.generate(text) #從背景圖建立顏色方案 image_colors =ImageColorGenerator(mask) #將詞云顏色設(shè)置為背景圖方案 wc.recolor(color_func=image_colors) #顯示詞云 plt.imshow(wc,interpolation='bilinear') #關(guān)閉坐標(biāo)軸 plt.axis("off") #顯示圖像 plt.show() #保存詞云 wc.to_file('詞云圖.png')
下面這張圖是我爬了阿里巴巴招聘網(wǎng)站上所有數(shù)據(jù)分析職位需求,生成的詞云圖,大家可以看看阿里對(duì)數(shù)據(jù)分析師的要求~
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。