溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何利用Python生成詞云

發(fā)布時(shí)間:2021-07-21 09:21:10 來(lái)源:億速云 閱讀:227 作者:chen 欄目:大數(shù)據(jù)

這篇文章主要介紹“如何利用Python生成詞云”,在日常操作中,相信很多人在如何利用Python生成詞云問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”如何利用Python生成詞云”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

前言:

       話說(shuō),在這個(gè)大數(shù)據(jù)時(shí)代,獲取信息顯得極為容易,可正是如此,我們想要對(duì)信息進(jìn)行直觀地了解難度就大了。

Excel是一個(gè)很好的數(shù)據(jù)可視化方法,不過(guò)有時(shí)候我們的數(shù)據(jù)來(lái)源可能并不是一張或者多張Excel表格,這樣子的話如果我們想利用Excel進(jìn)行數(shù)據(jù)可視化就顯得不是那么容易。

首先我們需要逐個(gè)將數(shù)據(jù)導(dǎo)入到Excel中,然后再用Excel的圖表對(duì)數(shù)據(jù)進(jìn)行可視化分析。在信息量大的情況下,這么做顯然得不償失,我們只是想對(duì)數(shù)據(jù)進(jìn)行一個(gè)直觀的了解,為什么要搞得這么復(fù)雜呢?

以上的問(wèn)題是很多人會(huì)遇到的,因此一些數(shù)據(jù)可視化方式便應(yīng)運(yùn)而生,例如詞云。大家看看這張圖片

如何利用Python生成詞云

是不是非常直觀并且炫酷呢?

現(xiàn)在,想做出這樣子的圖片的小伙伴們,跟著我,我手把手教你們做出這樣子的詞云,這里的實(shí)現(xiàn)方法是使用Python中的相關(guān)庫(kù)

安裝方法如下

pip install matplotlibpip install numpypip install jieba

以上的三個(gè)命令的作用是分別安裝:matplotlib,numpy以及jieba這三個(gè)庫(kù)。當(dāng)然有些同學(xué)可能已經(jīng)安裝過(guò)了。想要檢驗(yàn)是否有安裝,可以在命令行下輸入

pip list

這樣子即可顯示你已經(jīng)安裝的庫(kù),如果沒(méi)有全部出現(xiàn)上面的3個(gè)庫(kù),請(qǐng)?jiān)?strong>命令行下執(zhí)行對(duì)應(yīng)的命令并且等待安裝成功。

如果你沒(méi)有安裝Python或者輸入pip顯示不是內(nèi)部命令,請(qǐng)移步這篇文章

Python小白環(huán)境搭建-開(kāi)箱即用

現(xiàn)在直接上代碼,代碼上面有注釋,相信你一定能看懂

# worcloud是生成詞云的關(guān)鍵import wordcloud# numpy是一個(gè)強(qiáng)大的科學(xué)計(jì)算庫(kù),我們將用它來(lái)把PIL庫(kù)打開(kāi)的圖片保存為數(shù)組import numpy as np# PIL是一個(gè)圖像處理庫(kù),用來(lái)打開(kāi)圖片from PIL import Image# jieba是中文分詞庫(kù),可以智能地拆分詞語(yǔ)import jieba# matplotlib庫(kù)是一個(gè)繪圖庫(kù),可以用來(lái)顯示圖片以及繪制多種圖形import matplotlib.pyplot as plt
# 生成背景圖片的兩種方法## 注意背景圖片的路徑要寫對(duì),可以是完整路徑,例如C:/image/test.jpg# 若圖片與Python代碼在同一個(gè)文件夾,那可以直接寫圖片名稱+后綴,例如test.jpg# 1.使用 matplotlib庫(kù)讀取圖片bg_1=plt.imread("background_image_1.jpg")
# 2.使用numpy庫(kù)和PIL庫(kù),PIL庫(kù)用于打開(kāi)圖片,numpy庫(kù)用于將圖片轉(zhuǎn)化為數(shù)組# 下面這行代碼我注釋掉了# bg_2=np.array(Image.open('background_image_2.jpg'))
# 對(duì)于以上的圖片選擇,要特別注意圖片的背景應(yīng)該為白色

#配置詞云的背景,圖片,字體大小等參數(shù),# 也可以不配置,直接 wc=wordcloud.WordCloud()wc=wordcloud.WordCloud(  # font_path為字體文件的路徑,如果沒(méi)有這個(gè),那么生成的詞云圖片無(wú)法顯示中文  font_path="C:/Windows/Fonts/simfang.ttf",
 # scale為按比例放大或者縮小生成的圖片。例如1.5表示圖片放大為原來(lái)的1.5倍,可省略  scale=1.5,
 # mask表示背景圖片,如果不沒(méi)有背景圖片,那這個(gè)可以省略  mask=bg_1,
 # background_color為背景顏色,默認(rèn)為黑色,可以省略  background_color="black",
 # width為詞云生成的圖片寬度,默認(rèn)為400  width=600,
 # height為詞云生成的圖片高度,默認(rèn)為200  height=400,
 # max_words圖片上顯示的最大詞語(yǔ)的個(gè)數(shù)  max_words=1000,
 # max_font_size為最大字體的大小  max_font_size=120,
 # min_font_size為最小字體大小,默認(rèn)為4  min_font_size=4)
# 打開(kāi)要生成詞云的文件,一般是txt格式的純文本文檔with open('詞云來(lái)源.txt','r',encoding="utf-8") as f:
  # text=f.read()是說(shuō)讀取 詞云來(lái)源.txt 這個(gè)文件的所有內(nèi)容并存儲(chǔ)到變量text中  text=f.read()
 # 利用jieba庫(kù)把text拆分并且使用空格分隔拆分后的結(jié)果  spilt_text=" ".join(jieba.lcut(text))
print("正在生成詞云,預(yù)計(jì)時(shí)間35s......")
# 調(diào)用generate方法,傳入要生成詞云的文本
wc.generate(spilt_text)
# 把詞云保存成圖片wc.to_file('wordcloud.jpg')
print("生成完畢!")

背景圖片

如何利用Python生成詞云

詞云效果

如何利用Python生成詞云

到此,關(guān)于“如何利用Python生成詞云”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI