您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“Python數(shù)據(jù)可視化基礎(chǔ)舉例分析”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“Python數(shù)據(jù)可視化基礎(chǔ)舉例分析”吧!
matplotlib
python中最基本的作圖庫(kù)就是matplotlib,是一個(gè)最基礎(chǔ)的Python可視化庫(kù),一般都是從matplotlib上手Python數(shù)據(jù)可視化,然后開(kāi)始做縱向與橫向拓展。
Seaborn
是一個(gè)基于matplotlib的高級(jí)可視化效果庫(kù),針對(duì)的點(diǎn)主要是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的變量特征選取,seaborn可以用短小的代碼去繪制描述更多維度數(shù)據(jù)的可視化效果圖。
其他庫(kù)還包括
Bokeh(是一個(gè)用于做瀏覽器端交互可視化的庫(kù),實(shí)現(xiàn)分析師與數(shù)據(jù)的交互)
Mapbox(處理地理數(shù)據(jù)引擎更強(qiáng)的可視化工具庫(kù))等等
本篇文章主要使用matplotlib進(jìn)行案例分析
確定問(wèn)題,選擇圖形
業(yè)務(wù)可能很復(fù)雜,但是經(jīng)過(guò)拆分,我們要找到我們想通過(guò)圖形表達(dá)什么具體問(wèn)題。
在python中,我們可以總結(jié)為以下四種基本視覺(jué)元素來(lái)展現(xiàn)圖形:
點(diǎn):scatter plot 二維數(shù)據(jù),適用于簡(jiǎn)單二維關(guān)系
線:line plot 二維數(shù)據(jù),適用于時(shí)間序列
柱狀:bar plot 二維數(shù)據(jù),適用于類別統(tǒng)計(jì)
顏色:heatmap 適用于展示第三維度
數(shù)據(jù)間存在分布,構(gòu)成,比較,聯(lián)系以及變化趨勢(shì)等關(guān)系。對(duì)應(yīng)不一樣的關(guān)系,選擇相應(yīng)的圖形進(jìn)行展示。
轉(zhuǎn)換數(shù)據(jù),應(yīng)用函數(shù)
數(shù)據(jù)分析和建模方面的大量編程工作都是用在數(shù)據(jù)準(zhǔn)備的基礎(chǔ)上的:加載、清理、轉(zhuǎn)換以及重塑。我們可視化步驟也需要對(duì)數(shù)據(jù)進(jìn)行整理,轉(zhuǎn)換成我們需要的格式再套用可視化方法完成作圖。
下面是一些常用的數(shù)據(jù)轉(zhuǎn)換方法:
合并:merge,concat,combine_frist(類似于數(shù)據(jù)庫(kù)中的全外連接)
重塑:reshape;軸向旋轉(zhuǎn):pivot(類似excel數(shù)據(jù)透視表)
去重:drop_duplicates
映射:map
填充替換:fillna,replace
重命名軸索引:rename
將分類變量轉(zhuǎn)換‘啞變量矩陣’的get_dummies函數(shù)以及在df中對(duì)某列數(shù)據(jù)取限定值等等
函數(shù)則根據(jù)第一步中選擇好的圖形,去找python中對(duì)應(yīng)的函數(shù)。
參數(shù)設(shè)置,一目了然
原始圖形畫(huà)完后,我們可以根據(jù)需求修改顏色(color),線型(linestyle),標(biāo)記(maker)或者其他圖表裝飾項(xiàng)標(biāo)題(Title),軸標(biāo)簽(xlabel,ylabel),軸刻度(set_xticks),還有圖例(legend)等,讓圖形更加直觀。
第三步是在第二步的基礎(chǔ)上,為了使圖形更加清晰明了,做的修飾工作。具體參數(shù)都可以在制圖函數(shù)中找到。
下面,我總結(jié)了實(shí)現(xiàn)可視化會(huì)用到的一些基礎(chǔ)知識(shí)
Matplotlib
#導(dǎo)入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt
Figure和Subplot
matplotlib的圖形都位于Figure(畫(huà)布)中,Subplot創(chuàng)建圖像空間。不能通過(guò)figure繪圖,必須用add_subplot創(chuàng)建一個(gè)或多個(gè)subplot。
figsize可以指定圖像尺寸。
#創(chuàng)建畫(huà)布 fig = plt.figure() <Figure size 432x288 with 0 Axes> #創(chuàng)建subplot,221表示這是2行2列表格中的第1個(gè)圖像。 ax1 = fig.add_subplot(221) #但現(xiàn)在更習(xí)慣使用以下方法創(chuàng)建畫(huà)布和圖像,2,2表示這是一個(gè)2*2的畫(huà)布,可以放置4個(gè)圖像 fig , axes = plt.subplots(2,2,sharex=True,sharey=True) #plt.subplot的sharex和sharey參數(shù)可以指定所有的subplot使用相同的x,y軸刻度。
利用Figure的subplots_adjust方法可以調(diào)整間距。
subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None)
#創(chuàng)建畫(huà)布 fig = plt.figure() <Figure size 432x288 with 0 Axes> #創(chuàng)建subplot,221表示這是2行2列表格中的第1個(gè)圖像。 ax1 = fig.add_subplot(221) #但現(xiàn)在更習(xí)慣使用以下方法創(chuàng)建畫(huà)布和圖像,2,2表示這是一個(gè)2*2的畫(huà)布,可以放置4個(gè)圖像 fig , axes = plt.subplots(2,2,sharex=True,sharey=True) #plt.subplot的sharex和sharey參數(shù)可以指定所有的subplot使用相同的x,y軸刻度。
顏色color,標(biāo)記marker,和線型linestyle
matplotlib的plot函數(shù)接受一組X和Y坐標(biāo),還可以接受一個(gè)表示顏色和線型的字符串縮寫(xiě):'g--',表示顏色是綠色green,線型是'--'虛線。也可以使用參數(shù)明確的指定。
線型圖還可以加上一些標(biāo)記(marker),來(lái)突出顯示數(shù)據(jù)點(diǎn)的位置。標(biāo)記也可以放在格式字符串中,但標(biāo)記類型和線型必須放在顏色后面。
plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o') [<matplotlib.lines.Line2D at 0x8c919b0>]
刻度,標(biāo)簽和圖例
plt的xlim、xticks和xtickslabels方法分別控制圖表的范圍和,刻度位置和刻度標(biāo)簽。調(diào)用方法時(shí)不帶參數(shù),則返回當(dāng)前的參數(shù)值;調(diào)用時(shí)帶參數(shù),則設(shè)置參數(shù)值。
plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o') plt.xlim() #不帶參數(shù)調(diào)用,顯示當(dāng)前參數(shù); #可將xlim替換為另外兩個(gè)方法試試 (-1.4500000000000002, 30.45)
plt.plot(np.random.randn(30),color='g',linestyle='--',marker='o') plt.xlim([0,15]) #橫軸刻度變成0-15 (0, 15)
設(shè)置標(biāo)題,軸標(biāo)簽,刻度以及刻度標(biāo)簽
fig = plt.figure();ax = fig.add_subplot(1,1,1) ax.plot(np.random.randn(1000).cumsum()) ticks = ax.set_xticks([0,250,500,750,1000]) #設(shè)置刻度值 labels = ax.set_xticklabels(['one','two','three','four','five']) #設(shè)置刻度標(biāo)簽 ax.set_title('My first Plot') #設(shè)置標(biāo)題 ax.set_xlabel('Stage') #設(shè)置軸標(biāo)簽 Text(0.5,0,'Stage')
添加圖例
圖例legend是另一種用于標(biāo)識(shí)圖標(biāo)元素的重要工具。可以在添加subplot的時(shí)候傳入label參數(shù)。
fig = plt.figure(figsize=(12,5));ax = fig.add_subplot(111) ax.plot(np.random.randn(1000).cumsum(),'k',label='one') #傳入label參數(shù),定義label名稱 ax.plot(np.random.randn(1000).cumsum(),'k--',label='two') ax.plot(np.random.randn(1000).cumsum(),'k.',label='three') #圖形創(chuàng)建完后,只需要調(diào)用legend參數(shù)將label調(diào)出來(lái)即可。 ax.legend(loc='best') #要求不是很嚴(yán)格的話,建議使用loc=‘best’參數(shù)來(lái)讓它自己選擇最佳位置 <matplotlib.legend.Legend at 0xa8f5a20>
注解
除標(biāo)準(zhǔn)的圖表對(duì)象之外,我們還可以自定義添加一些文字注解或者箭頭。
注解可以通過(guò)text,arrow和annotate等函數(shù)進(jìn)行添加。text函數(shù)可以將文本繪制在指定的x,y坐標(biāo)位置,還可以進(jìn)行自定義格式
plt.plot(np.random.randn(1000).cumsum()) plt.text(600,10,'test ',family='monospace',fontsize=10) #中文注釋在默認(rèn)環(huán)境下并不能正常顯示,需要修改配置文件,使其支持中文字體。具體步驟請(qǐng)自行搜索。
保存圖表到文件
利用plt.savefig可以將當(dāng)前圖表保存到文件。例如,要將圖表保存為png文件,可以執(zhí)行
plt.savefig('figpath.png')
文件類型是根據(jù)拓展名而定的。其他參數(shù)還有:
fname含有文件路徑的字符串,拓展名指定文件類型
dpi分辨率,默認(rèn)100facecolor,edgcolor 圖像的背景色,默認(rèn)‘w’白色
format顯示設(shè)置文件格式('png','pdf','svg','ps','jpg'等)
bbox_inches: 圖表需要保留的部分。如果設(shè)置為“tight”,則將嘗試剪除圖像周圍的空白部分
plt.savefig('./plot.jpg') #保存圖像為plot名稱的jpg格式圖像 <Figure size 432x288 with 0 Axes>
到此,相信大家對(duì)“Python數(shù)據(jù)可視化基礎(chǔ)舉例分析”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。