您好,登錄后才能下訂單哦!
這篇文章主要介紹python之matplotlib和pandas繪圖的操作,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
Python是一種編程語(yǔ)言,內(nèi)置了許多有效的工具,Python幾乎無(wú)所不能,該語(yǔ)言通俗易懂、容易入門、功能強(qiáng)大,在許多領(lǐng)域中都有廣泛的應(yīng)用,例如最熱門的大數(shù)據(jù)分析,人工智能,Web開發(fā)等。
不得不說(shuō)使用python庫(kù)matplotlib繪圖確實(shí)比較丑,但使用起來(lái)還算是比較方便,做自己的小小研究可以使用。這里記錄一些統(tǒng)計(jì)作圖方法,包括pandas作圖和plt作圖。
前提是先導(dǎo)入第三方庫(kù)吧
import pandas as pd import matplotlib.pyplot as plt import numpy as np
然后以下這兩句用于正常顯示中文標(biāo)簽什么的。
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來(lái)正常顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False # 用來(lái)正常顯示負(fù)號(hào)
當(dāng)然還有一些最基本的步驟:
plt.xticks(x,xtk,size=12,rotation=50) #設(shè)置字體大小和字體傾斜度 plt.xlabel(u'城市') # x軸標(biāo)簽 plt.ylabel(u'數(shù)量') plt.title(u'朋友所在城市') # 圖的名稱 plt.legend() # 正常顯示標(biāo)題 plt.show() # 顯示圖像 plt.close() # 繪圖后養(yǎng)成習(xí)慣性的關(guān)掉
對(duì)于pandas中的二維數(shù)據(jù)框,可以直接作圖(Series類型),簡(jiǎn)單的折線圖或者曲線圖如下:
sdata.plot(color='r', style='-o') plt.show()
如果沒(méi)有用pandas,直接作曲線圖,可以這樣寫:
plot(x,y, color ='blue', linewidth=2.5, line)
rects1=plt.bar( #(x,data) 就是所要畫的二維數(shù)據(jù) left=x, #x 是X坐標(biāo)軸數(shù)據(jù),即每個(gè)塊的x軸起始位置 height=data, #data是Y坐標(biāo)軸的數(shù)據(jù),即每個(gè)塊的y軸高度 width=[0.1,0.2,0.3], #每一個(gè)塊的顯示寬度 bottom=[1,2,3], #每一個(gè)塊的底部高度 color='y', #塊的顏色 edgecolor='g', #塊的邊界顏色 linewidth=2, #塊的線條寬度 xerr=1, #x軸誤差bar yerr=1, #y軸誤差bar ecolor='r', #誤差bar的顏色 capsize=1, #誤差bar的線條寬度 orientation='vertical', #塊的方向 (horizontal,vertical) align="center", #塊的位置 (center, left, right) hold=None ) plt.show()
plot2=plt.pie(data, # 每個(gè)餅塊的實(shí)際數(shù)據(jù),如果大于1,會(huì)進(jìn)行歸一化,計(jì)算percentage explode=[0.0,0.1,0.2], # 每個(gè)餅塊離中心的距離 colors=['y','r','g'], # 每個(gè)餅塊的顏色 labels=['women','men','unknown'], # 每個(gè)餅塊的標(biāo)簽 labeldistance=1.2, # 每個(gè)餅塊標(biāo)簽到中心的距離 autopct='%1.1f%%', # 百分比的顯示格式 pctdistance=0.4, # 百分比到中心的距離 shadow=True, # 每個(gè)餅塊是否顯示陰影 startangle=0, # 默認(rèn)從x軸正半軸逆時(shí)針起 radius=1.0 # 餅塊的半徑 ) plt.axis('equal') # 顯示為圓形,避免比例壓縮為橢圓 plt.show()
數(shù)據(jù)樣例如下,名稱為va,類型為Series,左邊為職位名稱,右邊為數(shù)量:
sales 4140 technical 2720 support 2229 IT 1227 product_mng 902 marketing 858 RandD 787 accounting 767 hr 739 management 630
作圖:
fr = pd.Series(va.values.cumsum() / va.values.sum()) va.plot(kind='bar') fr.plot(color='r',secondary_y=True, style='-o') plt.annotate(format(fr[7], '.2%'), xy=(7, fr[7]), xytext=(7*0.9, fr[7]*0.9), arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=.2')) # 用于注釋圖形指標(biāo) # plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來(lái)正常顯示中文標(biāo)簽 # plt.rcParams['axes.unicode_minus'] = False # 用來(lái)正常顯示負(fù)號(hào) # plt1 = plt.pie(va.values, # labels=va.index, # autopct='%1.1f%%') plt.xticks(rotation=50) # 設(shè)置字體大小和字體傾斜度 plt.show()
左邊為出現(xiàn)的頻率,右邊為累積百分比(這里數(shù)據(jù)以降序排列較好,便于直觀地觀察),效果如下:
在pandas中,曲線圖可以直接畫,比如data中有多個(gè)屬性,可以直接使用data.plot()。使用plt,若各個(gè)屬性需要共用XY軸,那么可以重復(fù)plot即可。
使用pandas畫箱型圖簡(jiǎn)單方便,但是注釋比較麻煩,可以用annotate添加異常點(diǎn)的注釋。若使用之前的數(shù)據(jù)va,則先創(chuàng)建二維數(shù)據(jù)框再畫圖。如果有多個(gè)列為數(shù)字類型,那么可以畫每個(gè)列的箱型圖,這里只有一列數(shù)據(jù),如下:
pd.DataFrame(va).boxplot() plt.show()
使用plt直接進(jìn)行作圖:
plt.boxplot(data,labels=[], sym='o',whis=1.5)
其中,data可以是一維的,也可多維,若為多維則lables為每一維度的標(biāo)簽。sym為異常值的形狀,whis為調(diào)節(jié)垂直線段的長(zhǎng)度。效果如下:
使用plt:
plt.subplot(221) plt.plot(x, y1,'r-', lw=2) plt.subplot(222) plt.plot(x,y2)
使用pandas:
data.plot(subplots=True, color=['r','b'], style=['-o','-']) plt.show()
排版方式有不同,pandas是垂直排列,plt可以自己指定位置。pandas效果如下:
補(bǔ)充:Python DataFrame 多條件篩選 使用&
我就廢話不多說(shuō)了,大家還是直接看代碼吧~
DF6 Out[42]: B C D 0 1 B 10.750 1 3 C 8.875 2 2 T 58.000 3 2 L 57.000 4 3 Y 46.000
DF6[(DF6.B>1) & (DF6.D > 10)]
Out[45]: B C D 2 2 T 58.0 3 2 L 57.0 4 3 Y 46.0
以上是“python之matplotlib和pandas繪圖的操作”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。