您好,登錄后才能下訂單哦!
這篇文章將為大家詳細(xì)講解有關(guān)python 如何實(shí)現(xiàn)判斷一組數(shù)據(jù)是否符合正態(tài)分布,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。
正態(tài)分布:
若隨機(jī)變量x服從有個(gè)數(shù)學(xué)期望為μ,方差為σ2 的正態(tài)分布,記為N(μ,σ)
其中期望值決定密度函數(shù)的位置,標(biāo)準(zhǔn)差決定分布的幅度,當(dāng)υ=0,σ=0 時(shí)的正態(tài)分布是標(biāo)準(zhǔn)正態(tài)分布
判斷方法有畫圖/k-s檢驗(yàn)
畫圖:
#導(dǎo)入模塊 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline #構(gòu)造一組隨機(jī)數(shù)據(jù) s = pd.DataFrame(np.random.randn(1000)+10,columns = ['value']) #畫散點(diǎn)圖和直方圖 fig = plt.figure(figsize = (10,6)) ax1 = fig.add_subplot(2,1,1) # 創(chuàng)建子圖1 ax1.scatter(s.index, s.values) plt.grid() ax2 = fig.add_subplot(2,1,2) # 創(chuàng)建子圖2 s.hist(bins=30,alpha = 0.5,ax = ax2) s.plot(kind = 'kde', secondary_y=True,ax = ax2) plt.grid()
結(jié)果如下:
使用ks檢驗(yàn):
#導(dǎo)入scipy模塊 from scipy import stats """ kstest方法:KS檢驗(yàn),參數(shù)分別是:待檢驗(yàn)的數(shù)據(jù),檢驗(yàn)方法(這里設(shè)置成norm正態(tài)分布),均值與標(biāo)準(zhǔn)差 結(jié)果返回兩個(gè)值:statistic → D值,pvalue → P值 p值大于0.05,為正態(tài)分布 H0:樣本符合 H1:樣本不符合 如何p>0.05接受H0 ,反之 """ u = s['value'].mean() # 計(jì)算均值 std = s['value'].std() # 計(jì)算標(biāo)準(zhǔn)差 stats.kstest(s['value'], 'norm', (u, std))
結(jié)果是KstestResult(statistic=0.01441344628501079, pvalue=0.9855029319675546),p值大于0.05為正太分布
關(guān)于python 如何實(shí)現(xiàn)判斷一組數(shù)據(jù)是否符合正態(tài)分布就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。