溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python中畫箱線圖的方法

發(fā)布時間:2020-08-06 13:56:11 來源:億速云 閱讀:446 作者:小新 欄目:編程語言

這篇文章將為大家詳細(xì)講解有關(guān)python中畫箱線圖的方法,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

一、箱線圖概念

箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖。

python中畫箱線圖的方法

計算過程:

(1)計算上四分位數(shù)(Q3),中位數(shù),下四分位數(shù)(Q1)

(2)計算上四分位數(shù)和下四分位數(shù)之間的差值,即四分位數(shù)差(IQR,interquartile range)Q3-Q1

(3)繪制箱線圖的上下范圍,上限為上四分位數(shù),下限為下四分位數(shù)。在箱子內(nèi)部中位數(shù)的位置繪制橫線。

(4)大于上四分位數(shù)1.5倍四分位數(shù)差的值,或者小于下四分位數(shù)1.5倍四分位數(shù)差的值,劃為異常值(outliers)。

(5)異常值之外,最靠近上邊緣和下邊緣的兩個值處,畫橫線,作為箱線圖的觸須。

(6)極端異常值,即超出四分位數(shù)差3倍距離的異常值,用實(shí)心點(diǎn)表示;較為溫和的異常值,即處于1.5倍-3倍四分位數(shù)差之間的異常值,用空心點(diǎn)表示。

(7)為箱線圖添加名稱,數(shù)軸等。

二、四分位數(shù)的計算

分位數(shù)根據(jù)其將數(shù)列等分的形式不同可以分為中位數(shù),四分位數(shù),十分位數(shù)、百分位數(shù)等等。四分位數(shù)作為分位數(shù)的一種形式,在統(tǒng)計中有著十分重要的意義和作用,而大多數(shù)的統(tǒng)計學(xué)原理教材只介紹其基本含義,對其具體計算,尤其是由組距數(shù)列計算都不作介紹,成為統(tǒng)計學(xué)原理教材中的空白。那么,如何根據(jù)數(shù)列計算四分位數(shù)呢?一般來講,視資料是否分組而定。

1、根據(jù)未分組的資料計算四分位數(shù)

第一步:確定四分位數(shù)的位置

python中畫箱線圖的方法

第二步:根據(jù)第一步所確定的四分位數(shù)的位置,確定其相應(yīng)的四分位數(shù)。

例1:某車間某月份的工人生產(chǎn)某產(chǎn)品的數(shù)量分別為13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,則三個四分位數(shù)的位置分別為:

python中畫箱線圖的方法

即變量數(shù)列中的第三個、第六個、第九個工人的某種產(chǎn)品產(chǎn)量分別為下四分位數(shù)、中位 數(shù)和上四分位數(shù)。即:
Q1 =13.8公斤、Q2=14.6公斤、Q3=15.2公斤

上例中(n+1)恰好為4的倍數(shù),所以確定四分?jǐn)?shù)較簡單,如果(n+1)不為4的整數(shù)倍數(shù),按上述分式計算出來的四分位數(shù)位置就帶有小數(shù),這時,有關(guān)的四分位數(shù)就應(yīng)該是與該小數(shù)相鄰的兩個整數(shù)位置上的標(biāo)志值的平均數(shù),權(quán)數(shù)的大小取決于兩個整數(shù)位置距離的遠(yuǎn)近,距離越近,權(quán)數(shù)越大,距離越遠(yuǎn),權(quán)數(shù)越小,權(quán)數(shù)之和等于1。

例2:某車間某月份的工人生產(chǎn)某產(chǎn)品的數(shù)量分別為13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,則三個四分位數(shù)的位置分別為:

python中畫箱線圖的方法

即變量數(shù)列中的第2.75項(xiàng)、第5.5項(xiàng)、第8.25項(xiàng)工人的某種產(chǎn)品產(chǎn)量分別為下四分位 數(shù)、中位數(shù)和上四分位數(shù)。即:

python中畫箱線圖的方法

在實(shí)際資料中,由于標(biāo)志值序列中的相鄰標(biāo)志值往往是相同的,因而不一定要通過計算才能得到有關(guān)的四分位數(shù)。

2、由組距式數(shù)列確定四分位數(shù)

第一步,向上或向下累計次數(shù).

第二步,根據(jù)累計次數(shù)確定四分位數(shù)的位置.

(1)當(dāng)采用向上累計次數(shù)的資料確定四分位數(shù)時,四分位數(shù)位置的公式是:

python中畫箱線圖的方法

(2)當(dāng)采用向下累計次數(shù)的資料確定四分位數(shù)時,四分位數(shù)位置的公式是:

python中畫箱線圖的方法

第三步,根據(jù)四分位數(shù)的位置算出各四分位數(shù).

(1)、當(dāng)累計次數(shù)是向上累計時,按下限公式計算各四分位數(shù).

python中畫箱線圖的方法

(2)、當(dāng)累計次數(shù)是向下累計時,按上限公式計算各四分位數(shù).

python中畫箱線圖的方法

例3:某企業(yè)職工按月工資的分組資料如下:

python中畫箱線圖的方法

根據(jù)上述資料確定某企業(yè)職工的月工資的三個四分位數(shù)如下:

(1)采用向上累計職工人數(shù)的資料得月工資四分位數(shù)的位置為:

(2)采用向下累計職工人數(shù)的資料得月工資四分位數(shù)的位置為:

3、異常值

python中畫箱線圖的方法

三、畫圖

# Python
import plotly.plotly
import plotly.graph_objs as go
data = [
    go.Box(
        y=[0, 1, 1, 2, 3, 5, 8, 13, 21]  # 9個數(shù)據(jù)
    )
]
plotly.offline.plot(data)  # 離線繪圖

python中畫箱線圖的方法

關(guān)于python中畫箱線圖的方法就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI