溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

R語言二元正態(tài)分布及雙變量相關(guān)分析的示例分析

發(fā)布時間:2021-11-22 09:58:48 來源:億速云 閱讀:497 作者:柒染 欄目:大數(shù)據(jù)

R語言二元正態(tài)分布及雙變量相關(guān)分析的示例分析,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

皮爾遜系數(shù)、斯皮爾曼系數(shù)、肯德爾系數(shù),這是我們在雙變量相關(guān)分析中經(jīng)常使用的三大相關(guān)系數(shù)。皮爾遜系數(shù)使用時有一個基本條件,兩變量應(yīng)滿足二元正態(tài)分布,否則建議選用斯皮爾曼相關(guān)系數(shù)。

所以,兩個連續(xù)數(shù)據(jù)相關(guān)分析前,我們有必要首先進(jìn)行多元(二元)正態(tài)分布的檢驗。R語言中,我們可以使用mvnormtest包中的mshapiro.test函數(shù)完成。

案例數(shù)據(jù):雇員數(shù)據(jù)

本號后臺回復(fù)【雇員】下載案例數(shù)據(jù)。

R語言二元正態(tài)分布及雙變量相關(guān)分析的示例分析

二元正態(tài)分布檢驗  

現(xiàn)在我想考察一下初始薪金和當(dāng)前薪金間的相關(guān)性,  首先來做二元正態(tài)分布檢驗。

     
   
   
   mydata <- t(employee[,6:7])

mshapiro.test函數(shù)的參數(shù)U要求是每行是變量,每列是個案,因此我們需要t函數(shù)做行列轉(zhuǎn)置。

     
   
   
   library(mvnormtest)  
    
    mshapiro.test(mydata)

來看結(jié)果:

Shapiro-Wilk normality test
data:  Z
W = 0.70689, p-value < 2.2e-16

多元正態(tài)分布的  原假設(shè)是服從正態(tài)分布,經(jīng)過檢驗發(fā)現(xiàn),p-value <0.001,顯然有理由拒絕原假設(shè),說明這兩個變量數(shù)據(jù)不服從二元正態(tài)分布。

此時皮爾遜相關(guān)系數(shù)是不合適的,那我們就  用斯皮爾曼系數(shù)來反映初始薪金和當(dāng)前薪金的相關(guān)性。

R雙變量相關(guān)分析  

     
   
   
   cor.test(x=employee$salbegin,y=employee$salary,method = "spearman")

來看結(jié)果:

Spearman's rank correlation rho
data:  employee[, 6] and employee[, 7]
S = 3090197, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
0.8258977  

斯皮爾曼顯著性檢驗 p-value <0.001,通過檢驗,說明存在相關(guān)性,有統(tǒng)計學(xué)意義。二者的相關(guān)程度如何呢?

斯皮爾曼相關(guān)系數(shù)r=0.826,  說明當(dāng)前薪金和起始薪金間存在較強(qiáng)的正向相關(guān)性。

看完上述內(nèi)容,你們掌握R語言二元正態(tài)分布及雙變量相關(guān)分析的示例分析的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI