溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

R語言如何實(shí)現(xiàn)檢驗(yàn)多重共線性的操作

發(fā)布時(shí)間:2021-04-02 10:05:43 來源:億速云 閱讀:1372 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下R語言如何實(shí)現(xiàn)檢驗(yàn)多重共線性的操作,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

函數(shù)kappa()

df<-data.frame()
df_cor=cor(df)
kappa(df_cor, exact=T)

當(dāng) κ<100κ<100 , 說明共線性程度??;

當(dāng) 100<κ<1000100<κ<1000 , 有較強(qiáng)的多重共線性;

當(dāng) κ>1000κ>1000,存在嚴(yán)重的多重共線性。

函數(shù)qr()

x<-matrix()
qr(x)$rank

qr(X)$rank 計(jì)算X矩陣的秩,如果不是滿秩的,說明其中有xixi可以用其他xjxj的線性組合表示;此時(shí)可以進(jìn)行逐步回歸,用step()命令。

fm<-lm()
step(fm)

補(bǔ)充:多重共線性的產(chǎn)生原因、判別、檢驗(yàn)、解決方法

最近做回歸分析,出現(xiàn)了相關(guān)系數(shù)與回歸方程系數(shù)符號(hào)相反的問題,經(jīng)過研究,確認(rèn)是多重共線性問題并探索了解決方法。

在此將多重共線性的相關(guān)知識(shí)整理如下。

解釋變量理論上的高度相關(guān)與觀測值高度相關(guān)沒有必然關(guān)系,有可能兩個(gè)解釋變量理論上高度相關(guān),但觀測值未必高度相關(guān),反之亦然。所以多重共線性本質(zhì)上是數(shù)據(jù)問題。

造成多重共線性的原因有一下幾種:

1、解釋變量都享有共同的時(shí)間趨勢;

2、一個(gè)解釋變量是另一個(gè)的滯后,二者往往遵循一個(gè)趨勢;

3、由于數(shù)據(jù)收集的基礎(chǔ)不夠?qū)?,某些解釋變量可能?huì)一起變動(dòng);

4、某些解釋變量間存在某種近似的線性關(guān)系;

判別:

1、發(fā)現(xiàn)系數(shù)估計(jì)值的符號(hào)不對(duì);

2、某些重要的解釋變量t值低,而R方不低

3、當(dāng)一不太重要的解釋變量被刪除后,回歸結(jié)果顯著變化;

檢驗(yàn):

1、相關(guān)性分析,相關(guān)系數(shù)高于0.8,表明存在多重共線性;但相關(guān)系數(shù)低,并不能表示不存在多重共線性;

2、vif檢驗(yàn);

3、條件系數(shù)檢驗(yàn);

解決方法:

1、增加數(shù)據(jù);

2、對(duì)模型施加某些約束條件;

3、刪除一個(gè)或幾個(gè)共線變量;

4、將模型適當(dāng)變形;

5、主成分回歸

處理多重共線性的原則:

1、 多重共線性是普遍存在的,輕微的多重共線性問題可不采取措施;

2、 嚴(yán)重的多重共線性問題,一般可根據(jù)經(jīng)驗(yàn)或通過分析回歸結(jié)果發(fā)現(xiàn)。如影響系數(shù)符號(hào),重要的解釋變量t值很低。要根據(jù)不同情況采取必要措施。

3、 如果模型僅用于預(yù)測,則只要擬合程度好,可不處理多重共線性問題,存在多重共線性的模型用于預(yù)測時(shí),往往不影響預(yù)測結(jié)果;

看完了這篇文章,相信你對(duì)“R語言如何實(shí)現(xiàn)檢驗(yàn)多重共線性的操作”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI