您好,登錄后才能下訂單哦!
本篇文章為大家展示了R語言計(jì)算一組數(shù)據(jù)的置信區(qū)間并畫密度圖進(jìn)行可視化展示的示例分析,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
我看了StatQuest 介紹置信區(qū)間的那一期視頻,大體理解了,但是讓我用語言表述出來,還有點(diǎn)不知道如何表達(dá)。本來B站可以直接看StatQuest的視頻的,今天看到B站的up主發(fā)消息說StatQuest的原作者準(zhǔn)備入駐B站了,所以他把原來獲得授權(quán)的那些視頻全都刪掉了。所以要在B站看這些視頻還要等一陣子了。
今天的主要內(nèi)容來自 How to Calculate Confidence Interval in R : Statistics in R : Data Sharkie
計(jì)算置信區(qū)間用到的函數(shù)是CI()
函數(shù),來自R語言包Rmisc
R語言包Rmisc
第一次使用需要先安裝
install.packages("Rmisc")
計(jì)算某組數(shù)據(jù)均值95%的置信區(qū)間
x<-iris$Sepal.Length
library(Rmisc)
CI(x,ci=0.95)
返回的結(jié)果是
> CI(x,ci=0.95)
upper mean lower
5.976934 5.843333 5.709732
前面提到的參考鏈接里有一句話
Logically, as you increase the sample size, the closer is the value of a sample parameter to a population parameter, therefore the narrower the confidence interval gets. 樣本越大,樣本的均值越接近總體的均值,所以均值的置信區(qū)間就會(huì)越窄
ggplot2畫密度分布圖按取值范圍填充不同的顏色
下面使用ggplot2畫密度圖展示并且展示均值95%的置信區(qū)間
#install.packages("Rmisc")
library(Rmisc)
x<-iris$Sepal.Length
library(Rmisc)
x1<-CI(x,ci=0.95)
class(x1[1])
dat<-with(density(x),data.frame(x,y))
dat1<-dat[dat$x>x1[3]&dat$x<x1[1],]
library(ggplot2)
ggplot(iris,aes(Sepal.Length))+
geom_density(fill="grey")+
geom_vline(xintercept = x1[1],lty="dashed")+
geom_vline(xintercept = x1[3],lty="dashed")+
geom_area(data=dat1,aes(x=x,y=y),fill="red")+
geom_vline(xintercept = x1[2],lty="dashed")+
scale_y_continuous(expand = c(0,0),
limits = c(0,0.41))+
theme_minimal()
上述內(nèi)容就是R語言計(jì)算一組數(shù)據(jù)的置信區(qū)間并畫密度圖進(jìn)行可視化展示的示例分析,你們學(xué)到知識或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識儲備,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。