溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么在R語(yǔ)言中嵌套list

發(fā)布時(shí)間:2021-04-17 15:34:40 來(lái)源:億速云 閱讀:826 作者:Leah 欄目:開發(fā)技術(shù)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)怎么在R語(yǔ)言中嵌套list,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

第一步:

生成data set的函數(shù)已經(jīng)給出了。20個(gè)數(shù)據(jù)就是run20次~因?yàn)槭请S機(jī)生成的,最后得到的每個(gè)data set都不相同。然后把這20個(gè)數(shù)據(jù)集都存在一個(gè)list里~

art2 <- function(){
  x1 <- rnorm(20)
  y1 <- rnorm(20)
  x2 <- rnorm(20,mean=10)
  y2 <- rnorm(20)
  x3 <- runif(100,-20,30)
  y3 <- runif(100,20,40)
  clusterdata2 <- cbind(c(x1,x2,x3),c(y1,y2,y3))
  cvec <- c(rep(1,20),rep(2,20),rep(3,100))
  out <- list(data=clusterdata2,cvec=cvec)
  out
}
datasets<-list()
for (i in 1:20){
  datasets[[i]]<- art2()
}

為什么我的datasets要包兩層,是[[i]]? 其實(shí)這里就有l(wèi)ist的嵌套了??次以谏傻暮瘮?shù)里已經(jīng)有一個(gè)list,里面包含兩個(gè)元素,一個(gè)是$data:生成的原始數(shù)據(jù);另一個(gè)是$cvec:原始數(shù)據(jù)對(duì)應(yīng)的實(shí)際分類。所以我想要個(gè)大的list把這20個(gè)list都包含在內(nèi),就得來(lái)個(gè)嵌套~兩個(gè)框框——[[i]]就是兩層?。ㄎ覄倓偼蝗幌氲絒[[i]]]會(huì)不會(huì)是三層???。。我沒試過(guò)也,因?yàn)槊總€(gè)循環(huán)都是新增一層list,不會(huì)直接增兩層,不然有層為空就會(huì)報(bào)錯(cuò),哎呦我表述好難,先繼續(xù)往下吧~~

p.s. 如果想要提取第5次生成的結(jié)果,就datasets[[5]],當(dāng)然這里面還包含兩個(gè)元素:原始數(shù)據(jù)數(shù)據(jù)和實(shí)際分類。如果想提取里面的原始數(shù)據(jù)數(shù)據(jù),就datasets[[5]]$data,想提取里面的實(shí)際分類,則是datasets[[5]]$cvec。想提取全部20次的結(jié)果:直接datasets。如果!想要提取20次結(jié)果里的原始數(shù)據(jù),就沒那么直接了。得用for循環(huán)從1~20來(lái)一個(gè)datasets[[i]]$dat逐一取出來(lái)。這個(gè)應(yīng)該很好理解,因?yàn)樾ist里是包含兩種元素,外面嵌套list的才是重復(fù)20次。

第二步:

然后就是對(duì)這個(gè)大的datasets運(yùn)行K-means,K=2~10。這里有兩個(gè)循環(huán),一個(gè)是我首先要把datasets從1~20走一遍,然后里面每個(gè)data set我都要從K=2~10計(jì)算K-means的結(jié)果。for循環(huán)很好寫,具體的框架大致就是這樣:”???“ 的地方是需要思考滴

for (k in 2:10){
  for (i in 1:20){
    ???<- kmeans(datasets[[i]]$data,k,nstart=50)
    ???
  }
}

K-means的語(yǔ)句里同時(shí)包含了i和k,所以這個(gè)結(jié)果會(huì)是一個(gè)嵌套的list。照我這樣寫for循環(huán),里面那層就是i=1~20,外面那層是k=2~10。所以是當(dāng)k=2時(shí),把20個(gè)data sets循環(huán)一遍,然后k=3,再循環(huán)……直到k=10。所以我們要先保存固定k時(shí)的i=1~20的run出來(lái)的結(jié)果,第一個(gè)"???" 就得包括i,并且跟k無(wú)關(guān)。而且因?yàn)閗means的結(jié)果返回的個(gè)list,里面包含了各種元素:$cluster, $size,等等。所以這跟上面datasets的保存一樣,得是[[i]],兩層!

第一個(gè)"???"已經(jīng)解決了,假設(shè)是ks[[i]], 保存了當(dāng)k固定時(shí)循環(huán)i=1~20的結(jié)果?,F(xiàn)在我們要循環(huán)k=2~10,等于在列表ks的外面再嵌套一個(gè)list,是關(guān)于k循環(huán)的,跟i已經(jīng)沒什么關(guān)系了。所以下一個(gè)"???" 就得是kmean[[k]]<-ks。

結(jié)果就是這樣的~

kmean <- list()
ks <- list()
for (k in 2:10){
  for (i in 1:20){
    ks[[i]] <- kmeans(datasets[[i]]$data,k,nstart=50)
    kmean[[k]]<-ks
  }
}

現(xiàn)在講講怎么提取里面的數(shù)值。kmean是一個(gè)三層的list。最外面那層是跟k有關(guān)的,中間那層是跟i有關(guān),里面那層是K-means的output作為一個(gè)list。

所以kmean[[k]], k=2~10, 是當(dāng)k=k時(shí)20次K-means的結(jié)果。

如果想取k=2,第5個(gè)data sets的K-means結(jié)果,就是kmean[[2]][[5]],如果想取k=4,第1個(gè)data sets的K-means得到的分類結(jié)果cluster:kmean[[4]][[1]]$cluster。

Done!這是我個(gè)人在實(shí)際操作過(guò)程中的一個(gè)總結(jié),所以如果有什么問(wèn)題歡迎一起來(lái)討論~

Further studying——

在factorial experiment design里我們經(jīng)常會(huì)考慮多個(gè)factors因子,每個(gè)因子考慮幾個(gè)levels。算了我直接拿我的例子來(lái)講好了。。。在我最近做的事情里,要生成像開頭一樣的分類數(shù)據(jù)generate random clusters。

因?yàn)槭且蜃訉?shí)驗(yàn)設(shè)計(jì),所以我考慮了三個(gè)因子:(1) the number of clusters 每個(gè)data中有幾個(gè)群組,像開頭的例子就有3個(gè),這里我定的level是2,3,5; (2) the number of points in each cluster每群組里有多少點(diǎn) ,定的level是25,100,225; and (3) the degree of separation群組和群組之間相隔的遠(yuǎn)還是近,函數(shù)里面有個(gè)sepVal可以定義,我定的是0.01和0.021; 最后是重復(fù)2遍。把所有結(jié)果存到一個(gè)list里

感覺講得不太清楚T T。??创a吧!我想表達(dá)的意思就是無(wú)論考慮多少個(gè)因子,list會(huì)新增多少層,只要按照上面的方法一層層疊加就好了!重點(diǎn)是搞清楚每次層代表的含義,還有明白怎么樣取出想要的值~

cluster<-c(2,3,5)
point<-c(25,100,225)
sepval<-c(0.01,0.21)
repl<-2
 
#Eq=1:the number of points in each cluster is the same.
 
t<-list()
gen<-list()
Eq1<-list()
for (i in 1:3){
  for (j in 1:3){
    for (k in 1:2){
      t[[k]] <- genRandomClust(numClust=cluster[i], sepVal=sepval[k], numNonNoisy=2,
                               numNoisy=0, numOutlier=0, numReplicate=repl, fileName="Eq1",
                               clustszind=1,
                               clustSizeEq=point[j],
                               outputDatFlag=F,
                               outputLogFlag=F,
                               outputEmpirical=F,
                               outputInfo=F)
      gen[[j]]<-t
      Eq1[[i]]<-gen
    }
  }
}
 
#Eq1[[i]][[j]][[k]]
#Eq1[[i]][[j]][[k]]$datList[[1]]:rep1
#Eq1[[i]][[j]][[k]]$datList[[2]]:rep2

補(bǔ)充:如何從嵌套很多層的列表中直接取出所有數(shù)值

給定列表

s = [[[[[[1, 1]], [[9, 1]]], [[5, 1]]], [[[3, 1]], [[7, 1]]]], [[[[2, 1]], [[6, 1]]], [[[4, 1]], [[8, 1]]]]]
s[0] 是 [[[[[1, 1]], [[9, 1]]], [[5, 1]]], [[[3, 1]], [[7, 1]]]]
s[1] 是 [[[[2, 1]], [[6, 1]]], [[[4, 1]], [[8, 1]]]]

每一個(gè)外層列表都包含2個(gè)子列表不停往下嵌套,并且s[0] 比s[1] 多嵌套一層

解決方案

方法1

轉(zhuǎn)字符串之后使用replace替換掉不需要的值,例如

b = str(s).replace('[', '').replace(']', '').replace(' ', '').split(',')
for m,n in enumerate(b):
    if m%2 == 0:
        result.append(int(n))

這里根據(jù)需求刪掉了每一個(gè)最里層列表的第二維的值

方法2

優(yōu)美一點(diǎn)的解法是用遞歸去取值

def flat(nums):
    res = []
    for i in nums:
        if isinstance(i, list):
            res.extend(flat(i))
        else:
            res.append(i)
    return res
result = flat(s)

結(jié)果:

[1, 1, 9, 1, 5, 1, 3, 1, 7, 1, 2, 1, 6, 1, 4, 1, 8, 1]

去掉多余的1之后和下面的結(jié)果一致

結(jié)果:

result

Out[157]: [1, 9, 5, 3, 7, 2, 6, 4, 8]

上述就是小編為大家分享的怎么在R語(yǔ)言中嵌套list了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI