<address id="wasfd"><sub id="wasfd"><thead id="wasfd"></thead></sub></address>

<abbr id="wasfd"><video id="wasfd"></video></abbr>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

發(fā)布時間：2022-01-17 10:44:34 來源：億速云閱讀：849 作者：柒染欄目：大數(shù)據(jù)

今天就跟大家聊聊有關(guān)多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結(jié)了以下內(nèi)容，希望大家根據(jù)這篇文章可以有所收獲。

RobustRankAggreg包在各種數(shù)據(jù)挖掘文章里面亮相的頻次之高，無需我多言，大家可以去查看一下引用它的文獻，基本上都是GEO數(shù)據(jù)庫挖掘文章：

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

RobustRankAggreg文章

比如發(fā)表在peerJ的BIOINFORMATICS AND GENOMICS的文章Identification of key candidate genes and biological pathways in bladder cancer 里面的：

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

4個GEO數(shù)據(jù)集

作者把這4個數(shù)據(jù)集，分別獨立走差異分析，火山圖，熱圖等等標準流程，基本上讀一下我在生信技能樹的表達芯片的公共數(shù)據(jù)庫挖掘系列推文就明白了；

解讀GEO數(shù)據(jù)存放規(guī)律及下載，一文就夠
解讀SRA數(shù)據(jù)庫規(guī)律一文就夠
從GEO數(shù)據(jù)庫下載得到表達矩陣一文就夠
GSEA分析一文就夠（單機版+R語言版）
根據(jù)分組信息做差異分析- 這個一文不夠的
差異分析得到的結(jié)果注釋一文就夠

你也可以很輕松的分析這幾個數(shù)據(jù)集：GSE7476, GSE13507, GSE37815 and GSE65635 ，然后作者就使用了RobustRankAggreg包對這4個數(shù)據(jù)集的差異分析結(jié)果進行整合，如下：

The integrated DEGs were screened using the RRA package (corrected P < 0.05, logFC > 1 or ?logFC < ?1).
The RRA method is based on the assumption that each gene in each dataset is randomly arranged.
If the gene ranks high in all datasets, the associated P-value is lower, the possibility of differential gene expression is greater.
Through rank analysis, 343 integrated DEGs, consisting of 111 upregulated genes and 232 downregulated genes, were identified by the RRA method

并且把top20的上調(diào)基因和下調(diào)基因的差異倍數(shù)進行熱圖可視化，如下：

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

top20的上調(diào)基因和下調(diào)基因的差異倍數(shù)進行熱圖可視化

當(dāng)然了，不僅僅是mRNA的表達芯片，其它，比如circRNA芯片也是如此，同樣是發(fā)表于2018的文章：A circRNA–miRNA–mRNA network identification for exploring underlying pathogenesis and therapy strategy of hepatocellular carcinoma

就是下載了3個GEO數(shù)據(jù)集，走差異分析，并且使用RobustRankAggreg包進行整合，最后僅僅是確定了6個circRNA。

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

circRNA芯片整合

幾百篇文章我們就不用一一解讀啦，反正都是獨立的數(shù)據(jù)集自己做自己的差異分析，然后把多個數(shù)據(jù)集的差異基因拿去使用RobustRankAggreg包進行整合。

RobustRankAggreg包說明書

這個RobustRankAggreg包超級簡單，有意思的是居然并不在bioconductor列表哦，可能是因為它最開始并不是為生物信息學(xué)領(lǐng)域的數(shù)據(jù)分析而創(chuàng)造的吧！因為不在bioconductor，所以它的示例教程一塌糊涂，需要一點背景才能理解。其重點就是aggregateRanks函數(shù)而已：

options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
# https://bioconductor.org/packages/release/bioc/html/GEOquery.html
if (!requireNamespace("BiocManager", quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("RobustRankAggreg",ask = F,update = F) 
library(RobustRankAggreg)
?aggregateRanks

一般來說，正常R包的函數(shù)，都是可以通過問號來調(diào)取其幫助文檔的，aggregateRanks函數(shù)也不例外。我們直接看一下示例代碼：

set.seed(1234567)
glist <- list(sample(letters, 4), sample(letters, 10), sample(letters, 12))
freq=as.data.frame(table(unlist(glist)))
# Aggregate the inputs
ag=aggregateRanks(glist = glist, N = length(letters))
ag$Freq=freq[match(ag$Name,freq$Var1),2]

的確是超級簡單，可以看到，我們有26個字母，假設(shè)是26個基因，然后做了3次隨機抽樣，假設(shè)是3個數(shù)據(jù)集的差異分析，拿到的上調(diào)基因，列表如下：

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

值得注意的是，每次抽樣，得到的字母列表的順序也是有意義的哦。我們的多次數(shù)據(jù)集差異分析結(jié)果，也制作成為這樣的表格即可哈！

然后直接使用aggregateRanks函數(shù)即可，得到的數(shù)據(jù)結(jié)果如下：

多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析

可以看到，a這個字母在3次隨機抽樣都抽到了，所以它的 exact p-value 非常小，就是統(tǒng)計學(xué)非常顯著啦！

然后，其余的出現(xiàn)了兩次的字母就比較多了，它們的得分之所以有區(qū)別，就在于它們的排序。

n和g都是出現(xiàn)兩次，而且排名很靠前，所以p值是0.19，馬馬虎虎
k出現(xiàn)了兩次，q出現(xiàn)一次，而且都有一個在各自的抽樣場合排名第一，k的另外一次在最后面所以權(quán)重很低，所以p值是0.33，很差了。
至于e和y，雖然也是出現(xiàn)了兩次，但是都排名超級靠后，所以p值也很辣雞，接近于1了。

aggregateRanks函數(shù)其實就是對多個排好序的基因集，進行求交集的同時還考慮一下它們的排序情況?？傮w上來說，就是挑選那些在多個數(shù)據(jù)集都表現(xiàn)差異的基因，并且每次差異都排名靠前的那些。

看完上述內(nèi)容，你們對多個數(shù)據(jù)集整合神器RobustRankAggreg包的示例分析有進一步的了解嗎？如果還想了解更多知識或者相關(guān)內(nèi)容，請關(guān)注億速云行業(yè)資訊頻道，感謝大家的支持。

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
數(shù)據(jù)庫審計是什么
下一篇新聞：
Python如何實現(xiàn)多項式回歸

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<span id="jcgeo"></span>