您好,登錄后才能下訂單哦!
本文小編為大家詳細介紹“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”,內(nèi)容詳細,步驟清晰,細節(jié)處理妥當,希望這篇“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。
使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析
Mfuzz是用來進行不同時間點轉(zhuǎn)錄組數(shù)據(jù)表達模式聚類分析的R包,使用起來非常方便,直接輸入不同樣本歸一化后的counts或者FPKM及TPM值就可進行聚類。輸入文件的格式很簡單:
行為基因,列為樣本,保存為制表符分隔的txt文件。
## 安裝R包 if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("Mfuzz") ## 加載R包 library("Mfuzz") ## 導入基因表達量 gene <- read.table("input.txt",header = T,row.names=1,sep="\t") ## 轉(zhuǎn)換格式 gene_tpm <- data.matrix(gene) eset <- new("ExpressionSet",exprs = gene_tpm) ## 過濾缺失超過25%的基因 gene.r <- filter.NA(eset, thres=0.25)
由于輸入的表達量中不允許有缺失值NA出現(xiàn),所以我們要填補缺失值。
## mean填補缺失 gene.f <- fill.NA(gene.r,mode="mean") ## knn/wknn方法表現(xiàn)更好,但是計算起來比較復雜 gene.f <- fill.NA(gene.r,mode="knn") gene.f <- fill.NA(gene.r,mode="wknn") ## 過濾標準差為0的基因 tmp <- filter.std(gene.f,min.std=0) ## 標準化 gene.s <- standardise(tmp)
聚類時,我們需要輸入兩個參數(shù),c和m。c是我們期望的聚類個數(shù),由自己定義。m由mestimate計算得到。
## 聚類個數(shù) c <- 6 ## 計算最佳的m值 m <- mestimate(gene.s) ## 聚類 cl <- mfuzz(gene.s, c = c, m = m) ## 查看每類基因數(shù)目 cl$size ## 查看每類基因ID cl$cluster[cl$cluster == 1] ## 輸出基因ID write.table(cl$cluster,"output.txt",quote=F,row.names=T,col.names=F,sep="\t") ## 繪制折線圖 mfuzz.plot(gene.s,cl,mfrow=c(2,3),new.window= FALSE)
讀到這里,這篇“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。