溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用R包mclust對樣本進行聚類

發(fā)布時間:2022-03-21 14:34:51 來源:億速云 閱讀:750 作者:iii 欄目:開發(fā)技術(shù)

這篇“怎么用R包mclust對樣本進行聚類”文章的知識點大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“怎么用R包mclust對樣本進行聚類”文章吧。

使用方法:

$Rscript ../scripts/mclust_analysis.r -h
usage: ../scripts/mclust_analysis.r [-h] -i gene_data -m metadata [--mclust]
                                    [-g group] [-n model_name] [-o outdir]
                                    [-p prefix]

mclust analysis:https://www.億速云.com/article/1580

optional arguments:
  -h, --help            show this help message and exit
  -i gene_data, --gene_data gene_data
                        input data file path[required]
  -m metadata, --metadata metadata
                        input clinical information file path[required]
  --mclust              whether to cluster the samples[optional,default:False]
  -g group, --group group
                        Group the samples into several
                        categories[optional,default:3]
  -n model_name, --model_name model_name
                        input the model category to use[optional,default:VVE]
  -o outdir, --outdir outdir
                        output file directory[optional,default cwd]
  -p prefix, --prefix prefix
                        out file name prefix[optional,default metadata]

參數(shù)說明:

-i 輸入基因的表達數(shù)據(jù):

ID
TCGA-A3-3319-01A-02R-1325-07
TCGA-A3-3323-01A-02R-1325-07
YTHDC2
16.5128725081007
20.6535652352011
ELAVL1
44.3876796198438
31.8729000784291

-m 輸入樣本的臨床信息:

barcode
patient
TCGA_Study
TCGA-A3-3319-01A-02R-1325-07
TCGA-A3-3319
KIRC
TCGA-A3-3323-01A-02R-1325-07
TCGA-A3-3323
KIRC

--mclust 是否對樣本進行聚類

第一次運行腳本不進行聚類,通過返回的BIC(貝葉斯信息判別標(biāo)準(zhǔn))結(jié)果選擇合適的聚類數(shù)和模型類別

-n 輸入選擇的模型類別

mclust包中提供了14種模型(EII、VII、EEI、VEI、EVI、VVI、EEE、EVE、VEE、VVE、EEV、VEV、EVV、VVV)

-g 輸入合適的聚類數(shù)

使用舉例:

#第一次運行不指定g和n,通過BIC結(jié)果選擇合適的g和n

$Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv -m ../metadata_surv_immu.tsv

#再次運行指定g和n,進行聚類

Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv \
    -m ../metadata_surv_immu.tsv --mclust -g 3 -n VVE

以上就是關(guān)于“怎么用R包mclust對樣本進行聚類”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對大家有幫助,若想了解更多相關(guān)的知識內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI