溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

R語言的ssGSEA.r怎么使用

發(fā)布時間:2022-03-21 09:45:06 來源:億速云 閱讀:521 作者:iii 欄目:開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“R語言的ssGSEA.r怎么使用”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“R語言的ssGSEA.r怎么使用”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識吧。

ssGSEA.r  單樣本基因集富集分析

使用方法:

$Rscript ../scripts/ssGSEA.r -h
usage: ../scripts/ssGSEA.r [-h] -i expset -g geneset [-o outdir] [-p prefix]
ssGSEA免疫侵潤分析
optional arguments:
  -h, --help            show this help message and exit
  -i expset, --expset expset
                        input gene expression set matrix from RNA-seq data csv
                        format [required]
  -g geneset, --geneset geneset
                        input gene set database [required]
  -o outdir, --outdir outdir
                        output file directory [default cwd]
  -p prefix, --prefix prefix
                        output file name prefix [default demo]

參數(shù)說明:

-i 基因表達(dá)量  , 建議用TPM標(biāo)準(zhǔn)化之后的數(shù)據(jù):

IDTCGA-D7-A74A-01A-11R-A32D-31TCGA-BR-7704-01A-11R-2055-13TCGA-VQ-A91N-01A-11R-A414-31TCGA-CD-A4MH-01A-11R-A251-31
NUP5018.6550531.5923228.2338228.76485
CXCR464.85805125.12356.3524469.98976
NT5E111.481869.858779.3738225.05824
EFNA38.24785742.0330843.4643226.66024
STC14.78111121.3632740.8107719.51568
ZBTB7A95.51678103.4768158.3024126.2677
CLDN91.1874562.4761380.3660817.347344

-g 基因集  兩列數(shù)據(jù),第一列細(xì)胞類型,第二列為基因

CellTypeSymbol
B cellsMS4A1
B cellsTCL1A
B cellsMS4A1
B cellsTCL1A
B cellsHLA-DOB
B cellsPNOC
B cellsKIAA0125
B cellsCD19
B cellsCR2
B cellsIGHG1
B cellsFCRL2
B cellsBLK
B cellsIGHG1
B cellsCOCH
B cellsOSBPL10
B cellsIGHA1
B cellsTNFRSF17
B cellsABCB4
B cellsBLNK

結(jié)果說明:

得到每一個樣本的不同基因集中的NES值: 

NES值:用最大值與最小值間的絕對差對ssGSEA分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)化。

cell_typeTCGA-B7-A5TK-01A-12R-A36D-31TCGA-BR-7959-01A-11R-2343-13TCGA-IN-8462-01A-11R-2343-13TCGA-BR-A4CR-01A-11R-A24K-31
aDC0.6121305110.4527214220.4340650.352635
B cells0.4233227750.4088700640.4266120.413857
Blood vessels0.681023490.7754385720.6894330.577667
CD8 T cells0.6756153850.6500732420.6291210.566048
Cytotoxic cells0.6210561510.4252174420.4116170.3128
DC0.6198389250.4850555790.4891010.266905
Eosinophils0.5027849490.5149385570.4695410.488051
iDC0.5316197560.498437210.5309310.390699
Lymph vessels0.7108427690.7213230720.6583910.500574

方法說明:

單樣本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),是GSEA方法的擴展,主要是針對單個樣本無法做GSEA而設(shè)計。文章2009年發(fā)表于nature,題目為Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1。

首先對給定樣本的基因表達(dá)值進(jìn)行秩次標(biāo)準(zhǔn)化,然后利用經(jīng)驗累積分布函數(shù)計算富集分?jǐn)?shù)(ES)。設(shè)給定基因集為G,包含基因數(shù)為NG,給定單個樣本為S,表達(dá)譜包含基因數(shù)為N,N個基因按它們絕對表達(dá)值從高到低確定秩次。i 從1賦值到N,依此計算PGw和PNG。

讀到這里,這篇“R語言的ssGSEA.r怎么使用”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI