您好,登錄后才能下訂單哦!
本文小編為大家詳細(xì)介紹“R語言的ssGSEA.r怎么使用”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“R語言的ssGSEA.r怎么使用”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識吧。
ssGSEA.r 單樣本基因集富集分析
$Rscript ../scripts/ssGSEA.r -h usage: ../scripts/ssGSEA.r [-h] -i expset -g geneset [-o outdir] [-p prefix] ssGSEA免疫侵潤分析 optional arguments: -h, --help show this help message and exit -i expset, --expset expset input gene expression set matrix from RNA-seq data csv format [required] -g geneset, --geneset geneset input gene set database [required] -o outdir, --outdir outdir output file directory [default cwd] -p prefix, --prefix prefix output file name prefix [default demo]
-i 基因表達(dá)量 , 建議用TPM標(biāo)準(zhǔn)化之后的數(shù)據(jù):
ID | TCGA-D7-A74A-01A-11R-A32D-31 | TCGA-BR-7704-01A-11R-2055-13 | TCGA-VQ-A91N-01A-11R-A414-31 | TCGA-CD-A4MH-01A-11R-A251-31 |
NUP50 | 18.65505 | 31.59232 | 28.23382 | 28.76485 |
CXCR4 | 64.85805 | 125.123 | 56.35244 | 69.98976 |
NT5E | 111.4818 | 69.8587 | 79.37382 | 25.05824 |
EFNA3 | 8.247857 | 42.03308 | 43.46432 | 26.66024 |
STC1 | 4.781111 | 21.36327 | 40.81077 | 19.51568 |
ZBTB7A | 95.51678 | 103.4768 | 158.3024 | 126.2677 |
CLDN9 | 1.187456 | 2.476138 | 0.366081 | 7.347344 |
-g 基因集 兩列數(shù)據(jù),第一列細(xì)胞類型,第二列為基因
CellType | Symbol |
B cells | MS4A1 |
B cells | TCL1A |
B cells | MS4A1 |
B cells | TCL1A |
B cells | HLA-DOB |
B cells | PNOC |
B cells | KIAA0125 |
B cells | CD19 |
B cells | CR2 |
B cells | IGHG1 |
B cells | FCRL2 |
B cells | BLK |
B cells | IGHG1 |
B cells | COCH |
B cells | OSBPL10 |
B cells | IGHA1 |
B cells | TNFRSF17 |
B cells | ABCB4 |
B cells | BLNK |
得到每一個樣本的不同基因集中的NES值:
NES值:用最大值與最小值間的絕對差對ssGSEA分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)化。
cell_type | TCGA-B7-A5TK-01A-12R-A36D-31 | TCGA-BR-7959-01A-11R-2343-13 | TCGA-IN-8462-01A-11R-2343-13 | TCGA-BR-A4CR-01A-11R-A24K-31 |
aDC | 0.612130511 | 0.452721422 | 0.434065 | 0.352635 |
B cells | 0.423322775 | 0.408870064 | 0.426612 | 0.413857 |
Blood vessels | 0.68102349 | 0.775438572 | 0.689433 | 0.577667 |
CD8 T cells | 0.675615385 | 0.650073242 | 0.629121 | 0.566048 |
Cytotoxic cells | 0.621056151 | 0.425217442 | 0.411617 | 0.3128 |
DC | 0.619838925 | 0.485055579 | 0.489101 | 0.266905 |
Eosinophils | 0.502784949 | 0.514938557 | 0.469541 | 0.488051 |
iDC | 0.531619756 | 0.49843721 | 0.530931 | 0.390699 |
Lymph vessels | 0.710842769 | 0.721323072 | 0.658391 | 0.500574 |
單樣本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),是GSEA方法的擴展,主要是針對單個樣本無法做GSEA而設(shè)計。文章2009年發(fā)表于nature,題目為Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1。
首先對給定樣本的基因表達(dá)值進(jìn)行秩次標(biāo)準(zhǔn)化,然后利用經(jīng)驗累積分布函數(shù)計算富集分?jǐn)?shù)(ES)。設(shè)給定基因集為G,包含基因數(shù)為NG,給定單個樣本為S,表達(dá)譜包含基因數(shù)為N,N個基因按它們絕對表達(dá)值從高到低確定秩次。i 從1賦值到N,依此計算PGw和PNG。
讀到這里,這篇“R語言的ssGSEA.r怎么使用”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。