溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么使用ASProfile分析可變剪切事件

發(fā)布時間:2021-11-10 16:52:28 來源:億速云 閱讀:379 作者:柒染 欄目:大數(shù)據(jù)

怎么使用ASProfile分析可變剪切事件,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。

ASprofile是一款識別可變剪切事件的軟件,該軟件可以直接將同一個基因的多個轉(zhuǎn)錄本進(jìn)行比較,從而鑒定可變剪切事件。該軟件安裝比較簡單,下載解壓縮即可。基本用法如下

extract-as  \
transcript.gtf \
ref.fa.hdrs > as_events.txt

該腳本需要兩個參數(shù),第一個參數(shù)為轉(zhuǎn)錄本對應(yīng)的gtf文件,在實(shí)際分析時,首先利用cufflinks或者stringTie從測序數(shù)據(jù)中組裝到轉(zhuǎn)錄本序列,然后將組裝的轉(zhuǎn)錄本與已知的轉(zhuǎn)錄本合并去冗余,用merge之后的非冗余轉(zhuǎn)錄本序列作為輸入;第二個參數(shù)為基因組長度統(tǒng)計(jì)文件,后綴為hdrs, 內(nèi)容如下

>chr1 /len=249250621 /nonNlen=225280621 /org=Homo_Sapiens(hg19)
>chr2 /len=243199373 /nonNlen=238204518 /org=Homo_Sapiens(hg19)
>chr3 /len=198022430 /nonNlen=194797135 /org=Homo_Sapiens(hg19)

每一行代表一條染色體,分別給出總長度,去除N堿基之后的長度以及物種信息。最后生成的文件中會給出不同可變剪切事件的詳細(xì)結(jié)果。Asprofile中的可變剪切類型定義如下

1. 外顯子跳躍

外顯子跳躍的定義如下

怎么使用ASProfile分析可變剪切事件

分別用onoff表示發(fā)生了外顯子跳躍前后的轉(zhuǎn)錄本,X前綴表示外顯子的邊界非精確配對,和之前的exon相比,差了幾個bp。

單個外顯子跳躍稱之為exon skipping, 用SKIP表示,示意如下

怎么使用ASProfile分析可變剪切事件
多個外顯子跳躍稱之為cassette exons, 用MSKIP表示, 示意如下

怎么使用ASProfile分析可變剪切事件

2. 內(nèi)含子保留

內(nèi)含子保留的定義如下

怎么使用ASProfile分析可變剪切事件

分別用offon表示發(fā)生內(nèi)含子保留前后的轉(zhuǎn)錄本,X前綴表示外顯子的邊界非精確配對,和之前的exon相比,差了幾個bp。

單個內(nèi)含子保留稱之為retention of single intron, 用IR表示,示意如下

怎么使用ASProfile分析可變剪切事件

多個內(nèi)含子保留稱之為retention of multiple introns,用MIR表示,示意如下

怎么使用ASProfile分析可變剪切事件

3.  外顯子替換

外顯子替換稱之為alternative exon, 用AE表示,示意如下

怎么使用ASProfile分析可變剪切事件

包含各種情況,比如exon的5’端不變,3’端發(fā)生變化,示意如下

怎么使用ASProfile分析可變剪切事件

exon的3’端不變,5’端發(fā)生變化,示意如下

怎么使用ASProfile分析可變剪切事件
exon的3’端和5’端同時發(fā)生變化,示意如下

怎么使用ASProfile分析可變剪切事件

4. 轉(zhuǎn)錄起始位點(diǎn)的替換

轉(zhuǎn)錄起始位點(diǎn)的替換稱之為alternative transcript start, 用TSS表示,示意如下

怎么使用ASProfile分析可變剪切事件

5. 轉(zhuǎn)錄終止位點(diǎn)的替換

轉(zhuǎn)錄起始位點(diǎn)的替換稱之為alternative transcript termination, 用TTS表示,和TSS類似,只不過是3’末端位置發(fā)生了改變,示意如下

怎么使用ASProfile分析可變剪切事件

怎么使用ASProfile分析可變剪切事件

上述文件中可變剪切事件是以轉(zhuǎn)錄本為單位進(jìn)行展示的,每行代表一個轉(zhuǎn)錄本,存在冗余,當(dāng)我們想要知道某個基因上發(fā)生的可變剪切的類型和數(shù)量時,該文件就不夠直觀,官方提供了summarize_as.pl腳本,可以方便的得到非冗余的可變剪切事件以及每個基因可變剪切事件的匯總信息,用法如下

perl summarize_as.pl  \
transcript.gtf \
as.events.txt \
-p prefix

該腳本會生成兩個文件,后綴為nr的文件中,是非冗余的可變剪切事件;后綴為summary的文件中是每個基因可變剪切的類型統(tǒng)計(jì),示意如下

怎么使用ASProfile分析可變剪切事件

通過Asprofile, 可以直接對同一個基因的多個轉(zhuǎn)錄本進(jìn)行比較,從而鑒別不同的可變剪切事件,除此之外,Asprofile還提供了定量的功能, 可以計(jì)算fpkm值,通過collect_fpkm.pl腳本可以匯總多個樣本的可變剪切結(jié)果,用法如下

perl collect_fpkm.pl sampleA.AS,sampleB.AS -s txt

多個樣本用逗號連接,-s指定對應(yīng)文件的后綴,通過樣本名字加后綴識別對應(yīng)的文件。該腳本會給出每個可變剪切事件在樣本中的比例,基于這個比例我們可以進(jìn)行差異分析。更多用法請參考官方說明和腳本的幫助文檔。

看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進(jìn)一步的了解或閱讀更多相關(guān)文章,請關(guān)注億速云行業(yè)資訊頻道,感謝您對億速云的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI