您好,登錄后才能下訂單哦!
這篇文章給大家介紹seq2HLA如何利用RNA_seq數(shù)據(jù)進(jìn)行HLA分型,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
對于不同的HLA Allel來說,exon2和exon3 序列的差異性尤為明顯,很多的HLA 分型軟件都會(huì)根據(jù)這部分序列,整理出HLA Allel序列參考數(shù)據(jù)庫。
seq2HLA也采用了類似的策略,通過HLA不同Allel的exon2和exon3的序列,整理了一份HLA參考數(shù)據(jù)庫,通過將RNA_seq的reads與該數(shù)據(jù)庫比對,確定HLA分型結(jié)果,原理示意圖如下
迭代兩次,每次挑選出覆蓋度最高的Allel 作為分型結(jié)果。
seq2HLA采用python和R進(jìn)行開發(fā),安裝過程較為簡單,直接下載源代碼即可,安裝過程如下
git clone https://github.com/TRON-Bioinformatics/seq2HLA cd seq2HLA/
用法如下:
python seq2HLA.py -1 R1.fastq -2 R2.fastq -r test -p 10
-1
和-2
參數(shù)分別指定輸入的R1和R2端的fastq格式的序列; -r
參數(shù)指定輸出文件名稱的前綴,-p
指定線程數(shù),主要是bowtie比對時(shí)的線程。
輸出文件非常多,詳細(xì)列表如下
test.ambiguity test-ClassI-class.bowtielog test-ClassI-class.expression test-ClassI-class.HLAgenotype2digits test-ClassI-class.HLAgenotype4digits test-ClassII.bowtielog test-ClassII.expression test-ClassII.HLAgenotype2digits test-ClassII.HLAgenotype4digits test-ClassI-nonclass.bowtielog test-ClassI-nonclass.expression test-ClassI-nonclass.HLAgenotype2digits test-ClassI-nonclass.HLAgenotype4digits
我們主要關(guān)注后綴為HLAgenotype4digits
的結(jié)果文件,可以看到,同時(shí)體用了HLA Clas I 和 Class II 兩種類型基因的分型結(jié)果。以HLA I型基因的4位分型結(jié)果為例,文件內(nèi)容如下
#Locus Allele 1 Confidence Allele 2 Confidence A A*02:65 0.008687167 A*02:65 NA B B*39:05' 0.3821314 B*13:48 0.09848174 C C*08:02' NA C*08:02 NA
對于HlA I型基因,給出了A, B, C 三個(gè)基因的分型結(jié)果,每個(gè)基因給出了兩個(gè)Allel, 對于每個(gè)Allel, 會(huì)給出對應(yīng)的打分值。
關(guān)于seq2HLA如何利用RNA_seq數(shù)據(jù)進(jìn)行HLA分型就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。