溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何從FASTQ轉(zhuǎn)換得到uBAM格式

發(fā)布時間:2021-12-18 15:09:34 來源:億速云 閱讀:324 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要講解了“如何從FASTQ轉(zhuǎn)換得到uBAM格式”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“如何從FASTQ轉(zhuǎn)換得到uBAM格式”吧!

二代測序平臺產(chǎn)生的數(shù)據(jù)通常用fastq格式進(jìn)行存儲,fastq 存儲了我們最關(guān)心的序列和堿基質(zhì)量的信息。就測序而言,這樣的信息當(dāng)然是足夠了。但是對于分析而言,還缺少了一點信息。

給你一個fastq文件,你最多可以看出來樣本名,測序平臺,測序讀長等基本信息,如果想知道測序類型(是WES, WGS 還是RNA-seq),  樣本的采樣信息,樣本的分組信息,這些信息從fastq 文件是無法得到的。這些實驗相關(guān)的數(shù)據(jù),稱之為metadata。

uBAMFASTQ相比,處理存儲了序列和堿基質(zhì)量信息之外,還可以存儲metadata信息。

GATK4中,數(shù)據(jù)預(yù)處理部分的示意圖如下
如何從FASTQ轉(zhuǎn)換得到uBAM格式

可以看到,對于原始數(shù)據(jù),有兩種格式,一種就是我們常見的FASTQ; 另外一種就是uBAM。官方更加推薦使用uBAM格式。

如何從FASTQ轉(zhuǎn)換得到uBAM格式呢?我們需要借助picatd工具。picard提供了一個FastqToSam功能,可以將序列轉(zhuǎn)換成ubam格式。

基本用法如下:

java -jar picard.jar FastqToSam
   F1=sampleA_R1.fastq.gz
   F2=sampleA_R2.fastq.gz
   PL=illumina
   SM=sampleA
   LB=sampleA
   RG=sampleA
   O=sampleA.ubam

F1F2指定原始的fastq格式的數(shù)據(jù),對于雙端測序,同時指定F1和F2, 對于單端測序,指定F1就可以了。PL代表platform, 指定測序平臺,取值包含 illumina 和  solid 兩種;SM代表 sample  name, 指定樣本名稱;LB代表library name, 指定文庫名稱,RG代表read group, 指定reads group的名字,這兩個參數(shù)一般和樣本名相同就可以了。

ubam從名稱上也可以看出來,是屬于bam格式的,所以其內(nèi)容也分成了頭部和正文兩個部分。

1. 頭部的內(nèi)容

samtools view -H  sampleA.ubam
@HD    VN:1.5    SO:queryname
@RG    ID:sampleA    SM:sampleA    LB:sampleA    PL:illumina

第一行是標(biāo)準(zhǔn)的bam文件頭部的聲明,第二行的@RG就是轉(zhuǎn)換過程中添加的幾種metadata信息。

2. 正文的內(nèi)容

samtools view  sampleA.ubam

由于列數(shù)較多,這里我截取了前面幾列

如何從FASTQ轉(zhuǎn)換得到uBAM格式

每一行代表一條序列,序列ID相同的實際上是R1和R2端,從第二列的flag可以區(qū)分R1和R2端。

samtools flags 77
0x4d    77    PAIRED,UNMAP,MUNMAP,READ1
samtools flags 141
0x8d    141    PAIRED,UNMAP,MUNMAP,READ2

77對應(yīng)R1端, 141對應(yīng)R2端。
第三列的*代表沒有比對上染色體,這就是unmapped bam的由來。

通過FastqToSam可以從fastq文件得到ubam文件,picard 還提供了SamtoFastq命令,從bam 文件得到fastq 文件
用法如下:

java -jar picard.jar SamToFastq
   I=sampleA.ubam
   F=sampleA_R1.fastq
   F2=sampleA_R2.fastq

I代表input, 指定輸入的bam 文件;F和F2 指定輸出的fastq 文件。

感謝各位的閱讀,以上就是“如何從FASTQ轉(zhuǎn)換得到uBAM格式”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對如何從FASTQ轉(zhuǎn)換得到uBAM格式這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI