溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

awk命指定分隔符輸出字符串///使用bgzip遇到的報錯是怎樣的

發(fā)布時間:2022-01-05 18:22:05 來源:億速云 閱讀:145 作者:柒染 欄目:大數(shù)據(jù)

awk命指定分隔符輸出字符串///使用bgzip遇到的報錯是怎樣的,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

awk指定字符分割字符串、指定分隔符輸出字符串

 遇到的問題

使用blasr軟件將三代測序數(shù)據(jù)比對到參考序列

blasr longreads.fastq reference.fasta --nproc 16 > blasr.out
 

部分輸出結(jié)果

m54155_170415_100314/5309390/25118_26816/0_1698 reference 0 1 -3020 75.3097 127858 128847 510317 3 1182 
m54155_170415_100314/5243602/0_9742/0_9742 reference 0 1 -1076 79.0576 17916 18284 510317 8946 9296 9742
m54155_170415_100314/5440071/0_9295/0_9295 reference 0 0 -1122 91.2409 470798 471063 510317 0 267 9295 5
 

這個地方不知道為什么 reads 的 ID 多了后面一個部分。如果利用這個ID再來提取比對上的reads時就得不到結(jié)果

可以利用awk命令把結(jié)尾的部分去掉

參考鏈接 https://blog.csdn.net/liangbilin/article/details/108593296

cat blasr.out | awk '{print $1}' | awk -F '/' -v OFS="/" '{print $1,$2,$3}' > blasr.out1
 

-F 指定輸入文件的的分隔符 -v OFS 指定輸出文件的分隔符

 

bgzip遇到的報錯及解決辦法

這個服務器上沒有bgzip這個命令,我使用conda進行安裝

conda install tabix
 

這個安裝的是 0.2.6版本

解壓fastq文件時

bgzip -d pacbio.sequel.fastq.gz
 

遇到報錯

Error: 2
 

然后我卸載,重新安裝0.2.5試一下

conda uninstall tabix
conda install tabix=0.2.5
 

再次解壓遇到報錯

Error: invalid block header
 

以上報錯不知道什么原因,搜索一番后看到有人說安裝好 htslib后就可以直接使用bgzip了。我試了一下

conda uninstall tabix
conda install htslib
 

果然這次再用bgzip解壓就沒有報錯了

看完上述內(nèi)容,你們掌握awk命指定分隔符輸出字符串///使用bgzip遇到的報錯是怎樣的的方法了嗎?如果還想學到更多技能或想了解更多相關內(nèi)容,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

awk
AI