怎么過濾fasta文件

發(fā)布時(shí)間：2022-03-19 15:23:15 來源：億速云閱讀：181 作者：iii 欄目：開發(fā)技術(shù)

這篇文章主要介紹了怎么過濾fasta文件的相關(guān)知識，內(nèi)容詳細(xì)易懂，操作簡單快捷，具有一定借鑒價(jià)值，相信大家閱讀完這篇怎么過濾fasta文件文章都會有所收獲，下面我們一起來看看吧。

fasta文件有其固定的格式，如果某些序列格式錯誤或者出現(xiàn)一些不該出現(xiàn)的字符（例如亂碼），就需要過濾掉這些序列。過濾方法比較簡單，一個腳本就可以完成，避免重復(fù)的手動刪除。

腳本運(yùn)行命令：

perl  fasta.filter.pl  -in in.fasta  -o out.fasta

其中：

fasta.filter.pl：腳本名稱；

-in：輸入選項(xiàng)，后跟輸入文件名稱；

-o：輸出選項(xiàng)，后跟輸出文件名稱。

腳本如下：

use Bio::SeqIO;
use Bio::Seq;
use Getopt::Long;
my %opts;
GetOptions(\%opts,"in=s","o=s","h");
my$in  = Bio::SeqIO->new(-file => "$opts{in}" ,
                                -format => 'Fasta');
my$out = Bio::SeqIO->new(-file => ">$opts{o}" ,
                                -format => 'Fasta');
while(my $seq = $in->next_seq()){
 my ($id,$seqence,$desc)=($seq->id,$seq->seq,$seq->desc);
 next if($seqence eq "");
 next if($seqence =~ [^ATCGNatcgn]);
 $out->write_seq($seq);
 $out->close();
}
 $in->close();
 $out->close();

關(guān)于“怎么過濾fasta文件”這篇文章的內(nèi)容就介紹到這里，感謝各位的閱讀！相信大家對“怎么過濾fasta文件”知識都有一定的了解，大家如果還想學(xué)習(xí)更多知識，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

怎么過濾fasta文件

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽