Genbankファイルから塩基配列だけ抜き出すスクリプト
最近Perl書いてない上に眠れないのでやってみた。
while(<>){s/[^a-z]//g,print if($a=$a?1:/^O/)}46バイト。
validationだけど、G-languageのパッケージからmgen.gbkを取ってきて
$ perl hoge.pl mgen.gbk | wc
0 1 580074
$ head -1 mgen.gbk
LOCUS NC_000908 580074 bp DNA circular BCT 15-OCT-2004
$
合ってるっぽい。簡単すぎるな。。
コードゴルフってこう言うのなのかなあ。
定石を知りたい。