Excelの関数だけでもある程度イケる

 480本のデータがそれぞれ別のテキストファイルになったのが2セット揃ったので、これを藤宮仁:バイオインフォマティクスのためのプログラミング入門のbio_excel.xlsのマクロを用いて、ワークシートに一気に読み込む。
 ついで、文字列関数あたりを駆使して、ベクタ部分を切り落とし、さらにプライマー部分を認識して切り落とし、fasta形式に変換しやすいように細工をしてからcsv形式でセーブ。それをxyzzy正規表現を駆使してFASTA形式にする、というような作業を粛々と進めるのだが、一気にデータがトリミングされていくのを見ているのは、それなりに清清しさあり。
 さすがに、1本ずつこつこつ作業していく気はSst Iくんにもなかったらしく、できたFASTAファイルをそのままBLASTサーバーに叩き込んだら、次の作業もほどほどの時間で終了したらしい。これまであまりつかまっていないのをつかまえたような兆しがあるのは慶事であるが、ぬか喜びで終わるという線もあるので、情報の確認を急ぐ。まああと10倍くらいのデータサイズまでなら、悩殺されるまでもなくExcelxyzzyだけでこなせそうである。
 

本ブログではamazon associate広告を利用しています。