awkで細切れにしたFASTA形式のデータをxyzzyでフィニッシングしておいてCLC Genomic workbenchにインポート

 450 MBのFASTAファイルをmiで読み込んで仕上げ作業を進めようと思ったが、一晩たっても開くことができていなかったので、awkでサンプルごとの157ファイルに分割してDropboxに保存。これをWindowsxyzzyで開いて仕上げ作業を継続。
 思えば、Mac OSJEdit並みのテキストエディタWindowsでのカウンターパートを捜していて、xyzzyをご推薦いただいたのはドクターRosie兄であったと記憶する。今ではxyzzyなしでのテ(キストデータの)料理は考えられない。
 小分けしたこともあって、xyzzyでのファイル読み込みは問題ないのであるが、多数のファイルに単純な文字列置換を間違いなく施すにあたっては、JEditにあったようなマルチファイル一括置換が使えれば、と思ってしまう次第である。記憶に間違いなければJEdit Xはsystem 7の頃からのテキストエディタの後裔である。Mac App Store登録にあたっては色々とあったらしく、webストア販売版とは異なるバイナリが登録されている。考えようによってはお得である。
 こうして仕上がったFASTAをCLC Genomic workbenchにインポートしてしまうと、後はBLASTをスタートさせるだけである。7分ごとに、約9500本ずつBLASTに投入する旨メッセージが表示されている。総数600,000本であるからほぼ7時間24分で終了する予定である。

本ブログではamazon associate広告を利用しています。