塩基配列の収集から解析へ

 「ほんとに全部網羅できとンのか?」という自問するタイトルの論文を見つける。Supplementary fileに、系統関係の計算に用いた配列のアクセッションナンバーのリストがあるので、あとはExcelにうまいこと読み込んで、例によって100個ずつ区切ってEntrezのqueryに流し込む。このテクのすごいところは配列を100本単位でばさばさ扱えるところである(NCBIのサーバーに限度いっぱい負担をかけることは、この際ご容赦願うとして)。ただし、著者がアクセッションナンバーをミスタイプしていたりするのもつい見逃しやすく、エラい迷惑を被る危険性も増える。
 というので、これを基幹Dimension ClustalX 1.81にかけて帰ろうとして、ついでにClustalX2.0でも試しておこうかと思いつき、データをGmail経由でOptiplexに移して試してみると、なぜか読み込みエラーを返してくる。原因究明は今日のところはおいておいて、帰宅することにする。後日記:書くも愚かなことであったが、これはデータファイルの絶対アドレスの中に2バイト系の文字が入ることを許さない、というClustalW/X作者(の使ったライブラリ?)の約束事による。デスクトップに置いたファイルだと、c:\Documents and Settings\user\デスクトップ\FASTA.fasとなってアウトなのであった。別のハードディスクのトップからd:\clustalx\mission\20080116\FASTA.fasなどと専用のドライブで時系列に畑の畝(ディレクトリ)を耕す習慣をつけておけば、後で振り返りやすいというものである。
 ちなみに、Linux版は例の足りないライブラリを静的にリンクした改良版が年末に出ているようで、これも大いに楽しみである。[Linux]

本ブログではamazon associate広告を利用しています。