GeneBank収録塩基配列が100 Gbaseを突破

 ばいおいんふぉまてぃくす黎明期の家内制手工業時代、ドゥリトゥル博士が息子さんに「魚釣りのようなもの」と説明して、論文に印刷された塩基配列を手入力させてパーソナルデータベースを作っていて、ある時細胞の増殖に関わる遺伝子が発表されたときに、データベースからそれががんウイルスの遺伝子と相同であることがわかって(逆だったかも)、息子さんに「何年かかかったが魚が釣れたんだよ」と語ったという故事あり。オンラインでは公表されていないが、10年くらい前の「化学」に訳文が載った記憶があって、その当時フロッピー1枚からスタートしたであろうデータベースも、いよいよDVDで10枚突破。
 まあ、塩基配列だけなら250 GB HDで充分ということではあるが、実際には注釈の分量が数倍はあるであろうから、話はそれほど単純ではない。ここいらへんミラーしようと思ったら、一体どれだけのディスクが必要であるか、見当もつかず。[メタゲ]

本ブログではamazon associate広告を利用しています。