日本人におけるある疾患関連遺伝子の同定(2)Anaconda2とJupyter Notebook

 昨晩は、帰宅する前に自炊したインターフェース2017年6月号を、iPad Airで読みながら寝てしまった。
 特にこの6月号を購入した動機は、Mathematicaのような魔法のノートの趣きを感じていたJupyter Notebookのことを詳しく知りたかったことに尽きる。webで拾い読みしてみてもなかなかインストールのしかたや使い方の体系的な説明にたどりつけず、二の足を踏んでいた。薄い入門書で新しいテクノロジーの全体像をざっくりとつかまえるような場合に、Interface誌は以前から頼りにしている。かつて、HTMLの入門書としてインタフェース別冊のような本(後日追記:Open Design 13号)をラジオデパートで買って帰って座右の銘にしたのであったが、自炊したはずのPDFファイルにたずねあたらず。
 今日は仕事の合間に「第2部 科学技術のイチオシPythonソフト入門」をガイドにしていろいろ試して、ついにAnaconda-navigatorからJupyter Notebookを起動できるようになった。anacondaをインストールしてできるフォルダには118,978のファイルが含まれ、実に4.43 GBの容量がある。データ解析用のパッケージなどもほとんど揃っているようである。Jupyter Notebookのセルにpandasを使うスクリプトを書いて、昨日の.txtファイルをcsvに変換したのを読み込ませ表示することに成功。ただし、メモリ不足で20万行は読み込めてないようである。
 Jupyter Notebookは、ノートとして元データと処理(スクリプト)とその結果をひとまとめに保存したり再計算したりできる。徹夜で計算しているうちに、どういうデータセットでどういう処理をした結果だったのか、だんだんわからなくなることは度々あった。そういう意味で、これは実に優れた「データサイエンス」向き実験ノートと言える。informatics以外でも、泳動ゲルの画像ファイルを貼り付けられればwetなbiologyで使いでがありそうに思う。
 ということで、Notebook extensionsを入れて、画像ファイルがDrag&Dropで貼り付けられるところまでこぎつける。

Interface(インターフェース) 2017年 06 月号

Interface(インターフェース) 2017年 06 月号

  • 発売日: 2017/04/25
  • メディア: 雑誌

本ブログではamazon associate広告を利用しています。