野次馬データサイエンス(2)「形としてナイものが見える」楽しみ

 日本の古本屋で奇跡的に発見したA. K. デュードニー《別冊サイエンス「コンピューターレクリエーション1 遊びの発想」》が届いて、貪るように読んだ。訳を竹内郁雄氏、萩谷昌巳氏が担当されていて、今日に至るまでファンであるお二人に、コンピューターレクリエーションの手ほどきを受けていたことにいまさらにびっくりした。当時の筆者の興味の中心はMandelbrot集合であったが、ロトカ・ボルテラ方程式を取り上げた記事(10. サメ族対魚族 トーラス惑星ウォートーはエコロジカルウォーの真っ最中)も収録されていてびっくりさせられた。
 Lotka-Volterra競争系については、その後放送大学数理モデルとカオス(2005)》第12回の講義で目を見開かさせられた。これは、さしずめデータサイエンス教程の「5. モデル」の題材であろう。今なら、Interface2022年9月号別冊付録 プログラミング学園Python部 中島隆夫:微分方程式を通してみる世界:自然と人間.pp. 23-28, 2022.を参考文献にさせてもらうことになるだろうか。いや、巌佐庸《数理生物学入門 生物社会のダイナミックスを探る》もあった。

 教程「2. データの整理」「3. 変換」の題材としては、筆者の身につけた文化的な背景は、実に座右の銘PC-PAGE 25 《MS-DOSテキストデータ料理学》に負っている。このたびあとがき(FROM THE TEAM)に『楽しめるということは「形としてナイものがみえるということ」であると思う』という文章を見つけて、我が意を得たりと思った。本書はsedawkの取扱説明書としても際立った特徴があるが、31年後のビッグデータ見える化の予言に感嘆してしまった。

 それはまた、「風景ではないような風景を撮影するのだから、これは見えない的を狙っているようなもの」というチョートク師の言葉にも通じるものである。というので、久々に「撮る風景」の東京「現」風景を読んで、千代田区有楽町にあるという、ビルの屋上のデーモンを探しに行きたくなった。はたしてまだあるのか。
 以下は私的な備忘のためのメモである:
 「1. データのインポート」については、データベースでの気象データ、バイオインフォマティクスデータ、文献データなどの検索とダウンロードでよいであろう。
 ライフサイエンスのデータベースについては、「科学研究のとりこになる」を読んでとりこになってほしいものである。
 Nifty-ServeのFBIO(であっただろうか)に連載されたバイオインフォマティクスの記事で水島洋氏には大変お世話になった。いまやローカルに保存しているテキストすらないが、《マッキントッシュとインターネット―医学・バイオ・ゲノム研究へのネットワーク完全活用ガイド》や《実践 バイオインフォマティクス -ゲノム研究のためのコンピュータスキル-》であの頃に帰ることはできるだろうか?
 網羅と枚挙は、ゲノムデータの網羅性について、と同時にうつろいゆくインターネットのコンテンツの保存についての示唆を与えてくれる。
 インポートしたデータのクリーニング・整形の総論に(具体的なスキルは別に考えるとして)岡壇《生き心地の良い町》「第4章虫の目から鳥の目へ」を参考文献にあげておくのはどうだろうか。
 見えない的を狙って形のないものを「4. 可視化」する。
 「7. プログラミング」演習問題に、青空文庫の文豪作品でライミングする文芸プログラミングで形のないものを見る着想を得た。
 と、形のない「 y(et) a(nother) da(ta) scie(nce)」教程書の目次と参考文献リストが見えてくる楽しみを味わってみる。これ を「やぁだしぃー」と発音することにしたらウケないだろうか。

本ブログではamazon associate広告を利用しています。