デュードニー流コンピューターレクリエーションからデータサイエンスへ(2)というよりはデータサイエンス作法

 先の別腹データ教程のためのネタ集め(1)で、プログラミング学園について紹介したが、登録したIDでログインするとすぐに別冊を丸ままダウンロードできるリンクが表示されるというわけでもなかった。
 それで、(1)の続きで、現代数学の面白いところをコンピューターグラフィクスに表現するというワンダーランド本も参照してみる

 のだが、そのワンダーランドの入り口で、どうもワクワクを感じられなくなってしまって入ろうかやめようかまごまごしている自らの老いにくやしさを感じるばかりであった。
 そんなある日(おそらく登録から2か月くらいたって)、CQ出版社からメールで「プログラミング学園通信 第9回(1月31日配信)」が届いて、そこには小中高大および塾の先生なら無料でダウンロードでき生徒に配布できるファイルへのリンクが貼ってあった。
 いわく、

教科書に書かれていることが仕事でどのように役立つのでしょうか
製品設計・開発の現場と,教科書(数学,物理,科学,地理)の知識が結びつけば,生徒のやる気も喚起されることと思います.プログラミング学園がその一端を担えれば幸いです.

 早速片っ端からダウンロードして読みふけって、いまどきのイケてるデータサイエンスの要件を悟らされることになった。
 雑誌に掲載された新しいソフトウェアをインストールするために16進ダンプやBasicソースコードを延々打ち込んでタイプミスを潰すのが当たり前であったわれわれ世代と異なり、いまどきの若いモンはアプリストアからアプリをなんぼでもインストールできる。
 結局データを打ち込ませて、キーボード入力の練習をやらせようと思ってもダメなのだろう。タッチタイプできるヤシが打ち込むのをぼーっと待っていてそのデータをコピペしてくる。打ち上がったテキストの量や質ではなくて、かかった時間とミスタイプの数を評価する式を考えさせて、プリチータイプグランプリで競わせるくらいにしないとダメなのではないだろうか。大体筆者など他人がいない場所では音声入力がメインになっていて、キーボードでなければ入力できないわけでもないもんね。
 それで、データは公共データベースで検索して一人ずつ違うデータをダウンロードさせて、解析結果と考察はデータ次第という状況を作る。その上で、結果はグラフではなくグラフィカルまたはマルチメディアにアウトプットして宝物探しをする。
 ブラックホールが衝突したときの重力波を可聴域の音に変換して聴くというのをどこかで見かけたが、昨年過ごした場所の一年間の気温変化を音楽にして着信音にするとか、英文のラブレターを書いて、ASCIIコードに翻訳してみたり、これをアミノ残基の並びと考えて、遺伝暗号でコドンに変換して相同性検索を行って、ヒトゲノムに愛のメッセージがコードされていないか調べたり、AlphaFoldでハート型の構造を取るペプチドのアミノ酸の配列を探しだすとか、統計データでGISる以外にも随分ごちそうが作れて満腹になりそうなことがわかった。
 などと自慢気に車輪を再発明してしまったが、簡潔にまとめれば「データサイエンスに必要な要素とプロセス(インポート、整理、変換、可視化、モデル、コミュニケーション、プログラミング)」ということでこれらを明確に定義している「Rではじめる」本を最初から買っておけばよかったことは間違いない。
 後日記(2023-02-02)>10年経ってもdata scientistはsexiestな仕事かによれば、データサイエンティストは、"a high-ranking professional with the training and curiosity to make discoveries in the world of big data"と定義されている。知的路上生活者には、特に(training and) curiosity to make discoveriesには心を励まされた。これこそ知性の誕生以来続いてきた、Buz Aldrinの語るApollo計画の真髄と同じ「あくなき好奇心とおそるべき野次馬根性」なのではあるまいか。

本ブログではamazon associate広告を利用しています。