文献整理2020 ZOTEROとPubMedで生成したRSSを組み合わせる

 ずっとEvernoteで整理してきた論文(PDF)であるが、つい先日ふとしたことからいまどきの文献管理ソフトウェアを紹介するページにめぐりあった。どこから入って、途中でリンクをどうたどったかすぐに思い出せないほどこみいっているのだが、こういうご縁はよほど「文献ソフト」を求めてなければなかなか行きあたらないかもしれない。
 ということでZoteroを試験的にインストールしてみたら、これがある意味iPapersを超えた素晴らしいソフトウェアなのだった。
 ついこの間からPubMedでの検索結果のRSSFeedlyで追っかけてきたのだが、実はZoteroRSSを読み込むことができるのである。
 それでうれしくなって、PubMedの検索式の改良のために夜ふかししたりした。
 とは言うものの、PubMedRSSは、最新の100編までしか含まれないので、新着論文を追っかけるにはよいのであるが、それ以前のものを網羅的にZoteroに読み込むにはどうしたらよいか試行錯誤してみた。検索結果をXMLで保存すれば、それをZoteroにインポートできるのであるが、今のPubMedの保存のファイルタイプのオプションにXMLがない。Zoteroのヘルプページを読んでいるうちに、PMIDで指定した論文を読み込むことができるのが判明したので、以下のようにやってみた。
f:id:suushinagai:20200906205617p:plain
 まずPubMedで調べたいクエリで検索をかけて、6769件ヒットするというときに、検索結果を「selection: All results」「Format:PMID」でテキストファイルにダウンロードするのである。それをテキストエディタで開いてすべてを選択してコピーし、Zoteroの「識別子によってアイテムを追加する」ボタンを押して出てくるテキストボックスにペーストすると、PMIDを一つずつ読み込んでは、PubMedを引いて書誌情報をリトリーブしてくれるのである。
f:id:suushinagai:20200906195001p:plain
 自動的にアクセスしてくれるのには感動を禁じえないのだが、さすがに6769件もあるとサーバーに負荷をかけ続けてしまうのを申し訳なく思っている。進行状況がはっきりしないのであるが、DDoS攻撃のようなクローラーのアクセスと比べると、かなり間隔を開けてのアクセスのようであるし、現地時間日曜の早朝でもあるしお許していただけことを冀うものなり。ただし、いつ終わるともしれず、暴風圏に入って停電してしまうのではと、心配している。
 後日記(2020.09.07)>実に半日がかりでリトリーブが終わった。ダウンロードデータの嵩は7.9 GBとなった。今朝2時頃目が覚めて、なんだか滞っているので一旦quitして続きからやり直して13時頃終了した。データファイルの置き場所をDropboxにすると、「そんなところに置くと壊れやすいですよ。」とアラートが出てくるのであるが、そのまま強行して、出社後は基幹PCにインストールしたZotero for Windowsでアクセスしてみたが、問題なく使えた。将来的にはmacOS用のZoteroApple SiliconのMacに対応することで、同じバイナリでiPadでも動くようになったら、風呂に入りながら新着文献をRSSでチェックして、条件に合うものをライブラリに残していくという風になるのだろうと思う。

本ブログではamazon associate広告を利用しています。