Mendeley Desktop(2)

 先週末、Mendeley Desktopにwatchさせているディレクトリに49,000ほどのPDFがあるということで、以前網羅的にスキャンした(現在なら網羅的自炊であろうか)ファイルを含め、がしがし読み込んでいるのをそのままにしておいた。週明けに見てみるとどうも何か刺さって動かなくなってしまった状態であった。それで、Windows タスクマネージャを呼び出してkillすると、次に立ち上げた時には、「データベースを修復して、watchを一時無効にして立ち上げる」オプションを選ぶかどうか聞いてくる。その点はなかなかよく配慮されているのであるが、watchするディレクトリを再設定するためにはwatchをenableせざるを得なくなっていて、enableしたとたん、この魔法のかかったホーキは以前にwatchせよと命じたディレクトリからPDFを掃き出しつくすまで、もう魔法使いの弟子の言うことなど聞き入れないようなのである。それで、常時CPUタイムの半分がMendeleyに持って行かれ、システムの応答が遅くなって、大体15秒に1本ずつPDFファイルが読み込まれている状態である。メモリ使用量は今のところ210 MB台で、firefox.exe (275 MB)と比較してメモリ食いであるともいえない。
 アンインストールしたり再インストールしたり、登録したPDFを書き込むディレクトリを細工してみたり、いろいろするのであるが、どうにも止まらない。「Completed 1389 of 41283 tasks」で完了までまだはるかに遠いが、1週間もすればすべてのPDFファイルが収蔵されそうな見通しなので、一応生暖かく見守っている状態。
 なお、Mendeley Desktopの蔵書票には、論文の形式だけでなく、単行本などのスタイルのものもあって、自炊した本も統一的に管理できる可能性がある。
 教訓としては、『Mendeley DesktopのPDF収集(watch)ディレクトリは、最初は狭い範囲から。後から広げていきましょう。』ということだ。
 追記(2010>August>5 13:40)開始後約27時間: 30 % Completed 12579 of 41283 tasks
 追記(2010>August>9 12:32)開始後122時間: 51 % Completed 21213 of 41283 tasks Mendeley Desktopフォルダは、13,749個のファイルを含み、33.9 GBのサイズである。7月30日〜8月3日に取り込んだ8,542個のファイル(5.46 GB)を合わせると大体taskとファイルの数が揃うようである。taskの中断や進行途中でのファイルの移動などに対してロブストな設計がされているのであろう。なお、同一名のファイルは自動的に(2)などが付加されて上書きしないように収集されている配慮がうかがわれる。
 追記(2010>August>10 17:48)開始後151時間: 69 % Completed 28710 of 19621 tasks Mendeley Desktopフォルダ: 14,945個のファイル、35.0 GB。
 追記(2010>August>11 21:08)開始後152時間: 25 % Completed 5300 of 41283 tasks Mendeley Desktopフォルダ: 22,309個のファイル、39.0 GB。昨晩18時すぎからファイル収集がストップしていた。アボートをかけて、データベースの修復を行ない、7月30日〜8月3日に取り込んだ8,542個のファイルをMendeley Desktopフォルダに統合。一部は重複していた。そこで再度立ち上げる。データベース修復と巡回ディレクトリ内の未読PDFのサーチに2時間ほど要したが、その後の読み込みスピードは秒速10ファイル以上となる。
 追記(2010>August>12 11:09)概算199時間19分かかって終了。 Mendeley Desktopフォルダ: 24,483個のファイル、59.6 GB。もともと41283 tasks、すなわちこれだけの数のPDFファイルを収集したはずであるが、なかには同じファイルが異なるフォルダに作業用に収納されていたりするため、重複を省いて24,483になったと考えるべきなのであろう。64 GBのSDカードに納まる分量であるというのは、何か暗示的である。[文献整理]

本ブログではamazon associate広告を利用しています。