PDF管理にRefScout PDF managerとGoogle Desktop Searchをつかう

 2005.06.22現在、GDSはPDFファイルの中身についてもインデクシングの対象とするので、PDFをPMID.pdfというファイル名で保存しなくても、GDSで全文検索は可能である。 以下の記載は、GDSからPDFファイルを全文検索できなかった頃に、RefScout PDFを用いて、GDSのインデクシングの対象となる手持ちPDF一覧表を作るためのtipsである。
 この限りにおいては、今ではRefScout PDFを導入する必要はなく、筆者はWindows環境ではGDS(Google デスクトップ検索 20050516;日本語版)をインストールして、便利に使っている。ダウンロードしたPDFは、あいかわらずPMID.pdfというファイル名で保存しているが、これはファイルをiPapersの方でも使いまわすための方略にすぎない(2005.06.22 02:23)。 Google Desktop Search(GDS)がPDFの内容まで読んでくれないものかと期待していたが、どうもダメのようであるので、RefScout PDF managerを試用。Mac OS XiPapers同様、PDFをPMID.pdfというファイル名で管理するので、PDFデータ資源が共用できる。
 RefScout PDF managerを起動し(あらかじめRefScout本家からユーザー名、パスワードの発行(無料)を受ける必要あり)、PDFファイルを置いてあるフォルダを指定すると、そこからファイルをひとつずつ読みこんでは、ぱぶめどにアクセスして、著者、タイトル、雑誌名を取得し、それらとPMID, PDFファイルへのリンクを一覧にしたhtml文書(all_pdf.htm)を生成する。このファイルはGDSでインデクシングの対象となるので、結局ブラウザ(というかGDS)をフロントエンドとして2-clickでPDFに到達できるのである。…このコンビネーションはある意味iPapersを越えたかもしれない。なぜなら、PDF以外のテキストファイルも一緒に検索できるのであるから。と言うのは、最近本文のPDFファイルに加えて、付加的な情報 - supporting online materialsなどと呼ばれているPDFまたはDOCファイル - が公開されることが多いからである。付加的とはいえ、出版の段階で紙面からはみだすというような理由だけで本文から割愛された、かなり重要な情報が収録されるようになってきているが、これにはPMIDがつかないので、PMIDベースで管理することは原理的に不可能である。スマートな仕様のアップグレードを期待したいところであるが、Winでは、目下そのニッチをGDSがちゃんと埋めてくれるわけである。
 さて、そうすると従来他の名前をつけてダウンロードしてしまっている重複ファイルをどう始末するか、ということになるが、ファイルの中身を比較して同じ内容なら消去することができるAikoWinあたりで、まず異名同曲のファイルを削除してしまう。残った189コのファイルについてはひとつずつ手作業でPMID.pdfに改名していく必要あり。ここが自動化できれば言うことなしなのであるが、現在のところは、どうしてもこのかったるい初期導入コストを払っておく必要あり。[Win]

本ブログではamazon associate広告を利用しています。