Evernoteに重複して登録しているPDFを検出する方法を考え中

 2009年4月からEvernoteを使い始めて5年になろうとしている。使いはじめの時期には、ハードディスクに溜め込んでいたPDFを一気に流し込んで、いきなり容量制限に引っかかったりした。現在は、13170のノートを、73のノートブックに分類して収納している。ひとつのノートに大体ひとつPDFファイルが入っているのである。最初は論文一編ずつのPDFであったが、ノートブックあたりのファイルサイズ上限が100 MBに拡張されたため、最近は自炊した単行本まるごと一冊分のPDFになっている場合も多い。全体のサイズは、データベースファイルuser.exbの目方で計ると、45.7 GBである。最近ソフトがすんなり立ち上がらない原因のひとつがこれであろう。
 それぞれのノートブックでPDFを開いてみると、これらのファイルが\user\AppData\Local\Evernote\Evernote\Databases\Attachments\以下に格納されていることになっている。したがって、このディレクトリでファイルの重複を検出したり、Acrobatで「縮小サイズで保存」などが半自動でできるとすると、保管庫をかなり圧縮できそうに思われたのである。
 ところが、Attachmentディレクトリに展開されているPDFファイルは数えるほどで、どうにもノートの数と合わない。表示されているファイルに関してだけ、exbファイルの中から必要部分を抜き出すような、何か特別な処理をしているようにも思われる。
 

本ブログではamazon associate広告を利用しています。