読取革命ver.10お試し版

 前版までとかわって、かなりお安く導入できそうであるのと、イタリック体にもきちんと対応できる英文認識エンジン搭載と謳っているので、テスト中。こちらは、401ページを丸ごと読み込むことが可能であるので、透明テキストのはりつけも楽であろうと予想。
 目下、約1時間半で130ページ台を粛々と認識中。スピードに関しては、一回読み取ればよいので問題にはならず。むしろ識字率が問題なのであるが、画像ファイルをどう文字に直すかという定義を辞書として持っておけるので、鍛えると昨晩作ったものよりもさらにエントロピーの低いものを一発で出力できるかもしれないと期待。
 なかなか高い品質のテキストがとれたので、一夕これにはまってイメージ辞書にデータを追加しては再認識させることを繰り返すが、そこから先の改善はあまり芳しくないようでもある。[Win]

本ブログではamazon associate広告を利用しています。