2006-01-25から1日間の記事一覧

やさしくPDF OCR体験版

もうひとつ、電話帳並みのPDFファイルから基準配列の名前を抜き出すために、Vectorからダウンロードして試用。eTypistを作っていた会社の製品とは、お懐かしい限りである。一度に認識できるのは100ページまでなので、310ページを4回に分けて認識させないと…

AWKを語らず

てきとーなフィルタを通して不要なものを切り捨てれば、なんとか扱えるサイズになるであろう…と考えて、そういえば「テ料理本」があったはず、と書棚を探すに、見つからず。AWKの第一歩をダウンロードして、第一歩を踏み出す。 が、こういう「鰹節形式」でい…

求む!9 GB超のテキストが開けられる…

というので、反省会で蒸し返された計算なのだが、電話帳なみの分厚さのバイブルにのっている基準配列を一から検索、ダウンロードしていると何年かかるかわからず。かといって、すべてを網羅している(はず)のリリース9.35のデータ約20万本は、bzip2で固めて…

社員食堂にて

一人で定食を食べていたら、御奉行様、連隊長、親分が続々と集結し、昨晩の反省会が始まる。[メタゲ]

本ブログではamazon associate広告を利用しています。