ドキュメントスキャナを買った.
スキャンしたデータを検索する方法としてNamzuを使った全文検索で,
サーバ上に置いておいて常にどこからでも参照できるようにしたかった.
ということで,Namazuを導入.
メモ程度に要点だけ書いておく.
インストール方法は,適当なサイトを見れば大体大丈夫.
環境:FreeBSD 7.2-RELEASE-p4
○EUC-JPがない
Error: Couldn't find unicodeMap file for the 'EUC-JP' encoding
Error: Couldn't get text encoding
ports上のgraphics/xpdfが既にインストールされていたため,この問題が起きた.
graphics/xpdfを削除して,japanese/xpdfをインストールする.
○フォントがおかしい?
pdftotextを直に叩くと以下のようなエラーが出た.
Error: Couldn't find '90ms-RKSJ-H' CMap file for 'Adobe-Japan1' collection
何故か,日本語用の設定ファイル「/usr/local/share/xpdf/japanese/dot.xpdfrc」の
設定の一部が以下のようになっていた.
cMapDir Adobe-Japan1 /usr/local/share/fonts/adobe-cmaps
後ろに,/aj16/CMapをくっつける.
cMapDir Adobe-Japan1 /usr/local/share/fonts/adobe-cmaps/aj16/CMap
こんなところだったような気がする.
何だかんだで,2時間近く時間を取った気が...
あと,現状の問題.
・スキャン精度があまりよくない.
・ファイル名が日本語になってない(UTF-8なため)
そんなところ.