- 79 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/09(木) 01:14:31 ID:FvRG1vm8]
- 必ずしもスキャンと関係ないのですが、PDF画像とOCRの関係について質問です。
(前スレ870以降あたりでも話題になっていました) OCRのためにページをラスタライズするのはわかるのですが、その後透明テキスト付きPDFを 出力するのに、なぜどの製品も「出力解像度オプション」みたいなのがあるのかが、理解できません。 「出力解像度」もなにも、元のPDFに透明テキストを貼り付けるだけで一件落着なんではないでしょうか? 私的には、元ファイルの見てくれを完全に保ったまま、テキスト情報も含まれているのが理想です。 試したのは、Acrobat 7 Standard、読んde Ver.12、読取革命 Ver.10、e.Typist Ver.11の体験版で、いずれも微妙でした。 どなたか、良いソフトを紹介して頂けないでしょうか? # 結果を別途テキストファイルで保存するのはいい感じですが、ページ内の位置情報が含まれないのがイヤです。 # また、読んde Ver.12の「元画像の解像度を使う」オプションだと見てくれは保たれる(ただしjpegのノイズっぽいのは乗る) # のですが、ファイルサイズが膨れ上がる(例えば英文PDF 12ページで 1.8MB => 34.4MBだった)のが残念・・・
|

|