[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 06/03 19:37 / Filesize : 280 KB / Number-of Response : 988
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【ADF】スキャナで連続取り込み010.jpg【OCR】



79 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/09(木) 01:14:31 ID:FvRG1vm8]
必ずしもスキャンと関係ないのですが、PDF画像とOCRの関係について質問です。
(前スレ870以降あたりでも話題になっていました)

OCRのためにページをラスタライズするのはわかるのですが、その後透明テキスト付きPDFを
出力するのに、なぜどの製品も「出力解像度オプション」みたいなのがあるのかが、理解できません。
「出力解像度」もなにも、元のPDFに透明テキストを貼り付けるだけで一件落着なんではないでしょうか?

私的には、元ファイルの見てくれを完全に保ったまま、テキスト情報も含まれているのが理想です。
試したのは、Acrobat 7 Standard、読んde Ver.12、読取革命 Ver.10、e.Typist Ver.11の体験版で、いずれも微妙でした。
どなたか、良いソフトを紹介して頂けないでしょうか?

# 結果を別途テキストファイルで保存するのはいい感じですが、ページ内の位置情報が含まれないのがイヤです。
# また、読んde Ver.12の「元画像の解像度を使う」オプションだと見てくれは保たれる(ただしjpegのノイズっぽいのは乗る)
# のですが、ファイルサイズが膨れ上がる(例えば英文PDF 12ページで 1.8MB => 34.4MBだった)のが残念・・・







[ 続きを読む ] / [ 携帯版 ]

全部読む 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<280KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef