- 1 名前:揖保次郎 mailto:sage [2006/08/23(水) 14:41:00 ID:hvIq0cZe]
- 語ってください。
- 79 名前:login:Penguin [2009/05/18(月) 13:30:25 ID:32LxwiHT]
- sourceforge.jp/forum/forum.php?forum_id=18640
NHocrのソースコードを初公開 (ver 0.16(beta)) 投稿者: hgot 日付: 2009-05-15 18:56 日本語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。 Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出し が可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も 容易です。
- 80 名前:login:Penguin mailto:sage [2009/05/18(月) 19:38:05 ID:nm2XA63v]
- OCRって使わないほうがいいのかなと最近思う。
認識ミスはかならず起こるから、結局人間の目で検査することになるよね。 ところが似たような形ゆえに誤認識してるわけだから間違い探しが大変。
- 81 名前:login:Penguin mailto:sage [2009/05/19(火) 15:20:55 ID:hQEejHMo]
- スキャン→OCR→青空文庫テキスト化のノウハウをまとめた文章があってそれによれば
誤認識しやすい文字はエディタで文字色を変えて検査するとかの方法があるらしい 誤認識しやすい文字は ttp://www.siesta.co.jp/aozora/archives/002740.html
- 82 名前:login:Penguin [2009/05/19(火) 22:47:05 ID:VdrLajQJ]
- >>79
これいいですね。 試しに使ってみましたが、Windowsで認識率No.1を誇る本格読取の約200倍の 認識精度でした。 取り扱いも容易だし、このためだけにLinuxを導入する場合も出てくるのでは ないでしょうか? キラーアプリと言って差し支えないと思います。
- 83 名前:login:Penguin mailto:sage [2009/05/28(木) 21:09:32 ID:1fSWwA3J]
- >>82
つまり、本当は、使い物にならないレベルってこと?
- 84 名前:login:Penguin mailto:sage [2009/06/25(木) 09:41:47 ID:hXpPfq+7]
- 市販品には勝てんな。
- 85 名前:login:Penguin [2009/07/05(日) 07:38:52 ID:p3XE0Qtt]
- >>81
市販のに追いつくのは無理だと思う。
- 86 名前:login:Penguin mailto:sage [2009/07/05(日) 09:47:22 ID:J147l0Qp]
- 自分で作るしかないな。
- 87 名前:login:Penguin [2009/07/08(水) 08:29:23 ID:MYN3KcvK]
- >>85
学習が進むと市販製品より3桁精度が上がるぞ。
|

|