[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 12/23 15:51 / Filesize : 206 KB / Number-of Response : 904
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

[OCR] 画像→テキスト化総合



1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0]
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

552 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/29(水) 22:21:48 ID:ne9cS2rk0]
背景に画像があるやつ(CDについてる歌詞)を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね

553 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 02:31:45 ID:YMqPcJox0]
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
(句読点とカッコ類を一文字分スペースにまとめてたり)
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。

色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。

554 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 04:17:48 ID:8cX5+Y+i0]
背景が英字新聞の場合は?

555 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 19:34:15 ID:MBF2Q0dn0]
553はまともに使ったことなさそうだな


556 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/31(金) 19:28:40 ID:X8mRf/wg0]
>555
縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。

557 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/01(土) 01:18:08 ID:RaqlnS0/0]
>>556
置換すればいいじゃん。

558 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:04:55 ID:/ShAfiy40]
>557はまともにOCR使ったことなさそうだな。


559 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:31:24 ID:NVGVE2w40]
>>556
話変わってるじゃんw


560 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:33:33 ID:NVGVE2w40]
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合
よく分からん
詳しく説明してほしい



561 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 02:37:28 ID:kK0TPrWk0]
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。

562 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 08:36:01 ID:S2LE2C0F0]
> OCRなど30年前から使ってるが。

認知症ですか。かわいそうに。

563 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 10:02:13 ID:kK0TPrWk0]
>>562
inu.ei.meisei-u.ac.jp/~html/ocrweb/ocr3/index.html

564 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 19:22:06 ID:b21q+l2y0]
>>562

かわいそうに。

565 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 19:46:38 ID:mZ3rWXVo0]
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。

566 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/03(月) 20:33:46 ID:CzULmAqY0]
>>562かわいそうに。

567 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/03(月) 22:36:28 ID:PyWafQ3J0]
苛めよくない。

568 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/04(火) 06:11:03 ID:UdHs+6dV0]
プレイなんだよきっと

569 名前:名無しさん@お腹いっぱい mailto:sage [2007/09/08(土) 16:53:07 ID:bG+CAb9F0]
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。

570 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 19:33:58 ID:6fbD8CNm0]
解像度を上げて試してみようと思わないのかねぇ……



571 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 20:25:51 ID:mRd7ARAC0]
>スキャナーは300dpi
って書いてあるからハードウェアの光学解像度上限が300dpiなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。

572 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 21:03:57 ID:bG+CAb9F0]
>>570,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?

573 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 21:31:28 ID:qzHioSaW0]
画像の前処理が必要なんだと思う。

通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。

あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。

自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。

スキャン解像度は300dpiあれば十分だと思うよ。

574 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 22:21:40 ID:9kXomqHo0]
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)


575 名前:名無しさん@お腹いっぱい。 [2007/09/09(日) 04:18:08 ID:Wayz4dwa0]
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。

576 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 04:25:08 ID:YeApTPNwP]
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか

577 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 10:37:07 ID:TJ6TdM9A0]
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。






578 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 11:32:57 ID:nU6AA3X+0]
仕事で継続的にやることがわかってるんならネットバンギング登録すれば?
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ

579 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 12:20:35 ID:p37oIG6b0]
banging?

580 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 12:38:40 ID:TJ6TdM9A0]
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。






581 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:08:06 ID:b4CWqVib0]
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。

おまいさんが廃業すればいいんじゃねーの?

582 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:27:05 ID:nU6AA3X+0]
スマソ、バンキングね。

>>580
客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。

アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ

583 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:28:52 ID:pF0za8zm0]
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ

必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし

あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ

584 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 15:58:38 ID:6WtPLdEA0]
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない

585 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 16:09:19 ID:TJ6TdM9A0]
あ、スマン、
顧客の日々の取引(入金、出金 残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト いろいろやってみますね。
レス ありがd。




586 名前:名無しさん@お腹いっぱい。 [2007/09/09(日) 21:00:43 ID:XLgeQDJm0]
www.sii.co.jp/cp/products/english/sre8000/dictionary.html

587 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 22:55:58 ID:0TmXydc30]
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。
ってかプロなのかyo
ドシロウトの俺が「会計 通帳 OCR」と検索してあたりがつけられるようなことを
知らないのってやばいんでねーの。

588 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 23:20:35 ID:TJ6TdM9A0]
これでしょ。
実際に拡大コピーしないとダメだったのですが・・・。
www.z-irazu.jp/product.php

589 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/10(月) 23:46:17 ID:tLXqJKXQ0]
>>588
>>571

590 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/11(火) 08:00:32 ID:Homl5X9v0]
> 顧客の日々の取引(入金、出金 残高、相手先)
> のデータ作成を請け負っている仕事なので
> ぜんぜん自分の口座と関係ないので乙。

頭足りてないなら、とっとと廃業するべきだ。



591 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/22(土) 12:38:33 ID:IN/2021F0]
e.typist12.0で ルビを文中に挿入を選択して文庫本をスキャン>認識すると
一部の行が左端の最後の行に重複して表示されてしまうのですが
どう対処したらよいのでしょうか?

592 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/25(火) 17:38:23 ID:Pnv4wn/K0]
>591
たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって
しまってる状態。
認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。
それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識
してる。それしか対処の方法はなさそう。
傍点が大量になければ、テキストになった段階で修正するだけ。

傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。
ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は
いつでもずれてるから。

593 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/28(金) 00:49:01 ID:kO0WhpSR0]
>>575
んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR+人手チェックの方が早い

と、マジレスしてみる

594 名前:名無しさん@お腹いっぱい。 [2007/09/28(金) 02:22:27 ID:FG/hllZY0]
>>593
お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。

595 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/28(金) 06:42:17 ID:JinZJTny0]
ダイバダッダの魂宿りますた。
世界平和のために無償労働するっす。

596 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/30(日) 05:12:31 ID:fVlDcJAE0]
>職業がら200通位×ページ数

これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か 税務資料か

「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン


597 名前:ご参考まで [2007/09/30(日) 05:50:09 ID:fVlDcJAE0]
旧ヴァージョン アップデート(以下からたどる):
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/old.html

最新版(V1.1.1)の特長:
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識

解像度 50〜2,400dpi(400dpiを推奨)
>>596を一部訂正

ttp://panasonic.co.jp/pss/pstc/products/yomikaku/index.html
体験版(10日間)DL:
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/demo.html

598 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/01(月) 23:00:54 ID:ZJSIv2Sr0]
記帳代行で乙。

599 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 02:48:08 ID:lW4nXSBZ0]
>>598
ご本人は正にその仕事をされているように思うのだがw

600 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 03:30:28 ID:5xTbDZcD0]
名簿データ取り込み?



601 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 04:51:39 ID:9DUfmmoQO]
imepita.jp/20071003/110220

602 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 05:07:51 ID:ZwtirfFY0]
下は簡単なCaptcha画像ですが、
ja.wikipedia.org/wiki/%E7%94%BB%E5%83%8F:Captcha.png
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか?

603 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 07:43:43 ID:nJglqY7H0]
犯罪者乙!

604 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 09:58:49 ID:lW4nXSBZ0]
>>600
んや、税務会計関係

605 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 13:07:59 ID:La1Wx76N0]
>>602
スパム業者死ね

606 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 23:56:14 ID:H4AdpPJY0]
キャプチャってcaptureじゃなかったっけ

607 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 23:59:02 ID:H4AdpPJY0]
あー、全然別もんなんだ。俺が悪かった

608 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/12(金) 22:47:53 ID:SrJh6grm0]
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。

609 名前:名無しさん@お腹いっぱい。 [2007/10/13(土) 17:16:36 ID:nepRO5lX0]
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの?
解決できるソフトはある?

610 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/13(土) 17:39:44 ID:GAhJKdKe0]
学習機能は文字だけでしょ




611 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/14(日) 06:29:53 ID:VQe2G2hR0]
間違えるのも認識するのも全て文字だけだが?

612 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/19(金) 13:49:13 ID:Ziv6Jg4J0]
SmartOCR liteeditionのヘルプキャッシュってどこかにない?
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。

613 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 12:42:36 ID:YC+r/lRo0]
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される?
あとVer.11の方はアクティベーションあったりする?

614 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 13:20:42 ID:zf4XBilV0]
>>613
原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので

615 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 17:28:13 ID:YC+r/lRo0]
>>614
一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?


616 名前:名無しさん@お腹いっぱい。 [2007/10/24(水) 10:50:55 ID:S7BJ2he10]
613
10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが5文字になったとしてもあまり変わらないような気がする


617 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/24(水) 17:12:22 ID:PvY78B8J0]
>>613
英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。

英語圏のソフトの最新体験版を試してみては?

618 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 01:17:26 ID:kSzZVbgV0]
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。
段組なし(1ブロック)、フォント1種類、スタイル1種類、
罫線類なし、みたいな原稿だったらかなりの精度が出るけど、
そういう原稿って実際はあまりないし。

OCRが持ってる綴り辞書との照合もオートでやらせちゃうと
後で間違いを発見するのがかえって難しくなるので、結局
フラグがたったものを1つずつ確認してくしかない。


619 名前:618 mailto:sage [2007/11/08(木) 01:24:35 ID:kSzZVbgV0]
>>618
>改良の予定があるよ。

(正)改良の余地があるよ。

620 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/09(金) 04:45:42 ID:kwRwnBQS0]
OCR機能のついたPDFビューア「クセロReader ZERO」
ttp://xelo.jp/xelopdf/readerzero/index.html



621 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 00:51:16 ID:4YWhz3M30]
>>620
xelo.jp/xelopdf/readerzero/spec.html
ここを見ると、色々制限あるな

622 名前:名無しさん@お腹いっぱい。 [2007/11/24(土) 16:52:47 ID:vQJ6YjAl0]
期間中にクリック数の一番多い国が優勝
www.clickclickclick.com/default.asp


623 名前:名無しさん@お腹いっぱい。 [2007/11/24(土) 17:45:26 ID:/M81SGwoP]
>>622
独自OCRなんてあるんだ。。。

624 名前:名無しさん@お腹いっぱい。 [2007/12/10(月) 03:27:04 ID:oguiPK7L0]
紙にある表の枠を、
Excelで再現させるのは何のソフトがおすすめですか?

625 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/10(月) 05:33:02 ID:hQNhfr3P0]
特打

626 名前:名無しさん@お腹いっぱい。 [2007/12/10(月) 15:20:26 ID:mc4o5/AO0]
簡単フォーム

627 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/10(月) 16:48:47 ID:gWDyiZys0]
兆安い


628 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 22:02:42 ID:aoTjNDiZ0]
>>621
制限がファイル単位ってのは実はかなり緩いんじゃないか?
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど

629 名前:名無しさん@お腹いっぱい。 [2007/12/26(水) 12:05:39 ID:rr6NJUoQ0]
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが...
ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。
スパイウェア貰っちゃったかな?
大丈夫ですかね?

630 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/26(水) 15:31:38 ID:ieaMIqGT0]
あそこからリンクしてるSmartOCRLite107.zipの中身は
ウェブ魚拓で2006年4月26日 02:44(日本時間)に記録された download.vector.co.jp/pack/winnt/writing/other/SmartOCRLite107.zipの魚拓
と同じ。zipファイル内のSmartOCRLite107.EXEの
CRC32:5e81c645
MD5:929502ab3f674b03e1551893507a0997
SHA-1:20321d496c76a335d649e170100f2f4771be384b



631 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/08(火) 01:02:12 ID:tmDGCBY80]
ほっしゅ

632 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 23:05:37 ID:KbHOKl/s0]
        /⌒ヽ ,, - ──‐ - 、        
   , < ̄7⌒、_ノ::::::::::::::::::::::::::::::::::::::::::`ヽ       
 /:::::::::::::::乂 ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::\    
/:::::::::::::>‐7:: ̄::::::::::::::::∧:::::::::ト.:::::::::::::::::::::::::::::::ヽ   
:::::::::/  /::::::::::::::::::::::::/. V::::::|.ヽ:::::::::::::::::::::::::::::::::',.  
//   /::::::::::::::::::::::::/   V:::::.i ヽ.:::::::::::::::::::::::::::::::', 
     ,::::::::::::::::::::::__/.    V::i!::i  ',::::::::::::::::::::::::::::::::i. 
    i:::::::::::::::/ ̄/   `  ',::i',::', ─- 、.::::::::::::::::::::| 
.   |:::::::::::/:::::./ ,      ',.i ' ,、  ∨::\::::::::::::::::::| 
   |::::::::::::::::./  !_      `  \ V::::ヽ::::::::::::::::| 
.   |:::::::::::::::/ /示え、      二_、、 V、::::::::::::::::| 
.   |八::/⌒ / ん;;;;;;;|       /う ヾ、 ',:::::::::::::,  
    |/{ ∧  弋二ソ       |;;乂メ;| | |>k:::::/  
     k ⊥    ̄        弋二ン  /、iヽ/   
.      `‐|       '       ̄  /_ `/   <早くVIPに帰ろうよお兄ちゃん
        `、              メ__/    
         > _   r‐、    /ヾ       
      ,, -''´  |!ヽ| >-- ‐ r<´.         
   rヽ´  /  /       〈ニ ヽ          , -、
   |/ヽ\'  ./| ヽ      У \      / /                かわいいは正義
  ./   \ヽ { ヽ、   ´  /    ヽ ./´γ/ /                 afox.2ch.net/news4vip/
 /   /  ヽ\ヽ  ̄` ─'/   |  ∨Y彡ヽ,〈 

633 名前:名無しさん@お腹いっぱい。 [2008/02/05(火) 14:27:51 ID:j7DtTZgo0]
本格読取2を購入して使ってみたけど、
さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。
読取革命11の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。
e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz

e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど
もう少し認識率と領域指定を試してみたかったのにな。
手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか?

634 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/05(火) 19:54:01 ID:4B5oC2/T0]
>>633
WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、OSがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン&テキスト化、約1時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ





635 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/05(火) 23:33:02 ID:n6V+PtBt0]
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて
一向に識字率が上がる気配が無いんですが、仕様ですか?

636 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 00:01:06 ID:X1PyioH/0]
>>635
読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだyoって教え込む機能があんじゃねえの?

637 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 01:29:31 ID:ZvtDlRuB0]
そういう機能があっても、間違えるものは間違えるのが読み取り革命

638 名前:名無しさん@お腹いっぱい。 [2008/02/06(水) 14:55:56 ID:nDxnu5rf0]
>>634
すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。

639 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 22:27:32 ID:yNcr4Ry/0]
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。
テンプレート一回一回あてさせるつもりか?しかも数行おきに認識されるってどーよ

それにしてもe.Typistの精度には驚いた。

640 名前:名無しさん@お腹いっぱい。 [2008/02/07(木) 02:16:50 ID:mZYJX8l40]
アドビAcrobat PRO CS3に付いているOCRはどうですか?




641 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/09(土) 13:22:11 ID:kx6Thi940]
>>633
小説用途に限った場合の話だけど

e.Typistは比較的領域判定が優秀なのでほとんどの場合は自動でおk
小説再配置ツールやeTilTranで文字領域を切り出すだけで十分すぎるほど
認識率は読取革命よりはだいぶ上
ただ、感嘆符や――、……、ーのような記号をよく間違えたり読み飛ばしたりする
まれに同じページを不完全な状態で二重認識する(上半分だけとかそんな感じで)
ここがネック

ユーザー辞書は読取革命で何回教えても治らなかった経験から、全く使っていない
後で間違えやすい文字だけ一括置換してる

642 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/13(水) 20:01:46 ID:PDD8kYVFO]
英単語帳を読み取ってエクセルのデータにして
P‐STUDYシステムに問題集として読み込ませようと思っているのですが
英単語帳にむいているOCRソフトってありますか?

643 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/13(水) 20:04:16 ID:zrpzYaHV0]
>>641
規制されていたので、お礼が遅れました。
e.Typist12を購入して使っています。
おっしゃるように! ――、ー、一あたりの誤認識が多いですね。
…に関しては点線処理の縦点線ありにしたら、かなりよくなりました。
一括置換も100個が限度という所からエディタでするようにしました。
なかなか難しい所ですね。

644 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/28(木) 09:23:33 ID:NWfNaQSi0]
保守

645 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/04(火) 22:44:36 ID:I6sGMd1z0]
e.Typistでルビの部分の行を本文として処理してしまうことがたまにある。
eTilTranで傾き補正はかけた後なんだけど、これって解決する方法ないのかな?

ex)
正解:黄昏(たそがれ)が迫(せま)る道を

誤認識:たそがれ  せま
      黄昏が迫る道を

646 名前:名無しさん@お腹いっぱい。 [2008/03/07(金) 00:49:49 ID:i9ecjhLU0]
読取革命12、買おうかな。

647 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/07(金) 21:40:57 ID:jfB3M2/r0]
読取革命12と読んdeココ13を単行本の読み取りで比較してみたけど、読んdeココの方がよかった。
読取革命は文字以外の部分を無理矢理、認識しようとして意味不明の文字列を連発する。
読んdeココは認識できないものはスッパリ諦めて無視する傾向がある。
この方がむしろ修正の手間がかからないから楽なんだよね。

648 名前:名無しさん@お腹いっぱい。 [2008/03/10(月) 09:02:26 ID:1MG90Ymy0]
そうかもしれないね。
でも読取革命のがしがし読む感じがいいんだよね(笑)
まあまとまったゴミを消去する機能があってもいいよね。

649 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 11:14:49 ID:usFTg7Jp0]
以前から疑問だったんだが・・・
スキャナとかコピーとかしたとき、
原稿の一部だけ、字がにじんだり、潰れたりするのは何が原因なの?
途中で動いたってことなのかな?
しっかり押さえたつもりで、自覚症状が無いことがほとんどなんだが。

650 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 14:03:36 ID:vs8oaQ7S0]
>>649
そうだと思います。
やっぱり、カード類なんかはプラスチックで滑りやすいんで、画像が
ボケたり、片側だけが広がったりしてますね。




651 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/22(土) 22:33:23 ID:26pq4wpB0]
読んでココ13を使い始めたばかりの者です。
英文混じりの書籍を認識させるとき、小文字のc,o,sが頻繁に大文字に認識されます。
候補文字から修正してると自動的にユーザー辞書に追加されていきますが、
このまま同じ文字ばかり追加していって、認識率は上がるのでしょうか?
まだそれほど認識速度は落ちていませんが。
ほかにもっと上手いやり方がありますか?

652 名前:名無しさん@お腹いっぱい。 [2008/03/22(土) 23:31:46 ID:B1KQW1w80]
読取革命liteからver.12へのバージョンアップ、インストールがうまくできないのですが、この場合liteにver.12が上書きされることになるのですか?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<206KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef