[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 12/23 15:51 / Filesize : 206 KB / Number-of Response : 904
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

[OCR] 画像→テキスト化総合



1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0]
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

486 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 22:52:32 ID:NTiyhGlr0]
つかルビなんて確実に認識できるソフトなんてあるか?

487 名前:名無しさん@お腹いっぱい。 [2007/04/23(月) 00:37:51 ID:4t8hsufJ0]
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか?
上1cmを読み取らないようにしたいのですが……

とりあえずフォトショップで全部切ってから読み込ませようと思ってますが

488 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/24(火) 19:33:20 ID:GMXFIsi/0]
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない?
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな

489 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/24(火) 19:34:13 ID:GMXFIsi/0]
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味

490 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/25(水) 17:47:15 ID:72dBCul00]
ttp://no722.cocolog-nifty.com/

小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。

491 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/25(水) 20:56:34 ID:1/DHbGJL0]
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。

492 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 01:43:03 ID:GYa4q+ck0]
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど

493 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 01:46:06 ID:aXKryLXTO]
>>492
だろうね

494 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 07:31:38 ID:hsKdtYm00]
>>491
手が後ろに回るぞ!
警察に報告しました、逃げるなよ




495 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/27(金) 05:48:50 ID:qJ7wVrGj0]
>>491
nyで流れてる

496 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/27(金) 20:16:56 ID:TyEfRJXl0]
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな

497 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/30(月) 01:51:22 ID:sLkYqs0k0]
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意

498 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/30(月) 05:59:12 ID:5pL5s8yV0]
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。


499 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/06(日) 20:41:05 ID:G03gIUz/0]
漫画とかの目次の読み取り制度の高いOCRソフトって何?
自炊した漫画に目次とか手打ちしてくの怠過ぎ。


500 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/09(水) 13:57:21 ID:99QB49QB0]
tes

501 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/19(土) 17:34:20 ID:MJYxjg3x0]
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか?

502 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/19(土) 23:46:09 ID:PB2nZC+o0]
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。

ソフト.EXE < 画像.JPG > 結果テキスト.txt

みたいな感じで読めるソフトありますか?

503 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 00:19:18 ID:X0rH5ysl0]


504 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 01:06:51 ID:1nypUcOf0]
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば?

ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。



505 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 01:57:05 ID:fXVBB8f40]
>>504
そうしてみます。どうもです。

506 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:05:13 ID:m6D0J+hE0]
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。

この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。

体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。

和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。

507 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:07:21 ID:JtoWD+i20]
eTypist>>>革命>>>>>>>>よめやここ

508 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:17:03 ID:IP3+408H0]
>極力Windows環境を汚したくない気持ちもあります。
あほかw
体験版試したあとOSクリーンインストールでもしろ

509 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:20:54 ID:JtoWD+i20]
↑まちがい

↓正解
RegSeeker

510 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:27:13 ID:oQsTBG6L0]
>>506
つ[Acronis True Image]

511 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:39:28 ID:2EuU9Ihu0]
TotalUninstall

512 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/26(土) 20:26:38 ID:95PnN5Qd0]
e.typistの12っていつぐらいに出ると予想されます?
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。

513 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 20:35:52 ID:KKC/xjSJ0]
plusd.itmedia.co.jp/pcuser/articles/0705/29/news043.html
「本格読取 2 Deluxe」、6月29日発売。2970円。


なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: www.google.co.jp/search?q=%E6%9C%AC%E6%A0%BC%E8%AA%AD%E5%8F%96+platinum

514 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/30(水) 21:21:07 ID:pTXU8GzB0]
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?




515 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/31(木) 18:16:10 ID:qsHbord50]
>>506
smartお勧め

516 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/31(木) 22:33:58 ID:YxAzCzkf0]
>>514
スキャナー付属の物ならまずwebに無いだろう

517 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/03(日) 14:19:19 ID:RWdiD0XW0]
>>514
EPSONのHPにあるよ

518 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 12:28:22 ID:+k6s2B/y0]
>>506
 いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
 読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。

 やっぱり試用して、同じものスキャンしてみるといいよ。

519 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 13:32:08 ID:c6qqyJBg0]
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。

520 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 15:48:24 ID:rTQM8Q420]
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。

521 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 19:50:55 ID:QT4A944M0]
>>518
 自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。

522 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/10(日) 12:44:19 ID:Bn9+OI/80]
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ

523 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/10(日) 21:47:17 ID:O+MyPhJK0]
>>522

文字認識のメニューから
 言語を:日本語(英語混在)にする。
 そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。

 いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。

 とにかく「空白出力」を有効にすることが必須。

 本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。



524 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/11(月) 22:57:26 ID:fi0mIOzn0]
>>523
d



525 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/12(火) 21:14:17 ID:TmZVwJCw0]
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな?
読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です

526 名前:名無しさん@お腹いっぱい。 [2007/06/14(木) 18:16:13 ID:MZzFuaL20]
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?

527 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/14(木) 20:02:32 ID:/i8UfP/C0]
>>526
> ないですよね?
という問い掛けをいやらしく感じるのは漏れだけ?
つttp://www.google.com/search?q=%E5%A4%9A%E8%A8%80%E8%AA%9E+OCR&ie=utf-8&oe=utf-8

528 名前:名無しさん@お腹いっぱい。 [2007/06/14(木) 21:57:48 ID:MZzFuaL20]
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。

529 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 00:36:41 ID:d8IXz+hf0]
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない

>>528
>本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い

530 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 01:17:24 ID:VQaiHJ1E0]
>>529
読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー

531 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 12:00:27 ID:Mq2PXuOr0]
pc8.2ch.net/test/read.cgi/bsoft/996505150/

532 名前:名無しさん@お腹いっぱい。 [2007/06/18(月) 09:30:58 ID:puvoa998O]
p20.fileseek.net/cgi-bin/p.cgi?uR=ocr.rossa.cc%2F&sZ=
だれか試して

533 名前:名無しさん@お腹いっぱい。 [2007/06/20(水) 10:49:02 ID:JlYS+vI+O]
>>532ミスってた
ocr.rossa.cc/

534 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/22(金) 14:20:21 ID:7iUFwDnD0]
試した。
フツーーーのOCRソフトだった。

532=533は何が聞きたかったのかな?



535 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/08(日) 22:17:19 ID:WDaFYbIE0]
聞いてみて

536 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/10(火) 11:00:58 ID:R3FyXrqI0]
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。

537 名前:名無しさん@お腹いっぱい。 mailto:age [2007/07/21(土) 16:18:17 ID:e2ZhIFOP0]
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???

538 名前:名無しさん@お腹いっぱい。 [2007/07/21(土) 16:23:32 ID:e2ZhIFOP0]
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???


539 名前:名無しさん@お腹いっぱい。 [2007/07/21(土) 16:25:09 ID:e2ZhIFOP0]
スレ間違えました。失礼しました。

540 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/21(土) 18:11:53 ID:fXjgR9V20]
300dpiあれば十分だろ
あとはコントラストとかの問題

541 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 00:46:45 ID:0rh6CBEo0]
300dpiでは低いよ。
400dpi以上。試せばわかるはず。

542 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 01:00:59 ID:TRo+FmNZ0]
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。

543 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 04:29:14 ID:9fsxREmx0]
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。

認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。

「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。

200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者

544 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 00:57:09 ID:JoRSkVg70]
一般的な印刷物って300dpiではなかったっけ?
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。




545 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 02:04:22 ID:2Cew43Yn0]
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分

あとは文字がクッキリとコントラスト等が調節できてるかによる

546 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 03:45:50 ID:lorVcd360]
そんな原稿なら手入力した方が現実的だな。

547 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/27(金) 09:36:49 ID:BD0S29j10]
etypist12はどうですか?

548 名前:名無しさん@お腹いっぱい。 [2007/08/05(日) 01:40:32 ID:5939Ae+P0]
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
oshiete.new-akiba.com/archives/2007/07/googleocrsofti_freeocr.html


でも日本語未対応

549 名前:名無しさん@お腹いっぱい。 [2007/08/29(水) 20:36:32 ID:HhJFBICD0]
ここで大人気のSmartOCRってそんなに性能いい?

試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、
段組関係はお話にならないレベル。

X1
ってのが
X一になったりするしw

1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。

せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。

何かいい方法無いかなあ。

550 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/29(水) 21:15:24 ID:j//B3kLA0]
タダなんだからそんなもんだろ
品質に不満ならe-typistでも買った方が早い

バージョンアップ版は大昔に買ったスキャナに
付いてたのでもOKだし安いからオススメ

551 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/29(水) 21:41:29 ID:vQuDIF5d0]
ID変わったけど

>>550
e.Typistが一番いい?
読んでココの古いバージョンユーザーなんでうpグレードはこれが一番安いんだが。

質がいいのならそちらに乗り換えます。

メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。


552 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/29(水) 22:21:48 ID:ne9cS2rk0]
背景に画像があるやつ(CDについてる歌詞)を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね

553 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 02:31:45 ID:YMqPcJox0]
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
(句読点とカッコ類を一文字分スペースにまとめてたり)
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。

色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。

554 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 04:17:48 ID:8cX5+Y+i0]
背景が英字新聞の場合は?



555 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/30(木) 19:34:15 ID:MBF2Q0dn0]
553はまともに使ったことなさそうだな


556 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/08/31(金) 19:28:40 ID:X8mRf/wg0]
>555
縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。

557 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/01(土) 01:18:08 ID:RaqlnS0/0]
>>556
置換すればいいじゃん。

558 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:04:55 ID:/ShAfiy40]
>557はまともにOCR使ったことなさそうだな。


559 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:31:24 ID:NVGVE2w40]
>>556
話変わってるじゃんw


560 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 00:33:33 ID:NVGVE2w40]
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合
よく分からん
詳しく説明してほしい

561 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 02:37:28 ID:kK0TPrWk0]
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。

562 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 08:36:01 ID:S2LE2C0F0]
> OCRなど30年前から使ってるが。

認知症ですか。かわいそうに。

563 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 10:02:13 ID:kK0TPrWk0]
>>562
inu.ei.meisei-u.ac.jp/~html/ocrweb/ocr3/index.html

564 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 19:22:06 ID:b21q+l2y0]
>>562

かわいそうに。



565 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/02(日) 19:46:38 ID:mZ3rWXVo0]
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。

566 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/03(月) 20:33:46 ID:CzULmAqY0]
>>562かわいそうに。

567 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/03(月) 22:36:28 ID:PyWafQ3J0]
苛めよくない。

568 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/04(火) 06:11:03 ID:UdHs+6dV0]
プレイなんだよきっと

569 名前:名無しさん@お腹いっぱい mailto:sage [2007/09/08(土) 16:53:07 ID:bG+CAb9F0]
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。

570 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 19:33:58 ID:6fbD8CNm0]
解像度を上げて試してみようと思わないのかねぇ……

571 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 20:25:51 ID:mRd7ARAC0]
>スキャナーは300dpi
って書いてあるからハードウェアの光学解像度上限が300dpiなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。

572 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 21:03:57 ID:bG+CAb9F0]
>>570,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?

573 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 21:31:28 ID:qzHioSaW0]
画像の前処理が必要なんだと思う。

通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。

あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。

自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。

スキャン解像度は300dpiあれば十分だと思うよ。

574 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/08(土) 22:21:40 ID:9kXomqHo0]
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)




575 名前:名無しさん@お腹いっぱい。 [2007/09/09(日) 04:18:08 ID:Wayz4dwa0]
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。

576 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 04:25:08 ID:YeApTPNwP]
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか

577 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 10:37:07 ID:TJ6TdM9A0]
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。






578 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 11:32:57 ID:nU6AA3X+0]
仕事で継続的にやることがわかってるんならネットバンギング登録すれば?
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ

579 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 12:20:35 ID:p37oIG6b0]
banging?

580 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 12:38:40 ID:TJ6TdM9A0]
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。




581 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:08:06 ID:b4CWqVib0]
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。

おまいさんが廃業すればいいんじゃねーの?

582 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:27:05 ID:nU6AA3X+0]
スマソ、バンキングね。

>>580
客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。

アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ

583 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 14:28:52 ID:pF0za8zm0]
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ

必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし

あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ

584 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 15:58:38 ID:6WtPLdEA0]
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない



585 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/09(日) 16:09:19 ID:TJ6TdM9A0]
あ、スマン、
顧客の日々の取引(入金、出金 残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト いろいろやってみますね。
レス ありがd。




586 名前:名無しさん@お腹いっぱい。 [2007/09/09(日) 21:00:43 ID:XLgeQDJm0]
www.sii.co.jp/cp/products/english/sre8000/dictionary.html






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<206KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef