1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0] 読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・ 最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。
367 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/10(木) 14:37:36 ID:XmxyRxn90] 107は精度が落ちてるから
368 名前:365 mailto:sage [2006/08/10(木) 18:46:25 ID:Mw/M2k+w0] >366 マルチ違う 関連スレも見たぐぐった >367 教えてくれてありがd お礼に教える君になります。 320のページで検索(Suchen)すると、検索結果が 今までより1個多くなっている。さてなんでしょう(w
369 名前:名無しさん@お腹いっぱい。 [2006/08/13(日) 08:44:48 ID:eMHMvqto0] 何で読取革命が人気ないかわからん。俺の環境だと 読取革命>>e.Typist>読んで e.Typistは体験版、他は最新版。 今度からランク付けする場合、どんな資料読み取ってるか書いてもらいたい。 俺が読み取ってるのは図形、表、字混合、白黒の資料
370 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/13(日) 09:54:26 ID:GICVZJIQ0] ジャケ画の歌詞画像スキャン結果だと 読取革命>e.typist>読んでここ>SmartOCR 全部体験版の初期状態ね。
371 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/13(日) 14:27:28 ID:yMWJsO350] ヒント:金出して買えない厨房の溜まり場
372 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/13(日) 17:43:34 ID:6jIuQ4Dp0] 自覚してるわけですか
373 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/13(日) 22:26:50 ID:yMWJsO350] まあ読取革命は本格読取からの優待で安く買ったけど
374 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/14(月) 02:38:29 ID:2kxjreYM0] 初期状態でのOCR精度比べても無意味だろ 学習させないととてもじゃないが使い物にならんよ
375 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/14(月) 10:17:04 ID:sle7CdNN0] 段落を取れん場合は、学習機能も無意味。 段落のとり方を学習できる製品はないのかな。
376 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/15(火) 01:41:50 ID:f2VQuwo60] ある
377 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/15(火) 16:09:35 ID:f/D0Xu0a0] OCRを使ってますか? pc8.2ch.net/test/read.cgi/bsoft/1141402809/
378 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/31(木) 18:22:56 ID:bjz28sKf0] SmartOCRのヘルプページのサイトは、three.fsphost.com/freeocr/ から ocr.rossa.cc/ に移転しました。 多分、今までよりも快適に読むことができると思います。
379 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/06(水) 19:12:26 ID:yw7232fl0] 表面的な匿名をいいことにマナーが悪すぎるな
380 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/06(水) 20:18:47 ID:fi4e3w9G0] 製品パクってくるよりまし
381 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/09(土) 20:06:25 ID:Zk6MRhKi0] 2chでマナーとかいいだしたらキリが無いですよ。ぜんぜん大人しいほう。
382 名前:名無しさん@お腹いっぱい。 [2006/09/13(水) 16:13:30 ID:8KtJLkVe0]
383 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/20(水) 16:39:06 ID:T4QOs50J0] Smart OCRを初めて知ったので、今落とせてサンクス。
384 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/26(火) 22:06:44 ID:B0JYe+LK0] >>381 表だっては掲示板内で違法行為働いてることを堂々と書き込んでいるのはあまり見ない。 違法を違法と理解してない風な書き込みは流石に痛い。 そういうのがパクリを叩くのもまた痛い。
385 名前:名無しさん@お腹いっぱい。 [2006/09/28(木) 03:50:29 ID:y+zC8mrs0] つまりsmartOCRは社員がどこかのocrソフトメーカーからソースぱくってつくたってこと?
386 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 00:11:09 ID:Yq1fsyDX0] 表の読み取り最強なのはどれ? ちなみに、表=主に数字と定型的な単語のみで構成され、罫線で囲まれたもの ってことで。 日本語文書読解とかどうでもいいんで、望む機能としては 1.罫線の存在を認識できる = 点線を一や−の連続と思わないこと等 (ユーザーの設定により罫線ありと明示的に設定できるとなお良) 2.表のテンプレート設定が豊富 = セル・行・列指定で数字のみや記号のみに限定できる等 (細かく文字を限定できればなお良 例:「\19,800」みたいな価格→「数字 , \」、電話番号→数字と"−"のみ) 3.数十枚〜数百枚程度の自動認識機能
387 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 00:20:02 ID:Yq1fsyDX0] 読取革命の体験版を試してみたんだけど、これって一度作ったテンプレートの融通が利かないんだね。 例えば帳票をADFで連続読み取りしてると、どうしても2〜3ミリくらいは上下左右にずれちゃうんだけど テンプレートを呼び出したあと、ちょっとだけ位置を修正しようと思ってもこれが出来ない。 無理やり移動したり大きさ修正しようとすると、設定したセルや文字種が全部デフォルトに戻るw 表専用OCRじゃないから多くは望めないとはいえ、これはちょっと酷いんじゃないのかな〜。 前の職場で使われてた業務用OCRは優秀だったんだよね。 テンプレート位置を、画像上の罫線を参照して自動修正してくれたり ガチで連続読み取りに特化してた。
388 名前:名無しさん@お腹いっぱい。 [2006/09/29(金) 02:30:08 ID:90PHlJ6J0] つーかスマートOCR誤字ばっかりでぜんぜん読み込まない どっかに横文字で書いただけの文字の画像ないかな つーかこのスレをスクリーンキャプチャしてみるか。
389 名前:名無しさん@お腹いっぱい。 [2006/09/29(金) 02:37:58 ID:90PHlJ6J0] ]9fi:名畑しさん@お腹いっぱい.:2田10∈/ng,'pa(木)0:ifio:四ID:y4■CRTrcO つよU垢rErtOCRば社員がどこかの阻rソフ1・1其一カーからソースぱく丁て]くた.」てこと? t 瑚:名無しさん@お腹い]ぱい.:2田10[fn9,'29(k')OO.11.α91DY目1国DXO 却]請み取り最桂なのばど.れ7 ちなみに、表一土に数字と定型AMs単語のみで構成され、罫腺で匝まηたものーてことて. ヨ本語文書読解とかピうでもいいんで、望む機能としてば 1.…:線の存在菅詔識でぎる一点線を一や一の連続ヒ思わないこと等 (「一サーの設定:「より罫線あり1と明示的「設定できる仁なお良) ■■.表のアンプレー-設定が豊富-セル'fi一列指尼で数字のみ阜記号の捌こ眠定できる等 鰍ゥ(Y字}1狼定できれ1:碍「焉-仲1」:「UIF.Rnfi」みt'1.ln伍格→R歌字.耳」.雪話番岩→?.享t'一'Mh:) 3.数十枝一数百枝程度の目動認識機能 脚:名無しさん@お腹いっぱい.:PfCEIng,'pn(金)OO:20:nP TD:YclkvDXO 読取革命の構験版を証して碍たんだ∪ど、これって一劇乍ったテンプレートの甜動荒不1-VL'td■,んだね. 側えば帳草をA[Fで連続読み取りしてると、どうしても2〜3ミリくらいば上下左右にずれちゃうんだけど アンプレー1-琶呼ぴ山したあと、ちょ訓とだけ位置古修工しようこ思ってもこhhU来奄い. 無哩やり樗動しr一り六芦ざ條[Fしようと丁るk.設定し斤ヤ」しヤ夏字植が全部デフォルトに戻るw 表専用DC屯拝ないから多くば茎めたいとばいえ、こればちょ北酷いんしドtsいの右.な一... 前刃職場で使われてだ茉務用DCRば優秀だ丁だんだよね。 テ?」レート位直を、画像上の罫線を参照して目動修正してくILt[り ガチで連続読み取リに特化してた. ]SE:名無しさん@お腹いーぱい.:2fmE/ng,.pg(金)D2:田:nETD:叩PHL旧.-ID つ一研スマートOCR誤字は.・h,りでぜんぜん読み込よない どっか[こ構夏宰で書.,r一戸'けの又=の由偉煎.巾噴 つ一MILCjxレ芒スクリーノキャプチャし⊂みるか。 .一ワ汀表NnlL,た ー「「「一一一一一一一三]
390 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 08:13:46 ID:0aDHtvHn0] >前の職場で使われてた業務用OCRは優秀だったんだよね。 それが何だったか覚えてないの?それ使えばいいだけだと思うんだけど。
391 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 19:12:19 ID:EG4JKPXp0] エプソン、エー・アイ・ソフトを吸収合併 pc.watch.impress.co.jp/docs/2006/0929/epson.htm
392 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 23:03:15 ID:NpqBn/zy0] >>391 創業23年を目前にして、その歴史に幕か・・・。 まあ、「読んde!!ココ V.12」のパッケージに"EPSON"ロゴが入った時にそんな予感はしていた。 あと、EPSON製ソフト「オフィリオ・シナジーウェア」との連携をやたら強調したり・・・。 合併後も、EPSONが積極的に売り出しそうなのは、「読んde!!」等OCR系と「デジカメde!!」シリーズぐらいか? DiskX、まっぷっぷ、訳せ!!ゴマとかは放置プレーかな・・・。 ひとまず合掌。
393 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 23:21:31 ID:qqH6EebL0] WXが・・・
394 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/30(土) 17:07:10 ID:ocwN+jtc0] 読んdeみたいなクソソフトは消えても全くどうでもいい ・・・といいたいところだが対抗商品が全くなくなると e.Typistが手抜きし始めるから形だけでも残ってもらった方がいいな。
395 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/30(土) 17:19:00 ID:nUtd3U1F0] 読取革命がある
396 名前:386 mailto:sage [2006/09/30(土) 18:12:14 ID:ZJPKuVam0] >>390 日立超LSIシステムズのMY-QREADERってやつで\398,000。 ちなみにソフトだけじゃなく専用のPCIボード込みなのでピーコも_。 専用ハードによる文字認識でPenII 300MHzが主流の時代の代物なのに高速だった。 もっとも今はCPUが速くなったのでソフトだけでも十分なんだけど。
397 名前:名無しさん@お腹いっぱい。 [2006/09/30(土) 21:34:12 ID:NBV4N4H80] ダメもとでお聞きしますが、Mac対応でフリーのOCRソフトなんてありませんか。 それが無ければ、1万円を切るソフトはありませんか…? Mac対応版はWin対応のよりも倍ぐらい高いんですよね、どれも。OTL
398 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/30(土) 21:39:43 ID:iNUp/IlD0] WinReaderProを仕事用に検討していますが、どなたか使われた方いらっしゃいますか? 20万円もするので気楽には買えませんので。。。
399 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/01(日) 03:25:19 ID:6ixnYLr20] >>398 仕事で使うものの情報を こんなところで集めるのはやめろよ・・・ 自分で調べた方が安全
400 名前:名無しさん@お腹いっぱい。 [2006/10/01(日) 09:53:48 ID:WvMARitI0] >>399 PC関係の情報は2chが一番早いので。 仕事で使っているソフト、ハードの情報はほとんど2chで入手しました。 嘘の情報はそれなりにわかりますしね。2chか価格コムで調べて買うというのが多いですね。
401 名前:名無しさん@お腹いっぱい。 [2006/10/02(月) 02:32:58 ID:yT4SsxAOO] 俺は日立の帳票マスター使ってるよ
402 名前:名無しさん@お腹いっぱい。 [2006/10/02(月) 05:41:51 ID:ZYOoziFL0] smartが一番
403 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/05(木) 19:57:23 ID:aY7Ko/8j0] SmartOCRってまだどっかから手に入れられたりできない?
404 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 14:23:58 ID:ArovS4cU0] >>403 つttp://ocr.rossa.cc/
405 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 15:56:47 ID:6Bl0QuR70] >>404 リンク切れ?
406 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 02:59:04 ID:e9AUhQqs0] うお、レイアウトがw
407 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 10:20:48 ID:104t2KLp0] リンクきれてるな
408 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 17:19:03 ID:oro3A3sc0] filecache.deあぼーんでsmartocrオワタ\(^o^)/
409 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 17:35:15 ID:opPB5pDv0] \(^o^)/
410 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 03:51:16 ID:3kDvU2pq0] 俺持ってるから関係ないや
411 名前:名無しさん@お腹いっぱい。 [2006/10/08(日) 18:08:49 ID:N8NhqxEI0] ビジネスソフト板にも尾crすれがあった
412 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 18:17:19 ID:LMMEjzcE0] OCRを使ってますか? ttp://pc8.2ch.net/test/read.cgi/bsoft/1141402809/
413 名前:名無しさん@お腹いっぱい。 [2006/10/20(金) 17:49:29 ID:3UV/yuu60] ほすす
414 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/20(金) 19:30:32 ID:XhCLS0YF0] ソース糞ソフトから本格読取2がでるよ
415 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/21(土) 21:32:53 ID:x+s51qZ50] ttp://www.sourcenext.com/titles/use/74150/ 読取革命9改か・・・どこを「仕様変更」したか気になるところだ。
416 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/21(土) 21:34:17 ID:oeD+LEUh0] 名前とか。 他のソフトが付いてたなら、それも削られてる。辞書も多少削られてるかも。
417 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/22(日) 11:26:53 ID:XHAMoIGg0] 読み取り革命体験版インストして、期間が来たからアンインストしたけど アドイン解除してアンインストしたのに、ワードに読み取り革命のメニューが残ったまま。 どうやって消せばいいの?
418 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/23(月) 00:28:04 ID:geo80Ohm0] C:\Documents and Settings\USER_NAME\Application Data\Microsoft\Word\STARTUPか C:\Documents and Settings\USER_NAME\Application Data\Microsoft\AddInsに なんかそれっぽいのあったら消せ
419 名前:名無しさん@お腹いっぱい。 [2006/10/23(月) 07:14:35 ID:kQ6qEoy70] 以前、WinReader PRO(バージョンは6)を使って、高額なソフトでもこれでは実用に 絶えられないなと思って、OCRはまだまだだと思っていたが、最近出た、読んでココ(バージョン12) を使ってみて、偉いOCRソフトもかなり進化したなというのを感じた。 しかし、既存のPDFの認識精度はかなりのものがあるが、スキャナーから読み込んだもの に関しては、まだまだ実用の域には達していないと思った。 当方が扱う、法律関係の文章での話しで、通常のビジネス文章なら、そこそこ修正すれば 使えるのかもしれないが。
420 名前:名無しさん@お腹いっぱい。 [2006/10/23(月) 07:17:04 ID:kQ6qEoy70] >>398 OCRは仕事に使うには、まだまだだと思います。修正する手間を考えると、 大人しくPDFファイルないしは、紙媒体でのコピーが確実です。
421 名前:名無しさん@お腹いっぱい。 [2006/10/24(火) 09:03:43 ID:f/S+mxkS0] >>419 WinReaderPROていまver10だよね。 どうだろうね?
422 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/25(水) 19:49:57 ID:BG1ZUYK90] 今来た過去ログ読んだ SmartOCR欲しい・・・
423 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/26(木) 07:12:56 ID:GXHptwKo0] >>422 ヒント:ocr.rossa.cc
424 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/26(木) 08:03:57 ID:E4aP431G0] >>422 君性格くらいね スパイウェアを広めるのはいくない
425 名前:Nomu [2006/11/03(金) 22:23:36 ID:iUKc4B5G0] スキャン画像にOCRを掛けて透明テキスト付きPDFを作成するところ までは出来ています。実際、検索も可能になっています。 さて、元のデータがExcelやWORDなどで、そこから直接PDF化したものは 元の文字をテキスト選択ツールで選択できますが、 OCRで透明テキストの場合は、テキスト選択ツールで選択できるように するのは無理でしょうか。 なお、TouchUpなどで無理やり透明な文字をかぶせる技もあるでしょうが、 そういう余計な手数は掛けずに、行える範囲での前提とします。
426 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/03(金) 22:45:22 ID:6588JCgI0] >>425 コテハンうざい
427 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/03(金) 23:00:51 ID:z32n03Yy0] PDFの透明テキストとOCRは関係ない 帰れ
428 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/03(金) 23:11:29 ID:tSrIGytR0] やってみてから書き込め、ボケ
429 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/04(土) 00:16:36 ID:ZktZmkOe0] そういう余計な手数は掛けずに、 行える範囲での前提とします。  ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ( ^ω^) ∧_∧ / \ ( )ハァ? 何言ってんだこいつ .__| | .| |_ / ヽ ||\  ̄ ̄ ̄ ̄ / .| | | ||\..∧_∧ (⌒\|__./ ./ ||. ( ) ~\_____ノ| ∧_∧ / ヽ 氏ねよ \| ( ) | ヽ \/ ヽ. オマエ馬鹿だろ | |ヽ、二⌒) / .| | |
430 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/05(日) 11:58:49 ID:Bnn8beJe0] ( ゚д゚) 「そういう余計な手数は掛けずに、行える範囲での前提とします。」・・・ _(__つ/ ̄ ̄ ̄/_ \/ /  ̄ ̄ ̄ ( ゚д゚ ) _(__つ/ ̄ ̄ ̄/_ \/ / ( ゚д゚ ) ガタッ .r ヾ __|_| / ̄ ̄ ̄/_ \/ / ⊂( ゚д゚ ) ヽ ⊂ ) (⌒)| ダッ 三 `J
431 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/05(日) 18:39:47 ID:Iiq9SX+t0] >>430 こっち向かって走ってくんなw
432 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/08(水) 20:38:44 ID:3HKpT8rw0] パナソニック、認識精度が向上したOCRソフト「読取革命Ver.11」 pc.watch.impress.co.jp/docs/2006/1108/pana.htm
433 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/20(月) 02:48:19 ID:UlfEHxa00] 読取革命もルビの扱いをなんとかしてくれないことには何とも。
434 名前:名無しさん@お腹いっぱい。 [2006/11/21(火) 21:16:46 ID:vrsLPcFX0] ライブPDFとsmartOCRって同じ作者じゃね?
435 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/29(水) 11:17:23 ID:zSFqDqCI0] www.sourcenext.com/titles/use/74170/ 入力可能な画像ファイル形式: ico, これってアイコンファイルだよな? これをテキスト化する状況が思い浮かばんのだがw
436 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/29(水) 14:20:16 ID:nreIeUGR0] ライブラリィが対応してるので、わざわざ読めないようにする方が手間かかるだけだろ
437 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/11/29(水) 16:04:41 ID:lWCW+zBj0] 435はケチをつけたいだけでしょ
438 名前:NNN [2006/12/09(土) 01:02:01 ID:2/wxd38Y0] 読んde!!ココを使っているが認識してワードで表示する際、文字列をいくつかのテキストボックスで 区切って表示するせいでいちいちコピーしなくてはならず余計に手間がかかるのですが テキストボックスで区切らせない方法orテキストボックスを一気に解除する方法ってないのですか?
439 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/09(土) 13:18:39 ID:u6P8MIbS0] ワードのVBA使え
440 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/09(土) 13:20:36 ID:u6P8MIbS0] マルチかよ・・・
441 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/10(日) 14:57:22 ID:uMaBJc8r0] -‐- ,、 __〃 ヽ lv ! ヽ\ .ノノノ)ヘ))〉ヽ' / ̄ ̄ ̄ ̄ ̄ _!(0.)! (┃┃〈リ / < はいっ! /\ Vレリ、" lフ/ ./ \ \_____ / ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ \/l |―――――――! ヽ l | ○ み か ん | l l―――――――| . \l_______|
442 名前:名無しさん@お腹いっぱい。 [2006/12/14(木) 10:40:39 ID:7AK0d3kH0] メディアドライブのHP、なんで見られないんでしょうか?
443 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/12/22(金) 08:26:12 ID:dGNQhmqY0] 復活しているよ
444 名前:名無しさん@お腹いっぱい。 [2007/01/05(金) 00:57:29 ID:EeadamAd0] 本格読取2、精度良いね。俺の手持ちのドキュメントでは、読んでココより精度がよかった。 1980円以上の価値はあると思う。
445 名前:名無しさん@お腹いっぱい。 [2007/01/07(日) 11:58:38 ID:dRvUQxjL0] >>444 読取革命V9そのままらしいからな。対値段比で考えると相当いい。 ただ英文がやたら弱くないか? 日本語だけの文章なら精度いいんだが、英語が混じると悲惨なことになる。
446 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/12(金) 16:11:17 ID:9w4xHvEE0] SmartOCR1.07を常用していたが、透明テキストつきpdfにする場合解像度の設定において勝手に文字の大きさ基準でサイズを変えてしまう。 したがって、(別なソフトで)複数のpdfを連結した場合、元が同じ大きさの原稿でもAdobeReader上では場合によって違う大きさ表示になってしまう。 今までは1画像→1pdfにしていたから問題にはならなかった・・・・・orz で、とりあえず読んdeココ12無料体験版を使ってみたのだが・・・・・自動認識の認識率が非常に悪い・・・・こうも違うものなのか? 読んdeココは、(白地に黒のただの文書原稿ならどうか知らないが)文字と絵や写真をふんだんに使ったカラフルな画像は苦手のようだ。
447 名前:446 mailto:sage [2007/01/13(土) 08:13:51 ID:txbwSWm00] >>446 のサイズが変わる件、自己解決。 ○○○、捨てないでとっておいてよかった。 今回、色々体験版を使ってみたが・・・ずいぶん認識率に差があるな。 今回使った原稿では、S>e>>>>>ry だった。 とくに、ある特定の文章において文字認識(95%以上の認識率)ができるソフトと、どう設定を変えても文字認識できなかったソフトがあるのはびっくりだった。
448 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/13(土) 18:25:01 ID:ZKON0N9L0] 英文OCRエンジンを搭載してるかどうか
449 名前:446 mailto:sage [2007/01/13(土) 20:49:48 ID:txbwSWm00] >>448 >>447 に対してかな? ならば・・・・対象文章の詳細。 現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。 それを360dpi bmpファイルにして読ませた。 この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5〜3mm)も一応読み取ってくれたが、他2はry もっと高解像度で試せという声が聞こえてきそうだが・・・ 印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。
450 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/14(日) 22:06:26 ID:gDvAo02g0] デフォルトの精度よりも 使い勝手で選んだ方がいいよ 学習させないとどれも使い物にならないんだし 学習させたらどれも同じレベルになる たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ
451 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/14(日) 23:27:20 ID:6UO6XDK00] >>450 最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね? (注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。 もちろん、体験版だからちょろっと触った程度である。 でも、各ソフトのスタートラインが違いすぎる。
452 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/21(日) 11:01:20 ID:If32Oo320] 革体験 傾き補正・自動の精度が悪い。 傾き補正・手動の操作性が悪い。
453 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 17:43:47 ID:ucWpj8mf0] 160GB SATAHDDがカッコヨスぎてwarota キヤンヘ凸−ンはこのFAXを受取られた従業員数1〜400名規模の事業者の方が対象となります。 rl ノ ■=■ 伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□‖亡!■lコ′hザdb■■■ ′つn M 刑同MR月巳の侍仏洞i肌同ロロりし乗lq エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※) AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581 ・AMDSempronTMプロセッサ3400+ ・WindowsxpHomeEdition正規版 ・5†2〃β(512MBxl)DDR2−SDRAMメモリ .†6∂GβS∧mJのβ ・サムスン製†タインデ丁打液晶モニタ(フサソク) ・内蔵NVIDIAGe†0rCeTM6150LEGPUクーラフイツクス ・DVD−ROMドライブ ・1年間引き取り修理サービス(保守ハD−ツ含む) ・12時間テクニカル電話サポートくE・メールサホ■−ト付) 大容量160GBHDD槻 さらに大画面19’モニ附!
454 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 18:14:50 ID:ucWpj8mf0] 元ネタです。(FAXモデムでダイレクト受信) www.uploda.org/uporg665477.png みなさんの環境でコレをOCRかけたら、どれだけ正確に取り込めますか? ちなみに上で試したのは 7年前のソフト 読んdeココVer2.11 全自動です。 いま出回っているソフトを使ったらどれだけ進化してるか興味があります。
455 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 21:46:12 ID:LSNalub20] >>454 e.Typist V11。自動認識で453までの文章結果。 範囲指定してやればもう少しマシだとは思うが。 >キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。 >1/29要! >期間限定お得な特別商品のご案内 >(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※) >AMDCPU搭載PCDimensionC521今週のおすすめ! >発注コード >・AMDSempronTMフロセッサ3400+ >・Windows回XPHomeEdition正規版 >・512ル擢∋(512MBx1)DDR2-sDRAMメモリ .>160GBSA7酒HDD >・サムスン製19"チTFr液晶モニタ(ブラック) >・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス >・DVD-ROMドライブ >・1年間引き取り修理サービス(保守パーツ含む) >・12時間テクニカル電話サボート(E・メールサボ.一ト付〉 >大容量160GBHDD搭載 >さらに大画面19,モニタ付1
456 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 23:08:02 ID:ovSgjl0P0] >>454 読んココ12、いきなり認識させて キヤンヘe−ンはこのFAXを受取られた従業員数1−4m名規模の事業者の方が対象となります。 い 期間限定お得な特月 商品のご案内 (一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※) め ・AMDSempronTMプロセッサ3400+ ・Windows@xpHomeEd血m正規版 ・512MB(512MBxl)DDR2−SDRAMメモリ .160GβSA7乃11DD ・サムスン製19ルゲm液晶モニタ(ブカク) ・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス ・DVD−ROMトうイブ ・1年間引き取り修理サービス(保守バーツ含む) ・12時間テク二カバ電扇滑ボート(Eメールサポート付) 発注コードこ 州田 植 − 引 仁 9
457 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/26(金) 09:32:20 ID:WPLblaIx0] 今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。 コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・ 一括修正で、「首が痛くなる」ぞw 修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。 (横書きはそのまま) 個々の似たような文字形を一緒に修正するかどうか選べる。 そこで取捨選択するのは、当然人間様のお仕事。 その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。 せめて、どちら向きで表示させるか選べればいいのにな。
458 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/27(土) 23:08:02 ID:t4gJ+ZZy0] s
459 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/01(木) 23:38:35 ID:of0mcj9v0] >>455 に感動し、e.typistを買うことにした。 実際試用版つかってみたけど、全然優秀だったし。 読んでココだと、tiffのカラー版はよめないとか言われたし・・
460 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/02(金) 07:52:29 ID:8CCYdWQc0] e.Typistと読んde!!ココ両方持ってるけど >459 同意するようなそうでもないような。 誤認識の所を再認識させるのはがやりやすい。 前、試した時は読んde!!ココの方が 元文書のレイアウトに近かった。
461 名前:名無しさん@お腹いっぱい。 [2007/02/10(土) 17:26:39 ID:7v8Omm3H0] ここでSmartOCR
462 名前:名無しさん@お腹いっぱい。 [2007/02/11(日) 19:03:49 ID:CU4bnzbg0] e.typist¥2万か・・・もうちっと安くならんかな・・・
463 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/12(月) 01:20:06 ID:ov2QAPy90] >>459 あのまま読み込むのではなく フィルタかけてからのほうがいいよ そうすれば広告の認識率に近くなる
464 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/20(火) 17:35:07 ID:R0Pvtepc0] >>404 d。これ、Copyじゃない方がいいのかな?
465 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/20(火) 17:45:40 ID:R0Pvtepc0] あ、今気付いた。コピーの3つは落としやすくするためと、予備か
466 名前:名無しさん@お腹いっぱい。 [2007/03/06(火) 15:17:55 ID:wiKC1IMb0] あげちょる
467 名前:名無しさん@お腹いっぱい。 [2007/03/11(日) 14:10:41 ID:BmeVkgEa0] 現時点で落とせる所キボン ついでにあげ