[OCR] 画像→テキスト ..
449:446
07/01/13 20:49:48 txbwSWm00
>>448
>>447に対してかな?
ならば・・・・対象文章の詳細。
現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。
それを360dpi bmpファイルにして読ませた。
この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5〜3mm)も一応読み取ってくれたが、他2はry
もっと高解像度で試せという声が聞こえてきそうだが・・・
印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。
450:名無しさん@お腹いっぱい。
07/01/14 22:06:26 gDvAo02g0
デフォルトの精度よりも
使い勝手で選んだ方がいいよ
学習させないとどれも使い物にならないんだし
学習させたらどれも同じレベルになる
たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ
451:名無しさん@お腹いっぱい。
07/01/14 23:27:20 6UO6XDK00
>>450
最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね?
(注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。
もちろん、体験版だからちょろっと触った程度である。
でも、各ソフトのスタートラインが違いすぎる。
452:名無しさん@お腹いっぱい。
07/01/21 11:01:20 If32Oo320
革体験
傾き補正・自動の精度が悪い。
傾き補正・手動の操作性が悪い。
453:名無しさん@お腹いっぱい。
07/01/24 17:43:47 ucWpj8mf0
160GB SATAHDDがカッコヨスぎてwarota
キヤンヘ凸−ンはこのFAXを受取られた従業員数1〜400名規模の事業者の方が対象となります。
rl ノ ■=■ 伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□‖亡!■lコ′hザdb■■■
′つn M 刑同MR月巳の侍仏洞i肌同ロロりし乗lq
エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※)
AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581
・AMDSempronTMプロセッサ3400+
・WindowsxpHomeEdition正規版
・5†2〃β(512MBxl)DDR2−SDRAMメモリ
.†6∂GβS∧mJのβ
・サムスン製†タインデ丁打液晶モニタ(フサソク)
・内蔵NVIDIAGe†0rCeTM6150LEGPUクーラフイツクス
・DVD−ROMドライブ
・1年間引き取り修理サービス(保守ハD−ツ含む)
・12時間テクニカル電話サポートくE・メールサホ■−ト付)
大容量160GBHDD槻
さらに大画面19’モニ附!
454:名無しさん@お腹いっぱい。
07/01/24 18:14:50 ucWpj8mf0
元ネタです。(FAXモデムでダイレクト受信)
URLリンク(www.uploda.org)
みなさんの環境でコレをOCRかけたら、どれだけ正確に取り込めますか?
ちなみに上で試したのは 7年前のソフト 読んdeココVer2.11 全自動です。
いま出回っているソフトを使ったらどれだけ進化してるか興味があります。
455:名無しさん@お腹いっぱい。
07/01/24 21:46:12 LSNalub20
>>454
e.Typist V11。自動認識で453までの文章結果。
範囲指定してやればもう少しマシだとは思うが。
>キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。
>1/29要!
>期間限定お得な特別商品のご案内
>(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※)
>AMDCPU搭載PCDimensionC521今週のおすすめ!
>発注コード
>・AMDSempronTMフロセッサ3400+
>・Windows回XPHomeEdition正規版
>・512ル擢∋(512MBx1)DDR2-sDRAMメモリ
.>160GBSA7酒HDD
>・サムスン製19"チTFr液晶モニタ(ブラック)
>・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス
>・DVD-ROMドライブ
>・1年間引き取り修理サービス(保守パーツ含む)
>・12時間テクニカル電話サボート(E・メールサボ.一ト付〉
>大容量160GBHDD搭載
>さらに大画面19,モニタ付1
456:名無しさん@お腹いっぱい。
07/01/24 23:08:02 ovSgjl0P0
>>454
読んココ12、いきなり認識させて
キヤンヘe−ンはこのFAXを受取られた従業員数1−4m名規模の事業者の方が対象となります。
い
期間限定お得な特月
商品のご案内
(一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※)
め
・AMDSempronTMプロセッサ3400+
・Windows@xpHomeEd血m正規版
・512MB(512MBxl)DDR2−SDRAMメモリ
.160GβSA7乃11DD
・サムスン製19ルゲm液晶モニタ(ブカク)
・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス
・DVD−ROMトうイブ
・1年間引き取り修理サービス(保守バーツ含む)
・12時間テク二カバ電扇滑ボート(Eメールサポート付)
発注コードこ
州田
植
−
引
仁
9
457:名無しさん@お腹いっぱい。
07/01/26 09:32:20 WPLblaIx0
今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。
コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・
一括修正で、「首が痛くなる」ぞw
修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。
(横書きはそのまま)
個々の似たような文字形を一緒に修正するかどうか選べる。
そこで取捨選択するのは、当然人間様のお仕事。
その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。
せめて、どちら向きで表示させるか選べればいいのにな。
458:名無しさん@お腹いっぱい。
07/01/27 23:08:02 t4gJ+ZZy0
s
459:名無しさん@お腹いっぱい。
07/02/01 23:38:35 of0mcj9v0
>>455 に感動し、e.typistを買うことにした。
実際試用版つかってみたけど、全然優秀だったし。
読んでココだと、tiffのカラー版はよめないとか言われたし・・
460:名無しさん@お腹いっぱい。
07/02/02 07:52:29 8CCYdWQc0
e.Typistと読んde!!ココ両方持ってるけど
>459
同意するようなそうでもないような。
誤認識の所を再認識させるのはがやりやすい。
前、試した時は読んde!!ココの方が
元文書のレイアウトに近かった。
461:名無しさん@お腹いっぱい。
07/02/10 17:26:39 7v8Omm3H0
ここでSmartOCR
462:名無しさん@お腹いっぱい。
07/02/11 19:03:49 CU4bnzbg0
e.typist¥2万か・・・もうちっと安くならんかな・・・
463:名無しさん@お腹いっぱい。
07/02/12 01:20:06 ov2QAPy90
>>459
あのまま読み込むのではなく
フィルタかけてからのほうがいいよ
そうすれば広告の認識率に近くなる
464:名無しさん@お腹いっぱい。
07/02/20 17:35:07 R0Pvtepc0
>>404
d。これ、Copyじゃない方がいいのかな?
465:名無しさん@お腹いっぱい。
07/02/20 17:45:40 R0Pvtepc0
あ、今気付いた。コピーの3つは落としやすくするためと、予備か
466:名無しさん@お腹いっぱい。
07/03/06 15:17:55 wiKC1IMb0
あげちょる
467:名無しさん@お腹いっぱい。
07/03/11 14:10:41 BmeVkgEa0
現時点で落とせる所キボン
ついでにあげ
468:名無しさん@お腹いっぱい。
07/03/12 11:24:47 rV9/0Wky0
>404で普通に落とせるよ。
ダウンロードのリンクが表示されるまでに時間が掛かるだけ。
469:名無しさん@お腹いっぱい。
07/03/12 13:20:19 NPUsZQVC0
>>468
ちょwマジだw
ありがと&うp主THX!
470:名無しさん@お腹いっぱい。
07/04/03 10:58:15 jcDWAVO40
471:名無しさん@お腹いっぱい。
07/04/04 23:47:30 5pEd6gF3O
URLリンク(itpro.nikkeibp.co.jp)
472:名無しさん@お腹いっぱい。
07/04/07 02:59:49 Mb5vzdo40
本格読取2、英語の読み取り精度が悪いと思ったら、辞書自体省かれてたのね・・・
platinum版は初版ベースなの?2ベースなの?
473:名無しさん@お腹いっぱい。
07/04/07 11:26:38 k8qrpDmi0
OCRソフトでテキスト化したデータに、
さらに、これ使えば、読み取りミスを発見できるのでは?!
文章校正支援ツール Just Right!2 オンラインカタログ
URLリンク(www.justsystem.co.jp)
474:名無しさん@お腹いっぱい。
07/04/07 16:10:22 3tCIEtVy0
WinReaderPROの 中古版だと安いし2〜3万円のおもちゃより、
認識度はダントツに違う 探せば掘り出し物はある。
図書館から借りてきて、テレビを観ながら自動スキャンして
満員電車の中でパームを使って読んでいる。
475:名無しさん@お腹いっぱい。
07/04/07 23:33:39 Tk1ABTk/0
スレ違いだけど借りてきた本を自動スキャンってどうやるの?
裁断できないよね?
476:名無しさん@お腹いっぱい。
07/04/08 00:17:50 iQtddhHD0
文化の荒廃の序章
477:名無しさん@お腹いっぱい。
07/04/08 08:14:55 ilEa/RWS0
>>475
下のどっちか
いずれにしてもお金持ち
URLリンク(atiz.com)
URLリンク(www.kirtas-tech.com)
478:名無しさん@お腹いっぱい。
07/04/08 09:09:31 ISzvp7710
ちょっとしたロボットみたいな感じだね
479:名無しさん@お腹いっぱい。
07/04/08 12:57:03 tTmtr51s0
1冊300円くらいで画像化してくれる所あるし
そういうの利用してるんじゃないかな。
480:名無しさん@お腹いっぱい。
07/04/15 21:45:33 NsGlMjxe0
英文オンリーでOCRソフト使いたいんですが、一番認識率いいのは
どれなんでしょうか。
海外のフリーソフトとかありますかね??
481:名無しさん@お腹いっぱい。
07/04/15 22:24:51 Oyanpx/80
値段によってだいぶ違う。
とっつきやすいのは、本格翻訳 SUPER(\2900)についてくるOCRとか。
482:名無しさん@お腹いっぱい。
07/04/17 01:11:41 UnFTo7Bd0
>>480
FineReader Pro
二ページ続きの画像を自動分割してくれる。本をOCRして
PDF保存するときに便利。
英語だけだと役不足かもしれない。欧文多言語認識につよい。
483:名無しさん@お腹いっぱい。
07/04/22 03:11:18 WC4lxGTB0
縦書きのルビを誤認識しないソフトはありますか?
484:名無しさん@お腹いっぱい。
07/04/22 18:39:06 gRg6gkbq0
>>483
体験版を使って判断したら?
やった上での質問なら使ったことのあるソフト名書いてくれ
扱う原稿の状態などによっても違うし一概には言えないからさ
485:名無しさん@お腹いっぱい。
07/04/22 22:40:54 H0dJsJl6O
>>484
分からないならスルーすりゃいいのに
486:名無しさん@お腹いっぱい。
07/04/22 22:52:32 NTiyhGlr0
つかルビなんて確実に認識できるソフトなんてあるか?
487:名無しさん@お腹いっぱい。
07/04/23 00:37:51 4t8hsufJ0
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか?
上1cmを読み取らないようにしたいのですが……
とりあえずフォトショップで全部切ってから読み込ませようと思ってますが
488:名無しさん@お腹いっぱい。
07/04/24 19:33:20 GMXFIsi/0
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない?
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな
489:名無しさん@お腹いっぱい。
07/04/24 19:34:13 GMXFIsi/0
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味
490:名無しさん@お腹いっぱい。
07/04/25 17:47:15 72dBCul00
URLリンク(no722.cocolog-nifty.com)
小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。
491:名無しさん@お腹いっぱい。
07/04/25 20:56:34 1/DHbGJL0
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。
492:名無しさん@お腹いっぱい。
07/04/26 01:43:03 GYa4q+ck0
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど
493:名無しさん@お腹いっぱい。
07/04/26 01:46:06 aXKryLXTO
>>492
だろうね
494:名無しさん@お腹いっぱい。
07/04/26 07:31:38 hsKdtYm00
>>491
手が後ろに回るぞ!
警察に報告しました、逃げるなよ
495:名無しさん@お腹いっぱい。
07/04/27 05:48:50 qJ7wVrGj0
>>491
nyで流れてる
496:名無しさん@お腹いっぱい。
07/04/27 20:16:56 TyEfRJXl0
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな
497:名無しさん@お腹いっぱい。
07/04/30 01:51:22 sLkYqs0k0
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意
498:名無しさん@お腹いっぱい。
07/04/30 05:59:12 5pL5s8yV0
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。
499:名無しさん@お腹いっぱい。
07/05/06 20:41:05 G03gIUz/0
漫画とかの目次の読み取り制度の高いOCRソフトって何?
自炊した漫画に目次とか手打ちしてくの怠過ぎ。
500:名無しさん@お腹いっぱい。
07/05/09 13:57:21 99QB49QB0
tes
501:名無しさん@お腹いっぱい。
07/05/19 17:34:20 MJYxjg3x0
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか?
502:名無しさん@お腹いっぱい。
07/05/19 23:46:09 PB2nZC+o0
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。
ソフト.EXE < 画像.JPG > 結果テキスト.txt
みたいな感じで読めるソフトありますか?
503:名無しさん@お腹いっぱい。
07/05/20 00:19:18 X0rH5ysl0
?
504:名無しさん@お腹いっぱい。
07/05/20 01:06:51 1nypUcOf0
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば?
ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。
505:名無しさん@お腹いっぱい。
07/05/20 01:57:05 fXVBB8f40
>>504
そうしてみます。どうもです。
506:名無しさん@お腹いっぱい。
07/05/24 00:05:13 m6D0J+hE0
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。
この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。
体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。
和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。
507:名無しさん@お腹いっぱい。
07/05/24 00:07:21 JtoWD+i20
eTypist>>>革命>>>>>>>>よめやここ
508:名無しさん@お腹いっぱい。
07/05/24 00:17:03 IP3+408H0
>極力Windows環境を汚したくない気持ちもあります。
あほかw
体験版試したあとOSクリーンインストールでもしろ
509:名無しさん@お腹いっぱい。
07/05/24 00:20:54 JtoWD+i20
↑まちがい
↓正解
RegSeeker
510:名無しさん@お腹いっぱい。
07/05/24 00:27:13 oQsTBG6L0
>>506
つ[Acronis True Image]
511:名無しさん@お腹いっぱい。
07/05/24 00:39:28 2EuU9Ihu0
TotalUninstall
512:名無しさん@お腹いっぱい。
07/05/26 20:26:38 95PnN5Qd0
e.typistの12っていつぐらいに出ると予想されます?
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。
513:名無しさん@お腹いっぱい。
07/05/29 20:35:52 KKC/xjSJ0
URLリンク(plusd.itmedia.co.jp)
「本格読取 2 Deluxe」、6月29日発売。2970円。
なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: URLリンク(www.google.co.jp)
514:名無しさん@お腹いっぱい。
07/05/30 21:21:07 pTXU8GzB0
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?
515:名無しさん@お腹いっぱい。
07/05/31 18:16:10 qsHbord50
>>506
smartお勧め
516:名無しさん@お腹いっぱい。
07/05/31 22:33:58 YxAzCzkf0
>>514
スキャナー付属の物ならまずwebに無いだろう
517:名無しさん@お腹いっぱい。
07/06/03 14:19:19 RWdiD0XW0
>>514
EPSONのHPにあるよ
518:名無しさん@お腹いっぱい。
07/06/07 12:28:22 +k6s2B/y0
>>506
いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。
やっぱり試用して、同じものスキャンしてみるといいよ。
519:名無しさん@お腹いっぱい。
07/06/07 13:32:08 c6qqyJBg0
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。
520:名無しさん@お腹いっぱい。
07/06/07 15:48:24 rTQM8Q420
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。
521:名無しさん@お腹いっぱい。
07/06/07 19:50:55 QT4A944M0
>>518
自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。
522:名無しさん@お腹いっぱい。
07/06/10 12:44:19 Bn9+OI/80
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ
523:名無しさん@お腹いっぱい。
07/06/10 21:47:17 O+MyPhJK0
>>522
文字認識のメニューから
言語を:日本語(英語混在)にする。
そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。
いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。
とにかく「空白出力」を有効にすることが必須。
本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。
524:名無しさん@お腹いっぱい。
07/06/11 22:57:26 fi0mIOzn0
>>523
d
525:名無しさん@お腹いっぱい。
07/06/12 21:14:17 TmZVwJCw0
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな?
読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です
526:名無しさん@お腹いっぱい。
07/06/14 18:16:13 MZzFuaL20
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?
527:名無しさん@お腹いっぱい。
07/06/14 20:02:32 /i8UfP/C0
>>526
> ないですよね?
という問い掛けをいやらしく感じるのは漏れだけ?
つURLリンク(www.google.com)
528:名無しさん@お腹いっぱい。
07/06/14 21:57:48 MZzFuaL20
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。
529:名無しさん@お腹いっぱい。
07/06/16 00:36:41 d8IXz+hf0
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない
>>528
>本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い
530:名無しさん@お腹いっぱい。
07/06/16 01:17:24 VQaiHJ1E0
>>529
読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー
531:名無しさん@お腹いっぱい。
07/06/16 12:00:27 Mq2PXuOr0
スレリンク(bsoft板)
532:名無しさん@お腹いっぱい。
07/06/18 09:30:58 puvoa998O
URLリンク(p20.fileseek.net)
だれか試して
533:名無しさん@お腹いっぱい。
07/06/20 10:49:02 JlYS+vI+O
>>532ミスってた
URLリンク(ocr.rossa.cc)な
534:名無しさん@お腹いっぱい。
07/06/22 14:20:21 7iUFwDnD0
試した。
フツーーーのOCRソフトだった。
532=533は何が聞きたかったのかな?
535:名無しさん@お腹いっぱい。
07/07/08 22:17:19 WDaFYbIE0
聞いてみて
536:名無しさん@お腹いっぱい。
07/07/10 11:00:58 R3FyXrqI0
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。
537:名無しさん@お腹いっぱい。
07/07/21 16:18:17 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???
538:名無しさん@お腹いっぱい。
07/07/21 16:23:32 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???
539:名無しさん@お腹いっぱい。
07/07/21 16:25:09 e2ZhIFOP0
スレ間違えました。失礼しました。
540:名無しさん@お腹いっぱい。
07/07/21 18:11:53 fXjgR9V20
300dpiあれば十分だろ
あとはコントラストとかの問題
541:名無しさん@お腹いっぱい。
07/07/22 00:46:45 0rh6CBEo0
300dpiでは低いよ。
400dpi以上。試せばわかるはず。
542:名無しさん@お腹いっぱい。
07/07/22 01:00:59 TRo+FmNZ0
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。
543:名無しさん@お腹いっぱい。
07/07/22 04:29:14 9fsxREmx0
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。
認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。
「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。
200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者
544:名無しさん@お腹いっぱい。
07/07/23 00:57:09 JoRSkVg70
一般的な印刷物って300dpiではなかったっけ?
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。
545:名無しさん@お腹いっぱい。
07/07/23 02:04:22 2Cew43Yn0
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分
あとは文字がクッキリとコントラスト等が調節できてるかによる
546:名無しさん@お腹いっぱい。
07/07/23 03:45:50 lorVcd360
そんな原稿なら手入力した方が現実的だな。
547:名無しさん@お腹いっぱい。
07/07/27 09:36:49 BD0S29j10
etypist12はどうですか?
548:名無しさん@お腹いっぱい。
07/08/05 01:40:32 5939Ae+P0
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
URLリンク(oshiete.new-akiba.com)
でも日本語未対応
549:名無しさん@お腹いっぱい。
07/08/29 20:36:32 HhJFBICD0
ここで大人気のSmartOCRってそんなに性能いい?
試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、
段組関係はお話にならないレベル。
X1
ってのが
X一になったりするしw
1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。
せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。
何かいい方法無いかなあ。
550:名無しさん@お腹いっぱい。
07/08/29 21:15:24 j//B3kLA0
タダなんだからそんなもんだろ
品質に不満ならe-typistでも買った方が早い
バージョンアップ版は大昔に買ったスキャナに
付いてたのでもOKだし安いからオススメ
551:名無しさん@お腹いっぱい。
07/08/29 21:41:29 vQuDIF5d0
ID変わったけど
>>550
e.Typistが一番いい?
読んでココの古いバージョンユーザーなんでうpグレードはこれが一番安いんだが。
質がいいのならそちらに乗り換えます。
メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。
552:名無しさん@お腹いっぱい。
07/08/29 22:21:48 ne9cS2rk0
背景に画像があるやつ(CDについてる歌詞)を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね
553:名無しさん@お腹いっぱい。
07/08/30 02:31:45 YMqPcJox0
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
(句読点とカッコ類を一文字分スペースにまとめてたり)
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。
色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。
554:名無しさん@お腹いっぱい。
07/08/30 04:17:48 8cX5+Y+i0
背景が英字新聞の場合は?
555:名無しさん@お腹いっぱい。
07/08/30 19:34:15 MBF2Q0dn0
553はまともに使ったことなさそうだな
556:名無しさん@お腹いっぱい。
07/08/31 19:28:40 X8mRf/wg0
>555
縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。
557:名無しさん@お腹いっぱい。
07/09/01 01:18:08 RaqlnS0/0
>>556
置換すればいいじゃん。
558:名無しさん@お腹いっぱい。
07/09/02 00:04:55 /ShAfiy40
>557はまともにOCR使ったことなさそうだな。
559:名無しさん@お腹いっぱい。
07/09/02 00:31:24 NVGVE2w40
>>556
話変わってるじゃんw
560:名無しさん@お腹いっぱい。
07/09/02 00:33:33 NVGVE2w40
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合
よく分からん
詳しく説明してほしい
561:名無しさん@お腹いっぱい。
07/09/02 02:37:28 kK0TPrWk0
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。
562:名無しさん@お腹いっぱい。
07/09/02 08:36:01 S2LE2C0F0
> OCRなど30年前から使ってるが。
認知症ですか。かわいそうに。
563:名無しさん@お腹いっぱい。
07/09/02 10:02:13 kK0TPrWk0
>>562
URLリンク(inu.ei.meisei-u.ac.jp)
564:名無しさん@お腹いっぱい。
07/09/02 19:22:06 b21q+l2y0
>>562
かわいそうに。
565:名無しさん@お腹いっぱい。
07/09/02 19:46:38 mZ3rWXVo0
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。
566:名無しさん@お腹いっぱい。
07/09/03 20:33:46 CzULmAqY0
>>562かわいそうに。
567:名無しさん@お腹いっぱい。
07/09/03 22:36:28 PyWafQ3J0
苛めよくない。
568:名無しさん@お腹いっぱい。
07/09/04 06:11:03 UdHs+6dV0
プレイなんだよきっと
569:名無しさん@お腹いっぱい
07/09/08 16:53:07 bG+CAb9F0
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。
570:名無しさん@お腹いっぱい。
07/09/08 19:33:58 6fbD8CNm0
解像度を上げて試してみようと思わないのかねぇ……
571:名無しさん@お腹いっぱい。
07/09/08 20:25:51 mRd7ARAC0
>スキャナーは300dpi
って書いてあるからハードウェアの光学解像度上限が300dpiなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。
572:名無しさん@お腹いっぱい。
07/09/08 21:03:57 bG+CAb9F0
>>570,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?
573:名無しさん@お腹いっぱい。
07/09/08 21:31:28 qzHioSaW0
画像の前処理が必要なんだと思う。
通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。
あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。
自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。
スキャン解像度は300dpiあれば十分だと思うよ。
574:名無しさん@お腹いっぱい。
07/09/08 22:21:40 9kXomqHo0
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)
575:名無しさん@お腹いっぱい。
07/09/09 04:18:08 Wayz4dwa0
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。
576:名無しさん@お腹いっぱい。
07/09/09 04:25:08 YeApTPNwP
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか
577:名無しさん@お腹いっぱい。
07/09/09 10:37:07 TJ6TdM9A0
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。
578:名無しさん@お腹いっぱい。
07/09/09 11:32:57 nU6AA3X+0
仕事で継続的にやることがわかってるんならネットバンギング登録すれば?
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ
579:名無しさん@お腹いっぱい。
07/09/09 12:20:35 p37oIG6b0
banging?
580:名無しさん@お腹いっぱい。
07/09/09 12:38:40 TJ6TdM9A0
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。
581:名無しさん@お腹いっぱい。
07/09/09 14:08:06 b4CWqVib0
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。
おまいさんが廃業すればいいんじゃねーの?
582:名無しさん@お腹いっぱい。
07/09/09 14:27:05 nU6AA3X+0
スマソ、バンキングね。
>>580
客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。
アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ
583:名無しさん@お腹いっぱい。
07/09/09 14:28:52 pF0za8zm0
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ
必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし
あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ
584:名無しさん@お腹いっぱい。
07/09/09 15:58:38 6WtPLdEA0
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない
585:名無しさん@お腹いっぱい。
07/09/09 16:09:19 TJ6TdM9A0
あ、スマン、
顧客の日々の取引(入金、出金 残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト いろいろやってみますね。
レス ありがd。
586:名無しさん@お腹いっぱい。
07/09/09 21:00:43 XLgeQDJm0
URLリンク(www.sii.co.jp)
587:名無しさん@お腹いっぱい。
07/09/09 22:55:58 0TmXydc30
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。
ってかプロなのかyo
ドシロウトの俺が「会計 通帳 OCR」と検索してあたりがつけられるようなことを
知らないのってやばいんでねーの。
588:名無しさん@お腹いっぱい。
07/09/09 23:20:35 TJ6TdM9A0
これでしょ。
実際に拡大コピーしないとダメだったのですが・・・。
URLリンク(www.z-irazu.jp)
589:名無しさん@お腹いっぱい。
07/09/10 23:46:17 tLXqJKXQ0
>>588
>>571
590:名無しさん@お腹いっぱい。
07/09/11 08:00:32 Homl5X9v0
> 顧客の日々の取引(入金、出金 残高、相手先)
> のデータ作成を請け負っている仕事なので
> ぜんぜん自分の口座と関係ないので乙。
頭足りてないなら、とっとと廃業するべきだ。
591:名無しさん@お腹いっぱい。
07/09/22 12:38:33 IN/2021F0
e.typist12.0で ルビを文中に挿入を選択して文庫本をスキャン>認識すると
一部の行が左端の最後の行に重複して表示されてしまうのですが
どう対処したらよいのでしょうか?
592:名無しさん@お腹いっぱい。
07/09/25 17:38:23 Pnv4wn/K0
>591
たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって
しまってる状態。
認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。
それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識
してる。それしか対処の方法はなさそう。
傍点が大量になければ、テキストになった段階で修正するだけ。
傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。
ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は
いつでもずれてるから。
593:名無しさん@お腹いっぱい。
07/09/28 00:49:01 kO0WhpSR0
>>575
んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR+人手チェックの方が早い
と、マジレスしてみる
594:名無しさん@お腹いっぱい。
07/09/28 02:22:27 FG/hllZY0
>>593
お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。
595:名無しさん@お腹いっぱい。
07/09/28 06:42:17 JinZJTny0
ダイバダッダの魂宿りますた。
世界平和のために無償労働するっす。
596:名無しさん@お腹いっぱい。
07/09/30 05:12:31 fVlDcJAE0
>職業がら200通位×ページ数
これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か 税務資料か
「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン
597:ご参考まで
07/09/30 05:50:09 fVlDcJAE0
旧ヴァージョン アップデート(以下からたどる):
URLリンク(panasonic.co.jp)
最新版(V1.1.1)の特長:
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識
解像度 50〜2,400dpi(400dpiを推奨)
>>596を一部訂正
URLリンク(panasonic.co.jp)
体験版(10日間)DL:
URLリンク(panasonic.co.jp)
598:名無しさん@お腹いっぱい。
07/10/01 23:00:54 ZJSIv2Sr0
記帳代行で乙。
599:名無しさん@お腹いっぱい。
07/10/03 02:48:08 lW4nXSBZ0
>>598
ご本人は正にその仕事をされているように思うのだがw
600:名無しさん@お腹いっぱい。
07/10/03 03:30:28 5xTbDZcD0
名簿データ取り込み?
601:名無しさん@お腹いっぱい。
07/10/03 04:51:39 9DUfmmoQO
URLリンク(imepita.jp)
602:名無しさん@お腹いっぱい。
07/10/03 05:07:51 ZwtirfFY0
下は簡単なCaptcha画像ですが、
Wikipedia項目リンク
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか?
603:名無しさん@お腹いっぱい。
07/10/03 07:43:43 nJglqY7H0
犯罪者乙!
604:名無しさん@お腹いっぱい。
07/10/03 09:58:49 lW4nXSBZ0
>>600
んや、税務会計関係
605:名無しさん@お腹いっぱい。
07/10/03 13:07:59 La1Wx76N0
>>602
スパム業者死ね
606:名無しさん@お腹いっぱい。
07/10/03 23:56:14 H4AdpPJY0
キャプチャってcaptureじゃなかったっけ
607:名無しさん@お腹いっぱい。
07/10/03 23:59:02 H4AdpPJY0
あー、全然別もんなんだ。俺が悪かった
608:名無しさん@お腹いっぱい。
07/10/12 22:47:53 SrJh6grm0
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。
609:名無しさん@お腹いっぱい。
07/10/13 17:16:36 nepRO5lX0
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの?
解決できるソフトはある?
610:名無しさん@お腹いっぱい。
07/10/13 17:39:44 GAhJKdKe0
学習機能は文字だけでしょ
611:名無しさん@お腹いっぱい。
07/10/14 06:29:53 VQe2G2hR0
間違えるのも認識するのも全て文字だけだが?
612:名無しさん@お腹いっぱい。
07/10/19 13:49:13 Ziv6Jg4J0
SmartOCR liteeditionのヘルプキャッシュってどこかにない?
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。
613:名無しさん@お腹いっぱい。
07/10/21 12:42:36 YC+r/lRo0
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される?
あとVer.11の方はアクティベーションあったりする?
614:名無しさん@お腹いっぱい。
07/10/21 13:20:42 zf4XBilV0
>>613
原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので
615:名無しさん@お腹いっぱい。
07/10/21 17:28:13 YC+r/lRo0
>>614
一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?
616:名無しさん@お腹いっぱい。
07/10/24 10:50:55 S7BJ2he10
613
10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが5文字になったとしてもあまり変わらないような気がする
617:名無しさん@お腹いっぱい。
07/10/24 17:12:22 PvY78B8J0
>>613
英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。
英語圏のソフトの最新体験版を試してみては?
618:名無しさん@お腹いっぱい。
07/11/08 01:17:26 kSzZVbgV0
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。
段組なし(1ブロック)、フォント1種類、スタイル1種類、
罫線類なし、みたいな原稿だったらかなりの精度が出るけど、
そういう原稿って実際はあまりないし。
OCRが持ってる綴り辞書との照合もオートでやらせちゃうと
後で間違いを発見するのがかえって難しくなるので、結局
フラグがたったものを1つずつ確認してくしかない。
619:618
07/11/08 01:24:35 kSzZVbgV0
>>618
>改良の予定があるよ。
(正)改良の余地があるよ。
620:名無しさん@お腹いっぱい。
07/11/09 04:45:42 kwRwnBQS0
OCR機能のついたPDFビューア「クセロReader ZERO」
URLリンク(xelo.jp)
621:名無しさん@お腹いっぱい。
07/11/21 00:51:16 4YWhz3M30
>>620
URLリンク(xelo.jp)
ここを見ると、色々制限あるな
622:名無しさん@お腹いっぱい。
07/11/24 16:52:47 vQJ6YjAl0
期間中にクリック数の一番多い国が優勝
URLリンク(www.clickclickclick.com)
623:名無しさん@お腹いっぱい。
07/11/24 17:45:26 /M81SGwoP
>>622
独自OCRなんてあるんだ。。。
624:名無しさん@お腹いっぱい。
07/12/10 03:27:04 oguiPK7L0
紙にある表の枠を、
Excelで再現させるのは何のソフトがおすすめですか?
625:名無しさん@お腹いっぱい。
07/12/10 05:33:02 hQNhfr3P0
特打
626:名無しさん@お腹いっぱい。
07/12/10 15:20:26 mc4o5/AO0
簡単フォーム
627:名無しさん@お腹いっぱい。
07/12/10 16:48:47 gWDyiZys0
兆安い
628:名無しさん@お腹いっぱい。
07/12/22 22:02:42 aoTjNDiZ0
>>621
制限がファイル単位ってのは実はかなり緩いんじゃないか?
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど
629:名無しさん@お腹いっぱい。
07/12/26 12:05:39 rr6NJUoQ0
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが...
ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。
スパイウェア貰っちゃったかな?
大丈夫ですかね?
630:名無しさん@お腹いっぱい。
07/12/26 15:31:38 ieaMIqGT0
あそこからリンクしてるSmartOCRLite107.zipの中身は
ウェブ魚拓で2006年4月26日 02:44(日本時間)に記録された URLリンク(download.vector.co.jp)の魚拓
と同じ。zipファイル内のSmartOCRLite107.EXEの
CRC32:5e81c645
MD5:929502ab3f674b03e1551893507a0997
SHA-1:20321d496c76a335d649e170100f2f4771be384b
631:名無しさん@お腹いっぱい。
08/01/08 01:02:12 tmDGCBY80
ほっしゅ
632:名無しさん@お腹いっぱい。
08/01/14 23:05:37 KbHOKl/s0
/⌒ヽ ,, - ─‐ - 、
, < ̄7⌒、_ノ::::::::::::::::::::::::::::::::::::::::::`ヽ
/:::::::::::::::乂 ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::\
/:::::::::::::>‐7:: ̄::::::::::::::::∧:::::::::ト.:::::::::::::::::::::::::::::::ヽ
:::::::::/ /::::::::::::::::::::::::/. V::::::|.ヽ:::::::::::::::::::::::::::::::::',.
// /::::::::::::::::::::::::/ V:::::.i ヽ.:::::::::::::::::::::::::::::::',
,::::::::::::::::::::::__/. V::i!::i ',::::::::::::::::::::::::::::::::i.
i:::::::::::::::/ ̄/ ` ',::i',::', ─- 、.::::::::::::::::::::|
. |:::::::::::/:::::./ , ',.i ' ,、 ∨::\::::::::::::::::::|
|::::::::::::::::./ !_ ` \ V::::ヽ::::::::::::::::|
. |:::::::::::::::/ /示え、 二_、、 V、::::::::::::::::|
. |八::/⌒ / ん;;;;;;;| /う ヾ、 ',:::::::::::::,
|/{ ∧ 弋二ソ |;;乂メ;| | |>k:::::/
k ⊥  ̄ 弋二ン /、iヽ/
. `‐| '  ̄ /_ `/ <早くVIPに帰ろうよお兄ちゃん
`、 メ__/
> _ r‐、 /ヾ
,, -''´ |!ヽ| >-- ‐ r<´.
rヽ´ / / 〈ニ ヽ , -、
|/ヽ\' ./| ヽ У \ / / かわいいは正義
./ \ヽ { ヽ、 ´ / ヽ ./´γ/ / URLリンク(afox.2ch.net)
/ / ヽ\ヽ  ̄` ─'/ | ∨Y彡ヽ,〈
633:名無しさん@お腹いっぱい。
08/02/05 14:27:51 j7DtTZgo0
本格読取2を購入して使ってみたけど、
さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。
読取革命11の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。
e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz
e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど
もう少し認識率と領域指定を試してみたかったのにな。
手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか?
634:名無しさん@お腹いっぱい。
08/02/05 19:54:01 4B5oC2/T0
>>633
WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、OSがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン&テキスト化、約1時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ
635:名無しさん@お腹いっぱい。
08/02/05 23:33:02 n6V+PtBt0
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて
一向に識字率が上がる気配が無いんですが、仕様ですか?
636:名無しさん@お腹いっぱい。
08/02/06 00:01:06 X1PyioH/0
>>635
読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだyoって教え込む機能があんじゃねえの?
637:名無しさん@お腹いっぱい。
08/02/06 01:29:31 ZvtDlRuB0
そういう機能があっても、間違えるものは間違えるのが読み取り革命
638:名無しさん@お腹いっぱい。
08/02/06 14:55:56 nDxnu5rf0
>>634
すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。
639:名無しさん@お腹いっぱい。
08/02/06 22:27:32 yNcr4Ry/0
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。
テンプレート一回一回あてさせるつもりか?しかも数行おきに認識されるってどーよ
それにしてもe.Typistの精度には驚いた。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4066日前に更新/206 KB
担当:undef