[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 12/23 15:51 / Filesize : 206 KB / Number-of Response : 904
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

[OCR] 画像→テキスト化総合



1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0]
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

449 名前:446 mailto:sage [2007/01/13(土) 20:49:48 ID:txbwSWm00]
>>448
>>447に対してかな?
ならば・・・・対象文章の詳細。
現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。
それを360dpi bmpファイルにして読ませた。
この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5〜3mm)も一応読み取ってくれたが、他2はry

もっと高解像度で試せという声が聞こえてきそうだが・・・
印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。

450 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/14(日) 22:06:26 ID:gDvAo02g0]
デフォルトの精度よりも
使い勝手で選んだ方がいいよ
学習させないとどれも使い物にならないんだし
学習させたらどれも同じレベルになる

たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ


451 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/14(日) 23:27:20 ID:6UO6XDK00]
>>450
最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね?

(注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。
もちろん、体験版だからちょろっと触った程度である。
でも、各ソフトのスタートラインが違いすぎる。

452 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/21(日) 11:01:20 ID:If32Oo320]
革体験
 傾き補正・自動の精度が悪い。
 傾き補正・手動の操作性が悪い。

453 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 17:43:47 ID:ucWpj8mf0]
160GB SATAHDDがカッコヨスぎてwarota

キヤンヘ凸−ンはこのFAXを受取られた従業員数1〜400名規模の事業者の方が対象となります。
rl ノ     ■=■            伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□‖亡!■lコ′hザdb■■■
 ′つn M      刑同MR月巳の侍仏洞i肌同ロロりし乗lq
 エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※)
AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581
・AMDSempronTMプロセッサ3400+
・WindowsxpHomeEdition正規版
・5†2〃β(512MBxl)DDR2−SDRAMメモリ
.†6∂GβS∧mJのβ
・サムスン製†タインデ丁打液晶モニタ(フサソク)
・内蔵NVIDIAGe†0rCeTM6150LEGPUクーラフイツクス
・DVD−ROMドライブ
・1年間引き取り修理サービス(保守ハD−ツ含む)
・12時間テクニカル電話サポートくE・メールサホ■−ト付)
大容量160GBHDD槻
さらに大画面19’モニ附!

454 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 18:14:50 ID:ucWpj8mf0]
元ネタです。(FAXモデムでダイレクト受信)
www.uploda.org/uporg665477.png

みなさんの環境でコレをOCRかけたら、どれだけ正確に取り込めますか?

ちなみに上で試したのは 7年前のソフト 読んdeココVer2.11 全自動です。
いま出回っているソフトを使ったらどれだけ進化してるか興味があります。


455 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 21:46:12 ID:LSNalub20]
>>454
e.Typist V11。自動認識で453までの文章結果。
範囲指定してやればもう少しマシだとは思うが。

>キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。
>1/29要!
>期間限定お得な特別商品のご案内
>(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※)
>AMDCPU搭載PCDimensionC521今週のおすすめ!
>発注コード
>・AMDSempronTMフロセッサ3400+
>・Windows回XPHomeEdition正規版
>・512ル擢∋(512MBx1)DDR2-sDRAMメモリ
.>160GBSA7酒HDD
>・サムスン製19"チTFr液晶モニタ(ブラック)
>・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス
>・DVD-ROMドライブ
>・1年間引き取り修理サービス(保守パーツ含む)
>・12時間テクニカル電話サボート(E・メールサボ.一ト付〉
>大容量160GBHDD搭載
>さらに大画面19,モニタ付1

456 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/24(水) 23:08:02 ID:ovSgjl0P0]
>>454
読んココ12、いきなり認識させて

キヤンヘe−ンはこのFAXを受取られた従業員数1−4m名規模の事業者の方が対象となります。



期間限定お得な特月
商品のご案内
(一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※)

・AMDSempronTMプロセッサ3400+
・Windows@xpHomeEd血m正規版
・512MB(512MBxl)DDR2−SDRAMメモリ
.160GβSA7乃11DD
・サムスン製19ルゲm液晶モニタ(ブカク)
・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス
・DVD−ROMトうイブ
・1年間引き取り修理サービス(保守バーツ含む)
・12時間テク二カバ電扇滑ボート(Eメールサポート付)
発注コードこ
州田




9

457 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/26(金) 09:32:20 ID:WPLblaIx0]
今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。
コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・
一括修正で、「首が痛くなる」ぞw

修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。
(横書きはそのまま)
個々の似たような文字形を一緒に修正するかどうか選べる。
そこで取捨選択するのは、当然人間様のお仕事。
その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。

せめて、どちら向きで表示させるか選べればいいのにな。



458 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/01/27(土) 23:08:02 ID:t4gJ+ZZy0]
s

459 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/01(木) 23:38:35 ID:of0mcj9v0]
>>455 に感動し、e.typistを買うことにした。
実際試用版つかってみたけど、全然優秀だったし。
読んでココだと、tiffのカラー版はよめないとか言われたし・・

460 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/02(金) 07:52:29 ID:8CCYdWQc0]
e.Typistと読んde!!ココ両方持ってるけど
>459
同意するようなそうでもないような。
誤認識の所を再認識させるのはがやりやすい。
前、試した時は読んde!!ココの方が
元文書のレイアウトに近かった。

461 名前:名無しさん@お腹いっぱい。 [2007/02/10(土) 17:26:39 ID:7v8Omm3H0]
ここでSmartOCR

462 名前:名無しさん@お腹いっぱい。 [2007/02/11(日) 19:03:49 ID:CU4bnzbg0]
e.typist¥2万か・・・もうちっと安くならんかな・・・

463 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/12(月) 01:20:06 ID:ov2QAPy90]
>>459
あのまま読み込むのではなく
フィルタかけてからのほうがいいよ
そうすれば広告の認識率に近くなる

464 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/20(火) 17:35:07 ID:R0Pvtepc0]
>>404
d。これ、Copyじゃない方がいいのかな?

465 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/02/20(火) 17:45:40 ID:R0Pvtepc0]
あ、今気付いた。コピーの3つは落としやすくするためと、予備か

466 名前:名無しさん@お腹いっぱい。 [2007/03/06(火) 15:17:55 ID:wiKC1IMb0]
あげちょる

467 名前:名無しさん@お腹いっぱい。 [2007/03/11(日) 14:10:41 ID:BmeVkgEa0]
現時点で落とせる所キボン

ついでにあげ



468 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/12(月) 11:24:47 ID:rV9/0Wky0]
>404で普通に落とせるよ。
ダウンロードのリンクが表示されるまでに時間が掛かるだけ。

469 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/03/12(月) 13:20:19 ID:NPUsZQVC0]
>>468
ちょwマジだw

ありがと&うp主THX!

470 名前:名無しさん@お腹いっぱい。 mailto:  [2007/04/03(火) 10:58:15 ID:jcDWAVO40]
 

471 名前:名無しさん@お腹いっぱい。 [2007/04/04(水) 23:47:30 ID:5pEd6gF3O]
itpro.nikkeibp.co.jp/article/USNEWS/20060906/247265/

472 名前:名無しさん@お腹いっぱい。 [2007/04/07(土) 02:59:49 ID:Mb5vzdo40]
本格読取2、英語の読み取り精度が悪いと思ったら、辞書自体省かれてたのね・・・
platinum版は初版ベースなの?2ベースなの?

473 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/07(土) 11:26:38 ID:k8qrpDmi0]
OCRソフトでテキスト化したデータに、
さらに、これ使えば、読み取りミスを発見できるのでは?!

文章校正支援ツール Just Right!2 オンラインカタログ
www.justsystem.co.jp/justright/toku01.html

474 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/07(土) 16:10:22 ID:3tCIEtVy0]
WinReaderPROの 中古版だと安いし2〜3万円のおもちゃより、
認識度はダントツに違う 探せば掘り出し物はある。
図書館から借りてきて、テレビを観ながら自動スキャンして
満員電車の中でパームを使って読んでいる。

 

475 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/07(土) 23:33:39 ID:Tk1ABTk/0]
スレ違いだけど借りてきた本を自動スキャンってどうやるの?
裁断できないよね?

476 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/08(日) 00:17:50 ID:iQtddhHD0]
文化の荒廃の序章

477 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/08(日) 08:14:55 ID:ilEa/RWS0]
>>475
下のどっちか
いずれにしてもお金持ち

atiz.com/bookdrive.php
www.kirtas-tech.com/index.asp



478 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/08(日) 09:09:31 ID:ISzvp7710]
ちょっとしたロボットみたいな感じだね

479 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/08(日) 12:57:03 ID:tTmtr51s0]
1冊300円くらいで画像化してくれる所あるし
そういうの利用してるんじゃないかな。

480 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 21:45:33 ID:NsGlMjxe0]
英文オンリーでOCRソフト使いたいんですが、一番認識率いいのは
どれなんでしょうか。
海外のフリーソフトとかありますかね??

481 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/15(日) 22:24:51 ID:Oyanpx/80]
値段によってだいぶ違う。
とっつきやすいのは、本格翻訳 SUPER(\2900)についてくるOCRとか。

482 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/17(火) 01:11:41 ID:UnFTo7Bd0]
>>480
FineReader Pro
二ページ続きの画像を自動分割してくれる。本をOCRして
PDF保存するときに便利。
英語だけだと役不足かもしれない。欧文多言語認識につよい。

483 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 03:11:18 ID:WC4lxGTB0]
縦書きのルビを誤認識しないソフトはありますか?

484 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 18:39:06 ID:gRg6gkbq0]
>>483
体験版を使って判断したら?
やった上での質問なら使ったことのあるソフト名書いてくれ

扱う原稿の状態などによっても違うし一概には言えないからさ

485 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 22:40:54 ID:H0dJsJl6O]
>>484
分からないならスルーすりゃいいのに

486 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 22:52:32 ID:NTiyhGlr0]
つかルビなんて確実に認識できるソフトなんてあるか?

487 名前:名無しさん@お腹いっぱい。 [2007/04/23(月) 00:37:51 ID:4t8hsufJ0]
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか?
上1cmを読み取らないようにしたいのですが……

とりあえずフォトショップで全部切ってから読み込ませようと思ってますが



488 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/24(火) 19:33:20 ID:GMXFIsi/0]
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない?
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな

489 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/24(火) 19:34:13 ID:GMXFIsi/0]
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味

490 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/25(水) 17:47:15 ID:72dBCul00]
ttp://no722.cocolog-nifty.com/

小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。

491 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/25(水) 20:56:34 ID:1/DHbGJL0]
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。

492 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 01:43:03 ID:GYa4q+ck0]
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど

493 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 01:46:06 ID:aXKryLXTO]
>>492
だろうね

494 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/26(木) 07:31:38 ID:hsKdtYm00]
>>491
手が後ろに回るぞ!
警察に報告しました、逃げるなよ


495 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/27(金) 05:48:50 ID:qJ7wVrGj0]
>>491
nyで流れてる

496 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/27(金) 20:16:56 ID:TyEfRJXl0]
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな

497 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/30(月) 01:51:22 ID:sLkYqs0k0]
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意



498 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/30(月) 05:59:12 ID:5pL5s8yV0]
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。


499 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/06(日) 20:41:05 ID:G03gIUz/0]
漫画とかの目次の読み取り制度の高いOCRソフトって何?
自炊した漫画に目次とか手打ちしてくの怠過ぎ。


500 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/09(水) 13:57:21 ID:99QB49QB0]
tes

501 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/19(土) 17:34:20 ID:MJYxjg3x0]
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか?

502 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/19(土) 23:46:09 ID:PB2nZC+o0]
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。

ソフト.EXE < 画像.JPG > 結果テキスト.txt

みたいな感じで読めるソフトありますか?

503 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 00:19:18 ID:X0rH5ysl0]


504 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 01:06:51 ID:1nypUcOf0]
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば?

ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。

505 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/20(日) 01:57:05 ID:fXVBB8f40]
>>504
そうしてみます。どうもです。

506 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:05:13 ID:m6D0J+hE0]
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。

この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。

体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。

和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。

507 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:07:21 ID:JtoWD+i20]
eTypist>>>革命>>>>>>>>よめやここ



508 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:17:03 ID:IP3+408H0]
>極力Windows環境を汚したくない気持ちもあります。
あほかw
体験版試したあとOSクリーンインストールでもしろ

509 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:20:54 ID:JtoWD+i20]
↑まちがい

↓正解
RegSeeker

510 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:27:13 ID:oQsTBG6L0]
>>506
つ[Acronis True Image]

511 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/24(木) 00:39:28 ID:2EuU9Ihu0]
TotalUninstall

512 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/26(土) 20:26:38 ID:95PnN5Qd0]
e.typistの12っていつぐらいに出ると予想されます?
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。

513 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/29(火) 20:35:52 ID:KKC/xjSJ0]
plusd.itmedia.co.jp/pcuser/articles/0705/29/news043.html
「本格読取 2 Deluxe」、6月29日発売。2970円。


なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: www.google.co.jp/search?q=%E6%9C%AC%E6%A0%BC%E8%AA%AD%E5%8F%96+platinum

514 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/30(水) 21:21:07 ID:pTXU8GzB0]
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?


515 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/31(木) 18:16:10 ID:qsHbord50]
>>506
smartお勧め

516 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/31(木) 22:33:58 ID:YxAzCzkf0]
>>514
スキャナー付属の物ならまずwebに無いだろう

517 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/03(日) 14:19:19 ID:RWdiD0XW0]
>>514
EPSONのHPにあるよ



518 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 12:28:22 ID:+k6s2B/y0]
>>506
 いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
 読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。

 やっぱり試用して、同じものスキャンしてみるといいよ。

519 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 13:32:08 ID:c6qqyJBg0]
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。

520 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 15:48:24 ID:rTQM8Q420]
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。

521 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/07(木) 19:50:55 ID:QT4A944M0]
>>518
 自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。

522 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/10(日) 12:44:19 ID:Bn9+OI/80]
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ

523 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/10(日) 21:47:17 ID:O+MyPhJK0]
>>522

文字認識のメニューから
 言語を:日本語(英語混在)にする。
 そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。

 いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。

 とにかく「空白出力」を有効にすることが必須。

 本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。



524 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/11(月) 22:57:26 ID:fi0mIOzn0]
>>523
d

525 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/12(火) 21:14:17 ID:TmZVwJCw0]
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな?
読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です

526 名前:名無しさん@お腹いっぱい。 [2007/06/14(木) 18:16:13 ID:MZzFuaL20]
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?

527 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/14(木) 20:02:32 ID:/i8UfP/C0]
>>526
> ないですよね?
という問い掛けをいやらしく感じるのは漏れだけ?
つttp://www.google.com/search?q=%E5%A4%9A%E8%A8%80%E8%AA%9E+OCR&ie=utf-8&oe=utf-8



528 名前:名無しさん@お腹いっぱい。 [2007/06/14(木) 21:57:48 ID:MZzFuaL20]
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。

529 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 00:36:41 ID:d8IXz+hf0]
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない

>>528
>本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い

530 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 01:17:24 ID:VQaiHJ1E0]
>>529
読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー

531 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/16(土) 12:00:27 ID:Mq2PXuOr0]
pc8.2ch.net/test/read.cgi/bsoft/996505150/

532 名前:名無しさん@お腹いっぱい。 [2007/06/18(月) 09:30:58 ID:puvoa998O]
p20.fileseek.net/cgi-bin/p.cgi?uR=ocr.rossa.cc%2F&sZ=
だれか試して

533 名前:名無しさん@お腹いっぱい。 [2007/06/20(水) 10:49:02 ID:JlYS+vI+O]
>>532ミスってた
ocr.rossa.cc/

534 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/22(金) 14:20:21 ID:7iUFwDnD0]
試した。
フツーーーのOCRソフトだった。

532=533は何が聞きたかったのかな?

535 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/08(日) 22:17:19 ID:WDaFYbIE0]
聞いてみて

536 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/10(火) 11:00:58 ID:R3FyXrqI0]
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。

537 名前:名無しさん@お腹いっぱい。 mailto:age [2007/07/21(土) 16:18:17 ID:e2ZhIFOP0]
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???



538 名前:名無しさん@お腹いっぱい。 [2007/07/21(土) 16:23:32 ID:e2ZhIFOP0]
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???


539 名前:名無しさん@お腹いっぱい。 [2007/07/21(土) 16:25:09 ID:e2ZhIFOP0]
スレ間違えました。失礼しました。

540 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/21(土) 18:11:53 ID:fXjgR9V20]
300dpiあれば十分だろ
あとはコントラストとかの問題

541 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 00:46:45 ID:0rh6CBEo0]
300dpiでは低いよ。
400dpi以上。試せばわかるはず。

542 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 01:00:59 ID:TRo+FmNZ0]
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。

543 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/22(日) 04:29:14 ID:9fsxREmx0]
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。

認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。

「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。

200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者

544 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 00:57:09 ID:JoRSkVg70]
一般的な印刷物って300dpiではなかったっけ?
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。


545 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 02:04:22 ID:2Cew43Yn0]
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分

あとは文字がクッキリとコントラスト等が調節できてるかによる

546 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/23(月) 03:45:50 ID:lorVcd360]
そんな原稿なら手入力した方が現実的だな。

547 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/27(金) 09:36:49 ID:BD0S29j10]
etypist12はどうですか?



548 名前:名無しさん@お腹いっぱい。 [2007/08/05(日) 01:40:32 ID:5939Ae+P0]
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
oshiete.new-akiba.com/archives/2007/07/googleocrsofti_freeocr.html


でも日本語未対応

549 名前:名無しさん@お腹いっぱい。 [2007/08/29(水) 20:36:32 ID:HhJFBICD0]
ここで大人気のSmartOCRってそんなに性能いい?

試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、
段組関係はお話にならないレベル。

X1
ってのが
X一になったりするしw

1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。

せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。

何かいい方法無いかなあ。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<206KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef