[OCR] 画像→テキスト化総合

[OCR] 画像→テキスト ..

485:名無しさん＠お腹いっぱい。
07/04/22 22:40:54 H0dJsJl6O
>>484
分からないならスルーすりゃいいのに

486:名無しさん＠お腹いっぱい。
07/04/22 22:52:32 NTiyhGlr0
つかルビなんて確実に認識できるソフトなんてあるか？

487:名無しさん＠お腹いっぱい。
07/04/23 00:37:51 4t8hsufJ0
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか？
上１ｃｍを読み取らないようにしたいのですが……

とりあえずフォトショップで全部切ってから読み込ませようと思ってますが

488:名無しさん＠お腹いっぱい。
07/04/24 19:33:20 GMXFIsi/0
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない？
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな

489:名無しさん＠お腹いっぱい。
07/04/24 19:34:13 GMXFIsi/0
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味

490:名無しさん＠お腹いっぱい。
07/04/25 17:47:15 72dBCul00
URLﾘﾝｸ(no722.cocolog-nifty.com)

小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。

491:名無しさん＠お腹いっぱい。
07/04/25 20:56:34 1/DHbGJL0
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。

492:名無しさん＠お腹いっぱい。
07/04/26 01:43:03 GYa4q+ck0
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど

493:名無しさん＠お腹いっぱい。
07/04/26 01:46:06 aXKryLXTO
>>492
だろうね

494:名無しさん＠お腹いっぱい。
07/04/26 07:31:38 hsKdtYm00
>>491
手が後ろに回るぞ！
警察に報告しました、逃げるなよ

495:名無しさん＠お腹いっぱい。
07/04/27 05:48:50 qJ7wVrGj0
>>491
nyで流れてる

496:名無しさん＠お腹いっぱい。
07/04/27 20:16:56 TyEfRJXl0
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな

497:名無しさん＠お腹いっぱい。
07/04/30 01:51:22 sLkYqs0k0
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意

498:名無しさん＠お腹いっぱい。
07/04/30 05:59:12 5pL5s8yV0
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。

499:名無しさん＠お腹いっぱい。
07/05/06 20:41:05 G03gIUz/0
漫画とかの目次の読み取り制度の高いOCRソフトって何？
自炊した漫画に目次とか手打ちしてくの怠過ぎ。

500:名無しさん＠お腹いっぱい。
07/05/09 13:57:21 99QB49QB0
tes

501:名無しさん＠お腹いっぱい。
07/05/19 17:34:20 MJYxjg3x0
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか？

502:名無しさん＠お腹いっぱい。
07/05/19 23:46:09 PB2nZC+o0
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。

ソフト.EXE　<　画像.JPG　> 結果テキスト.txt

みたいな感じで読めるソフトありますか？

503:名無しさん＠お腹いっぱい。
07/05/20 00:19:18 X0rH5ysl0
？

504:名無しさん＠お腹いっぱい。
07/05/20 01:06:51 1nypUcOf0
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば？

ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。

505:名無しさん＠お腹いっぱい。
07/05/20 01:57:05 fXVBB8f40
>>504
そうしてみます。どうもです。

506:名無しさん＠お腹いっぱい。
07/05/24 00:05:13 m6D0J+hE0
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。

この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。

体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。

和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。

507:名無しさん＠お腹いっぱい。
07/05/24 00:07:21 JtoWD+i20
eTypist>>>革命>>>>>>>>よめやここ

508:名無しさん＠お腹いっぱい。
07/05/24 00:17:03 IP3+408H0
＞極力Windows環境を汚したくない気持ちもあります。
あほかｗ
体験版試したあとOSクリーンインストールでもしろ

509:名無しさん＠お腹いっぱい。
07/05/24 00:20:54 JtoWD+i20
↑まちがい

↓正解
RegSeeker

510:名無しさん＠お腹いっぱい。
07/05/24 00:27:13 oQsTBG6L0
>>506
つ[Acronis True Image]

511:名無しさん＠お腹いっぱい。
07/05/24 00:39:28 2EuU9Ihu0
TotalUninstall

512:名無しさん＠お腹いっぱい。
07/05/26 20:26:38 95PnN5Qd0
e.typistの12っていつぐらいに出ると予想されます？
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。

513:名無しさん＠お腹いっぱい。
07/05/29 20:35:52 KKC/xjSJ0
URLﾘﾝｸ(plusd.itmedia.co.jp)
「本格読取 2 Deluxe」、6月29日発売。2970円。

なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: URLﾘﾝｸ(www.google.co.jp)

514:名無しさん＠お腹いっぱい。
07/05/30 21:21:07 pTXU8GzB0
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?

515:名無しさん＠お腹いっぱい。
07/05/31 18:16:10 qsHbord50
>>506
smartお勧め

516:名無しさん＠お腹いっぱい。
07/05/31 22:33:58 YxAzCzkf0
>>514
スキャナー付属の物ならまずｗｅｂに無いだろう

517:名無しさん＠お腹いっぱい。
07/06/03 14:19:19 RWdiD0XW0
>>514
EPSONのHPにあるよ

518:名無しさん＠お腹いっぱい。
07/06/07 12:28:22 +k6s2B/y0
>>506
　いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
　読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。

　やっぱり試用して、同じものスキャンしてみるといいよ。

519:名無しさん＠お腹いっぱい。
07/06/07 13:32:08 c6qqyJBg0
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。

520:名無しさん＠お腹いっぱい。
07/06/07 15:48:24 rTQM8Q420
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。

521:名無しさん＠お腹いっぱい。
07/06/07 19:50:55 QT4A944M0
>>518
　自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。

522:名無しさん＠お腹いっぱい。
07/06/10 12:44:19 Bn9+OI/80
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ

523:名無しさん＠お腹いっぱい。
07/06/10 21:47:17 O+MyPhJK0
＞＞522

文字認識のメニューから
　言語を：日本語（英語混在）にする。
　そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。

　いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。

　とにかく「空白出力」を有効にすることが必須。

　本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。

524:名無しさん＠お腹いっぱい。
07/06/11 22:57:26 fi0mIOzn0
>>523
㌧

525:名無しさん＠お腹いっぱい。
07/06/12 21:14:17 TmZVwJCw0
縦書きで、英語部分のみ90度回転（本を横にして読む）してる部分を認識する方法ってあるかな？
読み取り範囲に横書き／縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です

526:名無しさん＠お腹いっぱい。
07/06/14 18:16:13 MZzFuaL20
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね？

527:名無しさん＠お腹いっぱい。
07/06/14 20:02:32 /i8UfP/C0
>>526
> ないですよね？
という問い掛けをいやらしく感じるのは漏れだけ？
つURLﾘﾝｸ(www.google.com)

528:名無しさん＠お腹いっぱい。
07/06/14 21:57:48 MZzFuaL20
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでｗ
非常に助かりました。

529:名無しさん＠お腹いっぱい。
07/06/16 00:36:41 d8IXz+hf0
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない

>>528
>本当に悪意はないのでｗ
最後のｗもやめたほうがいいよ
「ないですよね？」や「ｗ」が
自然に出てくるようだとちと怖い

530:名無しさん＠お腹いっぱい。
07/06/16 01:17:24 VQaiHJ1E0
>>529
読取革命できるんだ！　超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー

531:名無しさん＠お腹いっぱい。
07/06/16 12:00:27 Mq2PXuOr0
ｽﾚﾘﾝｸ(bsoft板)

532:名無しさん＠お腹いっぱい。
07/06/18 09:30:58 puvoa998O
URLﾘﾝｸ(p20.fileseek.net)
だれか試して

533:名無しさん＠お腹いっぱい。
07/06/20 10:49:02 JlYS+vI+O
>>532ミスってた
URLﾘﾝｸ(ocr.rossa.cc)な

534:名無しさん＠お腹いっぱい。
07/06/22 14:20:21 7iUFwDnD0
試した。
フツーーーのＯＣＲソフトだった。

532=533は何が聞きたかったのかな？

535:名無しさん＠お腹いっぱい。
07/07/08 22:17:19 WDaFYbIE0
聞いてみて

536:名無しさん＠お腹いっぱい。
07/07/10 11:00:58 R3FyXrqI0
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、ＯＣＲ結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。

537:名無しさん＠お腹いっぱい。
07/07/21 16:18:17 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか？私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか？？？

538:名無しさん＠お腹いっぱい。
07/07/21 16:23:32 e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか？私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか？？？

539:名無しさん＠お腹いっぱい。
07/07/21 16:25:09 e2ZhIFOP0
スレ間違えました。失礼しました。

540:名無しさん＠お腹いっぱい。
07/07/21 18:11:53 fXjgR9V20
300dpiあれば十分だろ
あとはコントラストとかの問題

541:名無しさん＠お腹いっぱい。
07/07/22 00:46:45 0rh6CBEo0
300dpiでは低いよ。
400dpi以上。試せばわかるはず。

542:名無しさん＠お腹いっぱい。
07/07/22 01:00:59 TRo+FmNZ0
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。

543:名無しさん＠お腹いっぱい。
07/07/22 04:29:14 9fsxREmx0
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン）では少なくともそうだ。

認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。

「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。

200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは？＞質問者

544:名無しさん＠お腹いっぱい。
07/07/23 00:57:09 JoRSkVg70
一般的な印刷物って300dpiではなかったっけ？
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。

545:名無しさん＠お腹いっぱい。
07/07/23 02:04:22 2Cew43Yn0
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分

あとは文字がクッキリとコントラスト等が調節できてるかによる

546:名無しさん＠お腹いっぱい。
07/07/23 03:45:50 lorVcd360
そんな原稿なら手入力した方が現実的だな。

547:名無しさん＠お腹いっぱい。
07/07/27 09:36:49 BD0S29j10
etypist12はどうですか？

548:名無しさん＠お腹いっぱい。
07/08/05 01:40:32 5939Ae+P0
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
URLﾘﾝｸ(oshiete.new-akiba.com)

でも日本語未対応

549:名無しさん＠お腹いっぱい。
07/08/29 20:36:32 HhJFBICD0
ここで大人気のＳｍａｒｔＯＣＲってそんなに性能いい？

試しにLiteを使ってるんだけど、いくら学習させてもＸを×と誤認識するし、
段組関係はお話にならないレベル。

Ｘ１
ってのが
Ｘ一になったりするしｗ

１を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。

せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。

何かいい方法無いかなあ。

550:名無しさん＠お腹いっぱい。
07/08/29 21:15:24 j//B3kLA0
タダなんだからそんなもんだろ
品質に不満ならe-typistでも買った方が早い

バージョンアップ版は大昔に買ったスキャナに
付いてたのでもOKだし安いからオススメ

551:名無しさん＠お腹いっぱい。
07/08/29 21:41:29 vQuDIF5d0
ID変わったけど

>>550
e.Typistが一番いい？
読んでココの古いバージョンユーザーなんでうｐグレードはこれが一番安いんだが。

質がいいのならそちらに乗り換えます。

メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。

552:名無しさん＠お腹いっぱい。
07/08/29 22:21:48 ne9cS2rk0
背景に画像があるやつ（CDについてる歌詞）を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね

553:名無しさん＠お腹いっぱい。
07/08/30 02:31:45 YMqPcJox0
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
（句読点とカッコ類を一文字分スペースにまとめてたり）
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。

色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。

554:名無しさん＠お腹いっぱい。
07/08/30 04:17:48 8cX5+Y+i0
背景が英字新聞の場合は?

555:名無しさん＠お腹いっぱい。
07/08/30 19:34:15 MBF2Q0dn0
553はまともに使ったことなさそうだな

556:名無しさん＠お腹いっぱい。
07/08/31 19:28:40 X8mRf/wg0
>555
縦書きで、本文とルビを混ぜて１文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。

557:名無しさん＠お腹いっぱい。
07/09/01 01:18:08 RaqlnS0/0
>>556
置換すればいいじゃん。

558:名無しさん＠お腹いっぱい。
07/09/02 00:04:55 /ShAfiy40
>557はまともにOCR使ったことなさそうだな。

559:名無しさん＠お腹いっぱい。
07/09/02 00:31:24 NVGVE2w40
>>556
話変わってるじゃんｗ

560:名無しさん＠お腹いっぱい。
07/09/02 00:33:33 NVGVE2w40
>縦書きで、本文とルビを混ぜて１文字として認識しているような場合
よく分からん
詳しく説明してほしい

561:名無しさん＠お腹いっぱい。
07/09/02 02:37:28 kK0TPrWk0
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。

562:名無しさん＠お腹いっぱい。
07/09/02 08:36:01 S2LE2C0F0
> OCRなど30年前から使ってるが。

認知症ですか。かわいそうに。

563:名無しさん＠お腹いっぱい。
07/09/02 10:02:13 kK0TPrWk0
>>562
URLﾘﾝｸ(inu.ei.meisei-u.ac.jp)

564:名無しさん＠お腹いっぱい。
07/09/02 19:22:06 b21q+l2y0
>>562

かわいそうに。

565:名無しさん＠お腹いっぱい。
07/09/02 19:46:38 mZ3rWXVo0
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。

566:名無しさん＠お腹いっぱい。
07/09/03 20:33:46 CzULmAqY0
>>562かわいそうに。

567:名無しさん＠お腹いっぱい。
07/09/03 22:36:28 PyWafQ3J0
苛めよくない。

568:名無しさん＠お腹いっぱい。
07/09/04 06:11:03 UdHs+6dV0
プレイなんだよきっと

569:名無しさん＠お腹いっぱい
07/09/08 16:53:07 bG+CAb9F0
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300ｄｐｉです。

570:名無しさん＠お腹いっぱい。
07/09/08 19:33:58 6fbD8CNm0
解像度を上げて試してみようと思わないのかねぇ……

571:名無しさん＠お腹いっぱい。
07/09/08 20:25:51 mRd7ARAC0
>スキャナーは300ｄｐｉ
って書いてあるからハードウェアの光学解像度上限が３００ｄｐｉなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。

572:名無しさん＠お腹いっぱい。
07/09/08 21:03:57 bG+CAb9F0
>>570,571
レス、サンキュー
正解です。300ｄｐｉが限度なのです。
どの位ならいいのでしょうか?

573:名無しさん＠お腹いっぱい。
07/09/08 21:31:28 qzHioSaW0
画像の前処理が必要なんだと思う。

通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。

あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。

自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。

スキャン解像度は300dpiあれば十分だと思うよ。

574:名無しさん＠お腹いっぱい。
07/09/08 22:21:40 9kXomqHo0
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)

575:名無しさん＠お腹いっぱい。
07/09/09 04:18:08 Wayz4dwa0
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。

576:名無しさん＠お腹いっぱい。
07/09/09 04:25:08 YeApTPNwP
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか

577:名無しさん＠お腹いっぱい。
07/09/09 10:37:07 TJ6TdM9A0
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。

578:名無しさん＠お腹いっぱい。
07/09/09 11:32:57 nU6AA3X+0
仕事で継続的にやることがわかってるんならネットバンギング登録すれば？
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ

579:名無しさん＠お腹いっぱい。
07/09/09 12:20:35 p37oIG6b0
banging？

580:名無しさん＠お腹いっぱい。
07/09/09 12:38:40 TJ6TdM9A0
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(ＰＤＦ?)てなんでしょうか?ヒントになるかもしれない。

581:名無しさん＠お腹いっぱい。
07/09/09 14:08:06 b4CWqVib0
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(ＰＤＦ?)てなんでしょうか?ヒントになるかもしれない。

おまいさんが廃業すればいいんじゃねーの？

582:名無しさん＠お腹いっぱい。
07/09/09 14:27:05 nU6AA3X+0
スマソ、バンキングね。

>>580
客をネットバンクに入れさせる必要がどこにあるの？
要は取引明細をテキスト化できりゃいいんでしょ？
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。

アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ

583:名無しさん＠お腹いっぱい。
07/09/09 14:28:52 pF0za8zm0
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ

必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし

あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ

584:名無しさん＠お腹いっぱい。
07/09/09 15:58:38 6WtPLdEA0
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない

585:名無しさん＠お腹いっぱい。
07/09/09 16:09:19 TJ6TdM9A0
あ、スマン、
顧客の日々の取引(入金、出金　残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト　いろいろやってみますね。
レス　ありが㌧。

586:名無しさん＠お腹いっぱい。
07/09/09 21:00:43 XLgeQDJm0
URLﾘﾝｸ(www.sii.co.jp)

587:名無しさん＠お腹いっぱい。
07/09/09 22:55:58 0TmXydc30
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。
ってかプロなのかyo
ドシロウトの俺が「会計通帳 OCR」と検索してあたりがつけられるようなことを
知らないのってやばいんでねーの。

588:名無しさん＠お腹いっぱい。
07/09/09 23:20:35 TJ6TdM9A0
これでしょ。
実際に拡大コピーしないとダメだったのですが・・・。
URLﾘﾝｸ(www.z-irazu.jp)

589:名無しさん＠お腹いっぱい。
07/09/10 23:46:17 tLXqJKXQ0
>>588
>>571

590:名無しさん＠お腹いっぱい。
07/09/11 08:00:32 Homl5X9v0
> 顧客の日々の取引(入金、出金　残高、相手先)
> のデータ作成を請け負っている仕事なので
> ぜんぜん自分の口座と関係ないので乙。

頭足りてないなら、とっとと廃業するべきだ。

591:名無しさん＠お腹いっぱい。
07/09/22 12:38:33 IN/2021F0
e.typist12.0で　ルビを文中に挿入を選択して文庫本をスキャン＞認識すると
一部の行が左端の最後の行に重複して表示されてしまうのですが
どう対処したらよいのでしょうか？

592:名無しさん＠お腹いっぱい。
07/09/25 17:38:23 Pnv4wn/K0
>591
たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって
しまってる状態。
認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。
それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識
してる。それしか対処の方法はなさそう。
傍点が大量になければ、テキストになった段階で修正するだけ。

傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。
ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は
いつでもずれてるから。

593:名無しさん＠お腹いっぱい。
07/09/28 00:49:01 kO0WhpSR0
>>575
んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR＋人手チェックの方が早い

と、マジレスしてみる

594:名無しさん＠お腹いっぱい。
07/09/28 02:22:27 FG/hllZY0
>>593
お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。

595:名無しさん＠お腹いっぱい。
07/09/28 06:42:17 JinZJTny0
ダイバダッダの魂宿りますた。
世界平和のために無償労働するっす。

596:名無しさん＠お腹いっぱい。
07/09/30 05:12:31 fVlDcJAE0
>職業がら200通位×ページ数

これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か　税務資料か

「読取革命」、スキャナーは300ｄｐｉです　→　最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン

597:ご参考まで
07/09/30 05:50:09 fVlDcJAE0
旧ヴァージョン　アップデート(以下からたどる)：
URLﾘﾝｸ(panasonic.co.jp)

最新版（V1.1.1)の特長：
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識

解像度 50～2,400dpi(400dpiを推奨)
>>596を一部訂正

URLﾘﾝｸ(panasonic.co.jp)
体験版(10日間)DL：
URLﾘﾝｸ(panasonic.co.jp)

598:名無しさん＠お腹いっぱい。
07/10/01 23:00:54 ZJSIv2Sr0
記帳代行で乙。

599:名無しさん＠お腹いっぱい。
07/10/03 02:48:08 lW4nXSBZ0
>>598
ご本人は正にその仕事をされているように思うのだがｗ

600:名無しさん＠お腹いっぱい。
07/10/03 03:30:28 5xTbDZcD0
名簿データ取り込み?

601:名無しさん＠お腹いっぱい。
07/10/03 04:51:39 9DUfmmoQO
URLﾘﾝｸ(imepita.jp)

602:名無しさん＠お腹いっぱい。
07/10/03 05:07:51 ZwtirfFY0
下は簡単なCaptcha画像ですが、
Wikipedia項目ﾘﾝｸ
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか？

603:名無しさん＠お腹いっぱい。
07/10/03 07:43:43 nJglqY7H0
犯罪者乙！

604:名無しさん＠お腹いっぱい。
07/10/03 09:58:49 lW4nXSBZ0
>>600
んや、税務会計関係

605:名無しさん＠お腹いっぱい。
07/10/03 13:07:59 La1Wx76N0
>>602
スパム業者死ね

606:名無しさん＠お腹いっぱい。
07/10/03 23:56:14 H4AdpPJY0
キャプチャってcaptureじゃなかったっけ

607:名無しさん＠お腹いっぱい。
07/10/03 23:59:02 H4AdpPJY0
あー、全然別もんなんだ。俺が悪かった

608:名無しさん＠お腹いっぱい。
07/10/12 22:47:53 SrJh6grm0
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。

609:名無しさん＠お腹いっぱい。
07/10/13 17:16:36 nepRO5lX0
読取革命だが、２つの文字を１つと間違えてしまう問題を学習機能によって解決できるの？
解決できるソフトはある？

610:名無しさん＠お腹いっぱい。
07/10/13 17:39:44 GAhJKdKe0
学習機能は文字だけでしょ

611:名無しさん＠お腹いっぱい。
07/10/14 06:29:53 VQe2G2hR0
間違えるのも認識するのも全て文字だけだが?

612:名無しさん＠お腹いっぱい。
07/10/19 13:49:13 Ziv6Jg4J0
SmartOCR liteeditionのヘルプキャッシュってどこかにない？
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。

613:名無しさん＠お腹いっぱい。
07/10/21 12:42:36 YC+r/lRo0
今現在　読取革命のVer.7を使って　英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11　にすればもう少し改善される？
あとVer.11の方はアクティベーションあったりする？

614:名無しさん＠お腹いっぱい。
07/10/21 13:20:42 zf4XBilV0
>>613
原稿の精度に左右される。
[K]ものだなｗ
悪知は無かったと思う（あってもクリア）
検証後DELしてしまったので

615:名無しさん＠お腹いっぱい。
07/10/21 17:28:13 YC+r/lRo0
>>614
一般的な英語のテキストに対して使ってます
[K]もの？　体験版？それともクラックのことでしょうか？

616:名無しさん＠お腹いっぱい。
07/10/24 10:50:55 S7BJ2he10
６１３
１０文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが５文字になったとしてもあまり変わらないような気がする

617:名無しさん＠お腹いっぱい。
07/10/24 17:12:22 PvY78B8J0
>>613
英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。

英語圏のソフトの最新体験版を試してみては？

618:名無しさん＠お腹いっぱい。
07/11/08 01:17:26 kSzZVbgV0
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。
段組なし（１ブロック）、フォント１種類、スタイル１種類、
罫線類なし、みたいな原稿だったらかなりの精度が出るけど、
そういう原稿って実際はあまりないし。

OCRが持ってる綴り辞書との照合もオートでやらせちゃうと
後で間違いを発見するのがかえって難しくなるので、結局
フラグがたったものを１つずつ確認してくしかない。

619:618
07/11/08 01:24:35 kSzZVbgV0
>>618
>改良の予定があるよ。

（正）改良の余地があるよ。

620:名無しさん＠お腹いっぱい。
07/11/09 04:45:42 kwRwnBQS0
OCR機能のついたPDFビューア「クセロReader ZERO」
URLﾘﾝｸ(xelo.jp)

621:名無しさん＠お腹いっぱい。
07/11/21 00:51:16 4YWhz3M30
>>620
URLﾘﾝｸ(xelo.jp)
ここを見ると、色々制限あるな

622:名無しさん＠お腹いっぱい。
07/11/24 16:52:47 vQJ6YjAl0
期間中にクリック数の一番多い国が優勝
URLﾘﾝｸ(www.clickclickclick.com)

623:名無しさん＠お腹いっぱい。
07/11/24 17:45:26 /M81SGwoP
>>622
独自ＯＣＲなんてあるんだ。。。

624:名無しさん＠お腹いっぱい。
07/12/10 03:27:04 oguiPK7L0
紙にある表の枠を、
Excelで再現させるのは何のソフトがおすすめですか？

625:名無しさん＠お腹いっぱい。
07/12/10 05:33:02 hQNhfr3P0
特打

626:名無しさん＠お腹いっぱい。
07/12/10 15:20:26 mc4o5/AO0
簡単フォーム

627:名無しさん＠お腹いっぱい。
07/12/10 16:48:47 gWDyiZys0
兆安い

628:名無しさん＠お腹いっぱい。
07/12/22 22:02:42 aoTjNDiZ0
>>621
制限がファイル単位ってのは実はかなり緩いんじゃないか？
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど

629:名無しさん＠お腹いっぱい。
07/12/26 12:05:39 rr6NJUoQ0
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが...
ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。
スパイウェア貰っちゃったかな？
大丈夫ですかね？

630:名無しさん＠お腹いっぱい。
07/12/26 15:31:38 ieaMIqGT0
あそこからリンクしてるSmartOCRLite107.zipの中身は
ウェブ魚拓で2006年4月26日 02:44(日本時間)に記録された URLﾘﾝｸ(download.vector.co.jp)の魚拓
と同じ。zipファイル内のSmartOCRLite107.EXEの
CRC32：5e81c645
MD5：929502ab3f674b03e1551893507a0997
SHA-1：20321d496c76a335d649e170100f2f4771be384b

631:名無しさん＠お腹いっぱい。
08/01/08 01:02:12 tmDGCBY80
ほっしゅ

632:名無しさん＠お腹いっぱい。
08/01/14 23:05:37 KbHOKl/s0
　　　　　　　　/⌒ヽ ,,　-　─‐　-　、　　　　　　　　
　　　, ＜￣7⌒､_ノ::::::::::::::::::::::::::::::::::::::::::｀ヽ　　　　　　　
　／:::::::::::::::乂　ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::＼　　　　
/:::::::::::::＞‐7::￣::::::::::::::::∧:::::::::ﾄ.:::::::::::::::::::::::::::::::ヽ　　　
:::::::::／　/::::::::::::::::::::::::/.　V::::::|.ヽ:::::::::::::::::::::::::::::::::',.　　
/／　　 /::::::::::::::::::::::::/　　V:::::.i　ヽ.:::::::::::::::::::::::::::::::',　
　　　 ,::::::::::::::::::::::__/.　　　 V::i!::i 　',::::::::::::::::::::::::::::::::i.　
　　　 i:::::::::::::::／￣/ 　｀　　',::i',::',　─- 、.::::::::::::::::::::|　
.　　　|:::::::::::/:::::./ ,　　　　　　',.i ' ,､　 ∨::＼::::::::::::::::::|　
　　　|::::::::::::::::./　 !＿　　　　｀　　＼　V::::ヽ::::::::::::::::|　
.　　 |:::::::::::::::/　／示え、　　　　二_､、 V、::::::::::::::::|　
.　　 |八::/⌒　/ ん;;;;;;;| 　　　　　／うヾ、 ',:::::::::::::,　　
　　　 |/{　∧ 　弋二ソ　　　　　|;;乂メ;| |　|>ｋ:::::/　　
　　　　　ｋ ⊥　　￣　　　　　　弋二ン　 /、iヽ/　　　
.　　　　　｀‐|　　　　　　　'　　　　　￣　　/_ ｀／　＜早くVIPに帰ろうよお兄ちゃん
　　　　　　　｀､　　　　　　　　　　　　　メ__／　　　
　　　　　　　　　＞　_　　ｒ‐、　　　　／ヾ　　　　　　
　　　　　 ,, -''´　 |!ヽ| ＞-- ‐ r＜´.　　　　　　　　　
　　 rヽ´　　/　　/　　　　　　〈ﾆヽ　　　　　　　　 , -、
　　 |／ヽ＼'　 ./|　ヽ　　　　　 У　＼　　　　　　／／　　　　　　　　　　　　　　　　かわいいは正義
　 ./　　　＼ヽ {　ヽ、　　 ´　　/　　　ヽ ./´γ／／　　　　　　　　　　　　　　　　　URLﾘﾝｸ(afox.2ch.net)
　/　　 /　　ヽ＼ヽ　￣｀　─'/　　　| 　∨Y彡ヽ,〈　

633:名無しさん＠お腹いっぱい。
08/02/05 14:27:51 j7DtTZgo0
本格読取２を購入して使ってみたけど、
さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。
読取革命１１の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。
e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz

e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど
もう少し認識率と領域指定を試してみたかったのにな。
手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか？

634:名無しさん＠お腹いっぱい。
08/02/05 19:54:01 4B5oC2/T0
>>633
WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、ＯＳがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン＆テキスト化、約１時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ

635:名無しさん＠お腹いっぱい。
08/02/05 23:33:02 n6V+PtBt0
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて
一向に識字率が上がる気配が無いんですが、仕様ですか？

636:名無しさん＠お腹いっぱい。
08/02/06 00:01:06 X1PyioH/0
>>635
読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだｙoって教え込む機能があんじゃねえの？

637:名無しさん＠お腹いっぱい。
08/02/06 01:29:31 ZvtDlRuB0
そういう機能があっても、間違えるものは間違えるのが読み取り革命

638:名無しさん＠お腹いっぱい。
08/02/06 14:55:56 nDxnu5rf0
>>634
すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。

639:名無しさん＠お腹いっぱい。
08/02/06 22:27:32 yNcr4Ry/0
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。
テンプレート一回一回あてさせるつもりか？しかも数行おきに認識されるってどーよ

それにしてもe.Typistの精度には驚いた。

640:名無しさん＠お腹いっぱい。
08/02/07 02:16:50 mZYJX8l40
アドビAcrobat PRO CS3に付いているOCRはどうですか？

641:名無しさん＠お腹いっぱい。
08/02/09 13:22:11 kx6Thi940
>>633
小説用途に限った場合の話だけど

e.Typistは比較的領域判定が優秀なのでほとんどの場合は自動でおｋ
小説再配置ツールやeTilTranで文字領域を切り出すだけで十分すぎるほど
認識率は読取革命よりはだいぶ上
ただ、感嘆符や―、……、ーのような記号をよく間違えたり読み飛ばしたりする
まれに同じページを不完全な状態で二重認識する（上半分だけとかそんな感じで）
ここがネック

ユーザー辞書は読取革命で何回教えても治らなかった経験から、全く使っていない
後で間違えやすい文字だけ一括置換してる

642:名無しさん＠お腹いっぱい。
08/02/13 20:01:46 PDD8kYVFO
英単語帳を読み取ってエクセルのデータにして
P‐STUDYシステムに問題集として読み込ませようと思っているのですが
英単語帳にむいているOCRソフトってありますか？

643:名無しさん＠お腹いっぱい。
08/02/13 20:04:16 zrpzYaHV0
>>641
規制されていたので、お礼が遅れました。
e.Typist12を購入して使っています。
おっしゃるように！　―、ー、一あたりの誤認識が多いですね。
…に関しては点線処理の縦点線ありにしたら、かなりよくなりました。
一括置換も１００個が限度という所からエディタでするようにしました。
なかなか難しい所ですね。

644:名無しさん＠お腹いっぱい。
08/02/28 09:23:33 NWfNaQSi0
保守

645:名無しさん＠お腹いっぱい。
08/03/04 22:44:36 I6sGMd1z0
e.Typistでルビの部分の行を本文として処理してしまうことがたまにある。
eTilTranで傾き補正はかけた後なんだけど、これって解決する方法ないのかな？

ex)
正解：黄昏（たそがれ）が迫（せま）る道を

誤認識：たそがれ　　せま
　　　　　　黄昏が迫る道を

646:名無しさん＠お腹いっぱい。
08/03/07 00:49:49 i9ecjhLU0
読取革命１２、買おうかな。

647:名無しさん＠お腹いっぱい。
08/03/07 21:40:57 jfB3M2/r0
読取革命12と読んdeココ13を単行本の読み取りで比較してみたけど、読んdeココの方がよかった。
読取革命は文字以外の部分を無理矢理、認識しようとして意味不明の文字列を連発する。
読んdeココは認識できないものはスッパリ諦めて無視する傾向がある。
この方がむしろ修正の手間がかからないから楽なんだよね。

648:名無しさん＠お腹いっぱい。
08/03/10 09:02:26 1MG90Ymy0
そうかもしれないね。
でも読取革命のがしがし読む感じがいいんだよね（笑）
まあまとまったゴミを消去する機能があってもいいよね。

649:名無しさん＠お腹いっぱい。
08/03/21 11:14:49 usFTg7Jp0
以前から疑問だったんだが・・・
スキャナとかコピーとかしたとき、
原稿の一部だけ、字がにじんだり、潰れたりするのは何が原因なの？
途中で動いたってことなのかな？
しっかり押さえたつもりで、自覚症状が無いことがほとんどなんだが。

650:名無しさん＠お腹いっぱい。
08/03/21 14:03:36 vs8oaQ7S0
>>649
そうだと思います。
やっぱり、カード類なんかはプラスチックで滑りやすいんで、画像が
ボケたり、片側だけが広がったりしてますね。

651:名無しさん＠お腹いっぱい。
08/03/22 22:33:23 26pq4wpB0
読んでココ13を使い始めたばかりの者です。
英文混じりの書籍を認識させるとき、小文字のc,o,sが頻繁に大文字に認識されます。
候補文字から修正してると自動的にユーザー辞書に追加されていきますが、
このまま同じ文字ばかり追加していって、認識率は上がるのでしょうか？
まだそれほど認識速度は落ちていませんが。
ほかにもっと上手いやり方がありますか？

652:名無しさん＠お腹いっぱい。
08/03/22 23:31:46 B1KQW1w80
読取革命liteからver.12へのバージョンアップ、インストールがうまくできないのですが、この場合liteにver.12が上書きされることになるのですか？

653:名無しさん＠お腹いっぱい。
08/03/24 11:50:59 Sg3HQnEQ0
ライトも１２も残るよ。

654:名無しさん＠お腹いっぱい。
08/03/24 21:33:37 RpC75rJB0
>>653
652です。レスありがとうございます。何度インストールしても辞書の読み込みに失敗、ということになり、どうやらliteインストール後にマイドキュメントをＤディスクに移動させたのが原因ではないかと。Ｃに戻してから再度やってみます。

655:名無しさん＠お腹いっぱい。
08/03/24 23:38:54 RpC75rJB0
>>653
辞書ファイルも、ライトと１２と両方残るのですか？

656:名無しさん＠お腹いっぱい。
08/03/25 10:13:15 UKwYieMD0
>651
それ以上認識率は変わらない。やりすぎると重たくなるだけ。
むしろ、テキスト出力して正規表現置換で小文字にしてしまうほうが
簡単じゃないかな。

657:名無しさん＠お腹いっぱい。
08/03/25 20:01:55 6dsHcr8U0
当然残るよ。

658:名無しさん＠お腹いっぱい。
08/04/02 18:09:26 PsFZJM1O0
etypist使っとけ

659:名無しさん＠お腹いっぱい。
08/04/06 18:08:29 O2A1ix0/0
>>548
プリンタ付属の古い読んde!!ココパーソナル（Ver.4.01）を使ってたが，
英文の認識だとこっちのほうがいいね

660:名無しさん＠お腹いっぱい。
08/04/07 13:46:50 d5ef102Q0
eTypistて透明テキストつきpdfで出力できないの？

661:名無しさん＠お腹いっぱい。
08/04/08 10:20:28 /9Ax63ok0
pdfをrtfかodfに変換する時に使えそうなのない?

662:名無しさん＠お腹いっぱい。
08/04/09 18:14:29 wF5n2yAm0
つadobe acrobat

663:名無しさん＠お腹いっぱい。
08/04/10 11:21:55 0U+ttj0K0
>>660 可能
>>661 e.typistで可能
URLﾘﾝｸ(mediadrive.jp)

664:名無しさん＠お腹いっぱい。
08/04/10 15:03:50 pNf6kXbz0
読んでココでpdfを読み込むと、一から画像をＯＣＲしてしまって、
元の透明テキスト情報は無くなってしまうのな？
元の透明テキストをそなまま読み込んで、修正のために、
テキストエディタ的な使い方って出来ないものかな？

665:名無しさん＠お腹いっぱい。
08/04/11 23:10:11 Gt2UltzU0
画像ビューワとテキストエディタを左右に並べればいいだけでは？

666:名無しさん＠お腹いっぱい。
08/04/11 23:10:57 Gt2UltzU0
画像ビューワじゃねーや
PDFのビューワな

667:名無しさん＠お腹いっぱい。
08/04/13 03:10:25 CMPBLWQF0
それが器ホンダが、図とか写真とかレイアウトとか書式を設定したりするのが面倒くさいだろ。

668:名無しさん＠お腹いっぱい。
08/04/13 05:37:43 C/qukH7P0
>>667
それのどこが「テキストエディタ的な使い方」なんだ？

669:名無しさん＠お腹いっぱい。
08/04/13 21:11:39 CMPBLWQF0
テキストエディタ的って誰が言ったんだよ?

670:名無しさん＠お腹いっぱい。
08/04/14 11:14:54 dJXYpbuD0
>>664
つadobe acrobat

671:名無しさん＠お腹いっぱい。
08/04/15 21:11:34 3OAKXwi90
>>669
おまえ話の見えない奴だな～

672:名無しさん＠お腹いっぱい。
08/04/16 01:45:53 TQ1X288s0
>>664
使うソフトを間違えてる
OCRは画像をテキスト化するソフト
PDF関係のソフトをあたるのが正解

PDF作成・変換ソフト。Part 5
ｽﾚﾘﾝｸ(software板)

673:名無しさん＠お腹いっぱい。
08/04/23 21:47:14 q2B+fOBS0
英文しかない場合は、外国産の方が認識率高いの？
ヨンデココがどうもダメ、領域を正しく抽出する所から
ちゃんとやってくれない、かすれてないのに。
ネットで落としたものだから、コピーし直すとか出来ない。

674:名無しさん＠お腹いっぱい。
08/04/24 08:00:33 34xibooz0
>>673
SmartOCRLこれは？　文字がはっきり写ってるなら　高確率で認識してくれるよ？

675:名無しさん＠お腹いっぱい。
08/04/24 10:21:13 LqECzoR50
>>673
ちゃんと英語モードにしてからやってる？

676:673
08/04/25 20:14:31 SRLFiK0c0
一応、漢字は無し、英文字記号数字のみの
設定で読み込ませてはいます。
あとSmartOCRはぐぐってみたけど、
サイトが閉鎖してました。

677:名無しさん＠お腹いっぱい。
08/04/27 16:15:02 lWgL7JQt0
>>676
SmartOCR - フリーウェアのOCRソフト
URLﾘﾝｸ(ocr.rossa.cc)

678:名無しさん＠お腹いっぱい。
08/04/27 19:31:23 8zNLeoOp0
エクセルファイル⇔一太郎ファイル⇔ワードファイル
が出来るフリーソフトありませんかね？
一太郎で作った表を自動計算させたいのでエクセルファイルに変えたいのですが・・・。
ご存知でしたら教えていただけないでしょうか？

679:名無しさん＠お腹いっぱい。
08/04/27 20:09:38 gFFqjIH80
URLﾘﾝｸ(q.hatena.ne.jp)

680:名無しさん＠お腹いっぱい。
08/04/27 22:14:55 gVL4KMxz0
>>673
ABBYY社のFineReaderの最新版使うといいよ。
お試し版もあったはず。以前試してみて認識率の高さに感動した。
読んdeココも一応ABBYY社のエンジン使ってるけどたぶん古い。

681:名無しさん＠お腹いっぱい。
08/04/27 23:06:11 D4XQ9+0+0
ソフト形式を変換とかじゃなくて表の（ハイパー？）リンクだけで出来そうだが

682:蕪木ら某 ◆Googl8RmwA
08/04/28 04:38:47 kpMp0cZ40
>>678-679>>681
+ URLﾘﾝｸ(faq.justsystem.co.jp)
　URLﾘﾝｸ(faq.justsystem.co.jp)
　URLﾘﾝｸ(faq.justsystem.co.jp)
　...
　URLﾘﾝｸ(faq.justsystem.co.jp)
　...
　ｽﾚﾘﾝｸ(bsoft板)
　...

683:名無しさん＠お腹いっぱい。
08/04/28 08:03:53 KHm4WEpd0
>>682
はいはい　かしこいかしこい
なにもしなくても一太郎だけでできますよっと

次ページ