[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 12/23 15:51 / Filesize : 206 KB / Number-of Response : 904
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

[OCR] 画像→テキスト化総合



1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0]
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

596 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/30(日) 05:12:31 ID:fVlDcJAE0]
>職業がら200通位×ページ数

これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か 税務資料か

「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン


597 名前:ご参考まで [2007/09/30(日) 05:50:09 ID:fVlDcJAE0]
旧ヴァージョン アップデート(以下からたどる):
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/old.html

最新版(V1.1.1)の特長:
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識

解像度 50〜2,400dpi(400dpiを推奨)
>>596を一部訂正

ttp://panasonic.co.jp/pss/pstc/products/yomikaku/index.html
体験版(10日間)DL:
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/demo.html

598 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/01(月) 23:00:54 ID:ZJSIv2Sr0]
記帳代行で乙。

599 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 02:48:08 ID:lW4nXSBZ0]
>>598
ご本人は正にその仕事をされているように思うのだがw

600 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 03:30:28 ID:5xTbDZcD0]
名簿データ取り込み?

601 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 04:51:39 ID:9DUfmmoQO]
imepita.jp/20071003/110220

602 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 05:07:51 ID:ZwtirfFY0]
下は簡単なCaptcha画像ですが、
ja.wikipedia.org/wiki/%E7%94%BB%E5%83%8F:Captcha.png
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか?

603 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 07:43:43 ID:nJglqY7H0]
犯罪者乙!

604 名前:名無しさん@お腹いっぱい。 [2007/10/03(水) 09:58:49 ID:lW4nXSBZ0]
>>600
んや、税務会計関係



605 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 13:07:59 ID:La1Wx76N0]
>>602
スパム業者死ね

606 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 23:56:14 ID:H4AdpPJY0]
キャプチャってcaptureじゃなかったっけ

607 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/03(水) 23:59:02 ID:H4AdpPJY0]
あー、全然別もんなんだ。俺が悪かった

608 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/12(金) 22:47:53 ID:SrJh6grm0]
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。

609 名前:名無しさん@お腹いっぱい。 [2007/10/13(土) 17:16:36 ID:nepRO5lX0]
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの?
解決できるソフトはある?

610 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/13(土) 17:39:44 ID:GAhJKdKe0]
学習機能は文字だけでしょ


611 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/14(日) 06:29:53 ID:VQe2G2hR0]
間違えるのも認識するのも全て文字だけだが?

612 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/19(金) 13:49:13 ID:Ziv6Jg4J0]
SmartOCR liteeditionのヘルプキャッシュってどこかにない?
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。

613 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 12:42:36 ID:YC+r/lRo0]
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される?
あとVer.11の方はアクティベーションあったりする?

614 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 13:20:42 ID:zf4XBilV0]
>>613
原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので



615 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/21(日) 17:28:13 ID:YC+r/lRo0]
>>614
一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?


616 名前:名無しさん@お腹いっぱい。 [2007/10/24(水) 10:50:55 ID:S7BJ2he10]
613
10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが5文字になったとしてもあまり変わらないような気がする


617 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/24(水) 17:12:22 ID:PvY78B8J0]
>>613
英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。

英語圏のソフトの最新体験版を試してみては?

618 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 01:17:26 ID:kSzZVbgV0]
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。
段組なし(1ブロック)、フォント1種類、スタイル1種類、
罫線類なし、みたいな原稿だったらかなりの精度が出るけど、
そういう原稿って実際はあまりないし。

OCRが持ってる綴り辞書との照合もオートでやらせちゃうと
後で間違いを発見するのがかえって難しくなるので、結局
フラグがたったものを1つずつ確認してくしかない。


619 名前:618 mailto:sage [2007/11/08(木) 01:24:35 ID:kSzZVbgV0]
>>618
>改良の予定があるよ。

(正)改良の余地があるよ。

620 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/09(金) 04:45:42 ID:kwRwnBQS0]
OCR機能のついたPDFビューア「クセロReader ZERO」
ttp://xelo.jp/xelopdf/readerzero/index.html

621 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 00:51:16 ID:4YWhz3M30]
>>620
xelo.jp/xelopdf/readerzero/spec.html
ここを見ると、色々制限あるな

622 名前:名無しさん@お腹いっぱい。 [2007/11/24(土) 16:52:47 ID:vQJ6YjAl0]
期間中にクリック数の一番多い国が優勝
www.clickclickclick.com/default.asp


623 名前:名無しさん@お腹いっぱい。 [2007/11/24(土) 17:45:26 ID:/M81SGwoP]
>>622
独自OCRなんてあるんだ。。。

624 名前:名無しさん@お腹いっぱい。 [2007/12/10(月) 03:27:04 ID:oguiPK7L0]
紙にある表の枠を、
Excelで再現させるのは何のソフトがおすすめですか?



625 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/10(月) 05:33:02 ID:hQNhfr3P0]
特打

626 名前:名無しさん@お腹いっぱい。 [2007/12/10(月) 15:20:26 ID:mc4o5/AO0]
簡単フォーム

627 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/10(月) 16:48:47 ID:gWDyiZys0]
兆安い


628 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 22:02:42 ID:aoTjNDiZ0]
>>621
制限がファイル単位ってのは実はかなり緩いんじゃないか?
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど

629 名前:名無しさん@お腹いっぱい。 [2007/12/26(水) 12:05:39 ID:rr6NJUoQ0]
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが...
ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。
スパイウェア貰っちゃったかな?
大丈夫ですかね?

630 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/26(水) 15:31:38 ID:ieaMIqGT0]
あそこからリンクしてるSmartOCRLite107.zipの中身は
ウェブ魚拓で2006年4月26日 02:44(日本時間)に記録された download.vector.co.jp/pack/winnt/writing/other/SmartOCRLite107.zipの魚拓
と同じ。zipファイル内のSmartOCRLite107.EXEの
CRC32:5e81c645
MD5:929502ab3f674b03e1551893507a0997
SHA-1:20321d496c76a335d649e170100f2f4771be384b

631 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/08(火) 01:02:12 ID:tmDGCBY80]
ほっしゅ

632 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/14(月) 23:05:37 ID:KbHOKl/s0]
        /⌒ヽ ,, - ──‐ - 、        
   , < ̄7⌒、_ノ::::::::::::::::::::::::::::::::::::::::::`ヽ       
 /:::::::::::::::乂 ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::\    
/:::::::::::::>‐7:: ̄::::::::::::::::∧:::::::::ト.:::::::::::::::::::::::::::::::ヽ   
:::::::::/  /::::::::::::::::::::::::/. V::::::|.ヽ:::::::::::::::::::::::::::::::::',.  
//   /::::::::::::::::::::::::/   V:::::.i ヽ.:::::::::::::::::::::::::::::::', 
     ,::::::::::::::::::::::__/.    V::i!::i  ',::::::::::::::::::::::::::::::::i. 
    i:::::::::::::::/ ̄/   `  ',::i',::', ─- 、.::::::::::::::::::::| 
.   |:::::::::::/:::::./ ,      ',.i ' ,、  ∨::\::::::::::::::::::| 
   |::::::::::::::::./  !_      `  \ V::::ヽ::::::::::::::::| 
.   |:::::::::::::::/ /示え、      二_、、 V、::::::::::::::::| 
.   |八::/⌒ / ん;;;;;;;|       /う ヾ、 ',:::::::::::::,  
    |/{ ∧  弋二ソ       |;;乂メ;| | |>k:::::/  
     k ⊥    ̄        弋二ン  /、iヽ/   
.      `‐|       '       ̄  /_ `/   <早くVIPに帰ろうよお兄ちゃん
        `、              メ__/    
         > _   r‐、    /ヾ       
      ,, -''´  |!ヽ| >-- ‐ r<´.         
   rヽ´  /  /       〈ニ ヽ          , -、
   |/ヽ\'  ./| ヽ      У \      / /                かわいいは正義
  ./   \ヽ { ヽ、   ´  /    ヽ ./´γ/ /                 afox.2ch.net/news4vip/
 /   /  ヽ\ヽ  ̄` ─'/   |  ∨Y彡ヽ,〈 

633 名前:名無しさん@お腹いっぱい。 [2008/02/05(火) 14:27:51 ID:j7DtTZgo0]
本格読取2を購入して使ってみたけど、
さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。
読取革命11の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。
e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz

e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど
もう少し認識率と領域指定を試してみたかったのにな。
手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか?

634 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/05(火) 19:54:01 ID:4B5oC2/T0]
>>633
WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、OSがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン&テキスト化、約1時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ







635 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/05(火) 23:33:02 ID:n6V+PtBt0]
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて
一向に識字率が上がる気配が無いんですが、仕様ですか?

636 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 00:01:06 ID:X1PyioH/0]
>>635
読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだyoって教え込む機能があんじゃねえの?

637 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 01:29:31 ID:ZvtDlRuB0]
そういう機能があっても、間違えるものは間違えるのが読み取り革命

638 名前:名無しさん@お腹いっぱい。 [2008/02/06(水) 14:55:56 ID:nDxnu5rf0]
>>634
すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。

639 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/06(水) 22:27:32 ID:yNcr4Ry/0]
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。
テンプレート一回一回あてさせるつもりか?しかも数行おきに認識されるってどーよ

それにしてもe.Typistの精度には驚いた。

640 名前:名無しさん@お腹いっぱい。 [2008/02/07(木) 02:16:50 ID:mZYJX8l40]
アドビAcrobat PRO CS3に付いているOCRはどうですか?


641 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/09(土) 13:22:11 ID:kx6Thi940]
>>633
小説用途に限った場合の話だけど

e.Typistは比較的領域判定が優秀なのでほとんどの場合は自動でおk
小説再配置ツールやeTilTranで文字領域を切り出すだけで十分すぎるほど
認識率は読取革命よりはだいぶ上
ただ、感嘆符や――、……、ーのような記号をよく間違えたり読み飛ばしたりする
まれに同じページを不完全な状態で二重認識する(上半分だけとかそんな感じで)
ここがネック

ユーザー辞書は読取革命で何回教えても治らなかった経験から、全く使っていない
後で間違えやすい文字だけ一括置換してる

642 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/13(水) 20:01:46 ID:PDD8kYVFO]
英単語帳を読み取ってエクセルのデータにして
P‐STUDYシステムに問題集として読み込ませようと思っているのですが
英単語帳にむいているOCRソフトってありますか?

643 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/13(水) 20:04:16 ID:zrpzYaHV0]
>>641
規制されていたので、お礼が遅れました。
e.Typist12を購入して使っています。
おっしゃるように! ――、ー、一あたりの誤認識が多いですね。
…に関しては点線処理の縦点線ありにしたら、かなりよくなりました。
一括置換も100個が限度という所からエディタでするようにしました。
なかなか難しい所ですね。

644 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/28(木) 09:23:33 ID:NWfNaQSi0]
保守



645 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/04(火) 22:44:36 ID:I6sGMd1z0]
e.Typistでルビの部分の行を本文として処理してしまうことがたまにある。
eTilTranで傾き補正はかけた後なんだけど、これって解決する方法ないのかな?

ex)
正解:黄昏(たそがれ)が迫(せま)る道を

誤認識:たそがれ  せま
      黄昏が迫る道を

646 名前:名無しさん@お腹いっぱい。 [2008/03/07(金) 00:49:49 ID:i9ecjhLU0]
読取革命12、買おうかな。

647 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/07(金) 21:40:57 ID:jfB3M2/r0]
読取革命12と読んdeココ13を単行本の読み取りで比較してみたけど、読んdeココの方がよかった。
読取革命は文字以外の部分を無理矢理、認識しようとして意味不明の文字列を連発する。
読んdeココは認識できないものはスッパリ諦めて無視する傾向がある。
この方がむしろ修正の手間がかからないから楽なんだよね。

648 名前:名無しさん@お腹いっぱい。 [2008/03/10(月) 09:02:26 ID:1MG90Ymy0]
そうかもしれないね。
でも読取革命のがしがし読む感じがいいんだよね(笑)
まあまとまったゴミを消去する機能があってもいいよね。

649 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 11:14:49 ID:usFTg7Jp0]
以前から疑問だったんだが・・・
スキャナとかコピーとかしたとき、
原稿の一部だけ、字がにじんだり、潰れたりするのは何が原因なの?
途中で動いたってことなのかな?
しっかり押さえたつもりで、自覚症状が無いことがほとんどなんだが。

650 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 14:03:36 ID:vs8oaQ7S0]
>>649
そうだと思います。
やっぱり、カード類なんかはプラスチックで滑りやすいんで、画像が
ボケたり、片側だけが広がったりしてますね。


651 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/22(土) 22:33:23 ID:26pq4wpB0]
読んでココ13を使い始めたばかりの者です。
英文混じりの書籍を認識させるとき、小文字のc,o,sが頻繁に大文字に認識されます。
候補文字から修正してると自動的にユーザー辞書に追加されていきますが、
このまま同じ文字ばかり追加していって、認識率は上がるのでしょうか?
まだそれほど認識速度は落ちていませんが。
ほかにもっと上手いやり方がありますか?

652 名前:名無しさん@お腹いっぱい。 [2008/03/22(土) 23:31:46 ID:B1KQW1w80]
読取革命liteからver.12へのバージョンアップ、インストールがうまくできないのですが、この場合liteにver.12が上書きされることになるのですか?

653 名前:名無しさん@お腹いっぱい。 [2008/03/24(月) 11:50:59 ID:Sg3HQnEQ0]
ライトも12も残るよ。

654 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 21:33:37 ID:RpC75rJB0]
>>653
652です。レスありがとうございます。何度インストールしても辞書の読み込みに失敗、ということになり、どうやらliteインストール後にマイドキュメントをDディスクに移動させたのが原因ではないかと。Cに戻してから再度やってみます。



655 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 23:38:54 ID:RpC75rJB0]
>>653
辞書ファイルも、ライトと12と両方残るのですか?

656 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/25(火) 10:13:15 ID:UKwYieMD0]
>651
それ以上認識率は変わらない。やりすぎると重たくなるだけ。
むしろ、テキスト出力して正規表現置換で小文字にしてしまうほうが
簡単じゃないかな。

657 名前:名無しさん@お腹いっぱい。 [2008/03/25(火) 20:01:55 ID:6dsHcr8U0]
当然残るよ。

658 名前:名無しさん@お腹いっぱい。 [2008/04/02(水) 18:09:26 ID:PsFZJM1O0]
etypist使っとけ

659 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/06(日) 18:08:29 ID:O2A1ix0/0]
>>548
プリンタ付属の古い読んde!!ココ パーソナル(Ver.4.01)を使ってたが,
英文の認識だとこっちのほうがいいね

660 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/07(月) 13:46:50 ID:d5ef102Q0]
eTypistて透明テキストつきpdfで出力できないの?


661 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/08(火) 10:20:28 ID:/9Ax63ok0]
pdfをrtfかodfに変換する時に使えそうなのない?

662 名前:名無しさん@お腹いっぱい。 [2008/04/09(水) 18:14:29 ID:wF5n2yAm0]
つadobe acrobat

663 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/10(木) 11:21:55 ID:0U+ttj0K0]
>>660 可能
>>661 e.typistで可能
mediadrive.jp/products/et/index3.html

664 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/10(木) 15:03:50 ID:pNf6kXbz0]
読んでココでpdfを読み込むと、一から画像をOCRしてしまって、
元の透明テキスト情報は無くなってしまうのな?
元の透明テキストをそなまま読み込んで、修正のために、
テキストエディタ的な使い方って出来ないものかな?



665 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/11(金) 23:10:11 ID:Gt2UltzU0]
画像ビューワとテキストエディタを左右に並べればいいだけでは?

666 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/11(金) 23:10:57 ID:Gt2UltzU0]
画像ビューワじゃねーや
PDFのビューワな

667 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/13(日) 03:10:25 ID:CMPBLWQF0]
それが器ホンダが、図とか写真とかレイアウトとか書式を設定したりするのが面倒くさいだろ。

668 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/13(日) 05:37:43 ID:C/qukH7P0]
>>667
それのどこが「テキストエディタ的な使い方」なんだ?

669 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/13(日) 21:11:39 ID:CMPBLWQF0]
テキストエディタ的って誰が言ったんだよ?

670 名前:名無しさん@お腹いっぱい。 [2008/04/14(月) 11:14:54 ID:dJXYpbuD0]
>>664
つadobe acrobat

671 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/15(火) 21:11:34 ID:3OAKXwi90]
>>669
おまえ話の見えない奴だな〜

672 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/16(水) 01:45:53 ID:TQ1X288s0]
>>664
使うソフトを間違えてる
OCRは画像をテキスト化するソフト
PDF関係のソフトをあたるのが正解

PDF作成・変換ソフト。Part 5
pc11.2ch.net/test/read.cgi/software/1200771165/

673 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/23(水) 21:47:14 ID:q2B+fOBS0]
英文しかない場合は、外国産の方が認識率高いの?
ヨンデココがどうもダメ、領域を正しく抽出する所から
ちゃんとやってくれない、かすれてないのに。
ネットで落としたものだから、コピーし直すとか出来ない。

674 名前:名無しさん@お腹いっぱい。 [2008/04/24(木) 08:00:33 ID:34xibooz0]
>>673
SmartOCRLこれは? 文字がはっきり写ってるなら 高確率で認識してくれるよ?



675 名前:名無しさん@お腹いっぱい。 [2008/04/24(木) 10:21:13 ID:LqECzoR50]
>>673
ちゃんと英語モードにしてからやってる?

676 名前:673 mailto:sage [2008/04/25(金) 20:14:31 ID:SRLFiK0c0]
一応、漢字は無し、英文字記号数字のみの
設定で読み込ませてはいます。
あとSmartOCRはぐぐってみたけど、
サイトが閉鎖してました。

677 名前:名無しさん@お腹いっぱい。 [2008/04/27(日) 16:15:02 ID:lWgL7JQt0]
>>676
SmartOCR - フリーウェアのOCRソフト
ocr.rossa.cc/

678 名前:名無しさん@お腹いっぱい。 [2008/04/27(日) 19:31:23 ID:8zNLeoOp0]
エクセルファイル⇔一太郎ファイル⇔ワードファイル
が出来るフリーソフトありませんかね?
一太郎で作った表を自動計算させたいのでエクセルファイルに変えたいのですが・・・。
ご存知でしたら教えていただけないでしょうか?

679 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/27(日) 20:09:38 ID:gFFqjIH80]
ttp://q.hatena.ne.jp/1058864683

680 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/27(日) 22:14:55 ID:gVL4KMxz0]
>>673
ABBYY社のFineReaderの最新版使うといいよ。
お試し版もあったはず。以前試してみて認識率の高さに感動した。
読んdeココも一応ABBYY社のエンジン使ってるけどたぶん古い。

681 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/27(日) 23:06:11 ID:D4XQ9+0+0]
ソフト形式を変換とかじゃなくて表の(ハイパー?)リンクだけで出来そうだが

682 名前:蕪木ら某 ◆Googl8RmwA mailto:sage [2008/04/28(月) 04:38:47 ID:kpMp0cZ40]
>>678-679>>681
+ faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49876+0397
 faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?50406+0397
 faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49258+0397
 ...
 faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49036+0397#a02
 ...
 pc11.2ch.net/test/read.cgi/bsoft/1200988045/
 ...

683 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/28(月) 08:03:53 ID:KHm4WEpd0]
>>682
はいはい かしこいかしこい
なにもしなくても一太郎だけでできますよっと

684 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/06(火) 12:37:25 ID:TWTA7jP10]
読んでココで認識結果をpdf出力するとき、
認識結果は透明テキストに反映されるわけだが、
2行を1行に間違えて認識してしまった場合、
上の行にしか貼り付けされないのな。
結果編集で改行入れても、その行は無いことになってしまう。
認識段階または結果編集段階で行を挿入できないのだろうか?




685 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/14(水) 14:04:19 ID:LzErthzGP]
>>680
英文なら認識率いいのか…日本語の認識率の悪さに辟易したが。

686 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/14(水) 17:49:48 ID:nAAoVTJI0]
だって文字の数や複雑さからして違うっていう

687 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 15:12:27 ID:3tPMVg6y0]
購入した本や図書館で借りた本を、OCRソフトで
テキスト化して個人的にノートパソコンかPDFで使用は、
著作権の違法に当たりませんか、またこの本を第三者に売却したら?

688 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 15:34:52 ID:IB0cb+yL0]
どう考えても売却はマズいだろ

689 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 15:37:22 ID:3tPMVg6y0]
図書館で借りた本はいいのかな

690 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 16:06:43 ID:rcBGeT790]
個人的な使用ならおkじゃ?
コピーとるのと同じでしょ

691 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 16:34:23 ID:3tPMVg6y0]
理屈ぽっくてすみません
友人から借りた多くの本でも

692 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/21(水) 19:23:56 ID:xmMzdCDf0]
>>691
理屈の前に日本語勉強しる

693 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/23(金) 02:21:36 ID:dy5Q840K0]
>>692
便所の落書き2chに何を興奮してんだよ、
変な物見てんじゃないぞ

694 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/23(金) 08:39:24 ID:qndHTxug0]
>>687
借りた本を売ったらいかんだろ
ってのはともかく、
自分で買った本なら別に法には触れないだろ。



695 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/24(土) 16:45:05 ID:zkuID2AP0]
PDF画像からテキストに変換で色々調べて準備終わった。
いざ実行してみるとPDFに画像コピー禁止の権限が・・ ヽ(`Д´)ノ オレノジカンカエセー

696 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/25(日) 01:29:44 ID:aA4ZumvxO]
e.Typist ver.12を使ってみたんだけど、ルビを埋め込み設定にしたにも関わらず、認識結果は埋め込みとそのままが表示された。
ver.11だと普通に埋め込みのみなんだけど、原因がわからん。
設定同じなんだけどなぁ。なんか設定いじくる必要があるのかな。
どなたか解決策ご存じありませんか。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<206KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef