[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 12/23 15:51 / Filesize : 206 KB / Number-of Response : 904
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

[OCR] 画像→テキスト化総合



1 名前:名無しさん@お腹いっぱい。 [2006/03/06(月) 18:04:38 ID:eFU2jlRP0]
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

830 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/16(火) 17:02:09 ID:/jtierzP0]
ヘルプのマニュアルは一応読んでるよ。
でも読み落としてるかもしれないから、何処に載ってるか教えてくれよ。
ただの煽りなら引っ込んでろ。

831 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/16(火) 18:33:15 ID:ir5gL59l0]
>>830
おまえ人に聞く態度か、ドアホ〜
おまえ頭悪いんじゃ 自覚せい 消えろ〜
買ったところから聞け たわけ〜

832 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/16(火) 19:21:17 ID:+a6zF2z/0]
    ∩___∩           |
    | ノ\   ,_ ヽ      |
   /  ●゛  ● |         |
   | ∪  ( _●_) ミ      (>>830) 
  彡、   |∪|   |       J
 /     ∩ノ ⊃  ヽ
 (  \ / _ノ |  |
  \  "  /  | |
   \ / ̄ ̄ ̄ /

833 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/16(火) 20:59:44 ID:1zLemMeh0]
やれやれ・・・釣り扱いかよ。
自己解決しますた。
ユーザー辞書の移植は、読み取りだけならdicファイルだけでいいけど、
書き込むにはコントロールファイルもいるんだな。
マニュアルには載ってないようだけど、

834 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/10(土) 08:16:09 ID:eYWtFstc0]
あぁ、1TBHDDが安くなりすぎてテキスト化しなくてもいいと思い始めた。

835 名前:名無しさん@お腹いっぱい。 [2009/01/10(土) 13:00:54 ID:TYnOKpqB0]
↑いやいや、検索するって役割があるでしょ。

質問です。
e.Typistをインストールすると、mediadriveというフォルダが、Documentsフォルダに作られますが、移動するにはどうすればよいですか。
これ非常に不便なのですが・・・

836 名前:名無しさん@お腹いっぱい。 [2009/01/10(土) 15:12:22 ID:IPOI/TmT0]
透明PDFにpngが使えないので萎えた
lzwのtiffでも数倍でかくなる


837 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/10(土) 16:30:03 ID:LjtLb05Y0]
OCRソフトってPDFの扱いが弱すぎるよね

838 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 00:40:51 ID:iuR1Bu1I0]
そもそもPDFっていらないしな。



839 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 02:42:06 ID:sd43c4tCP]
いやいやいや、今んところ透明テキストつきPDF以上に、
バランスの取れた形式ってないんじゃないのか?

OCR変換したテキストデータのみを使うとか正気の沙汰じゃないけど、
文字列検索ができるのはただの画像データにはないメリットだし、
何よりも可搬性が高いというメリットもあり。

>>838はこのスレでPDFいらないっていうことは
全部テキストデータで保存してるのか?

840 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 02:46:38 ID:iuR1Bu1I0]
検索しないから。一度読んだらだいたいの場所は頭に入ってる。
読むの速いし、パラパラ高速でめくれないPDFは論外。

841 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 02:59:40 ID:sd43c4tCP]
まぁ、検索するかどうかは確かに使い方次第かもしれないな。
でもPDFがパラパラ高速でめくれない、ってそれは単純に
PCのスペックによるものなんじゃね?

300ページくらいの本をスキャンして30MBくらいで保存してるけど、
Adobe Readerで見開き2ページ表示にしてもさくさくPageUp/Downできるけどなぁ。

842 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 03:12:05 ID:iuR1Bu1I0]
読むの遅いんじゃね?

843 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 03:16:50 ID:sd43c4tCP]
いやいやwww
PageDown押しっぱなしで300ページ見開き表示(150面)
の冒頭から最後まで15秒もかからないんだけど、
どんな速読マスターでもさすがにこのスピードは無理じゃないのか?

ということで脱線してきたのでもうレスはつけない。
スレ汚しすまない。

844 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 04:09:13 ID:/tuIuVbi0]
検索を使わなくてすむような使いかたしかしてない時点で

845 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 10:08:10 ID:osstJUh50]
小説とか?にしか使ってないのかな?
学術書や研究書をデータ化して検索可能にすると全然
違ってくるんだよね

読むときに単語ひとつひとつにまで注意は払えないけど
後から違うテキストにある単語の用法を検索するとか
単語が使われる頻度を調べるとかさ

846 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 16:45:17 ID:iuR1Bu1I0]
頭に入ってない、知らないかから検索しなきゃいけないんだろ。要はただの馬鹿。
統計とるのにOCRで作った修正処理してない、合ってるか間違ってるか
分からない透明テキストPDF使うなんて研究者失格だな。
専門分野なら頭に簡単に入るだろ。stockの知識は暗記しろ。

847 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 19:07:28 ID:N53izUZ70]
>>846
よう、天才。
あんた、なんでこのスレに粘着してんだ?

848 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 19:18:36 ID:/tuIuVbi0]
まじ天才。




俺の大学では会議はまだプリントされた紙を配る。
邪魔だから、PDFで保存。紙は捨てる。
学内自転車置き場に置かれた放置自転車の問題とか
入学試験の試験監督とか



これ結構な量なんだよ。
まれにこれが必要になるから困る。


でこんなものも全部頭に入れてるの?
俺なんて会議中熟睡だぜ



ありえんな。研究者とか書いてるが
ただのニートと見た。






849 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/11(日) 22:52:25 ID:xF2BYn5G0]
インド人じゃないの?
向こうのエリ−トは2時間くらいの会議ならその会議での会話を そらで再現出来る頭だって。

850 名前:名無しさん@お腹いっぱい。 [2009/01/12(月) 01:47:20 ID:n3qvCL0O0]
SVGがもうすこしがんばってくれれば、、、

851 名前:名無しさん@お腹いっぱい。 [2009/01/12(月) 02:07:33 ID:SDQi6vqPO]
おまえらレベル低いな。俺の国では読む前から本の内容くらい完璧に再現できないようなら落ちこぼれだから。

852 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 10:44:58 ID:iaaaILbh0]
テキスト化スレでなんでPDFを称賛してんだ?
スレ違いだ。

853 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 10:52:21 ID:Z3wpMu5b0]
>>852
ID:iuR1Bu1I0は、テキスト化すら必要なさそうだが。

854 名前:名無しさん@お腹いっぱい。 [2009/01/12(月) 10:53:10 ID:n3qvCL0O0]
つ透明テキスト付きPDF


855 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 10:56:31 ID:iaaaILbh0]
誘導 >> PDFの素晴らしさ話題はこちらへ

PDF作成・変換ソフト。Part 5
pc11.2ch.net/test/read.cgi/software/1200771165/

856 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 12:38:29 ID:ZsusePTR0]
透明テキスト付きPDFさえスレ違い認定してる奴って
なんなんだろう?

手元に元資料なくなったら読取り間違いを見つけるのに
PDFの画像だけが頼りじゃん

完全にテキストデータしか残さないの?

857 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 13:24:35 ID:hw4QZewC0]
>>849
そんなわけないだろw

12年と235日前の会議でもすべて覚えてるんかいw

858 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 13:26:19 ID:AdJ5kc2+0]
>>849
インド人の友達いるけど、みんな馬鹿だよ



859 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/12(月) 16:56:21 ID:KqRtE+b10]
>857が馬鹿なだけだと思うよ。
子供の反論だな。
「何時何分何秒に〜」w
まさか成人じゃないよね?

860 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/13(火) 01:49:48 ID:Ck0kGCM30]
何時何分ってアホ?

検索する必要もない奴がテキスト化してパソコンに保存?
もっとアホだな
テキスト化してパソコンに保存する時間が無駄だろうがw
その間にどれだけの文章を頭の中に入れれるの?天才君

861 名前:名無しさん@お腹いっぱい。 [2009/01/13(火) 11:24:35 ID:EXPdIEAt0]
WinReaderPro買うかどうか迷っている。
お前らどう思う?
用途は10万枚のxdwファイルの検索目的。

862 名前:名無しさん@お腹いっぱい。 [2009/01/13(火) 15:36:04 ID:uERZu1aC0]
xdwってそのまままじゃ検索できないんだ
へー

863 名前:KYjGIJJNILUJsLT mailto:herends@gmail.com [2009/01/13(火) 15:38:01 ID:ZVGLIrsS0]
naierrybou.awardspace.com/tna-victory-road-stream.html tna victory road stream
ontoned.awardspace.com/rumer-willis-photo.html rumer willis photo


864 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/14(水) 01:19:58 ID:L5omtrlo0]
こんなスレに天才君がごろごろしてるとは・・・・・



865 名前:名無しさん@お腹いっぱい。 [2009/01/14(水) 02:10:19 ID:0z5ueTXF0]
>>862
scanした原稿とかは無理だよ。

866 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 03:47:41 ID:ooQikYrc0]
透明テキスト付きPDFの話なんてどうでもいいんだけど。
透明テキスト付きPDFで、テキストに変換した内容をチェックする馬鹿はいないんだから。
ここでは議論が成り立たない。

867 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 08:28:25 ID:pt+iPJxK0]
>>866
出たな、天才。

868 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 11:27:58 ID:U2eiW9BI0]
学術論文データベースでダウンロードできるファイルは
ほとんどが透明テキスト付きPDFでございますw



869 名前:名無しさん@お腹いっぱい。 [2009/01/15(木) 12:58:17 ID:Coc/BK/S0]
>>868
医学論文はスキャンされたPDFが郵送とFAXとかダウンロードできるだけというのが全てかも。
俺が入会している論文屋はそうだね。日本では業界最大手だと思うけど。
それに本をばらしてscanしまくっているから透明テキストは自分でつけないといけない。

870 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 13:31:32 ID:/jTW0YpK0]


871 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 18:17:23 ID:ooQikYrc0]
>>868
だからスレ違いじゃん。
論文作った人がPDFにしてテキストつけてるのに画像→テキスト化のこのスレに何の関係あるんだよ?

872 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 18:38:34 ID:TDkR8k5P0]
たしかに(DAIGO)
論文書いたならワードとかだろうからそこからpdfに変換したら
文字化けもなにもないな
最初から文字としてpdfに埋め込まれてるだろう

873 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 21:52:56 ID:0k7MXLGD0]
論文データベースで提供される最近の論文なら学術誌の
ページまんまの普通にフォント込みのPDF
昔のものはスキャンされて透明テキスト付きPDF

同じように自分でスキャンした論文や本も透明テキスト付きで
残しておいて管理したいってわけ

しつこく透明テキスト付きPDFを排除しようとしてる人は
こういう用途を理解できないのかな?自分に関わりのない
用途だからって排除するってのはどうかと思うよ

874 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/15(木) 23:51:54 ID:pTl37oBI0]
2名くらいが言い合ってるんだろうが
そろそろメールででもやれw

875 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/16(金) 02:04:18 ID:o0QiI79a0]
読んでここと読み取り革命とe.typist
全部使ってみたけど
読んでここが一番まともだった

876 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/16(金) 04:31:05 ID:j5jbP+DhP]
一番妙な名前のが一番まともっぽいんだよな。
でもどこも煮詰ってきちゃって停滞してる感じもする。

877 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/16(金) 07:10:00 ID:kAwCRT9v0]
>>873
うざいからPDFスレでやれ。

878 名前:名無しさん@お腹いっぱい。 [2009/01/16(金) 07:13:05 ID:YFgvyqNy0]
よんでここ良いかあ?
typistだろ



879 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/16(金) 08:54:17 ID:KNjWFBiV0]
>>878
中の人、乙

880 名前:名無しさん@お腹いっぱい。 [2009/01/16(金) 12:34:31 ID:ar3mUcAl0]
で、WinReaderProを使った奴はいるか?おれはxdwでscanした文章が20Gくらいあるんだよ。
DocuWorks内蔵のOCRも悪くないけど、更に精度が上がるなら20万出してもいいかなと思うのだが。
俺が人柱になるしかないのか?

881 名前:名無しさん@お腹いっぱい。 [2009/01/16(金) 19:19:39 ID:u6xluZvZ0]
そうだね

882 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/17(土) 12:03:50 ID:q4cOoTS30]
構って君登場w


883 名前:名無しさん@お腹いっぱい。 [2009/01/17(土) 13:22:33 ID:8LomD8UX0]
くそ。
お前らがそういう態度なら絶対に書いてやらない。
WinReaderProで得た経験を誰にも教えないぞ。

884 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/17(土) 13:36:24 ID:ajPyCMtQ0]
精度なんて似たり寄ったり。重要なのは確認、修正作業のし易さ。

885 名前:名無しさん@お腹いっぱい。 [2009/01/17(土) 13:44:11 ID:8LomD8UX0]
まじかよ。そんなことしていられないよ。
検索で引っ掛けるのが目的だし。
20万円の価値は無いのか。

886 名前:名無しさん@お腹いっぱい。 [2009/01/17(土) 17:14:11 ID:3jWVocFV0]
買えば済むのに

887 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/17(土) 21:05:47 ID:q4cOoTS30]
https://ssl.mediadrive.jp/cgi-bin/demand/form.cgi?id=wrp12
ほんとに買う気なら体験版をとりあえず申し込むべし。

888 名前:名無しさん@お腹いっぱい。 [2009/01/20(火) 16:59:05 ID:Ez5R3CRM0]
読取革命大好き



889 名前:名無しさん@お腹いっぱい。 [2009/01/21(水) 02:20:01 ID:nux6CWbW0]
>>887
申し込みます。DocuWorksのVer6とVer7と比較してよければ買います。
全文検索は行方不明書類を捜す唯一の手段だからな。
行方不明書類ってどうしても発生するんだよね。
Scan時の重送で検出漏れもあるしね。

890 名前:VdTyVIXmByCFJdJ mailto:hsybaa@yukbkg.com [2009/01/21(水) 02:28:08 ID:27CcxXma0]
3ofhNQ <a href="jicyqypxfieh.com/">jicyqypxfieh</a>, [url=tdeqcqoimwwk.com/]tdeqcqoimwwk[/url], [link=qykftmbejfxg.com/]qykftmbejfxg[/link], nriidvmyuevw.com/

891 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/21(水) 17:02:44 ID:1Yv8qxGD0]
>>873
>同じように自分でスキャンした論文や本も透明テキスト付きで
>残しておいて管理したいってわけ

同じく。最新のAcrobatでも表があるページだと表部分だけでなく本文部分
の透明テキスト化も玉砕するんで困ってます。表が入っててもそこそこの
OCR化をしてくれて透明テキストとして出力してくれるソフトってあるの
でしょうか?




892 名前:名無しさん@お腹いっぱい。 [2009/01/21(水) 21:37:36 ID:NwoVvKSk0]
E.TYPISTでいいんじゃないの?

893 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/21(水) 21:40:41 ID:ze4pJbzr0]
企業内でスキャンしたい対象ってどんなのがあるかな?

894 名前:名無しさん@お腹いっぱい。 [2009/01/21(水) 21:47:38 ID:nux6CWbW0]
>>893
FAXやら報告書、見積書、請求書、領収書。

895 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/21(水) 21:50:24 ID:ze4pJbzr0]
わかるわ

896 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/21(水) 23:36:46 ID:VPMtNf1U0]
>>891
つ ScanPaper for PDF
絶賛絶版中
残念。....Ver. up待ってたのに...orz

897 名前:名無しさん@お腹いっぱい。 [2009/01/22(木) 14:57:17 ID:hloqxcjl0]
>>891
スレ違い。

898 名前:YLwdkzJwQk mailto:udvdolwp@slqaepks.com [2009/01/22(木) 14:59:20 ID:XZya3rFK0]
comment3, cxlkueu.tripod.com/sun-vall96/104.html us immigration and naturalization servic, 41903,



899 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/01/26(月) 14:02:08 ID:B6gIH/Ys0]
>>897
そっか?ここ「画像→テキスト化総合」スレだぞ。


900 名前:名無しさん@お腹いっぱい。 [2009/01/27(火) 01:41:17 ID:upxCQJ3+0]
WinReaderProの試用版ダウソしたぞ。
結構いいな。でも、DocuWorks文章だとファイル1枚ごとの取り込みだから気が遠くなるくらい遅い。、東南アジアとか中南米で仕事をするくらいのスローペース。
全く実用にならない。


901 名前:名無しさん@お腹いっぱい。 [2009/01/27(火) 07:41:36 ID:htkl5rYY0]
精度がいいんだったらそれくらいの時間我慢しろ

902 名前:名無しさん@お腹いっぱい。 [2009/01/27(火) 11:33:20 ID:upxCQJ3+0]
>>901
一枚一枚手作業できるかよw

903 名前:名無しさん@お腹いっぱい。 [2009/01/28(水) 00:27:11 ID:7RPnoVYN0]
結局、Docuworksからエンジンを呼び出して使う方法しかないね。でも、デモ版ではこの機能が使えない。。。
300dpiで取り込んだ書類の8pointの文字をきちんと認識したのはさすがだった。
DocuworksはVer6でもVer7でも誤認識したのに。
買うかな。。。でも、実売15万か。。。






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<206KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef