[OCR] 画像→テキスト ..
683:名無しさん@お腹いっぱい。
08/04/28 08:03:53 KHm4WEpd0
>>682
はいはい かしこいかしこい
なにもしなくても一太郎だけでできますよっと
684:名無しさん@お腹いっぱい。
08/05/06 12:37:25 TWTA7jP10
読んでココで認識結果をpdf出力するとき、
認識結果は透明テキストに反映されるわけだが、
2行を1行に間違えて認識してしまった場合、
上の行にしか貼り付けされないのな。
結果編集で改行入れても、その行は無いことになってしまう。
認識段階または結果編集段階で行を挿入できないのだろうか?
685:名無しさん@お腹いっぱい。
08/05/14 14:04:19 LzErthzGP
>>680
英文なら認識率いいのか…日本語の認識率の悪さに辟易したが。
686:名無しさん@お腹いっぱい。
08/05/14 17:49:48 nAAoVTJI0
だって文字の数や複雑さからして違うっていう
687:名無しさん@お腹いっぱい。
08/05/21 15:12:27 3tPMVg6y0
購入した本や図書館で借りた本を、OCRソフトで
テキスト化して個人的にノートパソコンかPDFで使用は、
著作権の違法に当たりませんか、またこの本を第三者に売却したら?
688:名無しさん@お腹いっぱい。
08/05/21 15:34:52 IB0cb+yL0
どう考えても売却はマズいだろ
689:名無しさん@お腹いっぱい。
08/05/21 15:37:22 3tPMVg6y0
図書館で借りた本はいいのかな
690:名無しさん@お腹いっぱい。
08/05/21 16:06:43 rcBGeT790
個人的な使用ならおkじゃ?
コピーとるのと同じでしょ
691:名無しさん@お腹いっぱい。
08/05/21 16:34:23 3tPMVg6y0
理屈ぽっくてすみません
友人から借りた多くの本でも
692:名無しさん@お腹いっぱい。
08/05/21 19:23:56 xmMzdCDf0
>>691
理屈の前に日本語勉強しる
693:名無しさん@お腹いっぱい。
08/05/23 02:21:36 dy5Q840K0
>>692
便所の落書き2chに何を興奮してんだよ、
変な物見てんじゃないぞ
694:名無しさん@お腹いっぱい。
08/05/23 08:39:24 qndHTxug0
>>687
借りた本を売ったらいかんだろ
ってのはともかく、
自分で買った本なら別に法には触れないだろ。
695:名無しさん@お腹いっぱい。
08/05/24 16:45:05 zkuID2AP0
PDF画像からテキストに変換で色々調べて準備終わった。
いざ実行してみるとPDFに画像コピー禁止の権限が・・ ヽ(`Д´)ノ オレノジカンカエセー
696:名無しさん@お腹いっぱい。
08/05/25 01:29:44 aA4ZumvxO
e.Typist ver.12を使ってみたんだけど、ルビを埋め込み設定にしたにも関わらず、認識結果は埋め込みとそのままが表示された。
ver.11だと普通に埋め込みのみなんだけど、原因がわからん。
設定同じなんだけどなぁ。なんか設定いじくる必要があるのかな。
どなたか解決策ご存じありませんか。
697:名無しさん@お腹いっぱい。
08/05/27 01:48:16 /mEeoUdB0
>>695
互換PDFビューアの過去バージョンで権限無視でコピーできるって話が昔あったような。
698:名無しさん@お腹いっぱい。
08/05/29 03:56:45 uFnsPlIH0
ビジネス書とかの単行本をテキスト化してるが、
e.Typist>>読んdeココ>>>>>>>>読取革命
だな。
読んdeココは多機能で使いやすくてバランスが取れた製品だと思うけど、
純粋に文字認識の精度だけを比べるとe.Typistが一番優れてる。
699:名無しさん@お腹いっぱい。
08/06/03 23:17:38 mqE/evSE0
>>680
ABBYY社のFineReaderはスゴイ
日本語化出来ないんだろうか?
700:名無しさん@お腹いっぱい。
08/06/03 23:47:39 WQ9oBg400
>>699
e.typistと比べてどっちが認識率が高い?
701:名無しさん@お腹いっぱい。
08/06/04 02:49:03 0YcMkrT10
>>700
英語ならFineReader、日本語ならe.Typistに決まってるだろ。
702:名無しさん@お腹いっぱい。
08/06/06 08:28:43 St1jBd+t0
FineReaderってOmnipageよりいい?
703:名無しさん@お腹いっぱい。
08/06/06 15:13:42 bjY5yxxP0
いい場合も悪い場合もある
URLリンク(www.ocrreview.com)
704:名無しさん@お腹いっぱい。
08/06/14 03:46:01 3uX8P8rx0
>>703
このサイト初めて見た。認識率だとやっぱりOmniPageが優れてるね。
FineReaderもそれに近い値だけど、時間も遅いので、なんだかこれを
使うメリットがにくい。
705:名無しさん@お腹いっぱい。
08/06/23 21:24:23 fdvf+v9p0
警察は宗教に目を光らせている、盲信によって罪悪感のない犯罪を
起こしやすい、教祖の出来不出来でその人の人生が決まる
教祖だけに罪はない、似たもの同士がお見合いするのかも知らない、
騙す人間が悪いが、騙される人間も同類か
706:名無しさん@お腹いっぱい。
08/06/23 22:00:12 KvQHOAny0
これまた激しい誤爆だな。
707:名無しさん@お腹いっぱい。
08/06/24 00:35:24 kDEQN6+m0
>>705
OCR誤認識がひどいな。
708:名無しさん@お腹いっぱい。
08/06/25 08:59:23 DKou2GCA0
読んでココはpdf出力するとき、追加保存が出来ないんだな。
wardやhtmlならできるのに・・・
仕方ないから新規ファイルで保存した後、いちいちpdfエディタ立ち上げて
結合させてるけど、マンドクセ。
709:名無しさん@お腹いっぱい。
08/06/25 15:04:00 OJ8SNbTv0
見開き表示とか綴じ方(右から左)の設定もできないから不便だよね。
710:名無しさん@お腹いっぱい。
08/06/30 17:17:28 nNrhDlkb0
ominipage 16が$79.99で買えるキャンペーン中
URLリンク(www.digitalriver.com)
711:名無しさん@お腹いっぱい。
08/06/30 19:37:06 5LpB7fyT0
>>710
↑クレカの番号と所有者名を収集してるんか?
トップページに行けないぞ?
712:名無しさん@お腹いっぱい。
08/06/30 19:38:03 5LpB7fyT0
Domain Name: NUANCESTORE.COM
Registrar: NETWORK SOLUTIONS, LLC.
Whois Server: whois.networksolutions.com
Referral URL: URLリンク(www.networksolutions.com)
Name Server: PDNS1.ULTRADNS.NET
Name Server: PDNS2.ULTRADNS.NET
Name Server: PDNS3.ULTRADNS.ORG
Name Server: PDNS4.ULTRADNS.ORG
Status: clientTransferProhibited
Updated Date: 16-oct-2006
Creation Date: 01-feb-2006
Expiration Date: 01-feb-2009
713:名無しさん@お腹いっぱい。
08/06/30 19:38:43 5LpB7fyT0
Registrant:
Digital River, Inc.
9625 W. 76th Street
Eden Prairie, MN 55344
US
Domain Name: NUANCESTORE.COM
------------------------------------------------------------------------
Promote your business to millions of viewers for only $1 a month
Learn how you can get an Enhanced Business Listing here for your domain name.
Learn more at URLリンク(www.NetworkSolutions.com)
------------------------------------------------------------------------
Administrative Contact, Technical Contact:
Digital River, Inc. hostmaster@digitalriver.com
9625 W. 76th Street
Eden Prairie, MN 55344
US
952-253-1234 fax: 952-253-8497
Record expires on 01-Feb-2009.
Record created on 01-Feb-2006.
Database last updated on 30-Jun-2008 06:31:44 EDT.
714:名無しさん@お腹いっぱい。
08/07/01 08:23:46 AL20YzVU0
はあ?
ieでもsafariでもいけるよ
715:名無しさん@お腹いっぱい。
08/07/09 09:25:33 tqR/hLP70
手書きの文字が認識できるOCRソフトってありますか?
716:名無しさん@お腹いっぱい。
08/07/25 18:03:44 nsfqqXyN0
TextSS
717:名無しさん@お腹いっぱい。
08/07/31 12:46:10 KkyDCbb60
文字じゃなくて、表などの枠線をスキャナから認識ってできますか?
718:名無しさん@お腹いっぱい。
08/07/31 14:14:49 kYKcm3m90
できます
URLリンク(jp.fujitsu.com)
719:名無しさん@お腹いっぱい。
08/07/31 23:49:10 mcLkMUjo0
>>717
e.Typistってのを使ってるけど、できますん
720:名無しさん@お腹いっぱい。
08/08/01 10:40:29 DLLVnu+y0
>>718
終了だから"できた"でつね
721:名無しさん@お腹いっぱい。
08/08/07 00:06:40 BSuE1Slo0
SubRipでbmp化した字幕データをテキスト化したくて、
読んでココv9と最新体験版、革命v12、タイピストv12、
スマートライトを試しました。スマートライトは画像読むだけで落ちるので
インストールに問題があったようなので別として、のこりでも、
見事に一文字たりとも認識されません。おまけにココだと、解像度エラー
といわれてしまいます。
吸い出し時に設定を変えてみましたが、白地に黒縁かその逆かはともかく
フチ付きの絵になり、それが誤認識の原因ではないかと考えていますが、
あまり自信がありません。どういう手順で、またどんなソフトを使って
(bmpは1500あるので、ひとつずつ開かなくてすむように)色などの
調整を試すのがよいか、どなたか教えてくださいませんでしょうか?
722:名無しさん@お腹いっぱい。
08/08/07 18:58:58 eM6AkDyu0
前に画像処理ソフトで処理してから読み込ませた方がいいかも。
ネガ反転や、解像度変更、ノイズ除去、余白やいらない部分の削除、カラー画像であればグレースケールや白黒画像に変換など、
一括処理できるソフトもたくさん有りますから、やってみるといいかもね。
723:名無しさん@お腹いっぱい。
08/08/13 00:32:22 IzZ40ACA0
どうしても小文字(ぁぃぅぇぉやゃゅょなど)が弱い
どこのソフトも駄目だ
724:名無しさん@お腹いっぱい。
08/08/13 09:31:08 v6VOgDwN0
e.Typist ver12買ってOCR作業中。
正 。 → o・O・0・0 これは許す。すっごいイヤだけど難しいだろうから。
正 I →1 これも当然許す。すっごい難しいだろうから。英語領域にしていすればかなり改善するし。
正 - → 1・I これはなに? なにしてるの? バカなの?('A`)
725:名無しさん@お腹いっぱい。
08/08/13 09:36:20 QnPzfkJy0
>>724
OCRにマジになるとか時間の無駄
726:名無しさん@お腹いっぱい。
08/08/13 12:13:34 jZK0Tj450
>>724
そんなに嫌なら文字種いじれよ
727:名無しさん@お腹いっぱい。
08/08/14 04:33:00 bB/191pD0
設定が悪いんじゃないの(笑)
728:名無しさん@お腹いっぱい。
08/08/14 10:08:20 +Lwt0Ob70
同じくeTypsit使ってるけど、ScanSnapでPDFに→OCR→透明テキスト付きPDFにすると画像がかなり劣化する。
Scan直後のPDFの画質を守る方法ってないのかな?(´・ω・`)
Acrobat Pro持ってるけど、画像が劣化したあとのPDFを編集しても意味ないよね…
729:名無しさん@お腹いっぱい。
08/08/14 16:13:43 BarBaXMw0
透明テキストつけるだけなのに
画像が痛むのか
730:名無しさん@お腹いっぱい。
08/08/14 17:14:00 yeyKQnnw0
OCRソフトのpdf入力は一端仮想プリンタに出しちゃって画像にして
文字認識してから改めてpdfに仕立て直してるからな。
最初からjpgでスキャン出力してそれをOCRソフトにかけるか
pdfにしちゃってたものは一度画像として書き出してからOCRソフトにかければいい。
731:名無しさん@お腹いっぱい。
08/08/14 22:51:59 d+q5/K3K0
実家にある本でもテキスト化してみるかと思って読んでココの体験版入れてみたけど
使い方もわかんねえし、結構めんどくさいんだな
小説なんかをちゃんと設定してやると誤認識1ページにどれくらいになるの?
732:名無しさん@お腹いっぱい。
08/08/15 02:20:36 UA5Ln4AC0
きちんとやればほとんどご認識なんかないよ。
どうしても読めない漢字とかってあるけど。
たとえば解像度600dpiとか、試しにやってみれば。
733:名無しさん@お腹いっぱい。
08/08/15 06:10:09 3bwMrQBM0
読んdeココのOCRファクトリー便利だぜ。
一度設定すればアイコンをダブルクリックするだけで全部自動でやってくれる。
734:名無しさん@お腹いっぱい。
08/08/16 21:12:32 BBpdl85r0
>>731
元の本のフォントと組版、スキャンの解像度にもよるけど
最良の時で大体1〜2頁に1字前後
酷いと1頁に10字以上とかあるね
1頁に誤字一字の割合だと読でてかなり気になるレベルだから
結局全編目を通して修正することになるね
735:名無しさん@お腹いっぱい。
08/08/17 10:35:23 EfKqQDE+0
e.Typist使ってみたけど、たまに一文字を勝手に分離して認識してしまう。
「え」が「、」と「λ」とかになる。
二文字に認識してるから学習しようがない。
細い所とかかすれるとだめ。
まだまだって感じだなあ。
736:名無しさん@お腹いっぱい。
08/08/17 21:14:50 NNvDk3xe0
何様だよw
737:名無しさん@お腹いっぱい。
08/08/17 21:44:41 a9bB+bqN0
読んでココの開発者だろ
738:名無しさん@お腹いっぱい。
08/08/18 01:00:46 v0mRsvdB0
>>732
ああ普段使わないからスキャナの設定なんか全く見てなかったわ
画像データだけ持ってきたけど、だめかもシンネ
OCRファクトリーでまとめて読み込んだ後って読んでココ上で誤字とか確認してる?
画像勝手に追いかけてくれるし、学習しなきゃだけど、エディターが使い
739:名無しさん@お腹いっぱい。
08/08/19 14:17:41 m4W/W6650
読んでココを試用してますが、
原稿では2行になってるはずなのに、1行の文として認識してしまい、
わけ分からない文字列を出してくるとき、これを2行に修正することは出来ませんか?
ただテキストを起こすだけなら、認識結果画面で改行して手打ちすれば良いだけですが、
当方、画像が重要な資料を扱ってるため、PDFで透明テキストで貼り付ける必要があり、
ただ改行しただけでは、透明テキストにはその追加した行が反映されていないのです。
740:名無しさん@お腹いっぱい。
08/08/19 14:32:14 pZKp1XtT0
AcrobatってOCRソフトとしてどんなもんなんだろう?
アカデミック版Standardで1万ちょいだから買ってみようかな?
741:名無しさん@お腹いっぱい。
08/08/19 14:37:27 9YTtEXub0
AcrobatのOCRは糞
よんでここ>>e.typist>読み取り革命>>>>AcrobatOCR
742:名無しさん@お腹いっぱい。
08/08/19 20:34:17 aPjCwCOs0
acrobat ocr≒ヨンデココ
ヨンデココ工作員市ね
743:名無しさん@お腹いっぱい。
08/08/19 22:10:18 ThYcLLsW0
e.Typist>読んでココだろ。
744:名無しさん@お腹いっぱい。
08/08/20 11:54:34 5xCLDVVM0
e.TypistのHP見てきたけど、
取り込んだ画像の補正機能について何も書いてないようなんだが、
見開きの傾き自動補正とか出来るのかな?
745:名無しさん@お腹いっぱい。
08/08/21 02:30:37 VsRH2oEP0
ここにはe.Typist使ってる奴はいないってことか
746:名無しさん@お腹いっぱい。
08/08/21 10:04:41 piDQE/Jd0
5cm身長アップが50m身長アップになった
これで俺も51m56cmだぜ
747:名無しさん@お腹いっぱい。
08/08/21 12:47:35 Q0h/A3Xy0
>>744
見開き手動補正はできる。
自動の傾き補正は見開きには対応してない。
748:名無しさん@お腹いっぱい。
08/08/21 15:39:21 Gdf1OOpi0
>>747
そっかー手動なのか。
こういうのは機械任せがありがたいんだけどなー。
サンキュー
749:名無しさん@お腹いっぱい。
08/08/21 17:31:48 ksXciaP30
smartOCRはいつも「事」を「夢」と認識する
後からテキストエディタで一括修正した方がいいのか
750:名無しさん@お腹いっぱい。
08/08/24 06:25:03 h6cmS6A40
>749
認識辞書で対応すべきではある
「夢」と「事」じゃ、正規表現使ってもまともに修正するのは難しいし、
一括置換すると間違ってないところまで間違えてしまいかねん、一つ一つ
修正するのはどっちもそれなりの数がありそうだから面倒
>745
e.Typistも読んdeココも使ってる。
個人的な感想としては、OCR結果を縮小してあるような画像だと、e.Typistのが
認識率はかなり高い。画像がでかくなるほど両者の認識率は近づいていくけど、
OCR直後のでかい画像だと読んdeココのが多少いいような気はする。
>739
不可能だな。1文字の区切りがきちっとできている状態で、それがどの文字なのかを
学習させることは可能だが、1文字の範囲がどこからどこまでかは学習させようが
ない。本文とルビをごっちゃにして1文字にしてしまうような場合と同様で、ずっと
以前からこういう状態だから、技術革新がないと無理じゃね
751:名無しさん@お腹いっぱい。
08/08/24 09:59:49 rHvUrtQk0
>>750
ピントのずれた、無駄に長い、タイミングの悪いレス、どうもありがとう。
752:名無しさん@お腹いっぱい。
08/08/24 10:12:44 MGOLjeef0
別にずれてないんじゃね
753:名無しさん@お腹いっぱい。
08/08/24 10:58:32 b29yVzjt0
正解率99% ネット認証技術、書籍のデジタル化に威力
URLリンク(www.asahi.com)
754:名無しさん@お腹いっぱい。
08/08/25 17:48:36 5eaoBiak0
うーん、99.1% ってほぼ自動ってのにはまだまだ程遠いね・・・
755:名無しさん@お腹いっぱい。
08/08/25 18:00:07 GHGOAqBa0
つかこれ英語限定じゃないの
756:名無しさん@お腹いっぱい。
08/08/25 18:50:29 kMvnDz2o0
人間の正解率てのは元々どのくらいなんだろうな。
俺なんて入力ミスもしてたんだろうが再入力の経験が何度もあるぞ。
人力OCRだから英語以外は対象地域を絞らないと無理だろうね。
757:名無しさん@お腹いっぱい。
08/08/25 20:00:55 JUspXpDS0
>>753
結構いいアイデアだな。
日本語だと厳しいが、まあ2chとかの日本語コミュニケーション限定サイトに
置くなら何とかなるかもしれん。
・・・と書いてて今気付いたんだが、難読文字を読んで貰って、それが正しいかどうかの
答え合わせは誰がやってるんだ?
読んだ結果が正しいと判って、それで初めて認証として成立するんだろ?
758:名無しさん@お腹いっぱい。
08/08/25 22:11:40 pBM6iPT60
>>753
よくこんなこと思いついてしかも実行したよなww
759:名無しさん@お腹いっぱい。
08/08/26 11:13:56 3pII43Sm0
>>757
二つのOCRで一致した部分は正解、ちがった部分は不明として
正解と不明が含まれたものを表示して入力させ
正解の部分は認証として使い、不明部分を入力結果から拾う
とかかね
760:名無しさん@お腹いっぱい。
08/08/29 05:58:38 PUHS2H7P0
多数決
761:名無しさん@お腹いっぱい。
08/08/30 16:48:15 UobhjFbi0
ケツ多数
762:名無しさん@お腹いっぱい。
08/08/31 00:12:15 xOEiIMAi0
どんなに正答率が上がったところで人による目視チェックは必須だろう。
763:名無しさん@お腹いっぱい。
08/09/07 09:56:23 9RYOriMs0
>>762
>人による目視チェックは必須
そうです。そしてそこが一番手間と時間がかかる部分。
上に出てたAcrobatのOCRはこのプロセスがないし、埋め込まれた
透明テキストを後から修正するのも事実上困難(不可能では
ないが、OCRソフトでオンタイムに修正していくような訳にはいかない)。
一カ所でも間違いあると困るというOCR作業もあるでしょうが、そうでない
場合には割り切って使うと便利とも言える。特にScanSnapとの組み合わせ
で大量の文書を処理する時など。
OCRエンジンも7で読んde! ココ(の世代落ち)になってるが、8や9で
どうなってるのか分からない。
764:名無しさん@お腹いっぱい。
08/09/10 11:38:25 H8/lfHgO0
OCR使ってて感じるのは、誤変換の原因はほとんど「切り出し間違い」。
文字列に占める空白の割合なんかから一意に決めてるんだろうけど、
カスレの多い原稿だと区切るところがめちゃくちゃ・・・
きっちり区切りなおせば正しく認識できるのに・・・
ユーザー辞書や単語認識かけて文字列にならないときとか、
この切り出しを見直して再認識処理してくれないのかね?
処理時間がべらぼうにかかりそうだけど。
765:名無しさん@お腹いっぱい。
08/09/10 12:42:49 8eNIWm0W0
GPUで処理できるようになったら何でも有りになるな。
766:名無しさん@お腹いっぱい。
08/09/10 18:20:58 8r86j5IT0
読んでココ使ってるんだけど、「〜」が認識されず空欄になってることが多い。
ユーザー辞書にも1文字だけど登録してるのに。何とかならないのかな?
767:名無しさん@お腹いっぱい。
08/09/10 18:22:38 aAaEuFR10
>764
小説みたいに同じ大きさの文字が延々と続いているのであれば、文字の大きさを
手動指定するモードとかあっても良さそうだよな。
見出し、本文、ルビの大きさを指定して、そこから文書を解析して認識するのなら
そんなに難しくはないような気もする。新聞とか広告文みたいにいろんな大きさの
文字が混在するのには無力だろうけど
768:名無しさん@お腹いっぱい。
08/09/12 17:59:53 BkRq8OtC0
URLリンク(code.google.com)
NHocr is a command line OCR (Optical Character Recognition) program for Japanese language
769:名無しさん@お腹いっぱい。
08/09/21 20:05:56 CcopwTiy0
素人で失礼ですが
OCRソフトは、10万円以上の価格でないと、7割文字認識できませんか?
770:名無しさん@お腹いっぱい。
08/09/21 22:19:11 m2yjq4Bi0
原稿の状態によっては何万出しても変わらない。
認識エンジン自体は1万前後の製品とはそんなに変わらなくて、内蔵辞書を持つとか、そういうところが変わってくる
771:名無しさん@お腹いっぱい。
08/09/24 01:41:38 KwoBHrO90
既存のPDFファイル(複合機でスキャン)に透明テキストを乗せようと
読んdeココ!!と読取革命の体験版、クセロReaderZeroを試してみたのですが、
完成後のファイルサイズがとんでもなくマチマチになるのはどうしてでしょうか?
クセロで約3倍、読取革命で約5倍、読んdeココ!!で約17倍にもなってしまいました。
同じ読んdeココ!!で、自動処理ではなく手動で作業を進めていくと
元々のファイルとほとんど変わらないサイズのものができあがるので、
これと同様の処理をなんとか自動でしてもらえたらいいのですが。
772:名無しさん@お腹いっぱい。
08/09/24 09:25:41 NU0TD4QW0
複合機の一部では、カラーやグレイスケール画像をJPEGの数分の1に圧縮するものがある
OCRで画像を読んで保存するときに、
1 読み込んだ画像を通常のJPEGで保存→ファイルサイズが数倍に
2 元の高圧縮画像のまま保存→ファイルサイズは元のまま
というケースに遭遇したことがある。今回のケースに当てはまるか分からんが。
773:名無しさん@お腹いっぱい。
08/09/24 15:57:00 j94B8AKB0
ソフト(と手順)によっちゃ画像をビットマップに展開して
再度圧縮してしまう場合もある
OCRソフトって文字認識に関しては強くてもPDFや画像の
扱いがなんでここまで糞なのってのが多い
774:名無しさん@お腹いっぱい。
08/09/24 16:30:47 NU0TD4QW0
非可逆圧縮で何度も圧縮・伸張したらひどいことになるんじゃ...
と思ったら手動の場合はちゃんとやっているのか
775:名無しさん@お腹いっぱい。
08/09/24 18:09:51 v43+h7ws0
いったい何を言っているんだ?
776:名無しさん@お腹いっぱい。
08/09/24 20:46:29 j94B8AKB0
>>774
結構その「ひどいこと」になっちゃうOCRソフトが多い
777:771
08/09/25 01:44:15 VosBAVv30
レスありがとうございます。
>>773さんの書かれているところが問題のようですね。
試しに複合機で作成したPDFファイルをAcrobat Pro(の体験版)でTIFFに変換し、
それをOCRで自動処理し透明テキストPDF出力としたところ、
サイズの変動がほとんどなくなりました。
次からは複合機でのスキャン時にPDFではなくTIFFで保存することにします。
あとは見開きの傾き自動補正がどのソフトでもできないようなので、
これについてはTIFFファイルをどうにか処理してみようと思います。
マンガのスキャン技術スレはマニアックな深みにはまってるようですが、
検索用に本をPDF形式でため込むだけならかなりよい感じですね。
778:名無しさん@お腹いっぱい。
08/09/25 08:14:14 A9ZTqUPm0
>>777
>マンガのスキャン技術スレはマニアックな深みにはまってるようですが
そのスレ教えてください。
779:名無しさん@お腹いっぱい。
08/09/25 14:59:37 6Td5Al990
>あとは見開きの傾き自動補正がどのソフトでもできないようなので
読んでココはできるっしょ?
780:名無しさん@お腹いっぱい。
08/09/26 13:37:29 yFUJpsc5O
e.Typist使ってるんだけど、だんだん操作するのが面倒になってきたので、
ファイル名を渡して連続自動処理を開始させたいんだけど、
どうやれば可能なの?
781:名無しさん@お腹いっぱい。
08/09/26 18:17:08 z9c8uZzd0
>>778
【初めての】スキャン職人養成スレ 七【自炊】
スレリンク(download板)
とか
【コミック】 自炊技術スレッド 30冊目 【書籍】
スレリンク(download板)
とか見てると画質と作業時間のトレードオフで無闇に画質よりにしすぎてるような気がするのですが。
>>779
最初に読ませるファイルと最後の出力ファイル名以外は全自動でさせるモードだと、
普通の傾き補正しか選べなかったように思うのですが、もう一度見てみますね。
「見開きのラインを認識できないなら仕方ない」と漠然と考えていたのですが。
782:名無しさん@お腹いっぱい。
08/09/26 18:39:15 Dg2t2hyN0
>最初に読ませるファイルと最後の出力ファイル名以外は全自動でさせるモードだと、
ああ、OCRファクトリーのことか。
それは使ったこと無いからわかんないや。
読んでココで見開き自動補正というと、センターを手動で指定すると、
あとは自動で傾き検出、補正してくれるってことだから。
783:名無しさん@お腹いっぱい。
08/09/26 20:07:07 z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
784:名無しさん@お腹いっぱい。
08/09/26 20:13:45 z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
785:名無しさん@お腹いっぱい。
08/09/26 20:31:24 z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。
786:名無しさん@お腹いっぱい。
08/09/26 20:32:42 z9c8uZzd0
うわああ連投してしまってた。 申し訳ないですorz
787:RQJgKKUofecPPwugoiK
08/10/21 00:23:09 HUr/ledZ0
More about mesothelioma at <a href="URLリンク(www.webng.com)">mesothelioma cancer lawyer</a>
URLリンク(www.webng.com)
[URL=URLリンク(www.webng.com) cancer lawyer[/URL]
788:bBDymJSOLg
08/10/21 00:23:09 TK425olO0
More about mesothelioma at <a href="URLリンク(www.webng.com)">mesothelioma cancer lawyer</a>
URLリンク(www.webng.com)
[URL=URLリンク(www.webng.com) cancer lawyer[/URL]
789:kIEszFhHEH
08/10/21 00:23:19 E+wJqkJG0
More about mesothelioma at <a href="URLリンク(www.webng.com)">mesothelioma cancer lawyer</a>
URLリンク(www.webng.com)
[URL=URLリンク(www.webng.com) cancer lawyer[/URL]
790:lqhDyZkYU
08/10/21 00:23:25 IPLca0TN0
More about mesothelioma at <a href="URLリンク(www.webng.com)">mesothelioma cancer lawyer</a>
URLリンク(www.webng.com)
[URL=URLリンク(www.webng.com) cancer lawyer[/URL]
791:rLrwTcsIAjZpfNgSA
08/10/21 00:24:59 Ps1bh35Y0
NSr3Vk This pearl has a programmable grind and brew feature, it holds a quarter pound of coffee beans and it has a filter indicator to tell you when your water filter is pooched, URLリンク(frespmesh.cn) Vons Weekly Ad
, :[[, URLリンク(fresnmesh.cn) Protran
, 843, URLリンク(fresnmesh.cn) Ludo Game Programming In C
, jii, URLリンク(fresimesh.cn) Snug Harbor Marina Chautauqua Ny
, enlfg, URLリンク(fresimesh.cn) Jardine Technical Services
, 8], URLリンク(freshmesfsdfh.cn) Lightbearers
, fvfm, URLリンク(fresimesh.cn) Safest Prescription Eyeglasses Fda Approved
, 966151, URLリンク(fresjmesh.cn) Female Pudenda
, 8-(, URLリンク(fresqmesh.cn) Sacagawea Dollar Quarter Machined
, 6948, URLリンク(fresmmesh.cn) Hydrolux
, :PPP, URLリンク(freskmesh.cn) Dvop
, 8-PPP,
792:名無しさん@お腹いっぱい。
08/10/28 07:01:10 2UwgvcQp0
読んでココ、早くunicode文字に対応してくれ!
793:名無しさん@お腹いっぱい。
08/10/29 19:21:47 GUt1EgdT0
OCRソフトって、前後の文字から推測するアルゴリズムにすれば
熟語とかの認識率が格段に上がるはずなのになんでやらないんだろう?
どうみても1文字ずつ単体でしか認識しようとしてないよな。
794:名無しさん@お腹いっぱい。
08/10/29 20:30:23 K8CjuoRX0
OCRって、元々の用途を考えると文章には不向きなんだよね。
申し込み用紙など決まった書式の中に住所、氏名書くようなものとか葉書(送り先を読み取って自動仕分けする機械がある)とか。
一語一句(誤字脱字も異字体も)正確に読み取るような用途向けだったはず。
それに、1文字でも誤認識があると、熟語全体を誤認識する可能性すらある。(だから「格段に上がるはず」という想定が通用しない。)
それを自動でどうにかするのが逆に難しい。1文字の区切りや行、列の方向を誤認識する事すらあるくらいなのに、複数文字組み合わせで
判定しようとすると辞書に無い熟語は認識率が上がらないし、辞書に無い熟語を「辞書にある熟語」で誤認識する可能性もある。
辞書の語彙を増やすと似たような文字を誤認識した場合に熟語ごと誤認識する可能性も高まる。
結局は1文字ずつちゃんと認識できないと辞書があっても誤認識率が上がるか大して変わらないからあまり意味が無いのでは?と思う。(人間の曖昧情報の認識力って優秀だよね、と思える部分)
かな漢変換エンジン(今で言うIME)のメーカーとOCRメーカーが組んで作ったところで・・・1文字誤認識しただけで1文丸々誤認識とか勘弁して欲しい事態になることも。
795:名無しさん@お腹いっぱい。
08/10/30 11:25:27 6UKMxSSc0
そこまでいく文字認識じゃなくて人工知能だからね。
コンピュータに一般常識やら駆け引きやらを実行させなくてはならない問題だ。
膨大なデータベースと高速演算が出来れば可能なのかもしれないが。
796:793
08/10/30 18:26:59 wNT2JRDf0
いやいや人工知能ってほど大げさなものじゃなくてさ。
例えば「微細」っていう言葉を認識するのに、ソフトは1語ずつ第一候補・第二候補…と
候補の語をいくつか持っていると思うんだよ。
それで2つの語の候補がそれぞれ、[1:徴 2:微 3:徹] [1:細 2:紳 3:組]だったとすると
この語句の組み合わせ(3x3=9通り)で熟語として成り立つのは「微細」だけ。
1語ずつ認識すると「徴細」という誤った結果になるけど、語の組み合わせで辞書と照合
すれば正しく「微細」となる。
単純に、辞書で照合できた熟語だけ優先的に出力するということ。
活字のOCRならこの方法が有効だと思うんだけどなあ。
797:名無しさん@お腹いっぱい。
08/10/30 18:37:13 1mZmHH950
>>793
実際高い製品ではそういうのができるものもあるよ。
というかスペルチェッカや文法チェッカのような技術は確立してるし、日本語の形態素解析も、再変換の技術がある程度確立してるから、技術的な困難はない。
ただデータベースのサイズが格段に上がるうえ、認識に極端な時間がかかる、辞書に載ってない言い回しや単語に弱い、言語が固定されてしまう(外来語に弱い)等の問題がある。
798:名無しさん@お腹いっぱい。
08/10/30 20:28:12 /oREtNdF0
そういう機能って、E.
とか読とかにだって最初からついてるよ。
マニュアルちゃんと読んで使えるようになってください。
799:名無しさん@お腹いっぱい。
08/10/30 21:45:34 MMyq2Afv0
英語のような分かち書きする言語だと比較的対応してるよな
800:793
08/10/31 18:17:48 JCWTUkt60
>>798が言ってるのはおそらくよく間違えて認識する単語を予め手動で登録しておく
ユーザー辞書のことを言ってるんだと思う。
俺が言ってるのはそうじゃなくて、国語辞典並みの20万語くらいの辞書をソフトが
持っていてその辞書を使って認識させることを言ってる。確かに>>797が言うように
極端に時間がかかる可能性があるし、メモリも食うと思う。今まで1時間程度で
終わってた処理がもしかしたら10時間くらいかかるかもしれない。でもそれだけ
かかっても認識の精度の方を選びたいという需要はあると思うんだよな。速度重視と
認識率重視の2つのモードがあってもいい。現在95〜99%と言われる認識率が1〜2%
上がるだけでも十分価値がある。最近のマルチコアのCPUを有効に活用できると思うし。
801:名無しさん@お腹いっぱい。
08/10/31 20:11:39 bCRz+lPk0
時間のかかるOCRソフトに用はありません
昔の3D処理ソフトじゃあるまいし
802:名無しさん@お腹いっぱい。
08/10/31 20:29:59 xBhEoWYg0
>>800
長文書く前にOCRを使ってみてはどうか?
お望みの辞書がついてると思う。
が、お望みの価値は見出せないだろう。
803:名無しさん@お腹いっぱい。
08/10/31 21:12:56 JLOd34LC0
>>800
先ずワードのスペルチェッカや文法チェッカを使えよ
道具を使えないんじゃチンパンジー以下だぞ
804:名無しさん@お腹いっぱい。
08/11/01 03:50:42 SFh3NAV80
>>800
URLリンク(mediadrive.jp)
URLリンク(mediadrive.jp)
805:名無しさん@お腹いっぱい。
08/11/01 13:09:12 A6vJWRwI0
e.typistのバージョン上がってたから一応
001408DE : 11→00
eTyp12mem.dllは一緒
806:名無しさん@お腹いっぱい。
08/11/02 13:02:46 AJubgEGf0
たぶんOCR使ったこと無くて、想像で言ってるんだろうね。
現状、認識処理に1時間もかかるわけがないw
807:名無しさん@お腹いっぱい。
08/11/02 16:11:17 SxT+me9H0
OCRだって自然言語処理してるよ
認識候補に対して辞書を使って絞り込みとかやってる
808:名無しさん@お腹いっぱい。
08/11/02 16:15:31 9MBAetAc0
認識処理は昔から早いけど、
結局は結果確認と誤認識や体裁の修正は必ずしないといけない。
その修正作業がどれだけ楽になるかがOCRソフトの一番大事なところ。
809:名無しさん@お腹いっぱい。
08/11/02 17:28:07 cwzkfA700
>>805
kwsk
810:名無しさん@お腹いっぱい。
08/11/02 17:31:04 poJP7dLr0
>>809
いや駄目だろ、それは
811:名無しさん@お腹いっぱい。
08/11/08 08:38:05 ZMhDwSXi0
素人ですみません。
OCRソフトを探しています。
透明テキストの機能を使って、文書の全文検索に使えるようにしたいと考えています。
PDFに変換してから、ちょこちょこといじりたいのですが、acrobatのOCR機能ってどうなんでしょうか?
OCR機能の点からみたacroatのメリット・デメリットは、>>763以外になにかありますか?(認識率が格段に低いなど)
SmartOCRは現在のOCRのシェアウェアやacrobatよりもどんな点で劣る(あるいは優れている)か教えてください。
812:名無しさん@お腹いっぱい。
08/11/09 12:45:08 EZAsVtJx0
PDFのOCR機能は画像OCRの付け焼き
813:名無しさん@お腹いっぱい。
08/11/12 02:08:52 6OQUopCS0
>>805
差分ファイルで
814:名無しさん@お腹いっぱい。
08/11/16 04:24:48 4vajSCcA0
読んde!!ココの次期バージョンは当分ないのだろうか?
ブラザーA3複合機買ったんだけど、OCRソフトは何買ったらいいか迷う。
Acrobat8持ってるから充分なのか、読んde!!ココ 13にアップグレードするか。
それともe.Typistを使ってみるか。
最終出力はテキスト付きPDFにしたいんだけど。
イチオシのワークフローあるかな?
815:名無しさん@お腹いっぱい。
08/11/16 05:27:56 0tZlWar00
あ
816:名無しさん@お腹いっぱい。
08/11/16 06:36:32 0tZlWar00
あ
817:名無しさん@お腹いっぱい。
08/11/16 15:06:04 kMc8Bxa00
読取革命12体験版を使ってみたんだが・・・・。
表編集モードにおいて、誤認識された罫線の削除のコツがよくわからない。
はさみのアイコンでなぞっても、消えない事が圧倒的に多い。
まるで出来ないかというとそうでもなく、あーでもないこーでもないとやっているといきなり消えることもある。
エロイ人、どうかこつを教えてくれ。
818:名無しさん@お腹いっぱい。
08/11/23 14:26:28 vpMal3Xl0
「本格読取 2」と「本格読取 2 Deluxe」って
何が違うんですか?
819:名無しさん@お腹いっぱい。
08/12/01 15:15:27 LWVSjDCk0
これまで何の疑問もなく「読んde!!ココ」 のバージョン10.01を使ってきた。
バージョン上げると読み取り精度は上がるのだろうか?
俺が使うのは英文ばかりだけどfの読み取りが悪くてイライラ。
820:名無しさん@お腹いっぱい。
08/12/02 11:26:40 j5O/upWL0
英文ならomnipageとか使え
821:名無しさん@お腹いっぱい。
08/12/02 14:14:45 u3ql/6+p0
FineReaderの最新版は抜群の精度
822:名無しさん@お腹いっぱい。
08/12/03 01:16:37 tni9wAEC0
>>817
ハサミの左の先端で消したい罫線をなぞると良いよ。
ってもう試用期間終わってるかな?
823:名無しさん@お腹いっぱい。
08/12/03 14:02:21 7DjjIJfp0
>>818
回答こないね
824:jrOORvtvExkE
08/12/04 06:23:20 eYjGu4xE0
Useful info about <a href="URLリンク(mesothelioma-disease.blog.ca)">mesothelioma cancer</a>
URLリンク(mesothelioma-disease.blog.ca)
[URL=URLリンク(mesothelioma-disease.blog.ca) cancer[/URL]
825:BPCEZIWpAquwwspfZk
08/12/04 06:23:22 VbG12Y6T0
Useful info about <a href="URLリンク(mesothelioma-disease.blog.ca)">mesothelioma cancer</a>
URLリンク(mesothelioma-disease.blog.ca)
[URL=URLリンク(mesothelioma-disease.blog.ca) cancer[/URL]
826:名無しさん@お腹いっぱい。
08/12/15 08:02:30 3Dr8GKKG0
読んでココv13の質問なんですが、
認識結果を修正するとき、候補文字から選択するとどんどんユーザー辞書に追加されていきます。
初期状態は、追加するかどうか、確認画面が出てたのですが、確認しないをチェックしてしまいました。
これを元に戻したい(確認画面が出て、不必要な辞書登録をしない)のですが、どこにその設定があるのか分かりません。
かなり探したのですが・・・何処に隠れてるのでしょう?ご存知の方教えてください。
827:名無しさん@お腹いっぱい。
08/12/15 23:31:57 SxBJUL7R0
自己解決しました。
で
別の問題が出てきました。
同じく、認識結果を修正中に、
候補文字から選択すると、半角指定してるはずの記号が全て全角になってしまいます。
仕事場と自宅で別々の読んでココを使ってるのですが、
仕事場のほうは半角で出てくるのですが、自宅は全角です。
環境設定とか同じはずなんだけどなあ・・・
ユーザー辞書が違うからかな?
828:名無しさん@お腹いっぱい。
08/12/16 12:37:06 62OVPLgO0
ユーザー辞書を移植したら、同じように半角で出てくるようになった・・・・
・・・・が、
今度は、移植した辞書に新しい字を追加しようとしたらエラーが出て落ちてしまう・・・orz
なんなんだ?
デフォだとユーザー辞書は隠しファイルになってるし、ダミーが置いてあったりするし、
移植したファイルは読めても書けない仕様なのか?
隠しファイル領域に入れないと駄目なのかね?
ヘルプ読むと、場所は何処に置いても良さそうなこと書いてるが。
俺みたいに2台のPCで場所変えて作業してる人のために、
設定や辞書の共有が出来るような仕組み無いのかね?
829:名無しさん@お腹いっぱい。
08/12/16 16:09:26 MKgRiCmn0
お前はマニュアルを読んでここ
830:名無しさん@お腹いっぱい。
08/12/16 17:02:09 /jtierzP0
ヘルプのマニュアルは一応読んでるよ。
でも読み落としてるかもしれないから、何処に載ってるか教えてくれよ。
ただの煽りなら引っ込んでろ。
831:名無しさん@お腹いっぱい。
08/12/16 18:33:15 ir5gL59l0
>>830
おまえ人に聞く態度か、ドアホ〜
おまえ頭悪いんじゃ 自覚せい 消えろ〜
買ったところから聞け たわけ〜
832:名無しさん@お腹いっぱい。
08/12/16 19:21:17 +a6zF2z/0
∩___∩ |
| ノ\ ,_ ヽ |
/ ●゛ ● | |
| ∪ ( _●_) ミ (>>830)
彡、 |∪| | J
/ ∩ノ ⊃ ヽ
( \ / _ノ | |
\ " / | |
\ / ̄ ̄ ̄ /
833:名無しさん@お腹いっぱい。
08/12/16 20:59:44 1zLemMeh0
やれやれ・・・釣り扱いかよ。
自己解決しますた。
ユーザー辞書の移植は、読み取りだけならdicファイルだけでいいけど、
書き込むにはコントロールファイルもいるんだな。
マニュアルには載ってないようだけど、
834:名無しさん@お腹いっぱい。
09/01/10 08:16:09 eYWtFstc0
あぁ、1TBHDDが安くなりすぎてテキスト化しなくてもいいと思い始めた。
835:名無しさん@お腹いっぱい。
09/01/10 13:00:54 TYnOKpqB0
↑いやいや、検索するって役割があるでしょ。
質問です。
e.Typistをインストールすると、mediadriveというフォルダが、Documentsフォルダに作られますが、移動するにはどうすればよいですか。
これ非常に不便なのですが・・・
836:名無しさん@お腹いっぱい。
09/01/10 15:12:22 IPOI/TmT0
透明PDFにpngが使えないので萎えた
lzwのtiffでも数倍でかくなる
837:名無しさん@お腹いっぱい。
09/01/10 16:30:03 LjtLb05Y0
OCRソフトってPDFの扱いが弱すぎるよね
838:名無しさん@お腹いっぱい。
09/01/11 00:40:51 iuR1Bu1I0
そもそもPDFっていらないしな。
839:名無しさん@お腹いっぱい。
09/01/11 02:42:06 sd43c4tCP
いやいやいや、今んところ透明テキストつきPDF以上に、
バランスの取れた形式ってないんじゃないのか?
OCR変換したテキストデータのみを使うとか正気の沙汰じゃないけど、
文字列検索ができるのはただの画像データにはないメリットだし、
何よりも可搬性が高いというメリットもあり。
>>838はこのスレでPDFいらないっていうことは
全部テキストデータで保存してるのか?
840:名無しさん@お腹いっぱい。
09/01/11 02:46:38 iuR1Bu1I0
検索しないから。一度読んだらだいたいの場所は頭に入ってる。
読むの速いし、パラパラ高速でめくれないPDFは論外。
841:名無しさん@お腹いっぱい。
09/01/11 02:59:40 sd43c4tCP
まぁ、検索するかどうかは確かに使い方次第かもしれないな。
でもPDFがパラパラ高速でめくれない、ってそれは単純に
PCのスペックによるものなんじゃね?
300ページくらいの本をスキャンして30MBくらいで保存してるけど、
Adobe Readerで見開き2ページ表示にしてもさくさくPageUp/Downできるけどなぁ。
842:名無しさん@お腹いっぱい。
09/01/11 03:12:05 iuR1Bu1I0
読むの遅いんじゃね?
843:名無しさん@お腹いっぱい。
09/01/11 03:16:50 sd43c4tCP
いやいやwww
PageDown押しっぱなしで300ページ見開き表示(150面)
の冒頭から最後まで15秒もかからないんだけど、
どんな速読マスターでもさすがにこのスピードは無理じゃないのか?
ということで脱線してきたのでもうレスはつけない。
スレ汚しすまない。
844:名無しさん@お腹いっぱい。
09/01/11 04:09:13 /tuIuVbi0
検索を使わなくてすむような使いかたしかしてない時点で
845:名無しさん@お腹いっぱい。
09/01/11 10:08:10 osstJUh50
小説とか?にしか使ってないのかな?
学術書や研究書をデータ化して検索可能にすると全然
違ってくるんだよね
読むときに単語ひとつひとつにまで注意は払えないけど
後から違うテキストにある単語の用法を検索するとか
単語が使われる頻度を調べるとかさ
846:名無しさん@お腹いっぱい。
09/01/11 16:45:17 iuR1Bu1I0
頭に入ってない、知らないかから検索しなきゃいけないんだろ。要はただの馬鹿。
統計とるのにOCRで作った修正処理してない、合ってるか間違ってるか
分からない透明テキストPDF使うなんて研究者失格だな。
専門分野なら頭に簡単に入るだろ。stockの知識は暗記しろ。
847:名無しさん@お腹いっぱい。
09/01/11 19:07:28 N53izUZ70
>>846
よう、天才。
あんた、なんでこのスレに粘着してんだ?
848:名無しさん@お腹いっぱい。
09/01/11 19:18:36 /tuIuVbi0
まじ天才。
俺の大学では会議はまだプリントされた紙を配る。
邪魔だから、PDFで保存。紙は捨てる。
学内自転車置き場に置かれた放置自転車の問題とか
入学試験の試験監督とか
これ結構な量なんだよ。
まれにこれが必要になるから困る。
でこんなものも全部頭に入れてるの?
俺なんて会議中熟睡だぜ
ありえんな。研究者とか書いてるが
ただのニートと見た。
849:名無しさん@お腹いっぱい。
09/01/11 22:52:25 xF2BYn5G0
インド人じゃないの?
向こうのエリ−トは2時間くらいの会議ならその会議での会話を そらで再現出来る頭だって。
850:名無しさん@お腹いっぱい。
09/01/12 01:47:20 n3qvCL0O0
SVGがもうすこしがんばってくれれば、、、
851:名無しさん@お腹いっぱい。
09/01/12 02:07:33 SDQi6vqPO
おまえらレベル低いな。俺の国では読む前から本の内容くらい完璧に再現できないようなら落ちこぼれだから。
852:名無しさん@お腹いっぱい。
09/01/12 10:44:58 iaaaILbh0
テキスト化スレでなんでPDFを称賛してんだ?
スレ違いだ。
853:名無しさん@お腹いっぱい。
09/01/12 10:52:21 Z3wpMu5b0
>>852
ID:iuR1Bu1I0は、テキスト化すら必要なさそうだが。
854:名無しさん@お腹いっぱい。
09/01/12 10:53:10 n3qvCL0O0
つ透明テキスト付きPDF
855:名無しさん@お腹いっぱい。
09/01/12 10:56:31 iaaaILbh0
誘導 >> PDFの素晴らしさ話題はこちらへ
PDF作成・変換ソフト。Part 5
スレリンク(software板)
856:名無しさん@お腹いっぱい。
09/01/12 12:38:29 ZsusePTR0
透明テキスト付きPDFさえスレ違い認定してる奴って
なんなんだろう?
手元に元資料なくなったら読取り間違いを見つけるのに
PDFの画像だけが頼りじゃん
完全にテキストデータしか残さないの?
857:名無しさん@お腹いっぱい。
09/01/12 13:24:35 hw4QZewC0
>>849
そんなわけないだろw
12年と235日前の会議でもすべて覚えてるんかいw
858:名無しさん@お腹いっぱい。
09/01/12 13:26:19 AdJ5kc2+0
>>849
インド人の友達いるけど、みんな馬鹿だよ
859:名無しさん@お腹いっぱい。
09/01/12 16:56:21 KqRtE+b10
>857が馬鹿なだけだと思うよ。
子供の反論だな。
「何時何分何秒に〜」w
まさか成人じゃないよね?
860:名無しさん@お腹いっぱい。
09/01/13 01:49:48 Ck0kGCM30
何時何分ってアホ?
検索する必要もない奴がテキスト化してパソコンに保存?
もっとアホだな
テキスト化してパソコンに保存する時間が無駄だろうがw
その間にどれだけの文章を頭の中に入れれるの?天才君
861:名無しさん@お腹いっぱい。
09/01/13 11:24:35 EXPdIEAt0
WinReaderPro買うかどうか迷っている。
お前らどう思う?
用途は10万枚のxdwファイルの検索目的。
862:名無しさん@お腹いっぱい。
09/01/13 15:36:04 uERZu1aC0
xdwってそのまままじゃ検索できないんだ
へー
863:KYjGIJJNILUJsLT
09/01/13 15:38:01 ZVGLIrsS0
URLリンク(naierrybou.awardspace.com) tna victory road stream
URLリンク(ontoned.awardspace.com) rumer willis photo
864:名無しさん@お腹いっぱい。
09/01/14 01:19:58 L5omtrlo0
こんなスレに天才君がごろごろしてるとは・・・・・
865:名無しさん@お腹いっぱい。
09/01/14 02:10:19 0z5ueTXF0
>>862
scanした原稿とかは無理だよ。
866:名無しさん@お腹いっぱい。
09/01/15 03:47:41 ooQikYrc0
透明テキスト付きPDFの話なんてどうでもいいんだけど。
透明テキスト付きPDFで、テキストに変換した内容をチェックする馬鹿はいないんだから。
ここでは議論が成り立たない。
867:名無しさん@お腹いっぱい。
09/01/15 08:28:25 pt+iPJxK0
>>866
出たな、天才。
868:名無しさん@お腹いっぱい。
09/01/15 11:27:58 U2eiW9BI0
学術論文データベースでダウンロードできるファイルは
ほとんどが透明テキスト付きPDFでございますw
869:名無しさん@お腹いっぱい。
09/01/15 12:58:17 Coc/BK/S0
>>868
医学論文はスキャンされたPDFが郵送とFAXとかダウンロードできるだけというのが全てかも。
俺が入会している論文屋はそうだね。日本では業界最大手だと思うけど。
それに本をばらしてscanしまくっているから透明テキストは自分でつけないといけない。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4063日前に更新/206 KB
担当:undef