[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 03/12 11:32 / Filesize : 318 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【ADF】スキャナで連続取り込み009.jpg【OCR】



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/13(木) 20:36:01 ID:6iEPiQr0]
数十枚、数百枚、数千枚単位の紙・書類・本などを一気に取り込む、
ドキュメントスキャナに関するスレ

漫画や書籍の取り込み方法、裁断方法、ADF、OCRに関する話題もアリ

関連情報はまとめページ参照


前スレ
【ADF】スキャナで連続取り込み008.jpg【OCR】
pc8.2ch.net/test/read.cgi/printer/1134740588/

「スキャナで連続取り込み」まとめページ
adf.dkiroku.com/


792 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/20(水) 21:51:56 ID:1iTg2LsH]
>>791
>>757-758

793 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/20(水) 23:20:45 ID:sjzxVuJz]
>>791
コミコンブってなんですか?ググっても分からなかった・・・

794 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/20(水) 23:49:54 ID:529MOkYI]
>>793
ttp://www.vector.co.jp/soft/win95/art/se278069.html

ソフト名、平仮名だったかも。

795 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/21(木) 06:41:19 ID:7JR0hIwn]
>>794
サンクスです!

796 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/21(木) 08:11:31 ID:0eBt4PXR]
>>789
あれの「監視フォルダ」機能がいけてないのに同意。
皆あんなの望んでいるの? 監視フォルダって言えば
そこにおけば自動的に処理されるってのを想像する
んだけど、ココ12 のはボタンを押してから監視を
止めるまで処理してくれないので正直使えない。

797 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/21(木) 23:31:22 ID:NhvPSXEX]
>>796
あれを「監視フォルダ機能」とか呼ぶこと自体詐欺だろ。

(1)監視フォルダ機能起動してください
    ↓
(2)ハイ、スキャンしてください
    ↓
(3)監視フォルダウィンドウでボタン押してください
    ↓
(4)はい、取り込んでOCRかけますよ〜


・・・全然監視してへんやん

798 名前:796 mailto:sage [2006/09/23(土) 03:04:02 ID:1cfaQiNY]
やっぱそうっすよね。

勘違いを誘うから別称にして欲しい。 > メーカさん

799 名前:701 mailto:sage [2006/09/23(土) 20:47:07 ID:h48IDB/U]
フォルダを監視するだけなら簡単だけど、書き込み終わったかどうかを
チェックするのが面倒だからやってないんだろうね。スキャンしてる
処理と連携するか、何回かチェックしてファイルに変更なければ〜みたいに
作らないといけない。

面倒といっても技術的には難しくないので、単に時間的に間に合わなかったのかと。

でも、実は↑やってるけど、スキャン+書き込みで結構処理が取られるので、
下手に重たい処理を自動実行すると肝心の取り込み速度が鈍るよ。
結局縦横変換とか一覧確認用サムネイル作成とか位がせいぜいだった。


800 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/24(日) 17:54:14 ID:7KPEqMJq]
エプソンのA3+ADF買ったのでチラ裏。
ADFの画質はさすがにヘッド固定式とは比較にならない。
でも裏写りが結構するのと、ADFで使ったときだけ入り口付近の縁が
薄くスキャンされるという問題が。

そこで、過去スレで裏写り対策でマジックインキでベルトを
塗るという荒業が披露されてたので清水の舞台から飛び降りるつもりで
今日一日かけて塗っては乾かしで真っ黒にしてみた。そしたら裏移りは
劇的に改善され、しかも反射が減ったためか縁の問題もほとんど解決した。
これかなりオススメ。

ただ、用心してやらないとステージにインク移りそう。漏れは
乾いた後、ステージに紙かぶせてほとんど擦り痕がなくなるまで
何回もADFを回したけど、完全に0にはならない。なので定期的に
アルコールで拭いてやる必要がありそう。擦れによるものなので、
逆にスキャンに利用する部分は綺麗なままだけどね。あと、裏塗ると
全体的に影がかかるので、明るさの設定を変えるか画像の明度レンジの
調整を後でやらないといけない。

他にこのスキャナで逝ってみようという人がいたら参考になれば。




801 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/24(日) 19:20:51 ID:D10hIjon]
>>800
機種名も添えてくれると有難いです。

802 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/24(日) 20:04:33 ID:7KPEqMJq]
>>801
ES-9000Hです。ADFが同じ他のES系でもいけると思う。


803 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/24(日) 20:49:58 ID:czX1lnqo]
ES-10000G+ADF持ってる。
大変参考になりますた。

804 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/24(日) 23:04:40 ID:aIG4gA8a]
A6(両面)サイズが送れるADFで画質が良いのを探してます。

今のところ、
キャノのDR-2850
リコーのIS250D
エプのESA3ADF2+ES7000H
ゼロのC4250
あたりかなと思ってますが他にないでしょうか?
また、IS250Dの画質はどんなもんでしょうか?

805 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 00:39:54 ID:mlpa6aDL]
おとなしくScansnapにしておけ

806 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 03:30:46 ID:rojXuahN]
>>804
> キャノのDR-2850
→DR-2050と大差無し(2580の事だよね)
> リコーのIS250D
→PFUのfi-5120Cと一緒.(少なくともハード的には)
>>615のサンプルってまだ生きてるかなぁ
> エプのESA3ADF2+ES7000H
→画質では一番(らしい)、でもA6対応してたっけ?
> ゼロのC4250
→解らん、けどbmp出力不可だから後補正するなら不向き

こんな感じか。ちなみに、何取り込むの?
小説文庫本(要は文字だけ)で状態の良いもの(黄ばみ無し)とかだったら
それこそscansnapでもそれなりに取り込めると思ふ。

807 名前:名無しさん@お腹いっぱい。 [2006/09/25(月) 07:44:25 ID:Pz7fHgc+]
裁断機の購入を考えておりますが、書籍を裁断機でばらす場合は、どのように裁断するのもなのでしょうか?
本を閉じたまま、背表紙側を裁断してばらすのでしょうか?
それとも本を真ん中のページくらいで開いて、真ん中の部分を裁断してばらすのでしょうか?
よろしくお願いします。

808 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 08:07:30 ID:U15g2vzE]
>>807
漏れはこっち。

>本を閉じたまま、背表紙側を裁断してばらすのでしょうか?

表紙は外してる。

809 名前:名無しさん@お腹いっぱい。 [2006/09/25(月) 18:57:44 ID:Pz7fHgc+]
>>808
なるほど。その場合って背表紙側をわずかな幅切断するんですよね?
わずかな幅でも問題なく裁断可能なのでしょうか?
評判のいいPK-513を考えております。

810 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 20:17:35 ID:sjOsKsnZ]
>>809
カンナで削るのががいいらしいよ



811 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 20:59:46 ID:vBlaQSjn]
>>809
僅かなと言っても、あんまギリギリだとノリが残ってスキャンしづらい。
俺は3〜4mmくらいで背表紙は切り落としているな。
これくらい切り落とすと、コミックスの見開き結合はキツイが、
単ページとしてみる分にはそれほど気にならない。
ちなみにPK-513の話ね。
どこでも勧められてるだけあって、良くできてる裁断機だよ。

812 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 22:13:20 ID:xtXJDNga]
糊が残ってるとステージにこすって染みのようなスポットが
以後のスキャン画像に入ってしまうことがあるんだけど、これ
どうやってきれいにしてます?

拭いても駄目で、今は消しゴムでやってるんですが、なにか
いい方法がないかな・・・(メラミンフォームとか一瞬発狂したが、
それはさすがにやめた)。


813 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/25(月) 23:44:10 ID:sjOsKsnZ]
>>812
メーカーマニュアルにあるとおりイソプロピルアルコールを布につけて拭いてみては?

814 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/26(火) 06:11:27 ID:yKTrGLBI]
>>812
俺は液晶用のウェットティッシュ使ってるな。
ちょっと湿り気がある物で拭かないと取れないし。

815 名前:648 mailto:sage [2006/09/26(火) 12:04:41 ID:2d+OH8X8]
とある事情でメインマシンのHDDをMaxtorの7Y250M0(250GB、Serial ATA)から
Raptor(WD1500ADFD)2台のRAID 0に変更したので、>>661の時よりどのくらい
フルカラーが速くなるかと思ってテストしてみました。結果(取り込み条件はHDD
以外は>>658に同じ)

DocuWorks
600dpi画質劣化なし:4分00秒→3分47秒
300dpi画質劣化なし:1分02秒→1分02秒

EPSON Scan(BMP)
600dpi:2分51秒→2分14秒
300dpi:53秒→41秒

EPSON Scanではかなりの効果が出ましたが、DocuWorksはかなり微妙な結果になってます。
DocuWorksはどうも単純なHDDの転送だけでは済まない何かがあるっぽい・・・orz

816 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/26(火) 19:25:08 ID:tgY9zaGp]
>>814
オレは液晶用ですらない百均のウェットティッシュでこすり取ってる。
読み取り部分って単なる透明プラ板だから何で拭いても一緒っしょ

817 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/26(火) 20:09:23 ID:f/iw8Zpd]
Σブックの後継らしきものが発表されたそうな
ttp://ascii24.com/news/i/hard/article/2006/09/26/664806-000.html

今の書籍管理がZIPなので解凍せずに見れたら嬉しいけどねぇ



818 名前:名無しさん@お腹いっぱい。 [2006/09/27(水) 08:23:35 ID:rby33VR1]
>>864
俺は液晶用のウェットティッシュ使ってる、って言いたいんだから
言わしといてやれよ。

819 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 08:34:53 ID:bMxMztSA]
>>864に期待

820 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 08:51:49 ID:zRnbo0rg]
>>817
そもそも、JPGやPDFを表示できるか疑問。



821 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 18:38:37 ID:AEXS0c6S]
bcnranking.jp/flash/09-00001667.html

822 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 19:51:14 ID:bMxMztSA]
>>820
メニューに写真、とあるからjpgくらいは表示できる様にするんじゃないかね。
zipで固めたもの、までは微妙だけど。LIBRIeも最近音沙汰無いしなぁ...

>>821
ttp://bcnranking.jp/pickup/08-00010284.html
貼るならこっちだべ。

823 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 23:20:05 ID:zRnbo0rg]
はっきり言って、jpgが表示できれば、神機だね。
MP3プレーヤー見たい売れて、
電子書籍の本格的普及に繋がるかも。
あとは値段だな。


824 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/27(水) 23:36:33 ID:QZbchS3b]
値段は4万くらいらしい。
jpgをコンバート無しに見れたらかなり買うかも。

825 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/28(木) 01:24:10 ID:pVjGaDHN]
APIを公開して、pdf,jpg,gif,txt などを
表示できるフリーソフトが出るようにしてくれ

826 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/28(木) 09:25:54 ID:xUjQltlh]
このsonyのやつはどう?
カラーじゃないのがなんだが4階調グレーでいいならかなりいいと思うのだが。
www.learningcenter.sony.us/assets/itpd/reader/index.html

827 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/29(金) 02:56:06 ID:zTSDjaNa]
>>826
ttp://japanese.engadget.com/2006/01/06/sony-readr/
LIBRIeの海外版だね。国内未発売だけどPDFも読めるみたい。
国内版は、自炊ツールが出てる分手持ちの資料を取り込むには便利かと。

来週のCEATECに向けて隠し玉みたいのが出てこないもんかね。
カラー電気泳動使ったLIBRIeとか...フルカラーはまだまだかなぁ

828 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/30(土) 11:46:03 ID:jKxDf3Vq]
>>789
scansnap.fujitsu.com/jp/feature/soft-1.html
これの初期設定フォルダを変更とかするとできないかな。
このためだけにScanSnap本体を追加購入するのも何だとは思うけど。

しかし、ScanSnap OrganizerのOCR認識率は、Acrobat7.0の標準OCR処理よりも
精度が高い気がする。

829 名前:名無しさん@お腹いっぱい。 [2006/10/01(日) 20:50:02 ID:6pRhraRJ]
キャノンのA3対応のドキュメントスキャナDR-5010Cについてですが、
雑誌や教科書等のカラー写真はどのくらい奇麗に取り込めるでしょうか?
1万円台のフラットベッドスキャナよりも劣りますでしょうか?
実際に使用されている方おりましたら、感想をお聞かせください。
よろしくお願いします。

830 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/01(日) 20:55:55 ID:R9vB+MbP]
参照用として困らない程度にはきれいに読み取れる
方式が違うので写真作品みたいにとっときたならフラベ



831 名前:名無しさん@お腹いっぱい。 [2006/10/02(月) 01:20:54 ID:fQWsA1fV]
>>830
なるほど、ありがとうございます。やはりフラットベッドにはかなわないんですね。
紙送りの機能についてはいかがでしょうか?
雑誌を裁断して、取り込んでも問題なく紙は送られますでしょうか?

832 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 07:16:23 ID:SxgLd1K0]
PFUよりCANONの方がダブルフィードは少ないらしい

それと、紙や札を数えるときの要領で、コンマ1ミリ位ずつずらしてセットすると
2枚3枚を同時に吸い込む回数は激減するよ

833 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 11:31:27 ID:aPF6SVHI]
>>831
かなわないとかそういう意味じゃないよ

834 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 18:52:21 ID:yBhZfJvB]
>>831
紙質にも拠るからコツを掴むまではイライラするかも。
fiとDR-2580使ってきての大雑把な印象としては、
fi=異なった紙質が混載してる時はどうやっても駄目な事がある
DR=ザラザラな紙質に弱い

5010って事は、A3とかも扱うんだろうから、より顕著に起きるんじゃないかね。

835 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 20:25:43 ID:SxgLd1K0]
>>828
残念ながら、ScanSnap Organizerでは、
ScanSnapで読み取ったPDFファイル以外は検索可能なPDFに変換できません。

836 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 22:32:48 ID:LKU/q17e]
>>835
PFUはクソソフトだな。
DR-2050ユーザーの意見。

837 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/02(月) 23:41:52 ID:ShpZ6A88]
>>836
でもCapturePerfectだってDRで読んだ画像しか
テキスト入りPDFにできないけど……

838 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 00:27:19 ID:uy1drV74]
>>837
そんなことないけど。
別スキャナーで取り込んだ複数のjpgをCapturePerfectに突っ込んで透明テキスト入りのPDFに出来るよ。

839 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 00:36:04 ID:gBrAxZfI]
独自ドライバのSCANSNAPに難癖付けても仕方ねぇべ。

>>837
ISISドライバのあるスキャナならCapturePerfectで読取できるよ。
fiとCapturePerfectの組み合わせで透明テキスト付きPDF作成できた。
画像ファイルも直に出来るとは思わなかった。今度試してみよう。

840 名前:名無しさん@お腹いっぱい。 [2006/10/03(火) 01:10:06 ID:flw8VW5M]
最近のスキャナは静かですか?
4年ほど前に複合機買いましたけど
スキャナがとてもプリンタはもちろんスキャナが
とても煩かったです。近所から苦情が来たため数回使ってやめましたが
今のは、どうなのでしょうか?



841 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 01:33:17 ID:GRB1pxpM]
引っ越した方が早いと思うよ

842 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 02:00:43 ID:flw8VW5M]
貧乏なので無理です
引越しできたとしてもたぶん環境は変わらないでしょう
一軒家に住みたいです
あの機会音が無ければなぁーと思います
ウィーン ガチャン ウィーン ピー
もう煩いw最近の機種もあまり音は改善されてないみたいですね

843 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 07:35:05 ID:+Imzl1xw]
防音ブースの中に入れるといいよ

844 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 08:19:30 ID:7mHpD4DX]
デジカメで撮れば?

845 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/03(火) 20:19:45 ID:oMRuQwR7]
網膜に焼き付けろよ

846 名前:336 mailto:sage [2006/10/03(火) 23:03:01 ID:ZfS1Hz3/]
PDFに貼り付けた透明テキスト(?)を削除するにはどうしたらいいでしょうか?
OCRをやり直したいんですが…。

847 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/04(水) 03:14:13 ID:xlSHEYqc]
Adobe Acrobat8ではどう?

848 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/04(水) 11:46:18 ID:ApKoMmZe]
>>846
むしろそんなことが出来ないとは思ってなかった。自分は。
適当に設定いじれば出来るもんだと思ってた。
けどAcrobat7で試したら自分も分からなかった。
テキスト情報の無いプレーンなPDFに戻すのって結構難しいのかな。

849 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/04(水) 15:34:22 ID:eZQ8k9Hz]
>>846
ACROBATからだったら、単純にもう一回OCRの実行すれば可能みたい。
特定のテキスト編集したり消すんだったら>>47
ただし、フォントが埋め込んで無いとエラーが出る。
CapturePerfectから作成したテキストが消せなくて悩んでたら
↓との事。
ttp://support.adobe.co.jp/faq/faq/qadoc.sv?222555+002

...面倒くせぇ。

850 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/04(水) 19:37:31 ID:9T4RbjFi]
Acrobatならちっとも難しくないぞ。
目的のファイルを開く→「名前を付けて保存」→ファイル形式でJpegを選択
でファイルの全ページをJpeg化できる。
再度AcrobatでPDFにし直すのもよし。再度OCRソフトに読み込ませてもよし。

バッチシーケンス使えばもっとスマートに出来るかもしれん。



851 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/04(水) 20:54:40 ID:1oJLYW8b]
Photoshopで読めば?

852 名前:336 mailto:sage [2006/10/05(木) 06:03:48 ID:ceWV8kNr]
>>850
その時、画像が劣化しませんか?

853 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/05(木) 08:20:38 ID:k2ObmtME]
なんで?

854 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/05(木) 11:56:15 ID:yhQuUnqz]
方法は教わったんだから自分でやってみりゃいいじゃねぇか


855 名前:名無しさん@お腹いっぱい。 [2006/10/06(金) 03:12:14 ID:Co1ZxjD7]
お前に言われる筋合いはない。引っ込めクズ。

856 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 03:59:52 ID:L9QD0AFI]
とゴミ屑が申しております

857 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 04:33:14 ID:zKXoZGBs]
たしかに画像が劣化するよな

858 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 13:13:17 ID:u/Mns1Wo]
JPEG化するときに劣化するのではない
PDF作成時にサイズ最適化とかすると多少劣化させた画像が取り込まれるが
それを忠実に吐き出してるだけ

859 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 14:34:58 ID:POuJpknZ]
Capture Perfect V3.0.31バージョンアップデータ
cweb.canon.jp/drv-upd/dr/cp3031ud.html

860 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 16:13:22 ID:UqkWOs9H]
>>858
ACROBATからJPGで保存にすると、再圧縮かけて劣化するべ。
無劣化でJPG書き出しする方法ガあれば教えて欲しい...

>>859
Capture Perfect側では傾き補正できない様にした、って事かなぁ。
それはそれで極端な...



861 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 16:36:43 ID:jj7csa4O]
>>859
>●V3.0.30→V3.0.31へのバージョンアップ内容
>1.OCR情報付きPDFファイルを作成する際、自動的に斜行補正が働く仕様
>  だったため、原稿によっては意図せず画像が斜行してしまうケースが
>  ありました。これを自動的に斜行補正を働かせない仕様に変更致しま
>  した。斜行補正を併用したい場合はスキャナドライバ設定にて有効に
>  して下さい。

斜行補正の精度を上げるという選択肢はないのかCANON。

862 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 22:06:41 ID:mInkeDQh]
>>860
>ACROBATからJPGで保存にすると、再圧縮かけて劣化するべ。
しませんよ。


863 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 22:15:34 ID:rvoHgLZ7]
2050Cで一番斜行がましになるのはどの方法かな?

Capture Perfect。
アクロバット経由。
それともOCRソフト経由

神業の洗濯バサミと30枚しかのせてなくて
ガンマ値もいじってない。
白地の書籍をスキャンしてるのに
酷いときは酷いよ。

864 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 22:35:02 ID:vXlLNLxd]
補正オンで縁ベタ原稿だけあとでとりなおす

865 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 23:24:27 ID:yP6XPnPO]
>>860
これは間違いなくあり得ない。Adobeもそういってる。
JPEG→PDF→JPEGで画質の劣化は起きないよ。

ただしOCRかけたり、最適化オプションで画像解像度を落とすと
当然劣化する。でもただPDF化しただけのものなら、劣化無しに元のJPEGに戻せる

866 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/06(金) 23:29:16 ID:yP6XPnPO]
>>861
スキャナドライバ側の斜行補正とCapturePerfect(のOCRエンジン)の斜行補正と
どっちが賢いかって言うと、ドライバの方がちょっと賢いような気がする。

でもこれまではPDFにするときはドライバの斜行補正はOFFにしとくしかなかった。

今度は逆にOCRエンジンの斜行補正がOFFになるってことやね。
選択肢としては正しいかも。黒枠が切れる?明るさを192まで上げろって

867 名前:860 mailto:sage [2006/10/07(土) 00:59:48 ID:vSW81fkm]
>>862
>>865
ん?普通にファイル→名前を付けて保存でファイル形式jpg選ぶんだよね?
最高品質に設定してもpng出力とくらべると多少変質してるみたいなんで
再圧縮かけてるのかと思ったんだが...
acrobat以外で生成したpdfだとダメ、とか条件があるのかなぁ。
ちょっと調べてみよう。

>>866
スキャナドライバ側の斜行補正=紙端検知
CapturePerfect(のOCRエンジン)の斜行補正=文字並び検知
じゃなかったっけ?どっちが良いかは原稿種に拠るんじゃね?
選択肢は残しといて欲しいなぁと思ったんだが...

868 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 07:31:57 ID:vSW81fkm]
>>867自己レス。
pdfから画像抽出するソフトやacrobatからアドバンスト→画像の書き出し使ったら
無劣化jpg書き出し出来たっぽい。acrobatの方は少々怪しいけど。
acrobatから名前をつけて保存、だと複数画像だろうがテキストだろうがページ毎に
一まとめにして画像として保存するから再圧縮かかるって事になるのかな。
>>852じゃないからとりあえず無劣化抽出できれば満足。スレ違いスマソ。

869 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 16:35:12 ID:hL9MFjYE]
>>865
便乗質問ですが、AcrobatでOCR化しただけでなんで劣化するのですか?
実は前から気になってることで、OCR化後のPDFの容量が思いっきり小さくなるので(5分の1くらい)、
なんとなく気持ち悪かったんですよ。
透明テキストを貼り付けてるならむしろ容量増えるべきだろ?と。

870 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 21:11:47 ID:jHt2Xs2p]
>>869
高解像度で取り込んで作ったきれいな絵のPDFにOCRかけてみな
汚くなるから、

方法はあるのかも知れないが、結構いじったがわからんかった。




871 名前:870 mailto:sage [2006/10/07(土) 21:23:05 ID:jHt2Xs2p]
>>869
失礼、これでは伝わらんな、

OCR後は、よく見ると確実に絵が汚くなっている。
文字の周りにノイズがのったり、印刷絵の網網も劣化している、
よって小さくなるのだろう。

いろいろ設定を変えてやってみたのだが、、、、



872 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 22:12:00 ID:mKm9fhoc]
>>869は劣化するのはわかってて理由を訊いているのでは

873 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 22:41:26 ID:hL9MFjYE]
>>872
あ、代弁ありがとうございます。

OCR化で劣化してることには気づいていており、設定変更では私の調べた限り対処は出来ませんでした。
で、気になるのが、何がどういう理由でOCR化するにあたって画像を劣化させる必要があるのか?ということが疑問だったのです。

今までOCR化はAcrobatでしか行ったことがないのですが、他のソフトの事情はどうでしょう?

874 名前:336 [2006/10/08(日) 09:21:59 ID:KeueR/7+]
気になりますね。
テキストデータを付加するだけでなんで画像まで劣化するのでしょうね。


875 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 10:15:17 ID:KRAaSbd4]
単純に再圧縮しているという仕様という名のバグ。

876 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 11:47:58 ID:RtdogS0I]
ある程度の解像度は文字認識に必要だが、OCRが済んでしまえば
高画質である必要は無いから、再圧縮してPDFのファイルサイズを
出来るだけ小さくしようという考えなんじゃないかな。
ファイルサイズが大きいとメモリを消費して操作も一層重くなるし。

877 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 12:55:37 ID:3w3LguV8]
OCR前後でサイズはどれぐらい変化するのですか?



878 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 14:50:18 ID:iiRXv7Ew]
>>869
ダウンサンプリングで劣化の度合い変わるんで、
何割もファイルサイズ落ちるんだったらそこを低くするのも手かと。
最低にしても多少は劣化してるみたいだけど。試し済みならスマヌ。

確かACROBATって読んでココのOCRエンジン積んでたと思ったんだけど、
こちらも同じ仕様なのかしらん。

879 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 17:18:30 ID:rlMAr23d]
>>878
OCRエンジンは認識するだけだろ。
画像側を再圧縮するかしないかなんてAdbe側の仕様

880 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 20:08:22 ID:fmeTwQ6i]
www.g-mark.org/search/Detail?id=32135&lang=ja



881 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 21:06:52 ID:ml9c+sg+]
AcrobatはOCRかけるときにいったん、ラスター画像として書き出して、
それに対してOCRをかけ、透明テキストをかぶせる際に画像を再圧縮している。
再圧縮の設定は「テキスト認識」の設定で「PDFの出力形式」で「検索可能な画像(非圧縮)」を
選んでも、その下に「画像のダウンサンプリング」とあるとおり、再圧縮は免れない。
support.adobe.co.jp/faq/faq/qadoc.sv?225546+002

「画像のダウンサンプリング」で「最低(600dpi)」を選んでも、かなり汚くなると言う印象。

PDFにただOCRかけるだけなら読んde!!ココの方が綺麗に仕上がる。
(エンジンのバージョンが違うからか、それともAcrobat独自の問題か)

読んde!!ココの設定は「オプション−環境設定−出力」の「画像領域の設定−画像の出力解像度」を
「元画像の解像度」にしておけばいい。


882 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/08(日) 22:51:04 ID:pYmZMzob]
>>881
詳しくありがとうございました。
読んでココを試してみたいと思います。

ただ、OCR化するような文字がたくさんの本を200dpiや300dpiのPDFで保存し続ける必要性があるのか?
と言われれば、Acrobatに右へならえしたほうがいいのですがw

883 名前:名無しさん@お腹いっぱい。 [2006/10/09(月) 12:13:04 ID:z4tsizML]
必要があるのか、なんてのは人それぞれだろ。余計なお世話だ。
氏ねよクズ>>882

884 名前:名無しさん@お腹いっぱい。 [2006/10/09(月) 20:58:24 ID:63+jhuUe]
>>883 最近は、夏休みの宿題が終わらなかったり、18才で童貞ってだけで自殺しちゃう
人居るから軽いジャブの気持ちでも、気をつけなよw


885 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/09(月) 22:48:39 ID:rNrW5aZQ]
>>882の「必要があるのか?」は自分へのツッコミだろ
何でお前が切れてんだ

886 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/09(月) 22:52:21 ID:oHQuyCHS]
なんでだろ?

887 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/09(月) 23:11:13 ID:mOLt1RJ3]
>>885
そうです。自分へのツッコミです。

888 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/10(火) 00:54:50 ID:OjYMUDI2]
コミュニケーション能力がない人間の勝手に誤解して勝手に暴走して
周りに疎まれてやがて孤立する黄金パターンを地でいってるな。

889 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/10(火) 02:53:00 ID:VTgybICt]
時々湧いてるage荒らしじゃん。近寄っちゃいけません。

890 名前:名無しさん@お腹いっぱい。 [2006/10/10(火) 16:05:50 ID:KAOUvVlx]
僕は・・・、



いつでも君のそばにいるよ。>>889



891 名前:336 [2006/10/11(水) 09:39:52 ID:GWsVyV36]
adobeのOCRを使うと再圧縮は免れない、と言うことでいいのでしょうか?


892 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/11(水) 11:19:33 ID:ks3l/SRv]
>>891
AdobeだけじゃなくOCR→透明テキスト処理をすると
必ず画像はリサンプリングされる。
ただ、Acrobatは特に汚く(ただしサイズは小さく)なる






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<318KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef