画像処理その10 - 暇つぶし2ch

画像処理その10 ..

577:デフォルトの名無しさん
08/05/11 06:02:53
>>572
もう釣りにしか見えないけど、自分が絶対断れない立場でこれをやれといわれたら
光の分布をチェックすると思う。方向ならなおよし。

578:デフォルトの名無しさん
08/05/11 07:15:59
>>577
詳しく
写真から3Dモデルを作るくらい難しい？

579:デフォルトの名無しさん
08/05/11 07:57:02
イラストを写真に撮ったのはどうすんの

580:デフォルトの名無しさん
08/05/11 08:22:41
イラストだけならイラスト
額が映っていたり遠近法で歪んで見えると実写だろ
3DCGは？

581:デフォルトの名無しさん
08/05/11 08:50:42
実写に手を加えたものは？

582:デフォルトの名無しさん
08/05/11 09:25:43
属するクラスの選択によって結果が違うだろうな。
両方やって妥当なほうを選択するだろうから
手を加える割合によるんじゃね。

583:デフォルトの名無しさん
08/05/11 10:52:48
完全に汎用なのかどうかにもよるが、画像の特徴抽出をいくつか実装して、
インターネット上に転がっているイラストや写真をどんどん喰わせて出力、
抽出されたパラメータを眺めて相違点を取り出し実装するのが一番現実的
じゃないか？
有意な相違点がなかったら？　それは区別できないってことだ。

584:デフォルトの名無しさん
08/05/11 15:56:53
輪郭線

585:デフォルトの名無しさん
08/05/11 17:09:36
>>579
これらのスレを有効活用してくれ
ｽﾚﾘﾝｸ(erocg板)
ｽﾚﾘﾝｸ(erocg板)

586:デフォルトの名無しさん
08/05/11 18:03:27
>>583
だろうなあ。
今、2割誤判定する方法をふたつ作ったので
こういうのを増やしていってAdaBoostなんかで繋げばいいのかな。
>>584
イラストは縁取りがある判定は一番初めにやったがダメだった。方法がダメなのかもしれないけど、
(1). 微分フィルタでエッジを出す
(2). 暗い色、または鮮やかでない色を抽出
(3). 3近傍内に(1)がある場合、3均衡内に(2)がある割合を求める
ってしたが、縁取りが無いイラストがあったり、あっても縁取りの色がイラストによってまちまちなのと
写真もエッジが出るあたりは暗くなっているので単純に暗い色でやるとうまくいかなかった。
まずは、イラストで縁取りされている輪郭線の色特徴からかな・・・。

587:デフォルトの名無しさん
08/05/11 18:42:55
コンピュータで書かれているイラストなら
色の変化が機械的に整っている。

588:M1
08/05/11 20:50:55
大学院で3次元の画像認識・理解をやろうと思ってるのですが、お奨めの参考書とかありませんか？

ネットで調べると情報は多くあるが内容は少ない。参考書探そうとすると参考とできる書籍自体がない(´･ω･｀)

学部ではOpenCVで画像処理やってました。機械の制御の研究室なので、誰も当てにできないヽ（ ´Д`）ﾉ;

589:デフォルトの名無しさん
08/05/11 21:12:20
コンピュータビジョン (単行本)
David A.Forsyth (著), Jean Ponce (著)

590:デフォルトの名無しさん
08/05/11 21:48:51
>>588
論文嫁

591:デフォルトの名無しさん
08/05/11 21:49:51
2chよりは、論文探してその人にメールした方が確実だな。

592:デフォルトの名無しさん
08/05/12 01:44:46
この分野は進歩が激しいので教科書より論文とかプロシーディングだろうな。

593:デフォルトの名無しさん
08/05/12 08:40:24
>>586
個々の判定方法の出力をうまいことひとつにまとめることが出来るなら、
その出力を利用してどちらかを判定する部分に、学習を行わせるツールを作成するといいよ。
面倒だったら、いくつか初期設定した後、どちらかがはっきりしている
１０００枚くらいの画像を利用して、ＧＡで境界値（または値の分布表）を
収束させると、うまくいくときは楽でいいだろう。ＧＡ部分の作成はたいした手間でもないし。

あとは勝ち残ったアルゴリズムに未知の画像を分類させて、分類に利用する既知の画像を
増やしていくことで、１０万枚くらいまでデータを増やせれば、代表的な画像の判定なら
かなりのところまで精度を上げられると思うよ。それ以上は難しいだろうが。

594:デフォルトの名無しさん
08/05/12 08:42:14
>>588
そういう大学で、大学院があるなら、画像研究をやってる研究室があるだろ。
そこにいって相談するのが一番早い。
ないなら、教授のつてで他大学の研究室を紹介して貰え。
縦割りの大学に将来はないぞ。

595:デフォルトの名無しさん
08/05/12 10:34:01
>>594
自宅警備員が偉そうに大学語るなよ（笑）

596:デフォルトの名無しさん
08/05/12 10:48:01
>>588
cinii辺りで検索してみれば？

597:デフォルトの名無しさん
08/05/12 14:05:34
>>593
その程度で難しいって・・・スキル低いやつだなｗｗ

598:デフォルトの名無しさん
08/05/12 14:29:39
>>597
日本語よく読めよ

599:デフォルトの名無しさん
08/05/12 17:43:56
言い訳ｗｗｗ

知識を無理に披露しようとした>>523かな。乙ｗ

600:デフォルトの名無しさん
08/05/12 18:29:24
>>513
>>519
boost.gil何に使ってます？

601:デフォルトの名無しさん
08/05/12 21:50:24
オカズに使ってます

602:M1
08/05/13 12:28:28
>>589-594
レスthx！やっぱ論文とか他の研究室あたるしかないようだな・・・

>>589
\14,000・・・・
図書館に申請か・・・・・

ﾏﾝﾄﾞｸｻ('A`)

603:デフォルトの名無しさん
08/05/13 18:54:38
ImageMagickで、24bit-BMPを8bit-BMPに変換したいのですが、
どうすればいいか分かる方いらっしゃいましたら教えてくださいm(__)m

604:デフォルトの名無しさん
08/05/13 19:28:50
>>603
URLﾘﾝｸ(www.ss.iij4u.or.jp)
こういう感じ？。

605:デフォルトの名無しさん
08/05/13 22:36:38
何のために減色したいのか知らないけれど、ファイルサイズを気にしているなら小さい画像だと逆効果なので要注意。
8ビットカラーBMPはパレットカラーだからパレットサイズが馬鹿にならない罠。

606:デフォルトの名無しさん
08/05/15 10:06:12
スレ違いの謗りを免れないが、教えてください。
jpeg で圧縮後のサイズを指定できるという書き込みを見かけて、最近また
そういうのができるといいと思い出して、やり方を探しているが分からない。
quality 指定の説明しかない。サイズ指定って出来ないですよね。

607:デフォルトの名無しさん
08/05/15 10:56:48
作るとしたら、DCTを済ませておいて
予め用意しておいた複数の量子化テーブルで圧縮試行を繰り返す、みたいな感じになるのかな・・・

608:デフォルトの名無しさん
08/05/15 11:36:45
ハフマン符号化があるから、処理前にサイズを求めるのは難しいね。
Qualityとファイルサイズの関係はだいたいどの画像も同じような曲線になるから
近似関数を求めておいて、適当なQualityで圧縮してから逆算してみるとか。
単純に二分探索でも良さそうだが。

609:デフォルトの名無しさん
08/05/15 14:16:55
QRコード画像を作りたいけど
どう作ればいいか載ってるサイトか本ありますか？

610:デフォルトの名無しさん
08/05/15 14:28:45
はい。

611:デフォルトの名無しさん
08/05/15 14:41:02
【2次元コード】QRコード総合スレ３【バーコード】
ｽﾚﾘﾝｸ(phs板)

612:606
08/05/15 15:35:57
>>607-608
ありがとうございました。

613:デフォルトの名無しさん
08/05/15 15:54:12
>>606-608
ファイルの話で、どうしても指定サイズ丁度にしたいのなら、
圧縮した後、非圧縮部分を付け加えて指定サイズにするのが簡単だ。

614:612-606
08/05/15 23:23:52
>>613
写真のJpegデータをトリムした後、Exif ヘッダ内に埋め込まれた２つの画像
データも更新して置こうと思っているのだが、小さい縦横の画像のJpegデータ
を作ると、そのサイズが大きくなって、Exif ヘッダに収まらない。（で今は
収まらなければ Exif 形式を諦めている。デジカメではうまく収まるように
よく作っているもんだと感心している。）

615:デフォルトの名無しさん
08/05/16 17:20:31
画像データの余白部分を指定した幅にしたいのですが、
どうすれば、できるのでしょうか。
画像データが複数ありバッチ処理できると良いのですが。

具体的には、
画像データの空白（白色）以外の部分に外接する四角形と
画像データの外周との幅が、指定された値になるよう、
余白部分を切り取ったり、追加したりする機能です。

よろしくお願いします

616:デフォルトの名無しさん
08/05/16 17:28:09
スレ違い

617:デフォルトの名無しさん
08/05/16 18:13:01
Visual C++を使って画像ビューアを作成(bmp・jpegが表示でき、色調・コントラスト機能が実装できるもの)したいのですが、どうしたらよいでしょうか？？初心者なので何から手を付けていいのかもわかりません。環境はVisual studio 2005です。よろしくお願いします。

618:デフォルトの名無しさん
08/05/16 18:17:48
開発環境のスレできけ

619:デフォルトの名無しさん
08/05/16 18:29:15
ImageMagick でいいんじゃね。

620:デフォルトの名無しさん
08/05/16 18:38:15
>>618
スレ違いでしたか、失礼しました。

>>619
ImageMagicとは何でしょうか？

621:デフォルトの名無しさん
08/05/16 18:40:57
ゴミ

622:デフォルトの名無しさん
08/05/16 19:51:55
聞く前にググらないとか有り得ないし100%釣り

623:615
08/05/16 20:52:18
>>616
スレ違いですか。申し訳ありません。
ググるキーワードか、お薦めスレ等を教えて頂けると幸いですが。
よろしくお願いします。

624:デフォルトの名無しさん
08/05/16 21:59:20
>>617
Express EditionならGDI+を使えばJPEG、TIFF、BMP、PNGを
読み込むことができる。

Standard以上でMFCが使用できるならCImageクラスを使用するなど
できますよ。

625:デフォルトの名無しさん
08/05/16 22:57:30
>615
Photoshopでアクション（SelectAll ->領域をshrink->領域反転->削除）を設定し、フォルダごと適用すればいいのでは。

>617
OpenCVのサンプルコードにあったと思う。とりあえずOpenCVインストールして、あとはそちらのスレへ。

626:デフォルトの名無しさん
08/05/16 23:53:42
>>624さん>>625さん、ありがとうございました。

627:615
08/05/17 11:09:43
>>625
レスありがとうございます。
今現在は理解できませんが、勉強いたします。

628:デフォルトの名無しさん
08/05/17 11:38:51
>>625
＞Photoshopでアクション（SelectAll ->領域をshrink->領域反転->削除）を設定し、フォルダごと適用すればいいのでは。
これだとデータを削ることになるジャマイカ。>615の目指すところとは違うと思うぞ。

629:デフォルトの名無しさん
08/05/17 11:57:04
何をしたいのかはっきりしないけど、
Photoshopアクション（カンバスサイズの拡張->上下左右20ピクセル）だと、元画像を削らない。

630:デフォルトの名無しさん
08/05/17 12:05:12
もう一度読むと、何がしたいのかなんとなくわかった。
もともとある程度の白枠があるわけね？
それなら、アクション（位置（０，０）を許容値０で自動選択->削除->カンバスサイズの拡張->上下左右20ピクセル）。

631:デフォルトの名無しさん
08/05/17 13:54:36
板違いもいいとこだ。自分でプログラム書けば簡単だろ。

632:デフォルトの名無しさん
08/05/19 16:22:24
フーリエ記述子から振幅スペクトルと振幅スペクトルの2乗であるパワースペクトルを求めると何の役に立つん？
振幅スペクトルって2次元ベクトルを足して1次元にしてるだけにしか見えないんですがー

633:デフォルトの名無しさん
08/05/19 17:20:11
はじめまして。
すごく初歩的なことをお尋ねします。

CMYKカラーのJpegファイルには、解像度（dpi）情報は含まれていないのでしょうか。
RGBカラーの場合は、取得することができているのですが・・

634:デフォルトの名無しさん
08/05/19 18:23:30
そもそも、RGBカラーのJPEGなんてあったっけ?

635:デフォルトの名無しさん
08/05/19 19:54:25
>>633
とりあえず、そのファイルをうｐしてみろ

636:デフォルトの名無しさん
08/05/19 22:09:40
>632
フーリエ記述子って知らんけど、フーリエ変換からのアナグラムと同じだと考えると、
振幅とパワースペクトルとの違いは位相成分なので、起点が違うんじゃね？
パワースペクトルだけだと形の同一性しか分からないけど、位相まで含めれば向きが特定できるとか。

637:デフォルトの名無しさん
08/05/22 19:43:11
>>600
かなり亀レスだけど研究に使ってる

638:デフォルトの名無しさん
08/05/22 21:45:40
>>634
あるよ。規格上は。
現物のファイルでは見たこと無いな

639:デフォルトの名無しさん
08/05/22 23:40:41
epsの入出力に対応して欲しい＞gil

640:デフォルトの名無しさん
08/05/23 06:32:39
.NET Framework 1.1 の C# で実装しています
Bitmapクラスに画像イメージを作成・編集し
Bitmap.Save にて Tiff フォーマットを指定して保存しています
この時に Tiff が圧縮された状態で保存されてしまうのですが
無圧縮での保存は可能なのでしょうか
よろしくお願い致します

641:640
08/05/23 07:27:32
>>640 です
EncoderValue.CompressionNone
を指定する所までは行ったのですが、実行すると圧縮されている・・・

642:デフォルトの名無しさん
08/05/23 07:40:14
スレ違い
.NETスレに池

643:デフォルトの名無しさん
08/05/23 07:49:35
無圧縮TIFFくらい自分で書けば?

644:デフォルトの名無しさん
08/05/23 17:18:34
>>643 = NEET

645:デフォルトの名無しさん
08/05/23 18:45:59
>>644
まだコード書けないのか。おまえ何でム板にいるんだ？

646:デフォルトの名無しさん
08/05/23 22:14:52
>>644

647:デフォルトの名無しさん
08/05/23 23:20:15
>>646
>>645

648:デフォルトの名無しさん
08/05/24 01:29:24
>>648

649:デフォルトの名無しさん
08/05/24 06:13:08
また、自分でコード書けないいつものバカが暴れてるのか。

650:デフォルトの名無しさん
08/05/24 10:37:07
ぼかしの高速化について質問です。
現在ガウスぼかしの処理を書いてるのですが、640x480範囲5で1枚あたり0.5秒もかかって
しまい、非常に遅いです。一応1次元に落としてはいるのですが、重み付きぼかしの場合、
通常のぼかしのように処理済みのピクセルの結果を流用することができないため、どう
計算量を減らすのかわかりません。
SSEも見様見真似で使ってみましたが、アルファ加重なしで40%高速化、ありではSSEなしと
同じ速度でした。これはたぶん書き方が悪いのだとは思いますが…
なにか参考になるところ、もしくは検索キーワードをいただければうれしいです。
よろしくお願いします。

651:デフォルトの名無しさん
08/05/24 10:48:04
例えば5x5ピクセルを参照して1ピクセルの値を求める場合。
計算上問題がなければ、縦5ピクセルx横1ピクセルの加重平均を横一列分計算して、
次にその結果の横5つを加重平均するようにすれば多少は処理を減らせる。

まあ、それでもぼかしって基本的に参照するピクセルが多くなりがちだからそうそう高速化は。

652:デフォルトの名無しさん
08/05/24 11:07:40
>>650
具体的に、0.5秒かかっているときのカーネルの大きさ（or ガウシアンの標準偏差）はどれくらい？

653:デフォルトの名無しさん
08/05/24 11:10:32
GPU使っちゃダメ？10倍以上速くなると思うけど。

654:デフォルトの名無しさん
08/05/24 11:20:24
質問です。
例えば下のような図があったときに、１～１１のそれぞれ領域を、
隣接する他の領域と異なる色で塗り分けるプログラムを作りたいのですが、
各領域の色を決定するアルゴリズムにはどういうものがありますか？

　　　　　〈｀ｰ─-､＿ノ＾j
　　　　　　｀> 　　　　＜＿＿, ─-､＿_＿_
　　　　　／　　　　　　　　j 　　　　　/￣￣￣Tー‐─┬''⌒ヽー-- ､
　　　r' 　　　　　　　　　　/､　　１　　/ 　　　　　|　５　 |　７　|　　　　|９
　　 └---─､　　　　/ 　｀ｰ─/ 　　３　　|　　　　│ 　　| 　　　ｌ |
　　　　　　＼　　　/ 　　　　　　/ 　　　　┌┴─‐─┴┐　/　８　ｌ |
　　　　　　　　　　＼　/　　　２　　/ｰ─ ----l 　　６　　 |‐┤ 　　　ｌ |
　　　　　　　　　　　　Ｖ　　　　　　/ 　　４　└─‐─┘　| 　　　ｌ |
　　　　　　　　　　　　し个､　　　/ 　　　　　　　　　　　　　　　　|　　　ﾊ〈
　　　　　　　　　　　　| 　｀ーl─‐┬─----------─┬─ｲ´￣ヽヽヽ
　　　　　　　　　　　　　　| 　　／ヽ　|　　　　　　　　　　　　　| 　　ﾊ　　〉〉〉
　　　　　　　　　　　| 　/ 　　|　| 　　　　　　　　　| 　/　│　/ 〈ノ
　　　　　　　　　　　　　|　|　　　|　|　　　　　　　　　　　　　|　/　　|　/
　　　　　　　　　　　　　__/　| 　__/ 　|１０　　　　　　　__/ 　| __/ 　|１０
　　　　　　　　　　(＿＿」　ﾞー-‐'　　　　　　　　　　　ﾞー-‐'(＿＿_」　　　　人
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　（＿_）
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　（＿＿）１１

655:デフォルトの名無しさん
08/05/24 11:24:56
宿題は自分で考えましょう

656:650
08/05/24 11:54:39
>>651
とりあえずそうしているのですが、その結果が0.5秒です orz

>>652
5です。　10だと約1秒でしたので、カーネルサイズと比例関係になっていると思います。

>>653
GPUですか…
DirectXは全くさわったことがないのでそこから始めなければならないんですよね… orz
もしGPUを使うとしたらシェーダは自分で書かなければならないのでしょうか?

657:デフォルトの名無しさん
08/05/24 12:12:57
GPUはCG言語から扱えるのでは

658:デフォルトの名無しさん
08/05/24 12:15:13
CgよかBrookGPUの方がよくね？
いっそCUDAかCAL使うのも手だけど。

659:デフォルトの名無しさん
08/05/24 12:15:32
ageちゃったｽﾏｿ

660:デフォルトの名無しさん
08/05/24 12:29:26
URLﾘﾝｸ(tpot.jpn.ph)
速度比較のお試し程度ならこれで十分じゃない?自分で理解できた方が良いけどさ。

661:650
08/05/24 12:49:23
うーん、できれば古いPCでも動くように作りたかったのですが、計算量はこれ以上減らせる
見込みはないのかな…　周りとの平均をとる以上無理か orz

>>657,658
やっぱり自前でシェーダ書かなければ無理ですよね orz
というか、かなり大きめの画像(HD以上)も扱えるようにしたいのですが、テクスチャ作れますかね?

>>660
ありがとうございます。
見た感じなんかCとはちょっと違いますね。
大きくは違わないけどCのノリで行ったら痛い目見そうだ

662:デフォルトの名無しさん
08/05/24 13:07:29
単に広範囲をぼかすだけなら小さめのガウスぼかしを複数回かける手もある。
クォリティ下げていいなら移動平均にすれば大きくぼかしても負荷ほとんど増えないが。

663:デフォルトの名無しさん
08/05/24 13:18:35
広範囲で極端な精度を求めないならパスカルの三角形を繰り返してやれば
擬似ガウシアンだよな。

664:デフォルトの名無しさん
08/05/24 13:21:08
そのくらい単純な処理の場合、計算量を減らすよりも
キャッシュのヒット率を考えた方が速くなると思うよ。

665:デフォルトの名無しさん
08/05/24 13:24:31
OpenCVのガウスぼかしはCPUにしてはわりと速いと思う

666:650
08/05/24 17:51:01
遅くなってすいません。

>>662
移動平均ということはモーションブラーのようにちょっとずつずらして
いくつも重ねてレンダリングするということでしょうか?

>>663
調べてみましたが、これも良さそうですね。　あんまり見た目も変わらないですし。

>>664
基本的に全部のピクセルを順番に走査するのであまり変わらないような気もしますが…
そこまでキャッシュミスするものなのでしょうか?

>>665
OpenCVですか。　言葉は聞いたことがあるのですが、どんなものなのでしょうか?
ちょっと調べてみます。

667:デフォルトの名無しさん
08/05/24 18:27:49
ぼかしは、計算時間かかるから、0.5秒なら妥当だと思うけど。
ちなみに、ガウシアンカーネルをコンボリューションしているの？FFTしてから掛け算しているの？
一般的に、前者は遅い。

ぼかしくらいで、OpenCV導入することはないと思うけど、OpenCVのブラーはたぶん後者。
３次元でブラー掛けた時、FFT２回分の時間と同じくらいだった気がするので。

668:650
08/05/24 19:13:06
>>667
>>651のように縦横別々に分けて掛けてます。
この方法だとO(2n)になるのでFFTよりは速い(たしかO(nlogn)だったと思うので)のでは
ないかと思うのですが、どうでしょうか?

いろいろ試したところ、通常のぼかしやカーネルの小さいガウスぼかしを重ねがけするのが
結果的にも時間的にもいい感じなのでもうちょっと調べてみます。

669:デフォルトの名無しさん
08/05/24 19:44:02
>>668
その方法ではせいぜいO(n^2)までしか行かない
縦横別々にFFTを使うほうが効率がいい

670:650
08/05/24 20:23:25
>>669
マジっすか orz
手元にFFTの乗った教科書があるのでちょっと見てみます。

…2^nのみじゃないといいなw

671:デフォルトの名無しさん
08/05/24 20:26:42
教科書みるよりOpenCVのソース見たほうが速くない?
用途にもよるけどAvisynthのフィルタもいろいろな処理のソースあるよGPLだけど。

672:デフォルトの名無しさん
08/05/24 20:34:06
FFTはFFTWを使うとして、係数を事前計算しておけばガウス暈しは(周波数空間像の)画素ごとに係数を掛けるだけなんだっけ?

673:デフォルトの名無しさん
08/05/24 20:34:19
畳み込みの勉強をすればいいかも

674:デフォルトの名無しさん
08/05/24 20:58:54
ちょこっと書いてみた所
Window Sizeは5×5
Pentium-4 2.4GHzで640×480、24ビットカラーで70ms
同8ビットグレイスケールで20ms
コンパイラはVS.net 2003 ProのC++でSSEもアセンブラもなし最適化は/G6
実数演算しているので整数演算にすればもう少し速くなると思う。

このくらいの速度はでるという参考にでも。

675:デフォルトの名無しさん
08/05/24 21:05:34
>>650の実行環境すら分からない状態で、0.5秒が遅いという本人の印象だけで
実装アルゴリズムもソースも、言語すら書かれていないというのに、
どうしてこんなに速いだの遅いだの言う話が進むのか。みな超能力者なのか。

とおもたよ。

676:デフォルトの名無しさん
08/05/24 21:07:59
理論的な早さは実行環境によらず語れるじょん？

677:デフォルトの名無しさん
08/05/24 21:17:20
>>675
「遅い」と言われたら、だいたい原因の想像がつくからだよ

678:デフォルトの名無しさん
08/05/24 21:29:29
>>676
速さ、な。
650が現状どの程度計算量を減らす手段をとったのか正しくわからない状態では、
適切な助言はできないだろ。もしかしたら、環境が遅いだけで650は最速に近い
アルゴリズムを実装しているのかもしれないぞ。
いずれにしても、ワークを直接ポインタで操作しているという前提で、汎的な工夫なら、

1.640x480なら、650x490のワークを利用することで境界判定をなくして
2.１次元化して座標からのアドレス計算を減らして
3.平均化も縦横個別に１次元化して(>>651)
4.必要な精度にもよるが適当でいいなら固定小数点化して整数演算に帰着させる

くらいしかないんじゃないかな。

679:650
08/05/24 21:40:10
FFTのソースやら説明を読んでたら頭が爆発しそうになりました。
ろくに数学をやってないのに手を出すべきじゃなかったかもしれません orz

>>674
(ﾟДﾟ)

>>675
ソースが糞だからだと思います。
しかし、自分も糞なので糞が直しても糞にしかなりません。

>>678
現在は2と3をやってます。
1はコピーに時間がかかりそうですが、コピーはしないのでしょうか?

680:デフォルトの名無しさん
08/05/24 23:58:56
FFTは別に理解していなくても、使えればいいよ。
（気持ちに余裕があるときクーリ＆ターキの大発明を理解したらいい。元はガウスだっけ？）

FFTは特にFFTWくらい高速なものになると理解困難。
サイズによってアルゴリズム変化するらしい。
使い方もちょっと特殊。

ま、何も考えずに使いたければ、OpenCVにIPL組み込むことだ。ボカシ命令実行するだけで、すべてやってくれる。

681:デフォルトの名無しさん
08/05/25 01:12:20
8bit インデックスカラー画像を、さらに可逆圧縮する方法は無いでしょうか？
汎用的な圧縮アルゴリズム以外で。

682:デフォルトの名無しさん
08/05/25 01:21:48
誰かエスパーいたら、相手にしてやれよ

683:デフォルトの名無しさん
08/05/25 03:08:35
>>681
自分で考えれば良いんじゃない？
これだけじゃ、これぐらいしか回答できない

PNGにデータを保存すれば良いんじゃない？
可逆圧縮だし、8bitデータも扱えるし

何も意識せず、保存したいならGDI+で良いと思うよ
アルゴリズムも気にする必要もない

684:デフォルトの名無しさん
08/05/25 08:17:15
>>681
BMPで画像サイズが小さいなら、24ビットにした方が小さくなる。

685:デフォルトの名無しさん
08/05/27 09:41:00
お勧めのTIFFからJPEGに変換ツール教えてください。
JavaServletから使いたいです。

686:デフォルトの名無しさん
08/05/27 11:39:52
ImageMagick
Serveletから使えるかはしらね。

687:デフォルトの名無しさん
08/05/27 13:18:56
>>686
いいですね！

688:デフォルトの名無しさん
08/05/28 10:11:21
おまいら、YYフィルタってどうよ？

689:デフォルトの名無しさん
08/05/29 19:00:05
アホクサ20年前のレベルやん

690:デフォルトの名無しさん
08/05/29 23:44:57
>685

普通に、SDKのクラス使えばできる。
java　画像変換でぐぐれ！

691:デフォルトの名無しさん
08/06/01 02:28:32
shape context ってわかる人いますか？
URLﾘﾝｸ(en.wikipedia.org)

概念はわかったけど、このshape context histogramがどう作られてるのか
さぱーりわかりません。
Step 2: Computing the shape context
のところ。

692:デフォルトの名無しさん
08/06/01 16:47:50
vine4.2でImageJをインストールしているんですが、
□□□など文字化けが起こるのですがいい解決方法がありませんか？

693:デフォルトの名無しさん
08/06/01 19:15:22
フォント指定してないからだろ

694:デフォルトの名無しさん
08/06/01 20:35:15
それは一般に豆腐と呼ばれる現象なのでググるとなんかわかるかもね

695:デフォルトの名無しさん
08/06/02 21:01:37
>>691
まるかいてー、角度でわけてー、半径でわけてー、
その半径のわけかたはー、log っぽくてー、
で、点の数をかぞえるー

696:デフォルトの名無しさん
08/06/03 00:46:49
百戦錬磨の職人の皆様、教えてください。

アドビのフォトショップにあるフィルタ...変形...渦巻きと同じことをやりたいです。
画像端部はそのままで中心部のみをネジる感じです。

URLﾘﾝｸ(charaku.maxs.jp)

しかしマッピング曲線がよくわかりません。
Wikipedia項目ﾘﾝｸ
にある「リチュース」というのを使うのでしょうか？

697:デフォルトの名無しさん
08/06/03 01:12:48
>>696
中心からの距離に比例して回転角度が変わるだけ。

698:デフォルトの名無しさん
08/06/03 01:19:26
マッピング「曲線」とか言ってる時点で根本的な部分で勘違いしている気がする。

699:デフォルトの名無しさん
08/06/03 08:43:47
画像輪郭抽出アルゴリズムの話なんだけど
微分値を拾う方法以外の方法で何か有名な方法ってありますか
有用な方法で思い当たる方法もあったら教えてください

700:デフォルトの名無しさん
08/06/03 09:24:31
領域分割してラベリング後に境界をとったら？
やりかたはたくさんある。

701:デフォルトの名無しさん
08/06/03 10:51:20
>>699
微分にもいろいろあるだろうけど、
ほかにも、ぼかし＋HPFとか、ウェーブレットでHH成分を拾うとか、色相変化をチェックするとか、

702:デフォルトの名無しさん
08/06/03 13:02:43
レベルセットの簡単なtutorialどこかにないですか？

703:デフォルトの名無しさん
08/06/03 13:40:36
そういえば
先日サイエンスに視覚神経がポジ画像ネガ画像を同時に送ってるってのがあったな
あといくつかの他のいわゆるレイヤーを同時に脳に送りつけてるって
この方式は輪郭抽出や画像認識で既に使われてるのかな

704:696
08/06/04 00:25:16
>>697 さん
いや、それがですね、中心距離への比例だと思ってやってたんですよ。
周辺から中心にいくにしたがって回転角をまわしてやるようにつくっても、
フォトショップのような自然な渦巻きにならないのです。

>>698 さん、あえて「曲線」と言わせていただきますが、
再マッピングに曲線式をあてはめると、なんらかの減衰項があるような感じなのです。

昨日からずっと調べてたのですが、クロソイド曲線をつかうのかなぁ？

705:デフォルトの名無しさん
08/06/04 00:36:14
じゃあ２乗とかちょっと微調整やるってかんじじゃないのかな。
自然ってのは自分が思うまで微調整やるしか

706:698
08/06/04 01:08:30
>>704
Photoshopが何をやっているかは、
↓のような画像を渦巻き変形してさらに「極座標を直交座標に」の変換をすれば一目瞭然。
┌──┰──┐
│　　　 ┃　　　 │
│　　　 ┃　　　 │
│　　　 ┃　　　 │
│　　　　　　　 │
│　　　　　　　 │
│　　　　　　　 │
└────┘
回転角度が中心に向かって単純に比例ではなく、
1 - sin(πx/2) に比例していることがわかる（0≦x≦1 は中心からの距離）。
つまり中央付近ではほぼ等速変化だけど、周縁では無変換領域と滑らかにつながるようになっている。
リチュースやクロソイドでは中心付近で回転が加速していくので描画効果としては使い物にならない。

707:デフォルトの名無しさん
08/06/04 09:09:53
もし704が問題なんだったら対数螺旋のような動きにしてみたら如何かな

708:デフォルトの名無しさん
08/06/04 13:41:23
単なる係数と補間精度だけの問題のようなきがする。

709:名無し募集中。。。
08/06/04 18:49:03
>>707
対数螺旋も中央付近で加速していくからフォトショップのようにはならないよ。
696氏はフォトショップの渦巻きフィルタの再現をしたいんでしょ？
フォトショップは中央は一様螺旋で周囲だけ緩和がかかるから>>706が正しい。

710:デフォルトの名無しさん
08/06/04 18:59:38
妥協すれば全て解決。100%コピー目指すなら逆アセしろ。

711:デフォルトの名無しさん
08/06/05 15:10:37
いろんな言語使ってる人いるみたいだけどrubyな人はいないみたいだね

712:デフォルトの名無しさん
08/06/05 16:31:59
エスパー乙

713:デフォルトの名無しさん
08/06/06 00:39:11
>>771
画像処理をしだしてからCばっかりでPerlとかは使わなくなった。
画像解析自体をスクリプト言語でやったりするんやろか

714:デフォルトの名無しさん
08/06/06 00:55:17
多段のフィルタを組み合わせたりするのにLL使うのはいいだろうけど、
画像処理自体に使うのはちょっと‥‥ねぇ

715:デフォルトの名無しさん
08/06/06 01:08:41
exe を走らせるスクリプトとかなら (*´･ω･)(･ω･｀*)ﾈｰ

716:デフォルトの名無しさん
08/06/06 08:55:57
pythonはPILあるけどrubyはそれに相当するものないから使われないってことなのか

717:デフォルトの名無しさん
08/06/06 09:09:15
スクリプト言語は文字列処理が得意なのであって、
画像処理、行列処理、をさせようと思ったら特に意味がない。

718:デフォルトの名無しさん
08/06/06 14:10:18
文字列は配列を切って貼ってする必要があるけど、画像処理はとってきた特徴量を
放り込んでおくだけってイメージ

719:デフォルトの名無しさん
08/06/06 14:21:27
ハァ？

720:デフォルトの名無しさん
08/06/06 16:08:10
>>695
分ける前の半径ってどうやって決めてるん？
曲座標変換が関係してるんかな？

721:デフォルトの名無しさん
08/06/06 17:43:54
あー、半径は自分で適当に設定するのか

722:696
08/06/15 10:37:03
>>697さん、>>698さん、>>705さん、>>707さん、>>708さん、>>710さん
「渦まき」できました！ありがとうございました。

723:デフォルトの名無しさん
08/06/15 10:45:13
どういたしまして

724:デフォルトの名無しさん
08/06/19 02:14:13
MPEG-7のデータセットをgoogleで探していたら
IEEEのサイトに飛ばされることが多いのですが、アカウントをとらないといけないのですか？

725:デフォルトの名無しさん
08/06/19 02:28:34
あ、これかな・・・
URLﾘﾝｸ(www.m4if.org)

726:デフォルトの名無しさん
08/06/22 17:47:13
H.264の実装説明した奴ないですかね？

727:デフォルトの名無しさん
08/06/25 12:06:43
x264のソースを落とした上でmarumoんとこでも読んで来い

728:デフォルトの名無しさん
08/06/26 21:12:02
画像センサや画像処理装置のスレって無い？

729:デフォルトの名無しさん
08/06/26 22:03:13
ハードは板違い

730:デフォルトの名無しさん
08/07/02 12:21:59
>>728
俺も探してるんだが無いね。
できたらCognexのVisionProとかﾘﾝｸｽのHalconだとかの情報も欲しいんだが・・

731:デフォルトの名無しさん
08/07/02 23:52:26
ImageMagick使ってPostScriptの回転・マルチページ化したいんだけどラスターデータみたいなガタガタの画になってしまう…
所詮こんなもんって事？

最終的にはPDFファイルにしたいんだがいきなり頓挫気味です。

732:デフォルトの名無しさん
08/07/03 09:13:39
displayだのconvertだのimportだの無遠慮に使い潰すこのゴミが

733:デフォルトの名無しさん
08/07/04 01:15:23
画像認識で自転車を認識したいのですが、どのように認識させていいのかわかり
ません。
今は自転車の簡単な特徴点をテンプレートととして用意してその点を認識させよ
うとしているのですが
なかなか認識させることができません。（テンプレートは自転車の車輪を想定し
て円状に点を６点取っています。

うまく自転車を認識させる方法がありましたら教えてください。

734:デフォルトの名無しさん
08/07/04 02:05:46
>>733
ハフ変換で円を検出してみるとか

735:デフォルトの名無しさん
08/07/04 04:23:03
横よりも縦から見ること多そうなので、丸で判別するのは難しそう。

結構面倒と思う

736:デフォルトの名無しさん
08/07/04 14:05:40
>>733
認識？検出？認識でいいんだよね？
顔認識とかと同じようなかんじで（ある意味での）情報圧縮を
使って特徴量を得てみたら違いがでるのではなかろうか。
主成分分析 (PCA)とか、線形判別分析 (LDA) とか。
で、識別器はパターン認識のなにかの手法、とりあえず k-nn でもいいし、SVM でもいいし使ってみたらそこそこ動いちゃったりしないだろうか。
ここで書いているのはパターン認識でとりあえず習う当たり前の手法なので、
コードとかもごろごろころがってると思うよ。

737:デフォルトの名無しさん
08/07/04 19:39:11
画像処理技術者の将来は明るいでしょうか？

738:デフォルトの名無しさん
08/07/04 21:29:25
将来タクシーの運ちゃんになりたいなら画像処理やればいいよ。

739:デフォルトの名無しさん
08/07/05 13:02:06
URLﾘﾝｸ(www.mit.edu)
これってさE2LSH package使いたいならメールしろって書いてあるの？

740:デフォルトの名無しさん
08/07/05 13:17:24
>>739
そうだけど、誰かに確認を手伝ってもらわないとだめですか、そうですか。

741:デフォルトの名無しさん
08/07/05 13:22:38
thanx!

742:デフォルトの名無しさん
08/07/05 13:24:46
メールってどうやって送ったらいいの？

743:デフォルトの名無しさん
08/07/05 13:35:32
そうか、読めもしないんだからそうなるわな。
でも、コードももらってもマニュアルも読めないし、
論文読んで中身が何をしているのかもわからないし、
使いこなせないんじゃない？

744:デフォルトの名無しさん
08/07/06 21:40:38
インターレースとプログレッシブのJpegを見分けるにはどうすればいいでしょうか。

745:デフォルトの名無しさん
08/07/06 21:53:40
画像ロードの瞬間、目をこらしてよくみろ

746:デフォルトの名無しさん
08/07/07 06:05:38
RGB以外の、CMYKやYUVなどのカラースペースのまま
ブラーや半透明合成を行うアルゴリズムの情報源を教えてください！

747:デフォルトの名無しさん
08/07/07 08:04:54
RGBのときのそれらのアルゴリズムが線形演算でできていて
RGBとCMYK、YUVの変換が線形に行えるなら
全体で線形性が保てているからアルゴリズムを線形変換するだけだよね。
(まあ結局RGBに戻して合成してることと理論上は同じにはなるけど)
と思ったけどRGBとCMYKは線形じゃないのが多いだろうな。

748:741
08/07/07 17:38:07
>>743

>>742は自分ではないです。

749:デフォルトの名無しさん
08/07/08 20:52:04
複数のjpg画像から動画を作るためのライブラリとかないでしょうか。
コマンドラインで実行する系で。

750:デフォルトの名無しさん
08/07/08 21:12:05
ffmpeg

751:デフォルトの名無しさん
08/07/12 03:09:15
誘導されてきました。マルチになりますが、アドバイスのほどよろしくお願いします。
現在テンプレートマッチングのプログラムを作っているのですが、
テンプレートマッチングでマッチングした部分の色を変えられず苦労しています。。
画像のある特定の範囲だけの色を変えるのってどうすればいいのでしょうか？

752:デフォルトの名無しさん
08/07/12 03:19:37
エスパーの登場を待つか詳細を書くかしましょうね。

753:751
08/07/12 03:46:45
かなりつたないプログラムですが、途中まで書いてみます。
超初心者なので、根本から間違っているかもしれません。
テンプレートの左下と一致する1ドットだけ色変換が行われるので、マッチング自体はできてると思うのですが…

int i,j,k,l,nx,ny,tmpnx,tmpny;
nx=bmpInfoHeader.biWidth;//元画像の幅
ny=bmpInfoHeader.biHeight;//元画像の高さ
tmpnx=bmpTmpInfoHeader.biWidth;//テンプレートの幅
tmpny=bmpTmpInfoHeader.biHeight;//テンプレートの高さ
//相違度の計算（gray[]はグレースケール化した元画像の一次元配列、tmpgrayはグレースケール化したテンプレート画像の一次元配列）
for(i=0;i<ny;i++){
　　for(j=0;j<nx;j++){
　　　　for(k=0;k<tmpny-1;k++){
　　　　　　for(l=0;l<tmpnx-1;l++){
　　　　　　　　d[i][j]=d[i][j]+(gray[i+k][j+l]-tmpgray[k][l])*(gray[i+k][j+l]-tmpgray[k][l]);
}
　　　　　}
　　　}
　}

754:デフォルトの名無しさん
08/07/12 03:47:43
//テンプレートとマッチしたところ（相違度=0.0）の色を変換。image1は出力先の一次元配列。
for(i=0;i<ny;i++){
　　for(j=0;j<nx;j++){
　　　　if(d[i][j]==0.0){
for(k=i;k<tmpny;k++){
　　for(l=j;l<tmpnx;l++){
image1[3*(k*nx+l)]=255;
　　　　　image1[3*(k*nx+l)+1]=image1[3*(k*nx+l)+2]=gray[k][l];
}
　　　}
　　　　　}else{
image1[3*(i*nx+j)]=image1[3*(i*nx+j)+1]=image1[3*(i*nx+j)+2]=gray[i][j];
}
　　　　}
}
}

755:デフォルトの名無しさん
08/07/12 05:39:28
「画像処理」の範疇とちょっと違うかもしれないけど質問です。

1つの凸多角形（頂点数4か5）と長方形が1つあり、
それらが部分的に重なるものとします。
このとき、重なった部分を表現する多角形の頂点を取り出すような、
何か一般的なアルゴリズムがあれば紹介して頂けないでしょうか。

756:755
08/07/12 05:46:26
図形はビットマップではなくベクタとして処理されるため、
(x, y)を逐一調べて、両方の図形に含まれるかを調べる、
というような方法ではないものを探しています。

757:デフォルトの名無しさん
08/07/12 05:51:13
分野的には計算幾何学だな。
計算幾何学のスレは2chでは全く流行らないから、多分今は無いが。

っていうか、それは普通に交差判定するしかないと思うけど。
魔法のように計算式1つで求まるわけないだろう。

758:755
08/07/12 06:12:47
あ、分かった。
1. 図形AとBの交差点を全て取り出す
2. Aに含まれるBの頂点を取り出す
3. Bに含まれるAの頂点を取り出す

1. + 2. + 3. = 取得すべき全頂点

759:デフォルトの名無しさん
08/07/12 10:45:25
>>755
辺が重なるときの例外処理が大変そう

760:デフォルトの名無しさん
08/07/14 10:15:10
URLﾘﾝｸ(geometryalgorithms.com)

761:デフォルトの名無しさん
08/07/14 13:08:05
>>755
maximaあたりで簡単にできそうだけどな

762:デフォルトの名無しさん
08/07/14 15:15:14
2つの3次元の線図形の類似性ってどうやって調べればいいのだろう
統計的な手法(平均や分散など)を使用できるのかな・・・

763:デフォルトの名無しさん
08/07/14 15:46:17
>>762
単純な形に分割して比較するとか、でっぱったところから特徴抽出するとか。
「3D similarity」でググると論文がでてくる。

764:デフォルトの名無しさん
08/07/14 15:48:42
>>763
なるほど
どうもです

765:デフォルトの名無しさん
08/07/27 20:23:54
単純に画素の算術平均取りたいけど
_mm_sub_epi32()使うと以上に遅い

うーーむ困ったのだ

766:デフォルトの名無しさん
08/07/27 21:16:42
>>765
何以上に遅いの?
そもそも_mm_sub_epi32()ってなに?

767:デフォルトの名無しさん
08/07/27 23:38:57
>>766
SSE2のPSUBDの、インテルC++コンパイラ風の記述かな？

768:デフォルトの名無しさん
08/07/28 11:31:07
インテルのコンパイラは勿論、
VC++やGCCでも使える組み込み関数だし、
割と一般的なんじゃね？

769:デフォルトの名無しさん
08/07/28 11:45:39
>>766
ググレカス

770:デフォルトの名無しさん
08/07/28 12:20:34
SSEネタとかは専門スレに逝くってのはどうだ？

771:デフォルトの名無しさん
08/07/28 12:45:27
だからそれが、画像処理と何の関係が?
一部のCPUに特化した最適化の話なら、そのCPUかそれ用のコンパイラのスレにでも行けばいいじゃん。

772:デフォルトの名無しさん
08/07/28 13:00:19
ここでいいよ

773:名無し募集中。。。
08/07/28 19:31:32
IPP買えばいいんじゃないかなっ

774:デフォルトの名無しさん
08/07/28 19:58:33
>>765
SSE2はsetとloadが遅いけど、本当に引き算が遅い?

775:デフォルトの名無しさん
08/07/28 23:23:55
>>774
VTune大先生がそのように指摘します
先生が間違うはずがありません。
高い値段するのに間違いを指摘するなんてありえません。

776:デフォルトの名無しさん
08/07/29 00:48:56
>>775
一命令単位でパフォーマンス見れるの？
ループしてんじゃないの？
画素の算術平均って具体的に何？
ある矩形内の平均？
平均に引き算ってどんな計算してるの？

777:デフォルトの名無しさん
08/07/29 01:11:41
>>776
775じゃないけど、平均で行う引き算と言えばこれじゃないかな。

ABCD
EFGH
IJKL

例えば上の矩形でFの画素を周囲の画素との平均値にする場合、
A+B+C+E+F+G+I+J+K (=X)って加算するでしょ。（で、割る。）
このXを保存しておけば隣のGの画素についてはB+C+D+F+G+H+J+K+Lって加算するより
X-(A+E+I)+D+H+Lという風にXを元に減算・加算したほうが計算が少なくなる。

778:デフォルトの名無しさん
08/07/29 11:15:59
>>776
vtuneは一命令単位の所要時間を見ることができるよ。
但し、パイプラインの制約だかなんだかで実際のアクセスが遅延している場合は
問題の(時間の掛かる)命令ではなく次の命令辺りで待ち時間が計上されることがある。

要は、>765はロード命令の次の引き算命令だけを見て遅いと言っていると思われる。
つまり、真に遅い原因はロードに起因するメモリアクセスってこと。

まぁ、vtune買うならIntelの講習も受けておけってこった。

779:デフォルトの名無しさん
08/07/29 19:22:38
SSE2でやるなら画素を16bitにして
ABCDEFGHI
JKLMNOPQR
STUVWXYZ0
を
a=load(ABCDEFGHI)
b=load(JKLMNOPQR)
c=load(STUVWXYZ0)
a+=b
a+=c
store(a, m);
として、m[]を計算するとか
アライメントされた連続したメモリブロックを一度に読んで計算しないとパフォーマンスでない。

780:デフォルトの名無しさん
08/07/29 23:56:30
>>779
SSE2でstoreってどれつかえばいいの？

781:デフォルトの名無しさん
08/07/30 02:04:15
>>780
_mm_store_*で、*部分はデータ型による

782:デフォルトの名無しさん
08/07/30 02:05:32
整数なら_mm_store_si128

783:デフォルトの名無しさん
08/07/31 03:54:03
画像をキレイにする方法を色々調べて、逆フィルタ、ウィナーフィルタというのに
辿り着きました・・・。
人間が目を凝らすときにもこういう処理をしているのかもしれないですね。

784:デフォルトの名無しさん
08/07/31 06:08:22
いいえ。

785:デフォルトの名無しさん
08/07/31 23:31:50
画像処理でSSE2つかっても遅くね？
あとさ

なんでSSE2って8bit単位でシフト演算できないんだ？
16と32はあるのに

786:デフォルトの名無しさん
08/08/01 21:13:04
32bitCPUのレジスタは、16bitと32bitだからじゃない？
ローレベルになるほど、ニーモニックに合わせてやらないといけない。

そういえば、Windowsも16bitを切り捨てたとき、動かなくなるソフト結構あったみたい。
64bitWindowsが主流になれば、そのうち32bitも切り捨てられるだろうし。

787:デフォルトの名無しさん
08/08/01 21:45:06
そうならないために.Netが作られたんだろ？

788:デフォルトの名無しさん
08/08/01 22:27:27
>>786
OSそのものが仮想マシンの上で動作しようかという時代に何を言ってるんだ。
でもスレ違いだから、そろそろやめような。

789:デフォルトの名無しさん
08/08/02 08:21:20
ゲームマシンはそのうち１２８ビットになるって１０年以上前に聞いたけど
なんでビット数は大きい方がいいの？　もうなったの？
パチンコ台も画像が増えたけど、あれは何ビット機使っている？

790:デフォルトの名無しさん
08/08/02 08:43:44
そりゃ一度に処理できる情報量が大きくなるからだろ.
PCの場合は,互換性とか対応アプリケーションとかの問題で64bit化さえなかなか進まないが.

791:デフォルトの名無しさん
08/08/02 08:44:14
ビット数というのが、CPUの演算精度の事言ってるのか、バス幅のこと言っているのか…

ＰＣのＧＰＵなんかは、384～512ぐらいのバス幅を持っている。
これをもってきて、512bitマシンと呼ぶのか？

rambusのDRAM-IF使ったらバス幅狭いので、ビット数が落ちるのか？
（データ転送能力はむしろ高いぐらいなのだが）

792:デフォルトの名無しさん
08/08/02 08:56:07
特に指定しない場合は明らかに前者を指すだろ

793:デフォルトの名無しさん
08/08/02 09:15:14
そんなもん、128ビットもあったって屁の足しにもなりゃしねぇ

次ページ