1 名前:デフォルトの名無しさん [2009/07/09(木) 09:52:04 ] 画像処理プログラミングについて質問、議論を行うスレッドです ・画像処理について素人同士で大激論 ・初学者の質問に対してやさしく(的を外れた)解答を与える ・その道の玄人も大歓迎 前スレ 画像処理 その11 pc12.2ch.net/test/read.cgi/tech/1222593978/
855 名前:デフォルトの名無しさん mailto:sage [2010/12/02(木) 18:05:56 ] >>85 σの大きさが処理速度に関係するのか? ガウシアンフィルタって次のヤツだろ f(x,y) = 1/(2 * π * σ^2) * exp (-(x^2 + y^2) / (2 * σ^2))
856 名前:デフォルトの名無しさん mailto:sage [2010/12/02(木) 18:08:03 ] ごめん、>>855 は無視して
857 名前:デフォルトの名無しさん mailto:sage [2010/12/02(木) 21:08:20 ] まず初めに1次元ガウシアンフィルタを横方向にかけておき、 その結果に対して同じ1次元ガウシアンフィルタを縦方向にかける、 という処理にすれば、もしかしたらメモリキャッシュなんかの効率が良くなり、 もしかしたら SIMD 系の CPU 命令を効率よく活用できるかもしれん。 (ただし、このように処理を分けると計算式内の乗算、加算の個数は単純に増える) あと、OpenCV のソースを見てみるのも手かもね。 既にやってた後ならごめん
858 名前:デフォルトの名無しさん [2010/12/02(木) 21:42:40 ] SIFT特徴量って、元画像のカラー情報は必要ないんだよね。 これは特徴量を算出するためには元画像をグレースケールに変換する必要があるってこと? それともカラー画像のままでもSIFT特徴量には変わりはないってこと?
859 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 01:24:51 ] 縦と横でフィルタリングするのは、斜め方向の距離を無視することになるから 加工された画像に特徴的なノイズが乗る場合があるね。 いっそ、fftしてフィルタリングしてifftしたら?
860 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 07:12:38 ] フィルタリンクの質ではなく、 おそらく畳み込みの処理速度を問題にしているのだと思うが
861 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 15:22:40 ] >>858 1チャンネルの画像を対象にしたアルゴリズムだからグレースケールで処理する カラーごとに特徴点検出をすることもある(color SIFT)
862 名前:デフォルトの名無しさん [2010/12/03(金) 17:26:55 ] カラーヒストグラムを使った画像検索は簡単にできたので、SIFT特徴量を使った形状認識をさせたいんだけど、 静止画像から生成されたSIFTファイルを使った、他の画像とのマッチングアルゴリズムが良くわからない。 原理的に、動画で写っている特定の物体を動画のフレーム間で同一物体として認識させるような用途には使えそう なことは判るんだが、まったくことなる静止画像をSIFT特徴量で比較してもデータがマッチングする余地はないんじゃないかと思う。 SIFTファイルを使った類似画像検索技術について、いい参考資料はない?
863 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 20:38:51 ] 画像のサムネイルを作りたいのですが。 800*600を1/8にして100*75のBMPにしたいです。 何か良いアルゴリズム又はサンプルソースありませんか?
864 名前:デフォルトの名無しさん [2010/12/03(金) 22:19:28 ] そんなのImageMagickで1行だよ。
865 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 22:22:38 ] 今見ましたが、プログラムの中に組込みたいんです。 言語はC++です。他の言語でもアルゴリズムかサンプルがあれば、 参考にしたいです。
866 名前:デフォルトの名無しさん [2010/12/03(金) 22:23:55 ] こんな感じで一括変換が可能 ls -1|awk -F. '{print "convert -geometory 100x75 "$1".jpg "$1".bmp"}'|sh
867 名前:デフォルトの名無しさん [2010/12/03(金) 22:25:45 ] だったらOpenCV
868 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 22:30:14 ] 8x8ピクセルを平均して1ピクセルにすればいいんだよ
869 名前:デフォルトの名無しさん mailto:sage [2010/12/03(金) 22:48:19 ] >>867 OpenCV 見ました。とても面白そうだけど、組込むには大きすぎるような… ライセンスを見つけられなかったし… OpenCVって商用可能なフリーなんですかね? >>868 一度それでやってみます。
870 名前:デフォルトの名無しさん [2010/12/03(金) 23:34:06 ] >>869 ImageMagickはライブラリがあるからプログラムに組み込めます。 もっとぐぐってください。
871 名前:デフォルトの名無しさん [2010/12/04(土) 04:36:06 ] >>869 OpenCVは商用可能なフリー(BSD)だよ
872 名前:デフォルトの名無しさん [2010/12/04(土) 13:12:22 ] cの中で内部実装するにしても別にライブラリ呼び出す必要性なんかないんじゃないかと思うよ そのままsytem関数で外部コマンドを実行させればいいわけだし。
873 名前:デフォルトの名無しさん mailto:sage [2010/12/04(土) 16:49:09 ] 画像うpろだ作りたいんだけど、これだけはやっとけってことは何? 必須機能な
874 名前:デフォルトの名無しさん mailto:sage [2010/12/04(土) 17:02:03 ] >>873 先ずは板違いを認識することだな。
875 名前:デフォルトの名無しさん mailto:sage [2010/12/04(土) 21:16:46 ] >>869 OpenCVのサンプルソースだ。お好みで画像の彩度を上げたりもできるだろうよ。 blogs.wankuma.com/aomushigou/archive/2009/01/13/166290.aspx ちなみに表示させる必要はないからcvShowImage()はいらなくて、 代わりに、保存させるcvSaveImage(ファイル名)だな。 ファイル名を変えながらforで回せば出来上がり。
876 名前:デフォルトの名無しさん mailto:sage [2010/12/04(土) 21:29:55 ] >>870 ,871,875 情報ありがとうございます。 >>875 のサンプルは短いですね〜、ちょっとやってみます。
877 名前:デフォルトの名無しさん mailto:sage [2010/12/05(日) 11:12:15 ] >>862 キーポイントの集合をbag of features(bag of keypoints、 bag of visual wordsとも) として検索すれば似たシーンなどは検索できる 精度はあまりよくない 同一物体を検索したいなら大規模なキーポイントのデータベースを作って 近似最近傍探索等で探す
878 名前:デフォルトの名無しさん mailto:sage [2010/12/06(月) 19:28:51 ] OpenCVよりもpython-fuのが便利だ
879 名前:デフォルトの名無しさん [2010/12/06(月) 21:18:13 ] だれかぼくのSIFT特徴量使った類似画像検索の質問答えて、お願い
880 名前:デフォルトの名無しさん mailto:sage [2010/12/07(火) 10:25:31 ] >>862 比べる2枚の画像からそれぞれSHIFT特徴量のベクトルを出しておくだろ? それらの特徴のスケールが大きいもん同士を比較すればいいんだから、 細かいところが違ってても一致するんだよ。 「特徴がスケール大きい」ってのは、濃淡の変化の仕方がなだらかって感じで 要するに細かいテクスチャなんかは無視して大きな変化を見てるってこと。 Jpegとかの低空間周波数成分をイメージするといいかもしれないな。
881 名前:デフォルトの名無しさん mailto:sage [2010/12/07(火) 10:31:35 ] 「いい参考資料はない?」って質問してんだけど
882 名前:デフォルトの名無しさん mailto:sage [2010/12/07(火) 18:38:33 ] >>881 あるよ
883 名前:デフォルトの名無しさん mailto:sage [2010/12/07(火) 21:27:07 ] bag of featrues でググって引用が多い5件
884 名前:デフォルトの名無しさん mailto:sage [2010/12/08(水) 02:17:14 ] >>879 szeliski.org/Book/ Chapter 14
885 名前:デフォルトの名無しさん [2010/12/08(水) 21:30:19 ] >>884 このよさそうじゃん。 ちょっとじっくり読んでみる
886 名前:デフォルトの名無しさん [2010/12/10(金) 14:17:05 ] SIFT特徴量の実装例、いくつかみてまわったんだけど、アプリケーションはMATLABで書いてるのが多い。 MATLABのホームページにいっても価格は要問い合わせとかになっていて公開されてないし。 なんか高そうなんですけど、実行系はGNU Octaveにかえてもだいじょうぶなのでしょうか? そもそもなんでMATLABとか特殊なソフトが登場してくるわけ?
887 名前:デフォルトの名無しさん mailto:sage [2010/12/10(金) 16:17:38 ] >>881 コンピュータビジョン最先端ガイド 3 にBag of featuresの解説が2章ほどあった。
888 名前:デフォルトの名無しさん mailto:sage [2010/12/10(金) 17:10:48 ] >>886 特殊ではなく、多くの研究者が使っているよ。論文のデモはMATLABばかりだし。 ほとんどはoctaveでも動く。 学生なら大学がライセンス持ってると思う。
889 名前:デフォルトの名無しさん [2010/12/11(土) 00:00:42 ] 一通り読んでみたけど、SIFT特徴量でググる際の一番いい検索ワードは「bag-of-featrues」だった。 これは単純にググってもでてこないわ。 局所特徴量をヒストグラム化してクラスタリングで分類というところまでは理解した。 後半部はカラーヒストグラムによる類似画像検索と同じなどので、前半の実装ができればすぐに作れそう。
890 名前:デフォルトの名無しさん mailto:sage [2010/12/11(土) 04:40:23 ] >>886 OpenCVでもSIFT使えるのは知ってるのか?
891 名前:デフォルトの名無しさん mailto:sage [2010/12/11(土) 04:55:27 ] >>886 本末転倒だな。OctaveはMATLABクローンだぞ。つまり、MATLABがあって初めてOctaveがある。 派生物よりオリジナル用に書いてあるのも当然じゃないか。
892 名前:デフォルトの名無しさん mailto:sage [2010/12/11(土) 11:02:25 ] >>887 3・・・だと・・・
893 名前:デフォルトの名無しさん mailto:sage [2010/12/11(土) 15:07:27 ] >>892 12月8日発行とあった。 密林では、まだ扱っていないようだ。
894 名前:デフォルトの名無しさん [2010/12/11(土) 18:00:29 ] でもMATLABって普通のとこじゃ売ってないじゃん。 大体、一般ライセンスはいくらすんのさ?
895 名前:デフォルトの名無しさん mailto:sage [2010/12/11(土) 20:36:09 ] >>894 1ライセンス40万くらいだったと思う。 コンピュータビジョンの研究なんて普通の人はしないからな。 他人のコードを動かすだけならOctaveで困らないし 読めれば動かすこともないと思うよ。 どうせアプリケーションはCだろうし。
896 名前:デフォルトの名無しさん mailto:sage [2010/12/14(火) 16:20:54 ] CまたはC++で動くDCT高速アルゴリズムのソース探してます。 ブロックサイズを変化させて実行したいので、ブロックサイズを任意に指定できるものがほしいです。 どなたかご存じのでしたら教えてください。 よろしくお願いします。
897 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 23:23:30 ] ImageMagickで複数のpng画像からpsdファイルを作ろうとしましたが できたpsdファイルを見るとレイヤーの透明部分がロックされてしまいます。 ロックされないで合成する方法かあるいは出来たpsdファイルのロックを プロンプトの命令で外す方法がありますか? ↓作ったコマンド convert -geometry 896x704! 00000.png 00000.png convert -geometry 896x704! zzz.png zzz.png composite -compose Over -gravity northwest background_tile.png zzz.png background_tile.png composite -compose Over -gravity northwest layer000.png zzz.png layer000.png convert -roll +0+0 layer000.png layer000.png convert 00000.png background.png layer000.png henkan.psd
898 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 23:48:14 ] 板違い
899 名前:デフォルトの名無しさん mailto:sage [2010/12/17(金) 23:56:12 ] >>898 うわ、すいません どこに行けばいいですか???
900 名前:897 mailto:sage [2010/12/18(土) 02:02:04 ] すいません、透明部分のあるpng画像をpsdに変換しただけで 透明部分がロックされたPSDが出来てしまう 事が分かりました。 どうしていいかまったく分からないです なんかアドヴァイスお願いしますOTL
901 名前:デフォルトの名無しさん mailto:sage [2010/12/18(土) 02:58:22 ] だからスレ違いだと言ってるだろすっとこどっこい そんなの画像処理でもなんでもない
902 名前:デフォルトの名無しさん mailto:sage [2010/12/18(土) 14:19:32 ] フォトショスレに行けば?
903 名前:897 mailto:sage [2010/12/18(土) 15:00:26 ] バイナリエディタで手動で変えるところまで出来たので とりあえずどこかへ移動します
904 名前:名無し募集中。。。 mailto:sage [2010/12/20(月) 14:27:27 ] ここは画像認識系の画像処理スレだから 画像加工系の画像処理はフォトショップ系のスレに移動してねっていう意味
905 名前:デフォルトの名無しさん mailto:sage [2010/12/20(月) 14:40:08 ] それ以前に、特定ソフトの操作方法(しかもファイル操作)の話は画像処理プログラミングとは全く関係無いだろうと 画像加工でもアルゴリズムの分析や最適化とかなら良いだろうし
906 名前:デフォルトの名無しさん mailto:sage [2010/12/20(月) 18:49:57 ] 誰か突っ込めよ
907 名前:デフォルトの名無しさん [2010/12/20(月) 19:18:13 ] なんでやねん!
908 名前:デフォルトの名無しさん [2010/12/20(月) 20:54:34 ] 組み込みじゃない画像認識ってハルコンとか使うの?
909 名前:デフォルトの名無しさん mailto:sage [2010/12/22(水) 02:37:00 ] >>905 ソフトじゃなくてバイナリデータの内容の話ならいいですか?? psdからだいぶデータを取得したけど 検索したサイト見てもよく分からない部分がありまして・・・
910 名前:デフォルトの名無しさん mailto:sage [2010/12/22(水) 03:27:20 ] www.youtube.com/watch?v=0mEHKFibv0g
911 名前:デフォルトの名無しさん mailto:sage [2010/12/22(水) 13:24:02 ] >>910 あああ、画像処理ってこういう高レベルの事でしたか・・・ どうもすいませんでした。 あとすいません自己解決もしました。 お騒がせしました
912 名前:デフォルトの名無しさん mailto:sage [2010/12/22(水) 19:16:43 ] >>911 20年前のFM-TOWNSでこうしたアイデアは先取りされていたけどね 画面にリアルタイムに映った自分の手でCGのボールを操作するゲームがあった
913 名前:デフォルトの名無しさん mailto:sage [2010/12/22(水) 19:18:03 ] www.youtube.com/watch?v=JQvLt7DQhaI www.youtube.com/watch?v=MZHEzDmXO2w
914 名前:片山博文MZ [2011/01/01(土) 13:28:49 ] パスの単純化の方法がわかりません。 困っています。教えてください。お願いします。
915 名前:デフォルトの名無しさん mailto:sage [2011/01/01(土) 15:00:49 ] potraceのソース嫁 本だったら「画像認識の基礎T」
916 名前:デフォルトの名無しさん [2011/01/01(土) 15:23:58 ] 画像処理関係はVC++やVC#より、Gimpの作成元のGtk+とかの方が優れているんでしょうか? 作るソフトはそう難しい処理をするわけでもないんですが、Gtk+の方が簡単な処理にも画像処理の点において 便利な関数とかあるなら、そっちを使いたいです。VC#でやってみたんですが、jpegなどにUI上で任意の図形を描画して 保存するのも結構手間がかかります。
917 名前:デフォルトの名無しさん mailto:sage [2011/01/01(土) 16:52:26 ] 関係ない
918 名前:デフォルトの名無しさん mailto:sage [2011/01/02(日) 01:47:23 ] www.youtube.com/watch?v=x32TGROYbdU&feature=related これと同じことをやりたいです。 背景差分→blob抽出→meanshift→オブジェクト同士が衝突するときKLTで推測? なんですかね さっぱりわかりません。 どなたか天才の方教えてください。
919 名前:デフォルトの名無しさん mailto:sage [2011/01/02(日) 01:55:27 ] 天才はここにはいないよ 他をあたってくれ
920 名前:デフォルトの名無しさん mailto:sage [2011/01/02(日) 03:25:18 ] とりあえず、同じような処理を作って試してみれば良いんでね?
921 名前:片山博文MZ [2011/01/02(日) 13:44:44 ] >>915 thanx