1 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 11:13:52 ] このスレッドは、他のスレッドでは書き込めない超低レベル、 もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。 CUDA使いが優しくコメントを返しますが、 お礼はCUDAの布教と初心者の救済をお願いします。 CUDA・HomePage www.nvidia.com/cuda 関連スレ 【GPGPU】NVIDIA CUDA質問スレッド pc11.2ch.net/test/read.cgi/tech/1190008468/ GPUで汎用コンピューティングを行うスレ pc11.2ch.net/test/read.cgi/tech/1167989627/ GPGPU#2 pc11.2ch.net/test/read.cgi/tech/1188374938/
231 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 09:16:36 ] だからお前はマルチプラットフォームの仕事をしたことあるのかと
232 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 11:23:15 ] サターンとプレステで同じゲームを同時に作ったぞ 同時に作っただけだけど
233 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:41:48 ] >>231 Firefoxはマルチプラットフォームじゃないのかね。
234 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:43:22 ] マルチプラットフォームの要件はオープンソースではかなり多い。 オープンソース系の企業ならそういう仕事していてもおかしくないね。
235 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:48:10 ] 日本語読めないの? 聞かれてるのは「お前は仕事でマルチプラットフォームをやったことがあるのか?」だぞ
236 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:51:51 ] >>235 話のすりかえ。 俺自身は学生時代にFirefoxの開発に携わったが、 今の話題は「マルチプラットフォームの仕事があるかないか」。 お前が間違っていることに気づけ。
237 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:53:16 ] そもそも、ここの住人が開発に携わったことがあるかどうかなんて誰も興味を持っていないし、 信憑性もない。 もっと有益は議論をすべきだと思うけどね。
238 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:54:24 ] スレ違い お前らネットイナゴは佃煮にされて死んでしまえ
239 名前:デフォルトの名無しさん [2008/08/25(月) 12:58:38 ] 派遣先企業で派遣先企業のプラットフォームに合わせたものを実装するのがおまえら派遣プログラマの仕事だろ 派遣先正社員からマルチプラットフォーム対応なんて指示されてないだろ くだらないこと考えて余計な工数使うなよ
240 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 13:13:32 ] >派遣先企業で派遣先企業のプラットフォームに合わせたものを実装するのがおまえら派遣プログラマの仕事だろ 派遣先がパッケージベンダってこともあるだろう なにムキになってるの?
241 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 13:23:54 ] >>239 何故派遣にこだわる?
242 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 13:49:24 ] ID出すとしょうもない素人以下の奴がいろんなスレに粘着してた
243 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 14:17:22 ] >>242 この板はID出ないじゃん
244 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 14:18:21 ] なんだみんな派遣だったのか
245 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 15:59:39 ] 派遣に異常なコンプレックスを持っている人がいるようですが、 池沼の方なので基本放置でおねがいします。
246 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 16:06:10 ] 夏の間だけ2chもアカウント認証式にすればいいと思う。
247 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 21:59:49 ] 正社員にコンプレックスでしょ? 派遣のどこにコンプレックスをもてと
248 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 23:45:38 ] ひどい脱線ぶりだな。
249 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 23:49:36 ] 派遣野郎はスレ違い
250 名前:デフォルトの名無しさん mailto:sage [2008/08/26(火) 00:13:24 ] >>232 それありそう。PS3 と Xbox360 とか。どう似せるかに力が注がれる・・・
251 名前:デフォルトの名無しさん mailto:sage [2008/08/26(火) 00:59:55 ] ここはなんのスレなんだ
252 名前:デフォルトの名無しさん mailto:sage [2008/08/26(火) 04:09:43 ] くだすれ
253 名前:デフォルトの名無しさん mailto:sage [2008/08/26(火) 06:23:56 ] CUDAはマルチプラットフォーム。
254 名前:デフォルトの名無しさん mailto:sage [2008/08/26(火) 07:35:34 ] アホかい。
255 名前:デフォルトの名無しさん [2008/09/25(木) 14:29:37 ] ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ■ 今週の名言 ────────────────────────────────────── 「HPCは“ハイ・プロダクティビティ・コンピューティング”」 日本SGIのHPC・サービス事業本部で本部長を務める田坂隆明執行役員)
256 名前:デフォルトの名無しさん [2008/09/28(日) 22:50:51 ] CUDAってSIMD並列といいうことは、過去のスパコン用のコード 移植したら激速ってことでOK?
257 名前:デフォルトの名無しさん mailto:sage [2008/09/29(月) 11:43:54 ] >>256 SIMDじゃないよ。仮にそうだとしても、そんなに単純な話じゃない。
258 名前:デフォルトの名無しさん mailto:sage [2008/09/30(火) 05:16:33 ] SIMDだよw
259 名前:デフォルトの名無しさん mailto:sage [2008/09/30(火) 16:35:15 ] SIMDじゃないなら、何なのか問いたい。
260 名前:デフォルトの名無しさん mailto:sage [2008/09/30(火) 17:38:27 ] SIMDだったりMIMDだったり
261 名前:デフォルトの名無しさん mailto:sage [2008/09/30(火) 21:12:21 ] 実行はSIMDだけど コードはスカラだから面倒臭いよ
262 名前:デフォルトの名無しさん [2008/10/01(水) 10:37:52 ] NVIDIAはSIMTと言っているね。SIMD+αくらい。 オンボメモリはSX8i並だからやっぱ速いんじゃねーの。
263 名前:デフォルトの名無しさん mailto:sage [2008/10/01(水) 13:58:23 ] 理屈はいいからなんか作れよ >>過去のスパコン用のコード移植したら激速ってことでOK? OKの一言で終わることをなにぐだぐだやってんだか
264 名前:デフォルトの名無しさん mailto:sage [2008/10/01(水) 18:46:54 ] 要するに、「移植できるもんならしてみろ」ってことだろw
265 名前:デフォルトの名無しさん mailto:sage [2008/10/01(水) 23:50:07 ] だね。単純に移植できるとは思わない方がいい。
266 名前:デフォルトの名無しさん mailto:sage [2008/10/02(木) 00:27:50 ] たしかにブロック切り分けの所もう少しスマートにならないのかと思うのだが あんなもんデバイスの種類で最適化した組み合わせを自動算出すりゃいいだろ
267 名前:デフォルトの名無しさん mailto:sage [2008/10/02(木) 00:29:52 ] >>266 CUDA2でストリームプロセッサ数なんかも取得できるようになったから、 是非とも自動算出関数を作ってみてくれ。
268 名前:デフォルトの名無しさん mailto:sage [2008/10/02(木) 01:08:48 ] いや作るのは簡単なんだけどCUDAってクラスも使えないしラップ出来ないからだめじゃん
269 名前:デフォルトの名無しさん mailto:sage [2008/10/02(木) 01:11:17 ] あいや出来るのか 使うのなら作るぞ
270 名前:デフォルトの名無しさん mailto:sage [2008/10/06(月) 20:37:38 ] CUDAに興味があっていろいろ調べてるんだけど slashdot.jp/hardware/comments.pl?sid=421471&cid=1432609 こんなにメモリアクセスがきついのか… へたれの俺はCPUで頑張ろうって気になってきた このあたりの条件が和らぐのはどれくらい後だろう?
271 名前:デフォルトの名無しさん mailto:sage [2008/10/06(月) 21:10:43 ] それでもビデオカードは一世代速いメモリを積んでいるから、レイテンシを誤魔化せれば、CPUより多少はいいんじゃないかな。 CPUもGPUも、演算能力よりメモリのスピードがネックなんだよねえ。
272 名前:デフォルトの名無しさん mailto:sage [2008/10/06(月) 22:18:57 ] >>270 そうそう、グローバルメモリはコヒーレントな読み出しなら4クロックなのに ランダムアクセスすると100倍のクロックを喰ってしまう。 スラッシュドットの記事の書き方はちょっと言葉が足りてなくて、 実際にはいかにメモリをコヒーレントな読み書きで済ませるかが鍵ということになる。 例えば、CUFFTの2Dを1000回回すのと1Dバッチと自前の転置を2回ずつ動かすのとでは、 64x64辺りだと余り変わらないのに128x128になると途端に2Dの方が速くなる。 プロファイラで調べると、CUFFTの内部で用意されている転置関数はコヒーレントな読み書きしかしていない。 一方、自前の転置はコヒーレントな読み出しとインコヒーレントな書き出しになっている。 つまり、1000回呼び出すコストをインコヒーレントな書き出しコストが上回ってしまうということだ。
273 名前:デフォルトの名無しさん mailto:sage [2008/10/07(火) 01:53:43 ] CPUより遅くなるということはない 電気代の割りに効果が少ないというのはあるw
274 名前:デフォルトの名無しさん mailto:sage [2008/10/11(土) 06:33:45 ] TMPGEncで軽い処理はCPUより遅い。 VRAMとのメモリ転送あるし。
275 名前:デフォルトの名無しさん mailto:sage [2008/10/15(水) 22:02:44 ] メインメモリと共有するタイプのGPUで処理した方が速い事も状況によってはあるのかな
276 名前:デフォルトの名無しさん mailto:sage [2008/10/15(水) 22:26:03 ] CUDAでは有り得ないからスレ違い。GPGPUスレにでもどうぞ。
277 名前:デフォルトの名無しさん mailto:sage [2008/10/26(日) 18:43:49 ] すいません、超低級な質問です。 dim3 threads(128, 1, 1); dim3 grid(128, 1, 1); hoge_kernel <<< grid, threads >>> (d_ptr, 128); とかで関数を呼び出したんですが、ホスト側のスレッド数が128個生成 されるみたいです。これって、GPU内にスレッドが出来るんだと思って たんですが、違うんでしょうか? ちなみに、-deviceemu はつけてません。コンソールに以下のように 出るので、GPUにはいってると思います。 Using device 0: GeForce 8600 GT
278 名前:デフォルトの名無しさん mailto:sage [2008/10/26(日) 20:58:06 ] >>277 >ホスト側のスレッド数が128個生成されるみたいです。 そう判断した根拠は? それとは別になるが、128x128が妥当かどうかは検証が必要だと思う。
279 名前:デフォルトの名無しさん mailto:sage [2008/10/27(月) 17:11:09 ] 質問です。 __device__ void hoge_kernel(void) { } extern "C" __global__ void hoge(void) { dim3 threads(16, 1, 1); dim3 grid(16, 1, 1); hoge_kernel <<< grid, threads >>> (); } 上をコンパイルすると、 「error: call can not be configured」 となるんですが、これはどういうことなんでしょうか。
280 名前:デフォルトの名無しさん mailto:sage [2008/10/27(月) 17:47:00 ] __global__な関数から__device__の関数を<<<>>>で呼ぶことはできない。
281 名前:デフォルトの名無しさん mailto:sage [2008/11/01(土) 09:40:52 ] ちょっと質問させてくらさい。。 8ストリーミングプロセッサ(SE)単位で構成されている ストリーミングマルチプロセッサ(SM)でのことなのですが、 グローバル(ローカル)メモリ上へのデータのロード、 ストア命令は100サイクル以上かかってしまいますよね。 その間、8つのストリーミングプロセッサはおお休みしている のでしょうか? それとも、他のWarpのインストラクションが割り当てられたり するのでしょうか。そうであるといいのですが、 そうするとSharedメモリがあとからのWARPにのっとられてしまって まずそうですよね??? レジスタ的には32bit×2048本あるようなので(280の場合) OKそうですが、Sharedメモリは16KBytesしかないし。 実際LD、STに160サイクルぐらいくったら、 160命令ぐらい無駄にしちゃって効率をかなり落としてる気がするので、 なんかやです。 24WARPぐらい、バッファリングしていて、割り当てられるWARPを out of oderで実行するという記事も、どっかで見たような 気がするのですがSharedメモリがじゃまして無理があるような・・・ なんか良い方法があるのかな??? っていうか、なにか根本的な部分で俺の勘違い?
282 名前:デフォルトの名無しさん mailto:sage [2008/11/01(土) 10:12:52 ] ・グローバルメモリアクセスは、最大400(?)クロック掛かるが、最短では4クロックで済む。 # そのためには、coalescedにアクセスできるように工夫する必要がある。 ・各ストリーミングプロセッサは、独立して動作する。Sharedメモリも同様。 例えば、行列の転置のような処理の場合、普通に書くとcoalescedに読んでincoherentに書かざるを得ない。 # 或いはその逆か。 そこで、CUFFT内で行なっている転置処理では、(プロファイルで見る限り)一旦共有メモリにおいて同期を取ることで、 読み書き共にcoalescedアクセスを維持しているようだ。
283 名前:デフォルトの名無しさん mailto:sage [2008/11/01(土) 18:40:52 ] >>282 早速のレス、さんくす。 なるほど、最短4クロックですか。coalescedにしてもレイテンシー だからだめかなって思ったけど、よくよく考えると、DRAMへの直接 アクセスに数百クロックってのはおかしいことに気づいた。 各ストリーミングプロセッサは、独立だけど1インストラクション単位で 同期してるんじゃないんかな(んなことぁない?) ・・・っておもったけどブランチがあるから、TPXレベルから見ると独立か??? 最初見たときSharedメモリも他のSPのregも0レイテンシで使える ようだったんで、演算と独立にグローバルメモリとのロード、ストアができん 16K程度のSharedメモリ、あまり意味ないじゃんとかおもったけど、 そんなことなさそだね。 なかなか面白そうなチップだ。 分岐粒度が32って実際、汎用でどうなんだろ。 ベクトルつかったことないんでわからんが、 適当にセルオートマタでも乗っけて遊んでみまつ。
284 名前:デフォルトの名無しさん [2008/11/12(水) 22:42:34 ] CUDA-Zなんて便利なものがありました。 forum.nvidia.co.jp
285 名前:デフォルトの名無しさん mailto:sage [2008/11/12(水) 22:55:32 ] >>284 kwsk
286 名前:デフォルトの名無しさん mailto:sage [2008/11/12(水) 23:19:24 ] ttp://cuda-z.sourceforge.net/
287 名前:デフォルトの名無しさん [2008/11/14(金) 19:39:30 ] あげてすまん。 CUDAのためにGTX280つきのPCかったのだが ほかにもう一枚グラボ買わないといけんのかな? あとPCIバスしか残ってないのだが・・・ LINUXで使う予定。
288 名前:デフォルトの名無しさん mailto:sage [2008/11/14(金) 22:57:10 ] >>287 別に一枚でも大丈夫。二枚挿しても(開発には)却って面倒だったり。 まぁ、二枚あれば表示に足引っ張られる心配なくなるから安定はするけどね。
289 名前:デフォルトの名無しさん mailto:sage [2008/11/15(土) 00:41:03 ] >>288 そうなのか、安心した。 ありがd
290 名前:デフォルトの名無しさん mailto:sage [2008/11/15(土) 17:39:36 ] 質問です。 float にてゴリゴリ計算して、結果を返すプログラムを書いてみたのですが、 普通のアルゴリズム、CUDA+GPU、CUDA+CPU(deviceemu) の2つで比較して みたところ、思ったより差が大きいのですが、こんなもんですか? もしくは、機種依存があったりするんでしょうか?
291 名前:290 mailto:sage [2008/11/15(土) 17:40:23 ] >>290 すいません、間違えました。 「2つで比較して」->「3つで比較して」
292 名前:デフォルトの名無しさん mailto:sage [2008/11/15(土) 19:43:01 ] 何の差? 演算精度なら、そりゃぁあるさ、floatなんだもの。
293 名前:デフォルトの名無しさん mailto:sage [2008/11/15(土) 20:51:43 ] ホストは、デフォルトではfloatをfloatで計算してくれないからな。 SSEを使うなりで、ホストがちゃんとfloatで計算すれば、結果は一致するんジャマイカ?
294 名前:デフォルトの名無しさん mailto:sage [2008/11/15(土) 20:57:47 ] >>293 一致する保証はないよ。CUDAのドキュメントにもあるけれど、超越関数はGPU内部の組み込み版を使うと若干誤差が残る。 いずれにしてもfloatの想定の範囲内だから、実用上は問題にならないけどね。
295 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2008/11/15(土) 22:26:10 ] x87 SSE CellB.E. CUDA の浮動小数サポートの対比表みたいなのがCUDAのマニュアルにあったな。 確かに完全じゃない。 糞まじめに準拠してるのはx87くらいだ
296 名前:290 mailto:sage [2008/11/16(日) 02:56:28 ] >>292-295 なるほど。出てきた結果が、CPU上の double で計算した結果と、 GPUの float で計算した結果が、最大1%程度違ったから、正直 驚きました。普段doubleしか使って無くて、誤差なんかほとんど 気にしなくてよかったので。 誤差が蓄積してくようなタイプのアルゴリズムではないと思っていた だけに、少し驚きました。
297 名前:デフォルトの名無しさん [2008/11/20(木) 18:53:51 ] Cで使っていた自作ライブラリは、 nvccでコンパイルし直さなきゃダメなの?
298 名前:,,・´∀`・,,)っ-○◎- mailto:sage [2008/11/20(木) 18:58:40 ] 食べてみたけどおいしかったよ。 一つどうぞ、あーんして
299 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2008/11/20(木) 19:44:47 ] 飾りだ、食うなボケ。
300 名前:,,・´∀`・,,)っ---- mailto:sage [2008/11/20(木) 21:36:00 ] 僕のもうないです >>299 から貰ってね
301 名前:デフォルトの名無しさん mailto:sage [2008/11/20(木) 23:10:32 ] >>297 ホスト(CPU)上で実行させるものならVC++と一緒にリンクできる。 (cppIntegrationサンプル参照) GPU上で実行させたいならそれなりにいじくらないと無理。
302 名前:デフォルトの名無しさん mailto:sage [2008/12/01(月) 15:16:29 ] -deviceemuでは動くプログラムが、GPUを使うと誤動作します。 __device__関数に引数が一部しか渡らなくなります(float4のz成分だけしか渡せない) ループ回数を極端に減らすと改善されるのですが、これはregisterメモリがパンクしてしまったということでしょうか?
303 名前:デフォルトの名無しさん mailto:sage [2008/12/01(月) 17:15:56 ] ソースを見ないとなんとも言えませんが、ループ回数とregisterは依存関係にはありません。 nvcc -ptxでptxファイルを出力して眺めてみては如何でしょう。
304 名前:デフォルトの名無しさん mailto:sage [2008/12/01(月) 23:02:30 ] ptxファイルですか。。。 正直どこをどう見たらいいのかわからないので敬遠していましたが、 遂に避けられないとこまで来てしまいましたかねえ。 見るべきポイントとかありましたら、よろしければ教えてください。
305 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2008/12/01(月) 23:09:56 ] ptxもネイティブコードじゃなしに中間コードの断片だからな。 レジスタが何本割り当てられるかとかそういった情報すら持ってないから困る。 その点Larrabeeは16本+16本+αとかレジスタ本数が決まってて コード生成時点で割り当てが決まってしまう。 結果的に静的な最適化がしやすい。 良し悪し。
306 名前:デフォルトの名無しさん [2008/12/02(火) 13:02:50 ] リョウテニ●ヽ( ・∀・)ノ● CUDA!
307 名前:デフォルトの名無しさん mailto:sage [2008/12/03(水) 17:58:11 ] .oとかにしてgccでリンクすることってできますか?
308 名前:デフォルトの名無しさん mailto:sage [2008/12/04(木) 00:09:51 ] >>307 何を? どこで? なんで質問もろくにできないの? ちなみに、エスパー募集ならお門違い。
309 名前:デフォルトの名無しさん mailto:sage [2008/12/04(木) 00:52:30 ] >>307 普通にできますよ。 -l/usr/local/cuda/lib -lcudart 等のオプションは当然自分で追加する必要があります。
310 名前:デフォルトの名無しさん mailto:sage [2008/12/04(木) 06:13:34 ] Windowsで、とかいう話だったりしてね。
311 名前:デフォルトの名無しさん mailto:sage [2008/12/04(木) 10:05:39 ] .objじゃなくて.oって書いてあるんだからそれはないんじゃない?
312 名前:デフォルトの名無しさん mailto:sage [2008/12/04(木) 22:31:14 ] それだったらわざわざ聞くかねぇ。まぁいいか。
313 名前:デフォルトの名無しさん mailto:sage [2008/12/12(金) 18:47:36 ] 【GPGPU】CUDA/ATI STREAM 速度・画質検証スレ pc11.2ch.net/test/read.cgi/jisaku/1228764782/
314 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 19:30:29 ] これからCUDAを始めようといろいろサイトを巡回しているのですが、 グリッドサイズとブロックサイズはどのようにして決めたらいいのでしょうか? 同期をとるかとらないかで変わると思いますが、とりあえずとらない場合でお願いします。
315 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 20:41:30 ] >>314 BlockSize(スレッド数)は32の倍数で余り大きくない辺り。GridSize(ブロック数)は充分大きく。
316 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 21:31:49 ] >>315 ありがとうございます。 もう一つ質問させていただきたいのですが、たとえば、512x512のようにブロックサイズ、グリッドサイズ ともに最大値未満の場合、<16, 32, 1>のように複数の次元に分けるのと、<512, 1, 1>のように1つの次元 にまとめるのとどちらがいいのでしょうか? 多分通常はブロックサイズは各次元の最大値<512, 512, 64>をオーバーすることが多いと思うので、こちらは 分けることになると思いますが、グリッドサイズの最大値は<65536, 65536, 1>もあるので、 次元を分けなくてもいいときは分けない方がいいのでしょうか?
317 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:01:51 ] threadサイズが実際の分散処理の単位になる つまりthread数だけ並列演算が行われる 例えばthread(1)にしてblock(10)とかだと順次処理と変わらない ただしthreadは256までしか出来ないのでblockという単位が容易されてる blockは単にプログラムがやりやすいように用意されただけのもので 実際に分散処理には影響しない
318 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:15:42 ] >>316 言いたいことがよく判らんが、演算量が512x512ならブロックを8x8にしてグリッドを64x64でいいんでない? 或いはxyの区別が重要でないならブロックを64、グリッドを4096とか。 私は後者の方針でptxファイルの出力とプロファイルの結果を睨みながら決定することが多いけど。 # 横着するときは前者だなぁw
319 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:17:30 ] >>316 単に内部ループが for(x=0;x<?;x++){} _global_ か for(x=0;x<?;x++){ for(y=0;y<?;y++){ _global_ } } になるかの違い
320 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:24:34 ] 元の位置を特定する為にglobal関数でインデックスを計算することになるから もしxやyのどちらかで収まるなら1つだけ使うのが良い global関数内部の計算コストが一番ネックになる部分だからね インデックスの計算部分が一番邪魔で削れるだけ削った方が良い
321 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:35:25 ] >>317 ,319 ありがとうございます。ようやく喉のつっかえが取れました。 >>318 試しに昔書いた画像処理のコードを移植しようとしていたのですが、入力によって いろいろサイズが変わるので、512x512で固定するのはちょっとやりづらいかなと… ただ、ここまでの話からするとchannel(RGB)*height*widthの三次元配列に画像をつっこんで、 grid = <height, channel, 1> block = <32, width / 32, 1> で処理を回せそうですね。画像の幅をを32の倍数に合わせる必要はありそうですが。 >>320 ありがとうございます。実際に使うときは上のような感じにブロックとグリッドの数を決めようかなと 思いますが、どうでしょうか?
322 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 22:59:47 ] heightは超えてもいいの? 範囲は内部でインデックスが範囲かどうか判定するよりは 端数を含めたメモリを確保して必要無い部分も計算させてしまった方が速いよ
323 名前:デフォルトの名無しさん mailto:sage [2008/12/14(日) 23:22:38 ] >>322 そこまで大きな画像を入れるかどうかは分かりませんが、確かに高さが65536を 超える場合は分割してやる必要がありますね。 >端数を含めたメモリを確保して必要無い部分も計算させてしまった方が速いよ ということは、配列にコピーするときに幅を合わせてコピーするのではなく、後ろに空白部分を まとめた方がいいということでしょうか? #これって多次元配列を引数に渡すのってどうするんだろう…
324 名前:デフォルトの名無しさん mailto:sage [2008/12/15(月) 00:01:31 ] いや、最終的には全て一次元の配列でそれが適切な間隔でアクセスされるように並んでいるのが一番いいことになる。 だから、画像なんかの場合だと座標値に意味がないなら詰め込んで構わない。 実際には、コンボリューションフィルターなどで隣の画素を参照しないといけないことが多いだろうけど、 その場合はどうせ共有メモリを使ってアクセスを減らすなどの工夫が必要だからどの途32の倍数に拘る必要はない気がする。
325 名前:デフォルトの名無しさん mailto:sage [2008/12/15(月) 00:50:40 ] 論文用のならともかく普通の画像処理で画像サイズが固定されてることはまずないし サイズも共有メモリじゃとても足りない 共有メモリを使うならCPUサイドであらかじめ画像を分割して渡すという方法しかないけど効率悪いよ 毎回隣接した画素情報も含めないといけないから
326 名前:デフォルトの名無しさん mailto:sage [2008/12/15(月) 01:06:12 ] >>324 カーネルサイズにもよりますが、sharedメモリはちょっとサイズ的にきつそうですね… constantメモリならブロックサイズを調整すれば何とかなるかも? >>325 単なる趣味グラムなので、ぶっちゃけ全部globalメモリからとってきてもいいような気がしたのですが、 逆にそれだとCPUで処理するよりも遅くなりそうですね
327 名前:デフォルトの名無しさん mailto:sage [2008/12/16(火) 01:54:49 ] 遅くなりそうというかどんだけがんばっても最終的にはglobalメモリを使うのが一番早いという結論になるよ まあそれがGPGPUの一番のネックなんだけどね CPUサイドのメモリを共用するようにいずれはなるんだろうけど今の限界はそこ
328 名前:デフォルトの名無しさん mailto:sage [2008/12/16(火) 06:11:12 ] 一番(手っ取り)早いのは同意するが、一番速いとは限らない。 それこそ、思考放棄じゃないかな?
329 名前:デフォルトの名無しさん mailto:sage [2008/12/19(金) 00:31:55 ] 詰まってます、助けて・・・ 私はVS2005で開発しようとカスタムウィザードを入れ、ツールキットとSDKをインスコし パスも通したのにLNK1181エラーでるんです・・・存在しないオブジェクトファイルを指定するのはなぜでしょう? ライブラリパスがみつからないってどういうことなんでしょうか?
330 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 01:37:50 ] "Program" "Files"と認識してるとか
331 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 02:38:31 ] Windowsってなんで重要なディレクトリ名にスペースなんか入れるんだろう。 MSって頭悪いの?
332 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 04:16:06 ] 低脳を排除するためかもねw
333 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 05:06:25 ] プログラマお断り。ずっと消費者で居てくだちい。
334 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 06:27:59 ] デスクトップやマイドキュメントのスペースや半角カナフォルダはなくなったが、Program Filesはそのままだな。
335 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 09:43:22 ] >>331 その昔16ビットOSが主流だったころM$は8文字ファイル名しか扱えなかった そしてUnix系OSは既にロングファイルネームに対応していた そこで登場したのが32bit Window 95だった 長いファイル名が使えるんだぞ、凄いんだぞと新発明でもしたかのように宣伝していた そして自慢げにフォルダ名を無駄に長くした
336 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2008/12/20(土) 12:23:53 ] VistaはUNIXerには優しくなったな。 上位エディション限定だけどSUAも使えるし
337 名前:デフォルトの名無しさん mailto:sage [2008/12/20(土) 20:39:06 ] CUDAをさ、VS2005で使えてる人っているの? つか、なんで英語のマニュアルしかないんだよ。わかんねーよ
338 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2008/12/21(日) 00:44:02 ] むしろ2005以外でどうやって使うんだ? 2.1βで2008対応したけど
339 名前:デフォルトの名無しさん mailto:sage [2008/12/21(日) 00:58:06 ] >>338 おお、それはいいこと聞いた やっと2005アンインストールできる
340 名前:デフォルトの名無しさん mailto:sage [2008/12/21(日) 01:37:02 ] >>338 どこか日本語で環境設定を教えてくれるサイト知ってたら教えてくれ・・・
341 名前:デフォルトの名無しさん [2008/12/21(日) 01:55:48 ] 環境設定なんか何も要らんがな。スクリプト走らせるだけ。 bashのバージョンによってはウォーニング出るけど、ちゃんと動く。 スクリプト猿にも成れないとは、どんだけゆとり脳なんだよ?スポンジなの?
342 名前:,,・´∀`・,,)っ-●◎○ mailto:!sage [2008/12/21(日) 10:35:26 ] どのみちあの程度の英語が読めない人に優れたプログラミング書くのは無理だと思うんだ。 俺の私的な業務の手伝いしてくれるなら日本法人さんに代わりにチュートリアルとかの要求 してあげてもいいんだけど、職権乱用か。 >>340 ここで解らなかったらもう諦めたら? chihara.naist.jp/people/STAFF/imura/computer/OpenGL/cuda1/disp_content
343 名前:デフォルトの名無しさん mailto:sage [2008/12/21(日) 11:55:12 ] どうでもいいけど、↑のURLは「disp_content」を削らないとエラーになった。
344 名前:デフォルトの名無しさん mailto:sage [2008/12/21(日) 12:58:13 ] >>340 サンプルプロジェクトを開いて設定を見て勉強するのがいいよ
345 名前:デフォルトの名無しさん mailto:sage [2008/12/24(水) 12:51:08 ] 英語読めないのにプログラミング言語してる男の人って・・・
346 名前:デフォルトの名無しさん mailto:sage [2008/12/24(水) 18:35:50 ] 英語に優越感もってるやつって、さもしいな
347 名前:デフォルトの名無しさん mailto:sage [2008/12/24(水) 19:03:01 ] >>345 可愛いもんだよねv
348 名前:デフォルトの名無しさん mailto:sage [2008/12/24(水) 23:58:39 ] 英語なんて誰でも1ヶ月もあればある程度は読めるようになるよ 出来ないと思い込んでやろうとしないだけで
349 名前:デフォルトの名無しさん [2008/12/26(金) 12:46:32 ] vs2005の環境で拡張子cuの場合、定義参照はできるのですが、 インテリセンスが機能しません。freeとかvcのランタイムも同様に 機能しないのですが、やり方分かる方いますか? ツール->オプション->テキストエディタ->ファイル拡張子にcu c++として 登録するとできるのは上記だけです
350 名前:デフォルトの名無しさん mailto:sage [2008/12/26(金) 22:27:18 ] いっそ、nvccの拡張機能以外は全部cppでやったら?
351 名前:デフォルトの名無しさん mailto:sage [2008/12/27(土) 05:03:22 ] それがスマートだね
352 名前:デフォルトの名無しさん [2008/12/27(土) 17:53:02 ] 質問です。 VC++2005で開発する際に、コマンドプロンプトにデバイス名も含め一切文字を表示させたくないのですが、どのようにすればよいでしょうか?
353 名前:デフォルトの名無しさん mailto:sage [2008/12/27(土) 18:38:27 ] >>352 長いパス名が邪魔なだけなら set PROMPT=$G とか?
354 名前:デフォルトの名無しさん mailto:sage [2008/12/27(土) 18:47:25 ] >>352 CUTILを使うと標準出力があるって話なら、リダイレクトするかCUTILを使わなければいいと思うのだが。
355 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 01:33:08 ] プロンプト出したくないって話なら_tmainじゃね
356 名前:352 [2008/12/28(日) 02:53:51 ] >>353-355 回答ありがとうございます。 >>353 質問があいまいですみません。 パス名が邪魔、ってわけではないです。 >>354 おそらくこの指摘にあてはまるのだと思います。 >リダイレクト リダイレクトしても、コマンドプロンプトに表示が出てしまいます。 >CUTIL cutil.hを使わずに、cutil.hで提供されている関数を使わない方法、もしくは、代替可能なヘッダーファイルはありますか? >>355 _tmainを使ってしまうとWindowsでしか使えないソースコードになってしまうので、別の方法があれば教えてください。
357 名前:352 [2008/12/28(日) 02:55:28 ] 自己レスですw 誤:cutil.hで提供されている関数を使わない方法 正:cutil.hで提供されている関数を使う方法 の間違いです。
358 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 03:10:48 ] system("cls"); とか
359 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 10:49:28 ] >>356 > _tmainを使ってしまうとWindowsでしか使えないソースコードになってしまうので、別の方法があれば教えてください。 Windows かどうかで #ifdef するくらいは許されるんじゃないの?
360 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 14:29:28 ] プロジェクトの設定でWindowsアプリにすればいいだけでしょ
361 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 14:32:32 ] >>_tmainを使ってしまうとWindowsでしか使えないソースコードになってしまうので、別の方法があれば教えてください。 mainだろうがWindows依存部分のコードが発生するのは当たり前でしょ CUDAの部分とC++の部分とWindows依存部分とファイルを分離するのが鉄則だよ 複数の環境で使う場合は#ifdefプラグマを使って分離したWindows依存部分の #includeを切り替えるようにするだけ
362 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 17:29:43 ] コンパイラのオプションで指定できるでしょ 環境ごとにmakefile書くだけじゃね
363 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 17:48:49 ] >>361 #ifdefはいつからpragmaになりましたか?
364 名前:デフォルトの名無しさん mailto:sage [2008/12/28(日) 17:53:47 ] >>363 #ifdefディレクティブと言いたかったんじゃないの? で、使い慣れない言葉なんでつい間違えたと。 句読点もちゃんと使えないようだし、日本語に慣れていない三国人なんでしょ。
365 名前:デフォルトの名無しさん [2008/12/28(日) 22:36:27 ] cudaのMDコードどこかに追ってませんか?
366 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 12:11:23 ] たった1行でここまで意味不明なのも凄いな。
367 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 12:24:23 ] ×追ってませんか? ○オッドアイいませんか?
368 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 13:39:38 ] >>365 氏はcudaで書かれたMD(分子動力学)コードどこかに落ちてませんか と聞いてるのかと。当方も知らないので答えられませんが。 Fortranで書いたものを全部はアレなのでGPU上で実行したいサブルーチンだけ Cに変えてCUDAで動かしたいのですが、そんな例とかは落ちてないですかね。 mainルーチンその他関係ないところまで全部Cに移植するのが嫌ってだけな んですが。あ、当方はIntelFortran使用。 当方まだCUDA触りたて、試しにSTREAM BMTのtriadだけ手で適当に書いて GeForce9600GTで40GB/s弱(効率7割弱)のメモリバンド幅。あ、じゃもうでき るじゃんとか勝手に思い、Fortranのコードに挑もうとしてあえなく止まってますorz
369 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 14:08:06 ] つttp://www.easize.jp/product/fortrantocudamenu.html
370 名前:368 mailto:sage [2008/12/29(月) 14:20:59 ] >>369 ありがとうございます。m(_ _)m 多次元配列はどのみちGPU上では一次元化するつもりでしたがなるほど。 参考にさせていただきます。
371 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 14:45:46 ] >>369 そのページ、ポインタの扱いがメタメタだな わかってるなら別にいいが
372 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 14:49:43 ] うん、ぶっちゃけ「"cuda fortran"でぐぐって一番上に来たリンク貼り付けただけ」なんだ、すまない
373 名前:デフォルトの名無しさん mailto:sage [2008/12/29(月) 14:50:01 ] 何か普段使うものをCUDAに移植しようと思いつつ適当な物が見当たらない
374 名前:デフォルトの名無しさん mailto:sage [2008/12/30(火) 02:15:09 ] ぶっちゃけ、俺もそうなんだよね。おまけで付いて来たサンプル書き換えて 動かしてFLOPSベンチしてるだけ。 CUDA動かす環境をコスパ良く構築するには?と考えて色々やってみたが、 構築した環境で動かすモノって、結局サンプルの改造ばっか。まんまと nVidiaの販促戦略に乗せられたぜw
375 名前:デフォルトの名無しさん mailto:sage [2008/12/30(火) 08:50:29 ] zip圧縮とかjpg圧縮とかを移植したらライセンスの関係はどうなるの?
376 名前:デフォルトの名無しさん mailto:sage [2008/12/30(火) 12:52:04 ] 圧縮アルゴリズムに関しては問題ないんじゃね?
377 名前:デフォルトの名無しさん mailto:sage [2009/01/19(月) 15:08:44 ] CUDAプログラミングモデルの概要 ttp://http.download.nvidia.com/developer/cuda/jp/CUDA_Programming_Model_jp.pdf CUDAプログラミングの基本(パート I - ソフトウェアスタックとメモリ管理) ttp://http.download.nvidia.com/developer/cuda/jp/CUDA_Programming_Basics_PartI_jp.pdf CUDAプログラミングの基本(パート II - カーネル) ttp://http.download.nvidia.com/developer/cuda/jp/CUDA_Programming_Basics_PartII_jp.pdf
378 名前:デフォルトの名無しさん mailto:sage [2009/01/21(水) 03:21:23 ] デバイス側に確保したメモリにホスト側から cudaMemcpyのように一括でコピーするのではなく、 一部分だけコピーする、又は書き換える良い方法がありましたら教えてください。
379 名前:デフォルトの名無しさん mailto:sage [2009/01/21(水) 03:28:19 ] ・cudaMemcpy()で一部分だけコピーする。 ・cudaMemset()で(ry ・そういうカーネル関数を用意して呼び出す。
380 名前:デフォルトの名無しさん mailto:sage [2009/01/21(水) 12:27:16 ] 一部分だけってのはたいてい順次処理になるからCPUにやらせたほうが有利だよ
381 名前:デフォルトの名無しさん [2009/01/22(木) 01:33:54 ] CUDAのプログラミングでZIPアーカイブのパスワード解析とか、早くなりませんかねぇ。 エンコード/デコードに使えるんだから、どうなんでしょう?
382 名前:デフォルトの名無しさん mailto:sage [2009/01/22(木) 06:38:19 ] CUDAのfortranサポート予定ってGPUカーネルの部分をfortranライクに 書けるようになるって理解でいいのかな?2.0からって見かけたけど、それっぽい記述が全く無い…
383 名前:デフォルトの名無しさん mailto:sage [2009/01/22(木) 08:47:26 ] >>379-380 ありがとうございました。 参考にさせていただきます。
384 名前:デフォルトの名無しさん mailto:sage [2009/01/22(木) 19:18:17 ] >>381 総当りか辞書型か知らんが演算能力よりI/Oの問題だろ普通。
385 名前:デフォルトの名無しさん mailto:sage [2009/01/22(木) 20:12:54 ] >>381 早くなるよ
386 名前:デフォルトの名無しさん [2009/01/23(金) 00:20:22 ] >>384 ファイル数が多い場合はI/Oも問題になるかもしれませんが、 ある程度のサイズであればWindowsでもメモリに読み込むので、 それほど問題にならないのでは? 毎回物理的に読みに行くわけではないし。
387 名前:デフォルトの名無しさん mailto:sage [2009/01/26(月) 09:28:38 ] ファイルI/OじゃなくメモリI/Oなのでは?
388 名前:デフォルトの名無しさん mailto:sage [2009/01/28(水) 11:49:27 ] >>387 お前は何を言っているんだ
389 名前:デフォルトの名無しさん [2009/01/28(水) 12:47:12 ] >>388 pciバスつかうんだろ? 立派なioとおもうが つかクーダってほんとマイナーなんだね。
390 名前:デフォルトの名無しさん mailto:sage [2009/01/28(水) 13:18:14 ] そりゃNVIDIA限定だからだろ?グラボを選ぶのなら汎用的なアプリは作れない。 CUDAよりもっといろんなグラボに対応しているOpenCLへのつなぎに過ぎないよ。
391 名前:デフォルトの名無しさん mailto:sage [2009/01/29(木) 00:08:14 ] ZIPのパスワード解析にZIPファイル全体へのアクセスが必要だと勘違いしてる馬鹿w
392 名前:384 [2009/01/29(木) 08:00:22 ] >>381-391 ああ、俺がぼけてた。なんか知らんけど自分でもなんであんなレスつけたんだろ orz わけわからない流れにしちまって、すまん。 正しくはこうだな。↓ パス解析では総当りにしても辞書にしてもforなどのループ速度が求められるだけで、 CUDAによる計算は意味があるのかい?と思った。 MD5とかデータから導き出す数値ならば本当の意味での解析だから意味ありそうだけど。
393 名前:デフォルトの名無しさん mailto:sage [2009/01/29(木) 23:02:34 ] こんな記事もあるしな GPUを利用した無線LANのパスワードクラッキングが主流に itpro.nikkeibp.co.jp/article/MAG/20090123/323378/
394 名前:デフォルトの名無しさん [2009/01/30(金) 03:18:20 ] >>393 の言ってるのはまさに本当の意味での解析ってやつだしな。 WPA/WPA2-PSKからの復元は総当り/辞書比較と違ってGPGPUにする意味がある。
395 名前:デフォルトの名無しさん mailto:sage [2009/02/01(日) 15:41:49 ] Catalystだけど、トリップ検索は随分速くなるみたい ttp://sourceforge.jp/projects/naniya/wiki/Radeon
396 名前:デフォルトの名無しさん mailto:sage [2009/02/02(月) 21:51:40 ] ホスト側でconstantメモリを動的に確保できないのでしょうか? 方法がありましたら教えてください。
397 名前:デフォルトの名無しさん mailto:sage [2009/02/02(月) 22:44:30 ] >>396 目的が良く分からないのでなんとも言えませんが、 どうせ64KBしかないのだから静的に64KB確保しておくのではだめなのでしょうか。
398 名前:デフォルトの名無しさん [2009/02/02(月) 22:54:45 ] >>396 あるけど、なんでprograming guide読まないの??
399 名前:デフォルトの名無しさん mailto:sage [2009/02/02(月) 23:59:28 ] >>397 静的に確保しておいてもよかったんですが,綺麗にかけるならとw >>398 一度目を通したつもりでしたが,素通りしていたようです。 もう一度読み直してきますm(_ _)m
400 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 00:08:13 ] 誰かZIPの暗号解析ツール作って>< それか解析のループ部分だけうpしてくれたら、カーネルは俺が書きます。
401 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 06:54:02 ] 総当りするだけならどっかのオープンソース実装の パスワードチェックと復号ルーチンとってくればいいだろ
402 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 10:20:56 ] ただでさえ消費電力がデカイのにパスワード解析に何週間も動かしてられっかw
403 名前:デフォルトの名無しさん [2009/02/07(土) 16:57:19 ] 超解像のような考え方は昔からあるようだな フリーソフトImageD2 www.tiu.ac.jp/~zohzemi/imgD2/index.html これは時間軸方向にも参照するものだ。 NVIDIAのMOTIONDSPと同じ考え方だな。 西川善司の大画面☆マニア 第113回 超解像 av.watch.impress.co.jp/docs/20090120/dg113.htm この方法は数フレームを参照することで低解像な映像のブレから情報量をアップさせるようだが、 この方法だとシーンチェンジやめまぐるしく動く映像では逆効果でめちゃくちゃな映像になるのではないか? (これは上記のフリーソフトの別ページでも注意点として載っていた) でも東芝などの日本の各社がやってる1フレームだけで行う超解像はそもそも無理がある。だから不自然な画質になったり、情報量が逆に消失したりする。 Lanczosなどでそのままアプコンしたほうがずっと情報量あるし自然な画質だ。比較してみれば一発で分かる。 plusd.itmedia.co.jp/lifestyle/articles/0812/24/news031_2.html ここの元画像を720×480にし、それをAVIUTLなどでLanczosでフルHDにしたもののほうがずっと綺麗。 超解像は単純な処理だから柵とか崩れてるし、文字も駄目だし、元からあった情報を処理によって消しちゃう副作用のほうが強い。 超解像、超解像と目新しくいって盛り上げようとしたいのは分かるが、こんなのはまやかしだよ。 www1.axfc.net/uploader/Li/so/24824.zip&key=pass 比較用画像もうpしておいた 一方、数フレームでやる方法は計算が大変だが、シーンチェンジや盛大な動きの問題さえクリアすればかなり使えそうではある。 MOTIONDSPや↓はそのあたりちゃんとクリアしているのだろうか? www.flashbackj.com/red_giant/instant_hd_advanced/
404 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:01:19 ] 10年ぐらい前にカーネギメロン大学で勉強してた頃に超解像のプログラム作れっていう課題を出されたことがある
405 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:34:44 ] ちょー解像は判ったからマルチすんなや。
406 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 20:13:09 ] >>403 スレ違いじゃない? GPGPU 向きな処理なのは確かだし、そもそも Cell なり SpursEngine は GPU じゃないし。 画像処理スレとかあったと思うよ?
407 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 23:45:41 ] アメリカのメロン大学は一応名門だけど日本校はどうなんだ?
408 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 01:05:45 ] >>404 なにその高レベルな課題 俺の大学時代と雲泥の差
409 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 02:58:06 ] 超解像の原理が未だに理解出来ません 複数の映像フレームの同じポイントの色の出現頻度に一番高い色を適用するってことですか?
410 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:45:42 ] は?今の超解像って、時間軸の補完までやってるのか?
411 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 13:52:05 ] MPEGの原理は主にフレーム間差分をとってJPEG圧縮なんで、それを改めてチェックしたところで・・・
412 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 21:06:32 ] >>407 神戸のハーバーランドの近くにあるあれか? 兵庫県の財政圧迫してるらしいよ。 学生少なくて撤退の噂もあります 同じビルの同じ階に神戸電子専門学校の学校法人が経営する大学院がある。 何を勘違いしたのか兵庫県立大学も情報科学の大学院を神戸市内に置いてる。 神戸という都市に何を求めてるのか、理解不能である。 たしかに古くからの工業都市で組み込みソフト屋の数がそれなりにいるのはわかる。 最大の勘違いは、日本のITドカタは職場を離れて大学院に通えるほど裕福ではないことだ。
413 名前:デフォルトの名無しさん [2009/02/08(日) 21:49:03 ] 俺はてっきり、ラーメン大学とか、洗車大学と同じノリで、 神戸電子専門学校が作ったヒト寄せパンダだと思ってた。 ってか別法人なのか? 学生少なくて、って言う前に、派遣のワーキングプア、 デジタル土方に成る為にわざわざ苦労して大学通う馬鹿 が神戸のどこに居るんだよっ? 俺が居るよ…orz
414 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 22:51:22 ] 兵庫県もネギメロンなんて誘致するくらいなら神戸大に寄附講座でも作ったほうがよかったんじゃね? 現状兵庫県内で優秀な学生がいるんだし。 おっと、「学生」の枠で括ると近くの中高一貫校のほうがよっぽど・・・
415 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 09:41:15 ] 情報系の大学院は多すぎるよな 旧帝でも定員割れする世の中なのに このうえ西和彦が秋葉に大学院作るんだから馬鹿としか
416 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 12:50:30 ] >>411 誰がMPEGの話をしてるの? 誰も君の知識を披露してくれなんて頼んでないよ? 圧縮で壊れるったって圧縮率によるし、位相が生き残ってりゃ理論的には解像度は上げられる。 圧縮率によっては壊れた分が回復するだけかも知れないけどな。
417 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 14:21:54 ] 誰がMPEGの話をしてるの? 誰も君の知識を披露してくれなんて頼んでないよ?
418 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 15:40:30 ] それを言うなら、なんでいきなり超解像の話になったんだろ?
419 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 15:43:20 ] メロン日本校のカリキュラムを見たけど、ウンコすぎて話にならねぇw こりゃ学生もこねーわ
420 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/09(月) 18:02:06 ] >>416-417 だれも連投してくれなんて頼んでないよ?
421 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/09(月) 18:06:41 ] GPGPU向けの画像・動画関連のソフトってどれも速さばかり求めて品質は二の次だな ウンコなエンコーダだとRGB/YUV変換で腐る 一番腐るのは量子化だろうけどな
422 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 18:25:28 ] Geforceは何気にGTXシリーズで初めて64bitに対応してるけど 演算装置は1個しかないw 並列処理が得意な分野でfloatだけで済むようなものはほぼ無いだろw
423 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 19:05:29 ] >>420 連投じゃなくて別人 2ch歴長いんだからそれくらい分かれ
424 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 20:42:10 ] 甘いな。floatでも速ければ使い物になる用途は結構あるもんだよ。 例えば、近似計算なんかはfloatで近似させてからdoubleで更に近づけることもできるしね。
425 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 21:56:34 ] そういや西和彦もこっちの出身だな。確か甲陽から和田大 だから、落ちこぼれか。そもそも博士余りで高学歴ワープアPD が社会問題に成ってる今日この頃に、大学院新設とかもうね アボガドバナナ…。 鴨葱メロンと言えば、金出教授もこっちの出身だったな。 沢山カメラ使って超解像みたいな論文も有ったような無かったような。
426 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 13:06:41 ] >>425 お前、自分の考えまとめるの下手だな。
427 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 13:31:44 ] まあ、CUDAは英文のドキュメントが読めてある程度知能がないと 使えないからな。 スレ違いの話で盛り上がるのも分かるな。バカばっかりだしw
428 名前:デフォルトの名無しさん [2009/02/13(金) 17:06:53 ] CUDA版のTripcode Explorerができたみたいですね。最適化に期待します。 tripper.kousaku.in/ download.kousaku.in/trip/Tripcode-Explorer-CUDA-test1.zip
429 名前:,,・´∀`・,,)っ-●◎○ mailto:!sage [2009/02/13(金) 18:13:51 ] ようこそ、バーボンハウスへ。 このテキーラはサービスだから、まず飲んで落ち着いて欲しい。 うん、「絶対に動かない」んだ。済まない。 仏の顔もって言うしね、謝って許してもらおうとも思っていない。 でも、このネタプログラムを見たとき、君は、きっと言葉では言い表せない 「ときめき」みたいなものを感じてくれたと思う。 殺伐とした世の中で、そういう気持ちを忘れないで欲しい、そう思って 5分ででっちあげたんだ。 じゃあ、注文を聞こうか。 -------------------- 1M超のバイナリファイルに何が詰まってるか疑問な人は、テキストエディタで開いてみればいいよ><
430 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 23:27:26 ] CUDAはコアレスと分岐の扱いを把握すれば、やりたいことは大体クリア出来ると思われ。
431 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/14(土) 00:05:15 ] 結局プレディケートなんだよね。 SMあたりの命令デコーダは1基だからSP毎に別々のフローを実行することができない。 Larrabee(Ct)なら分岐は容易に表現できる。
432 名前:デフォルトの名無しさん mailto:sage [2009/02/14(土) 01:58:51 ] >>431 プレディケードって??
433 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/02/14(土) 11:48:56 ] えーとね、たとえば if (cond) { funcA(); } else { funcB(); } なんてコードがあるとしよう。 普通のCPU向けのCだと、 cond の条件にしたがって、funcA()を実行するブロック、 あるいはfuncB()を実行するブロックにジャンプする。 すなわち命令ポインタを操作してコードを飛ぶ。 CUDAにおいてはシェーダマルチプロセッサ一つにたいし、命令デコーダは1つしかない。 にもかかわらず、condは要素ごとに変わるわけで、条件分岐先はSPごとにバラバラになる可能性がある。 んで、そこで使うのがプレディケートなわけだけど、簡単にいえば、ifとelseの両方を通るようにする。 funcAとfuncBをインライン展開して、条件ビットで選択的に実行するコードに展開する。 んで、各要素に対して、実行するか実行しない(あるいは実行結果を反映しない)かを選択的に行うわけだ。 並列度の高いプロセッサではよく使われる方法だ。 んで、こっからはこのアプローチの弱点。 問題はif-elseを何重にも組み合わせたり、switch文を多用する場合、総当たりにかかる計算時間量が 並列化によるパフォーマンスメリットを相殺し、逆に遅くなるケースもある。 並列処理を諦めて素直に要素ごとに逐次処理をさせてくれたほうがかえって効率がいいかもしれない。 しかしCUDAってそのへんの融通がきかないんだよね。基本的に【並列処理しか記述できない】から。 正確には逐次処理は専用のプリミティブなんかを使って限定的に逐次処理はやれるけど記述面では かえって面倒になる。 GPUで不得意な処理はCPUでやれってアプローチだからそのへんの融通を利かせる気は無いらしい。
434 名前:デフォルトの名無しさん mailto:sage [2009/02/14(土) 11:57:31 ] CUDAで困るのはその点のほかに、並列数を途中で変えられないこともあるよね。 一度ホストに処理を戻すと遅くなりかねないし、共有メモリが失われてしまうし。 私の関わっているプロジェクトでは演算処理が中心なので、ある程度融通が利いてくれないとね。
435 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 06:24:49 ] 前にも有ったけど、条件分岐したら負け。 Crayだってそうだったじゃん。
436 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 12:43:21 ] CPUだとforループが多重になる部分をGPUに 丸投げすればいいんでしょ? 3項演算子程度は実行して欲しいけど
437 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/02/15(日) 16:42:36 ] > forループが多重になる部分 重要なのは回数であって多重かどうかはあまり関係ないです。 32の倍数であることは有る程度重要かな 一番重要なのは依存関係がないこと。 たとえばループを逆順で実行しても結果が等価であったりとかね。 240 SP(30 SM)を使えるとすれば、フルに使うには、最低960程度の演算が並列実行可能である必要があります。 ただし、全部のSMでまったく同じ処理をする必要はないです。
438 名前:デフォルトの名無しさん [2009/02/15(日) 17:06:37 ] >一番重要なのは依存関係がないこと。 そうだね。そのためiCotの時も関数型言語の並列化 に七転八倒してたね。 今ならerlangで良いんじゃね? CUDAスレでこんなこと 言うのも何だけど、Cライクな手続き型言語だとどうして もすぐに壁にぶつかってしまって、スケーラビリティが 出せない。もしくは出そうとするとプログラマの負担が 重過ぎる。 個人的には今更lispやprologに復活されたくはないけど。
439 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 17:15:56 ] >>438 そう、わかったよ じゃあ俺様がCUDA用erlang処理系書いてやる
440 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 17:57:47 ] ループを並列処理に展開するのって自動化出来そうだけど
441 名前:デフォルトの名無しさん mailto:sage [2009/03/04(水) 19:00:05 ] >>424 おいおい調子に乗って嘘つくな。 「簡単にできるぜ!」っとか鼻高々なのはいいけどそんなのないよ。
442 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 00:44:05 ] >>441 いや数値計算なら反復法とか1次連立方程式の陰解法で使えるだろ
443 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 00:59:48 ] また自信満々な人の嘘つき合戦ですか?
444 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 01:00:38 ] なんだよ微分方程式、というか積分使うのか。 積分を近似計算といっていいのか? 実用内ではあると思うけど、それもfloat(7)からdouble(16)だろ。何回ループするつもりなんだよ。
445 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 03:47:40 ] 積分を近似計算と言ってはいけない理由がわからん。
446 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 06:23:04 ] 数値計算なら兎も角、シミュレーション関係なら大いに有り得る話だな。 自分が知っていることが全てではないと認めることができれば世界は広がるのに。
447 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 20:24:13 ] 他人を否定することでしか自分を正当化できない、ということか。
448 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 21:39:34 ] >>447 数値計算と近似計算の違いを教えてくれませんか?
449 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 04:35:50 ] >>448 1+1=2となるのは、数値計算ではあるが近似計算ではない。
450 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 08:57:12 ] CUDA 2.1 Notebook Drivers for Windows ttp://forums.nvidia.com/index.php?showtopic=91157 βだけども
451 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 14:44:51 ] >>446 とすると、貴方の世界ではシミュレーションとは近似計算をしてるってことですか?
452 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 15:05:56 ] 物理にしろ確率モデルにしろコンピュータシミュレーションは近似計算だろ
453 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 15:08:22 ] 整数演算は近似計算ではありません。
454 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 15:15:06 ] approximationの意味分かってるの
455 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 15:38:46 ] なんかめんどくさそうな人がいっぱいいますね。 どうでもいいですが、早いところストリーム用のプログラミング手法を確立して、ストリームに特有な技法を紹介する本を出してくださいな。
456 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 16:26:22 ] どうして煽りを入れる人ほど知識が足りないんだろう?
457 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 17:11:04 ] >>456 知識が足りないから煽るじゃないですかね? そういう低脳な人は「煽ることしか出来ないよね」っとも言いますけど。 そんなことどうでもいいんで「ストリームんグ・プログラミング技法」とかいうブログを早く作ってくださいな。 「approximationの意味分かってるの」とかめんどくさそうな人との議論とかいかめしい顔した人が言う哲学に興味はないんで。
458 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 17:14:51 ] ↑ 低脳な人の煽りの見本
459 名前:デフォルトの名無しさん [2009/03/06(金) 18:03:55 ] 458 名前: デフォルトの名無しさん [sage] 投稿日: 2009/03/06(金) 17:14:51 ↑ 低脳な人の煽りの見本
460 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 19:56:54 ] プログラム板なんだから少しはプログラム出せって
461 名前:デフォルトの名無しさん [2009/03/06(金) 20:18:50 ] ↑ 低脳な人の煽りの見本
462 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 20:40:17 ] ↑ 低脳な人の煽りの見本 ↓
463 名前:デフォルトの名無しさん [2009/03/06(金) 20:41:28 ] >>448 1+1=2となるのは、数値計算ではあるが近似計算ではない。
464 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:21:12 ] VIPのまとめWikiに書いたこともあるが、今はネタがない。 あーそうそう、x16バスに繋がった8800GTの方がx8バスに繋がったGTX280よりも速かったってこと位か。 但し、転送量が多目の用途だからだとは思うが。
465 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/06(金) 22:22:16 ] VIPPERプログラミングスレの派生なのかここ?
466 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:23:45 ] 大丈夫、私はvipには書いていないw でも何故かまとめWikiには複数投稿している罠。
467 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 02:00:17 ] 自分が知らない事はWeb見て知ったかぶらないで馬鹿げたレスする暇で amazonで本の一冊でも買えばいいのに。 ところでCUDAで性能だすためのまとまった日本語の文書ないかな?
468 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 02:22:11 ] そもそもCUDAに関して有用な日本語資料がなくね? 公式でさえ日本語マニュアルはあんなだったし。
469 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 02:25:00 ] 大丈夫、英語資料すらろくなのないから。
470 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 02:30:32 ] やはり本家のドキュメントにあたるしかないのか。 めんどくせー。環境の開発もいいけどドキュメントの整備も力入れてほしいわ。
471 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 07:18:34 ] 逆に日本語ドキュメントがあっても大して意味無いよ。 IntelのプログラミングマニュアルなんていまだにPentium 4のことしか書いてないぞ。 日本法人仕事しなさすぎる。 CUDAを勉強するより前に英語アレルギーを克服したほうが何かと良くなるかも。
472 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 07:55:47 ] 英語アレルギーってなに?
473 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 08:25:11 ] そう言いたくなるくらい、英語から目を背ける人は世の中に意外と多い。
474 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 08:45:27 ] 俺の場合英語と日本語だと読むスピードが10倍〜100倍違うorz.
475 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 11:19:36 ] 母国語でないと読むスピードが遅いだけじゃなく小さなとこで思い 違いがでてきて結局後からまた参照したりして嫌だ。
476 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 11:23:45 ] 技術的文書に機械翻訳はどの程度通用するんだろ。奇想天外な訳になってしまうのかな。連投スマソ
477 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 11:41:59 ] 英文学読めって言ってるんじゃないんだし、書ける・話せるも別問題。 技術ドキュメントの英語なんて、有る程度形式ばった言い回ししかやらないので 単語を摘み出すだけでも回数を重ねればそこそこ意味はわかるようになると思う。 慣れてくれば技術系ニュースサイトとかも読んでみたり。
478 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 11:51:27 ] だんごさんはどーゆーサイトみてますか スレ違い申し訳ない
479 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 12:17:36 ] Intelの開発者ブログとかRSSに入れてる
480 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 22:13:23 ] 団子はGPGPU嫌いなんじゃなかったの?
481 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 22:18:46 ] 逆に、好きな奴いるのか? 非生産的で変態だけど性能のために仕方なく使う類のモノだろ
482 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 22:22:35 ] おれもGPGPUなんて嫌いだな。 開発したことあるけどPSシリーズも大嫌い。
483 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/08(日) 08:31:15 ] x86でいうMMX/SSEって、分岐が除去できるとか直列方向のパフォーマンスメリットがあった。 GPGPUって並列方向のスループットありきで、ホスト側のコードでお膳立てしてやらないといけない。
484 名前:デフォルトの名無しさん [2009/03/08(日) 19:46:25 ] >非生産的で変態だけど それってintelアーキのことじゃん。昔からずっと言われ続けてることだが。 mc68kやsparc,mipsの方がよっぽど素直に書ける。 けど市場規模のために仕方無く使わされてる。
485 名前:デフォルトの名無しさん mailto:sage [2009/03/08(日) 20:10:12 ] アセンブラはmc68とx86しかやったことないけど、 mc68はかきやすかったな〜。 欲を言えば16本すべて汎用レジスタだったらよかったんだけどw
486 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 01:10:52 ] >>484 あー? メモリアドレッシングモードが貧弱すぎるんだけどー? まじうけるー? パネェっすよ
487 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 01:20:53 ] インテルに慣れきってるとそう思うかもね。 どうせ団子はインテル一筋なんだろ?w
488 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 02:18:43 ] > mc68とx86 その時代だと8086だろ。「x86」って基本的に32ビット以降のことを言うと思うんだけど。 32ビットだとぜんぜん自由度が違うっしょ。セグメントなんて使わなくていいし。 4GBの論理メモリ空間をリニアにアドレッシングできるし。 んで、案の定ローエンドサーバだけにとどまらずHPCもx86に惨敗して虫の息じゃないか 古くからあるRISCなんて。 MIPSも組み込みに逃げたけどARMに食われたね。 それはともかくSSE・MMXも経験ない男の人がCUDAなんて・・・ さて、CUDAの話なんだけど、基本的に最小の演算単位は32ビット×32のSIMDで メモリロード・ストアも、各要素ごとに計算してscattering/gathering機構付きの ロード・ストアユニットで、 このへんはCUDAのアーキテクチャマニュアルにも載ってる通り。 従来SIMDって基本的に連続的に並べないと性能出ないけど、 CUDAは動的にベクトルを再構成することで、一気に柔軟性が向上した。 逆にこの強力なロード・ストアユニットを載せたせいで、連続したデータに対する ロードストアの効率が悪くなってね。 一時変数をどっかに置いとこうとした場合にも、32要素ごとにバラバラにアドレスを計算する scattering/gathering機構つきのロード・ストアユニットに通す羽目になる。 これじゃエネルギー効率的にもよくないでしょ。 んで、レジスタにそのまま保持すればいいじゃないってことで、それで 1つのシェーダコアあたりのレジスタファイルが、32KBとか64KBみたいな巨大なことになってる。 それにしても一般のCPUのL1キャッシュよりレイテンシの大きいレジスタファイルって一体・・・
489 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:50:28 ] 団子の脳みそがx86のアーキテクチャで凝り固まってて、現代風のプログラミングパラダイムについて来れないってことだろ。 あと10年もすればおまえの持ってる小手先業などは博物館の展示資料でしかないし、おまえの能書きなど頑固オヤジの戯言同じなるだろう。 インテルのブログで洗脳されまくっちゃうのもいいけど、アーキテクチャマニュアル云々よりも団子が頭の切り替えをできるかどうかのほうが問題なんじゃないの?
490 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 02:57:29 ] 現代風のプログラミングパラダイムって何だ?
491 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 03:33:26 ] 斜め上をいく愚言に感謝する。 しかしながらscattering/gatheringによる柔軟なアクセスはSIMDの新時代を切り拓くものだ。 実際Intelも2〜3年先のSIMD拡張では256ビット、512ビットと幅が広くなってるため、 AoS/SoAの変換をいかに効率よくこなすかがテーマになってくる。 (ちなみにLarrabeeにはscatter/gather命令そのものを導入する) このへんはむしろCISC的なプロセッサの美学だと思うがね。 AltiVecとかCellのSPEでなら何十命令かかる命令を1命令でこなす。 1クロックサイクルスループットでこなせない命令を実装しないのがRISCだろ。 モダンなCPUではパイプラインの前半部分のほうがALU自体よりもコストがかかるしまってるから それで処理単位がリッチなCISCのほうが効率がよくなってるわけさ。 このへんは gimpo.2ch.net/test/read.cgi/i4004/1220728356/76 あたりと同意見 しかしさ、16要素とか32要素とか、全部バラバラのアドレスだとしてみ? とてもワーストケースで要素数分だけメモリアクセスが必要だぜ。 RISCの守備範囲じゃねーよ んで、個人的にCUDAの問題は、scatter/gatherスカラ命令を備えないことなんだよね。 常に32並列単位で演算しないといけない。それで小回りがきかない。 スカラレジスタでアドレス指定するベクトル単位のロード・ストアと scatter/gather Larrabeeあたりがまさにこれをやってるわけだが。 > あと10年もすればおまえの持ってる小手先業などは博物館の展示資料でしかないし、おまえの能書きなど頑固オヤジの戯言同じなるだろう。 残念だが俺は流行りものの言語・フレームワークには目がない。 Ruby On Railsとか大好きだし。むしろ高級言語をより効率的に使うためにマシン語レベルで理解する必要があるんだよ。 たとえばさ、LLって性能的にはネイティブマシン語より遅いから、LL向けのJITコンパイラ書きたいとするじゃん。 どうしてもアセンブラの知識は必要なんだよね。もちろん業務じゃないよ。 ということでプロ高級言語er、趣味マシン語er それでARM語もx86語もそれなりにたしなんでおきたいわけ。
492 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 03:37:32 ] ○んで、個人的にCUDAの問題は、スカラ命令を備えないことなんだよね。
493 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 03:52:38 ] 頑固オヤジの戯言ごとと同じになるだろう。 ニート相手に5行も書くの面倒だから誤字脱字なおすのも面倒だよな。 「CISC的」とかいう概念がもう古いパラダイムってこと。 おまえみたいな純粋な「消費者」の戯言などどうでもいいけど、ストリームなのに128/256bits単位とか全く鼻糞だろ。 ストリーム演算やってるのに、「スカラ演算もやりたい!」「アドレッシング!」という考え自体を改めたほうがいいと思うけどね。 どうでもいいけど、ストリーミング・プログラミングの小技を集めたブログをはよ作ってよ。 C#だとスニペットというんだったか?そういうイディオム集みたいのでもいいから。
494 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 03:59:04 ] Intelの中の人のブログって言っても、本当に自社製品のプログラミングがらみの話題って 月に1回出るかどうかのレベルだぜ 次期Windowsの話題だったり、XMLやLLなんかのWebまわりの技術がどうこうだったり。 中の人の興味のあることが書いてあるって感じだけど、頭の悪い技術系ゴシップサイト よりはよっぽど為になる。さすが半導体総合メーカーだわって思うわ。 NVIDIAのニュースも購読してたけど本当に自社製品向けのコンピュータグラフィックスのノウハウとか グラフィックよりの物理演算が中心で、そっち方面はそんなに深入りする気はないので読む価値なしと。 (そっち方面で食ってる人ごめんなさいね)
495 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 04:01:57 ] >>493 > どうでもいいけど、ストリーミング・プログラミングの小技を集めたブログをはよ作ってよ。 > C#だとスニペットというんだったか?そういうイディオム集みたいのでもいいから。 プププププ
496 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 04:11:02 ] ソースコード例文をいんたーねっつで検索してきてコピペをするのが プログラミングだと思ってる人はそう言うのに本質を求めるよね。 いや、いいんだけどね。 俺とて業務では最高級の言語から低級言語で書かれたライブラリを使わせてもらってる立場だし。
497 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 04:43:49 ] ちなみにマルチコアとかSIMDを使いこなして最適化コード書いたりできる人間は稀少性があるから 長い目でみれば食いっぱぐれしないよ。 今でこそ団塊COBOLerの後釜需要があったりするくらいだし (徐々にJavaや.NETに置き換わってるので将来性を考えれば微妙だが) 自動並列化ランタイム環境使えばいいとか言うだろ? そう言う考えの三流プログラマは食いっぱぐれる。間違いなく。 じゃあその並列化ランタイムは誰が書くんだと。書きもしないのに沸いてくるのかと。 最近流行のJavaScriptのJIT部分のコードでも見てみればいい。各CPU用のバイトコードの山だ。 その点、覚えさせれば小学生でも出来るような、コードをコピペして貼り合わせる能力なんて誰が評価するんだよ。 知識が無いと難しい作業こそ高い市場価値がある。 CUDAはまだ市場として育ってないがな。とがってる分、苦手なことが多すぎて。
498 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 05:31:36 ] 俺の団子が火を吹くぜ!
499 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 05:54:25 ] っていうか、電子の移動度の限界とか云々でクロックが上がらないのでフリーランチ終焉、 SIMDやマルチコアを明示的に使いこなさないと性能出ませんよ これ以上1スレッドの負荷の重たいソフト書くなよ、なんて、何年も前から言われてることなのに 「価値がなくなる」だとか何を妄言はいてるんだか。 10年後に100GHzとか200GHzとかいくのかよ。 数十コアとか数百コアになって最適化屋の需要拡大することはあっても、縮小することなんてねーよ 要するにSIMD・マルチコア使いは10年先もナウい。パネェ
500 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 06:07:53 ] 最適化できる奴は別にたくさん要らないよなぁ・・・ 結局ライブラリ作って終わりだし。 そういうライブラリがなかったり高額だったら、誰も使わないからあまり流行らないわけで、どんどん忘れ去れていく技術なだけだしなぁ・・・ GPUとは関係ないけど、MSの提唱してる技術とかかなり不発が多くて流行らずに忘れ去れてるの多いでしょ。 (スカラの)マルチコアとライバル関係だけど、運が悪いとGPU(ストリーム)の方が流行らずに終わってしまうことだってある。PCってのはそういう世界だったよな。 どうでもいいけど人柱がんばってよ
501 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 06:10:54 ] せいぜいコードコピペで済む単発案件こなしてなよ 希少価値のある技術には見えないがね。 どっちかというとコピペプログラミングこそ自動化できそうだけどなぁ お絵かきツールだけでプログラムのフロー書くASTERIAみたいなツールも出てきてるし
502 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 06:52:27 ] 既にゲーム業界では下っ端レベルからそういう技術が要求されるようになってるけどね PS3とか360やってるところなら半ば強制だぜ 脳天気でいられるのは高級言語屋とローエンド組み込みCPUソフト技術者くらい CUDAは流石に今のポジション以上の普及はないと思うよ 「汎用」ってものをわかってない。
503 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 07:00:18 ] GPGPUの【GP】に関してならLarrabeeに食われるだろうね。 たとえば普通のCを使うとして、たとえばtime.hすら使えないのがCellのSPEなら CUDAはそれ以前の問題だし
504 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:01:11 ] スニペットとかコピペってのは、結局コードのモジュール化ってことでしょ。 オブジェクト指向による再利用促進とも言うけど、それは時代の流れって言うよりもう当たり前じゃないのか? IDEとか便利だし、かゆいところは自分でコード書けばいいんじゃないか。 今の時代、30分で作れるのに一からメモ帳作る奴はよっぽどバカでしょ。
505 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:03:23 ] ああ抜けてた。 コピペって簡単に言うけど、典型コードの再利用なわけでだからこそメモ帳アプリが30分で作れる威力があるんだけど。
506 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:05:53 ] そういえば、ム板でコテ名乗ってるのは団子ぐらいしかいないよね?他にいるの?
507 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 07:23:14 ] >>504 コピペの単純工程をやるプログラマもいれば ライブラリを書くプログラマもいるわけで 法律事務所のアルバイトと弁護士くらいの格差は出てくるかもね いや、既に出来てるか
508 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:07:28 ] >>505 使い回しでメモ帳に30分ってかかりすぎだろ。3分でやれよ。 テキストコントロール配置してファイル読み書き機能付けるだけで終わりだろ IDEの雛形だけでほぼ完成なんだからさ それともGREP機能でも搭載するのか?
509 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:12:15 ] 30秒だろ #include <stdlib.h> int main(void) { system("notepad.exe"); return 0; } 再発明する価値もない。
510 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:20:05 ] 無いものを作る、あるいは既にあるものをより良くすることに知的労働の価値があるわけで 劣化コピーの再発明で金とるなど馬鹿の所業だろ。
511 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:42:01 ] >>509 ワロタw
512 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 10:28:29 ] 30分で作れる程度のエディタなんて誰も使いたくないな
513 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:06:54 ] なんでおまえらはそのうちいい情報を提供してくれそうな人を叩くんだよ
514 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:13:14 ] いい情報を提供するのが自分じゃないと気がすまないからさ。 そのために全体が遅延しても問題なし。
515 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:28:58 ] CUDAは既存の一握りのプログラムの再発明のためデバイス・言語処理系だろ。 性能はともかく効率CUDAでできることは普通のCPUでもできる。 より高いスループットを得るためにこそある。 プログラミング対象を選ぶし、性能を出すには工夫がいる。 テキストエディタの話じゃないけど、生産性を言い訳にして自分で創意工夫が出来ない奴には不向き。
516 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:38:56 ] ,,・´∀`・,,)っ-○◎● に嫉妬してるだけじゃね?
517 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 13:34:37 ] まぁ、団子は必ずしも間違ってはいないからな。 CUDAに未来はないかもしれないけれど、OpenCLはAMDも担いでいるからもう少し生き延びるだろうし。
518 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 19:05:27 ] OpenCL(笑) なんかの魔法の言語のように思ってないか? OpenCLは「GPU版Java」じゃない。 共通化されてるのは言語の基本仕様の部分だけで、細かいところは処理系依存。 んでもって、CUDAやCAL/Brook+のプログラミングの敷居を高くしてるのは言語処理系じゃなくて 少ないスクラッチパッドメモリとレイテンシの大きいメモリと やたら小回りが利かないベクタ演算ユニット、その他諸々のGPUのパイプライン・・・ 要するにシェーダコアの構成そのものにあるのであって、それが解消されない限り CPUを置き換えて普及していくことなどあり得ない。 普通のCPUと同じ定番言語のC/C++言語をまがりなりにもサポートしてるのに 業界の評価のお寒いCellを見れば、課題は言語じゃなくて汎用プロセッサとしての 柔軟性にあることくらいわかるだろ? その意味、OpenCLを効率良く実行できるのはよりCPUに近いLarrabeeだと思うよ。 というか本質的にOpenCLなんて要らない。 どうせCellなんかと同じくハード専用にカリカリにチューニングしなきゃいけないんだし。
519 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 19:35:29 ] >>518 世の中それほどぎりぎりのチューニングまではしないけどちょっとは速く走って欲しいなんて用途が結構あるのよ。 で、私自身はOpenCLはAMDが必死こいてアピールしているだけで実際には普及しないと思っているのよね。 どうせLarrabee出て来る頃にはCtも来ているだろうから、NVIDIAもAMDも青息吐息でしょ。 まぁ、CUDAスレなんだからLarrabeeの待つ未来を語るのは程々にしましょ。
520 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 19:58:15 ] 期待してなんか無いよ。 Cellと同じくニッチ市場を食い合うだけ。
521 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 20:55:32 ] ゲーム屋の意見としては、SPUの数とメモリが倍あったらCellも悪くないと思う。 あとはメモリのバンド幅か。 柔軟性もあったら嬉しいけどね(整数や分岐とか)。
522 名前:デフォルトの名無しさん mailto:sage [2009/03/10(火) 04:01:00 ] >期待してなんか無いよ。 おっと、だんごさんの悪口はそこまでだ
523 名前:デフォルトの名無しさん [2009/03/11(水) 03:05:50 ] >やたら小回りが利かないベクタ演算ユニット、その他諸々のGPUのパイプライン・・・ Crayだってそうだったじゃん。Personal CrayとしてCUDAは良く出来てると 思うけど。 メモリの不自由な階層は何とかしてくれ、と思うけど。Cray同様、IPも持って 一般I/Oも出来て欲しい。 あと出張先でデモ出来るように、CUDAの動くnVidia GPU載ったサブノート が出てくれないと…。学会発表しようにも、デスクトップ担いで持参しなきゃ ならんってのは勘弁。
524 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/11(水) 03:24:55 ] つ[Asus N10]
525 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 11:31:57 ] つ[新Mac Book]
526 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/11(水) 22:47:25 ] いや、でも、アカデミック畑の人の求める特化型プロセッサって一般のニーズとかけ離れてると思うよ。 CellやGRAPE-DRでワードやエクセルが動くかっつーの。 当たり前だけどアカデミック色の薄いアプリケーションって書く人少ないのよね。 サンプル探しにCUDA-Zone逝っても「なんとか論文ps.gz」みたいなのしかないし
527 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 23:01:58 ] ここにアカデミック色の殆どないアプリケーションを書いている人が居るんだが、 残念なことに特定用途向けだし契約の都合もあるんで公開できないんだわさ。
528 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 23:04:35 ] アカデミック色って例えば何? ブラックホールのシミュレーションとか?
529 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/11(水) 23:08:18 ] 俺も書いてたよ NVIDIAの営業さんじきじきに頼まれたがめんどくさくなった
530 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/11(水) 23:09:07 ] >>528 そういえばGRAPEのコミュニティではCUDAはやたら受けが良いらしいね。
531 名前:デフォルトの名無しさん [2009/03/12(木) 19:48:28 ] >>523 モバイルCUDA環境が欲しくてN10jc買った 性能は ./nbody -benchmarkで16.472GFLOP/s ./nbodyでタイトルバーにでるやつだと80GFLOP/sくらい
532 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/12(木) 21:20:13 ] 割と出るんだね 大学時代にやった熱力学シミュレーションのレポートをまた引っ張り出してきてCUDAで実装してみるかな。 Rubyで書いたらアホみたいに遅くてC++で書き直した覚えがある。
533 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:33:06 ] Rubyで書いてCより性能でればいいのにね。無理言うなって感じだが
534 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:52:39 ] アルゴリズムが悪いんじゃないの。
535 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 01:58:40 ] まさに「グリッド」(格子点)だよ。 アホみたいに並列化しないと性能出ないCUDAには向いた問題
536 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 02:20:43 ] RubyはCでかかれたインタプリタであって、 1語句ごとにループ・switch文で処理を行う以上 それ自体の致命的な遅さはどうしようもない。 YARVとかJRubyなら多少速いかも知れんが 本家はまだJIT以前の問題だし。 Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。
537 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 02:50:22 ] 団子の中の人って、大学逝ってたんだ。 >>531 意外とやるな。電池で動いてそれなら上出来だと思う。 ARM+DSPでは桁違いに負けてると思う。しかし、所詮 ネトブクに毛が生えただけなのに、ThinkPad Xシリーズ より重いのか。 Linux対応はどない? EeePCのLinux対応はすこぶる良 かったから期待してるのだが。
538 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 08:17:53 ] >>537 CentOS5.2はおk サウンドは自分でドライバ当てる必要あり 無線LANは認識してる (ドライバ入れてないから使えるかどうかは不明 あとはカメラと指紋認証が使えないくらい 他の鳥は試してないからわからん BIOSでHT切れないのが気持ち悪い
539 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 10:27:16 ] >>537 金を気にしないならネットブックは辞めたほうがいい。 1024x600は割と不便。 EeeUbuntuなら、最初からEeePC向けのカメラやBluetoothの設定ユーティリティが インストール済みだが。
540 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 22:33:58 ] >Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。 いつ? >YARVとかJRubyなら多少速いかも知れんが >本家はまだJIT以前の問題だし。 YARVはすでにRuby本家だけど?
541 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 22:38:08 ] >>540 www.rubyist.net/~matz/20070116.html#p04
542 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 22:41:31 ] 参考になるかもしれない、じゃん
543 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 23:25:23 ] >>541 リンク先読んだが、Xbyakじゃなくて「Gecko 3.0にはJIT付きJavaScriptエンジンが添付されるということだが」が、将来の参考になるという風にしか読めないんだが・・・ 2007年の時点なら、Matz氏がRuby用のJITについて参考にするという文脈なら、XbyakじゃなくてYARVのJITが暗黙でしょ。
544 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 23:50:07 ] 別に"へるみエンジン"を検討してるなんて言ってないが 「JIT」としか言ってねーよ
545 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 00:21:40 ] JITじゃなくて、「「いずれは考えなきゃいけない」的」と「参考になるかもしれない」は違うだろって話でしょ? あと、 >YARVはすでにRuby本家だけど? についてはノーコメントのなの?
546 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 00:33:17 ] YARVはJIT実装があったろ? あれこそ亜流だけど
547 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 00:39:52 ] >>545 ちなみにYARVとか鬼車のJITは環境非依存の中間コードに変換するだけであって CPUネイティブじゃないよ。 んで更にそのバイトコードをインタプリタで動かしてる。 ネイティブコードのJITに言及したのは↓だけ > _ [言語] IA32(x86)JITアセンブラ Xbyak
548 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 00:41:52 ] ま、Rubyが動かせそうなGPUはLarrabeeが最初で最後だろうな
549 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 01:01:14 ] いつJITの実装の話になったんだ。 話そらすのが上手いなww そもそもMatz氏はXbyakについて「「いずれは考えなきゃいけない」的」な事は言ってないので(参考にするのはGecko 3.0の方)、>>541 以降のお団子さんのコメントは見当違い。
550 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 01:08:02 ] Xbyakを採用するなんて俺は言ってないし君が勝手に勘違いしただけでしょ
551 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 01:14:17 ] もともとはRubyがC++よりクソ遅いって当たり前の話だろ。 スクリプト言語が静的コンパイル言語を超えられる訳がない それだけのことよ
552 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 02:39:35 ] 団子、いい加減にしろ。最近のお前はオカシイぞ。 形式言語より、日本語勉強し直せ。マジで。 コミュ力無さ過ぎ。
553 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 02:50:01 ] 自分が思考短絡してるのを棚に上げて他人を避難するヴァカがいると聞いて
554 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 03:08:30 ] 自己紹介、乙。 そんなヴァカ呼んでないから、「避難」してこい。
555 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 04:45:16 ] テンプレ入りか > Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。
556 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 04:46:34 ] コテ団子の相手はするな。キチガイになっちまうぞ!
557 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 05:44:29 ] >>553 自分の技術力をいくら上げても、無責任な発言ばかりしていると誰も君のことを信用しなくなるよ。気をつけたほうがいいと思う。
558 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/14(土) 11:15:53 ] 「JIT」について話してるのに 一番近くにある単語「Xbyak」を「検討」ということにしたがる思考短絡ぶりがゆとり脳
559 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/14(土) 11:18:59 ] Matz氏はXbyak見て(JITの仕組みを)「いずれは考えなきゃいけない」的なこと言ってたんだけどね。 これでいいかな?
560 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/14(土) 11:46:40 ] 温度分布の立体グラフをExcelでプロットしたいんだが、なんかいい方法ある? 俺もゆとりだからCSVで吐き出して読み出すとか原始的な方法しか思いつかない
561 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 12:10:49 ] 隔離スレなのか、ここはw
562 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 15:18:59 ] >>560 Excelなんかを使いたいなら、csvでいいんでない? つーか、団子もそれに噛み付く奴も自分の言葉が足りてないことに気付けよ。
563 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 18:37:07 ] ここはグダスレじゃないぽ
564 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/14(土) 18:39:25 ] くだをまくスレです
565 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 20:57:56 ] どのスレでもゆとり脳の団子が来ると荒れる。 そして人がいなくなる。
566 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 21:02:45 ] まだゆとりがどうのこうの言ってる時代錯誤な奴がいるのか
567 名前:デフォルトの名無しさん [2009/03/14(土) 21:06:25 ] おまえはヒマになると2ch開いてるだろ?w
568 名前:デフォルトの名無しさん mailto:sage [2009/03/14(土) 21:29:38 ] お前は○○だろ ↑↑自分がそうだから他人も同じだと思っている奴の決まり文句
569 名前:デフォルトの名無しさん mailto:sage [2009/03/15(日) 01:33:02 ] ○○な>>568
570 名前:デフォルトの名無しさん mailto:sage [2009/03/16(月) 00:57:27 ] Vista x64 Device 0: "GeForce 9600M GT" 4096 bodies, total time for 100 iterations: 663.110 ms = 2.530 billion interactions per second = 50.602 GFLOP/s at 20 flops per interaction