【GPGPU】くだすれCUDAスレ【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 05/09 17:28 / Filesize : 215 KB / Number-of Response : 912
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2008/03/22(土) 11:13:52 ]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
www.nvidia.com/cuda

関連スレ
【GPGPU】NVIDIA CUDA質問スレッド
pc11.2ch.net/test/read.cgi/tech/1190008468/
GPUで汎用コンピューティングを行うスレ
pc11.2ch.net/test/read.cgi/tech/1167989627/
GPGPU#2
pc11.2ch.net/test/read.cgi/tech/1188374938/
501 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 06:10:54 ]: せいぜいコードコピペで済む単発案件こなしてなよ
希少価値のある技術には見えないがね。

どっちかというとコピペプログラミングこそ自動化できそうだけどなぁ
お絵かきツールだけでプログラムのフロー書くASTERIAみたいなツールも出てきてるし
502 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 06:52:27 ]: 既にゲーム業界では下っ端レベルからそういう技術が要求されるようになってるけどね
PS3とか360やってるところなら半ば強制だぜ
脳天気でいられるのは高級言語屋とローエンド組み込みCPUソフト技術者くらい

CUDAは流石に今のポジション以上の普及はないと思うよ
「汎用」ってものをわかってない。
503 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 07:00:18 ]: GPGPUの【GP】に関してならLarrabeeに食われるだろうね。
たとえば普通のCを使うとして、たとえばtime.hすら使えないのがCellのSPEなら
CUDAはそれ以前の問題だし
504 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:01:11 ]: スニペットとかコピペってのは、結局コードのモジュール化ってことでしょ。
オブジェクト指向による再利用促進とも言うけど、それは時代の流れって言うよりもう当たり前じゃないのか？
IDEとか便利だし、かゆいところは自分でコード書けばいいんじゃないか。
今の時代、３０分で作れるのに一からメモ帳作る奴はよっぽどバカでしょ。
505 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:03:23 ]: ああ抜けてた。

コピペって簡単に言うけど、典型コードの再利用なわけでだからこそメモ帳アプリが３０分で作れる威力があるんだけど。
506 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 07:05:53 ]: そういえば、ム板でコテ名乗ってるのは団子ぐらいしかいないよね？他にいるの？
507 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 07:23:14 ]: >>504
コピペの単純工程をやるプログラマもいれば
ライブラリを書くプログラマもいるわけで

法律事務所のアルバイトと弁護士くらいの格差は出てくるかもね
いや、既に出来てるか
508 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:07:28 ]: >>505
使い回しでメモ帳に30分ってかかりすぎだろ。3分でやれよ。
テキストコントロール配置してファイル読み書き機能付けるだけで終わりだろ
IDEの雛形だけでほぼ完成なんだからさ

それともGREP機能でも搭載するのか？
509 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:12:15 ]: 30秒だろ

#include <stdlib.h>
int main(void) { system("notepad.exe"); return 0; }

再発明する価値もない。
510 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:20:05 ]: 無いものを作る、あるいは既にあるものをより良くすることに知的労働の価値があるわけで
劣化コピーの再発明で金とるなど馬鹿の所業だろ。
511 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 09:42:01 ]: >>509
ワロタｗ
512 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 10:28:29 ]: 30分で作れる程度のエディタなんて誰も使いたくないな
513 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:06:54 ]: なんでおまえらはそのうちいい情報を提供してくれそうな人を叩くんだよ
514 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:13:14 ]: いい情報を提供するのが自分じゃないと気がすまないからさ。
そのために全体が遅延しても問題なし。
515 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:28:58 ]: CUDAは既存の一握りのプログラムの再発明のためデバイス・言語処理系だろ。
性能はともかく効率CUDAでできることは普通のCPUでもできる。
より高いスループットを得るためにこそある。
プログラミング対象を選ぶし、性能を出すには工夫がいる。

テキストエディタの話じゃないけど、生産性を言い訳にして自分で創意工夫が出来ない奴には不向き。
516 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 12:38:56 ]: ,,・´∀｀・,,）っ-○◎●　に嫉妬してるだけじゃね？
517 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 13:34:37 ]: まぁ、団子は必ずしも間違ってはいないからな。
CUDAに未来はないかもしれないけれど、OpenCLはAMDも担いでいるからもう少し生き延びるだろうし。
518 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 19:05:27 ]: OpenCL（笑）

なんかの魔法の言語のように思ってないか？
OpenCLは「GPU版Java」じゃない。
共通化されてるのは言語の基本仕様の部分だけで、細かいところは処理系依存。

んでもって、CUDAやCAL/Brook+のプログラミングの敷居を高くしてるのは言語処理系じゃなくて
少ないスクラッチパッドメモリとレイテンシの大きいメモリと
やたら小回りが利かないベクタ演算ユニット、その他諸々のGPUのパイプライン・・・
要するにシェーダコアの構成そのものにあるのであって、それが解消されない限り
CPUを置き換えて普及していくことなどあり得ない。

普通のCPUと同じ定番言語のC/C++言語をまがりなりにもサポートしてるのに
業界の評価のお寒いCellを見れば、課題は言語じゃなくて汎用プロセッサとしての
柔軟性にあることくらいわかるだろ？

その意味、OpenCLを効率良く実行できるのはよりCPUに近いLarrabeeだと思うよ。
というか本質的にOpenCLなんて要らない。
どうせCellなんかと同じくハード専用にカリカリにチューニングしなきゃいけないんだし。
519 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 19:35:29 ]: >>518
世の中それほどぎりぎりのチューニングまではしないけどちょっとは速く走って欲しいなんて用途が結構あるのよ。
で、私自身はOpenCLはAMDが必死こいてアピールしているだけで実際には普及しないと思っているのよね。
どうせLarrabee出て来る頃にはCtも来ているだろうから、NVIDIAもAMDも青息吐息でしょ。

まぁ、CUDAスレなんだからLarrabeeの待つ未来を語るのは程々にしましょ。
520 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/09(月) 19:58:15 ]: 期待してなんか無いよ。
Cellと同じくニッチ市場を食い合うだけ。
521 名前：デフォルトの名無しさん mailto:sage [2009/03/09(月) 20:55:32 ]: ゲーム屋の意見としては、SPUの数とメモリが倍あったらCellも悪くないと思う。
あとはメモリのバンド幅か。
柔軟性もあったら嬉しいけどね（整数や分岐とか）。
522 名前：デフォルトの名無しさん mailto:sage [2009/03/10(火) 04:01:00 ]: >期待してなんか無いよ。
おっと、だんごさんの悪口はそこまでだ
523 名前：デフォルトの名無しさん [2009/03/11(水) 03:05:50 ]: >やたら小回りが利かないベクタ演算ユニット、その他諸々のGPUのパイプライン・・・
Crayだってそうだったじゃん。Personal CrayとしてCUDAは良く出来てると
思うけど。
メモリの不自由な階層は何とかしてくれ、と思うけど。Cray同様、IPも持って
一般I/Oも出来て欲しい。
あと出張先でデモ出来るように、CUDAの動くnVidia GPU載ったサブノート
が出てくれないと…。学会発表しようにも、デスクトップ担いで持参しなきゃ
ならんってのは勘弁。
524 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/11(水) 03:24:55 ]: つ[Asus N10]
525 名前：デフォルトの名無しさん mailto:sage [2009/03/11(水) 11:31:57 ]: つ[新Mac Book]
526 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/11(水) 22:47:25 ]: いや、でも、アカデミック畑の人の求める特化型プロセッサって一般のニーズとかけ離れてると思うよ。
CellやGRAPE-DRでワードやエクセルが動くかっつーの。

当たり前だけどアカデミック色の薄いアプリケーションって書く人少ないのよね。
サンプル探しにCUDA-Zone逝っても「なんとか論文ps.gz」みたいなのしかないし
527 名前：デフォルトの名無しさん mailto:sage [2009/03/11(水) 23:01:58 ]: ここにアカデミック色の殆どないアプリケーションを書いている人が居るんだが、
残念なことに特定用途向けだし契約の都合もあるんで公開できないんだわさ。
528 名前：デフォルトの名無しさん mailto:sage [2009/03/11(水) 23:04:35 ]: アカデミック色って例えば何？
ブラックホールのシミュレーションとか？
529 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/11(水) 23:08:18 ]: 俺も書いてたよ
NVIDIAの営業さんじきじきに頼まれたがめんどくさくなった
530 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/11(水) 23:09:07 ]: >>528
そういえばGRAPEのコミュニティではCUDAはやたら受けが良いらしいね。
531 名前：デフォルトの名無しさん [2009/03/12(木) 19:48:28 ]: >>523
モバイルCUDA環境が欲しくてN10jc買った
性能は
./nbody -benchmarkで16.472GFLOP/s
./nbodyでタイトルバーにでるやつだと80GFLOP/sくらい
532 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/12(木) 21:20:13 ]: 割と出るんだね

大学時代にやった熱力学シミュレーションのレポートをまた引っ張り出してきてCUDAで実装してみるかな。
Rubyで書いたらアホみたいに遅くてC++で書き直した覚えがある。
533 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:33:06 ]: Rubyで書いてCより性能でればいいのにね。無理言うなって感じだが
534 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:52:39 ]: アルゴリズムが悪いんじゃないの。
535 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/13(金) 01:58:40 ]: まさに「グリッド」（格子点）だよ。
アホみたいに並列化しないと性能出ないCUDAには向いた問題
536 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/13(金) 02:20:43 ]: RubyはCでかかれたインタプリタであって、
1語句ごとにループ・switch文で処理を行う以上
それ自体の致命的な遅さはどうしようもない。

YARVとかJRubyなら多少速いかも知れんが
本家はまだJIT以前の問題だし。
Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。
537 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 02:50:22 ]: 団子の中の人って、大学逝ってたんだ。

>>531
意外とやるな。電池で動いてそれなら上出来だと思う。
ARM+DSPでは桁違いに負けてると思う。しかし、所詮
ネトブクに毛が生えただけなのに、ThinkPad Xシリーズ
より重いのか。
Linux対応はどない? EeePCのLinux対応はすこぶる良
かったから期待してるのだが。
538 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 08:17:53 ]: >>537
CentOS5.2はおk
サウンドは自分でドライバ当てる必要あり
無線LANは認識してる
（ドライバ入れてないから使えるかどうかは不明
あとはカメラと指紋認証が使えないくらい

他の鳥は試してないからわからん

BIOSでHT切れないのが気持ち悪い
539 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 10:27:16 ]: >>537
金を気にしないならネットブックは辞めたほうがいい。
1024x600は割と不便。

EeeUbuntuなら、最初からEeePC向けのカメラやBluetoothの設定ユーティリティが
インストール済みだが。
540 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 22:33:58 ]: >Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。

いつ？

>YARVとかJRubyなら多少速いかも知れんが
>本家はまだJIT以前の問題だし。

YARVはすでにRuby本家だけど？
541 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/13(金) 22:38:08 ]: >>540
www.rubyist.net/~matz/20070116.html#p04
542 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 22:41:31 ]: 参考になるかもしれない、じゃん
543 名前：デフォルトの名無しさん mailto:sage [2009/03/13(金) 23:25:23 ]: >>541
リンク先読んだが、Xbyakじゃなくて「Gecko 3.0にはJIT付きJavaScriptエンジンが添付されるということだが」が、将来の参考になるという風にしか読めないんだが・・・
2007年の時点なら、Matz氏がRuby用のJITについて参考にするという文脈なら、XbyakじゃなくてYARVのJITが暗黙でしょ。
544 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/13(金) 23:50:07 ]: 別に"へるみエンジン"を検討してるなんて言ってないが
「JIT」としか言ってねーよ
545 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 00:21:40 ]: JITじゃなくて、「「いずれは考えなきゃいけない」的」と「参考になるかもしれない」は違うだろって話でしょ？
あと、
>YARVはすでにRuby本家だけど？
についてはノーコメントのなの？
546 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 00:33:17 ]: YARVはJIT実装があったろ？
あれこそ亜流だけど
547 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 00:39:52 ]: >>545
ちなみにYARVとか鬼車のJITは環境非依存の中間コードに変換するだけであって
CPUネイティブじゃないよ。
んで更にそのバイトコードをインタプリタで動かしてる。

ネイティブコードのJITに言及したのは↓だけ

> _ [言語] IA32(x86)JITアセンブラ Xbyak
548 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 00:41:52 ]: ま、Rubyが動かせそうなGPUはLarrabeeが最初で最後だろうな
549 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 01:01:14 ]: いつJITの実装の話になったんだ。
話そらすのが上手いなｗｗ

そもそもMatz氏はXbyakについて「「いずれは考えなきゃいけない」的」な事は言ってないので（参考にするのはGecko 3.0の方）、>>541以降のお団子さんのコメントは見当違い。
550 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 01:08:02 ]: Xbyakを採用するなんて俺は言ってないし君が勝手に勘違いしただけでしょ
551 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 01:14:17 ]: もともとはRubyがC++よりクソ遅いって当たり前の話だろ。
スクリプト言語が静的コンパイル言語を超えられる訳がない
それだけのことよ
552 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 02:39:35 ]: 団子、いい加減にしろ。最近のお前はオカシイぞ。
形式言語より、日本語勉強し直せ。マジで。
コミュ力無さ過ぎ。
553 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 02:50:01 ]: 自分が思考短絡してるのを棚に上げて他人を避難するｳﾞｧｶがいると聞いて
554 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 03:08:30 ]: 自己紹介、乙。
そんなヴァカ呼んでないから、「避難」してこい。
555 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 04:45:16 ]: テンプレ入りか
> Matz氏はXbyak見て「いずれは考えなきゃいけない」的なこと言ってたんだけどね。
556 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 04:46:34 ]: コテ団子の相手はするな。キチガイになっちまうぞ！
557 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 05:44:29 ]: >>553
自分の技術力をいくら上げても、無責任な発言ばかりしていると誰も君のことを信用しなくなるよ。気をつけたほうがいいと思う。
558 名前：,,・´∀｀・,,）っ-●◎○ mailto:sage [2009/03/14(土) 11:15:53 ]: 「JIT」について話してるのに
一番近くにある単語「Xbyak」を「検討」ということにしたがる思考短絡ぶりがゆとり脳
559 名前：,,・´∀｀・,,）っ-●◎○ mailto:sage [2009/03/14(土) 11:18:59 ]: Matz氏はXbyak見て（JITの仕組みを）「いずれは考えなきゃいけない」的なこと言ってたんだけどね。

これでいいかな？
560 名前：,,・´∀｀・,,）っ-●◎○ mailto:sage [2009/03/14(土) 11:46:40 ]: 温度分布の立体グラフをExcelでプロットしたいんだが、なんかいい方法ある？
俺もゆとりだからCSVで吐き出して読み出すとか原始的な方法しか思いつかない
561 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 12:10:49 ]: 隔離スレなのか、ここはw
562 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 15:18:59 ]: >>560
Excelなんかを使いたいなら、csvでいいんでない?

つーか、団子もそれに噛み付く奴も自分の言葉が足りてないことに気付けよ。
563 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 18:37:07 ]: ここはグダスレじゃないぽ
564 名前：,,・´∀｀・,,）っ-○◎● mailto:sage [2009/03/14(土) 18:39:25 ]: くだをまくスレです
565 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 20:57:56 ]: どのスレでもゆとり脳の団子が来ると荒れる。
そして人がいなくなる。
566 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 21:02:45 ]: まだゆとりがどうのこうの言ってる時代錯誤な奴がいるのか
567 名前：デフォルトの名無しさん [2009/03/14(土) 21:06:25 ]: おまえはヒマになると２ｃｈ開いてるだろ？ｗ
568 名前：デフォルトの名無しさん mailto:sage [2009/03/14(土) 21:29:38 ]: お前は○○だろ

↑↑自分がそうだから他人も同じだと思っている奴の決まり文句
569 名前：デフォルトの名無しさん mailto:sage [2009/03/15(日) 01:33:02 ]: ○○な>>568
570 名前：デフォルトの名無しさん mailto:sage [2009/03/16(月) 00:57:27 ]: Vista x64
Device 0: "GeForce 9600M GT"
4096 bodies, total time for 100 iterations: 663.110 ms
= 2.530 billion interactions per second
= 50.602 GFLOP/s at 20 flops per interaction
571 名前：デフォルトの名無しさん mailto:sage [2009/03/27(金) 14:21:17 ]: >>567
暇じゃなくても開いてるわボケ
572 名前：デフォルトの名無しさん mailto:sage [2009/03/27(金) 14:35:28 ]: 忙しいときほど2ch開いちゃう、ふしぎっ
573 名前：デフォルトの名無しさん mailto:sage [2009/03/30(月) 08:24:15 ]: ■後藤弘茂のWeekly海外ニュース■
KhronosがGDCでGPUやCell B.E.をサポートするOpenCLのデモを公開
pc.watch.impress.co.jp/docs/2009/0330/kaigai497.htm
574 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 02:16:00 ]: 素人質問で恐縮ですが……
Tesla C870を手に入れたのでCUDAで画像処理をしようとしているのですが、
CUDAでテクスチャフィルタリングユニットの機能を使うにはどうすればいいですか？
○○の○ページを嫁！で構いませんので、教えて下さい。
575 名前：,,・´∀｀・,,）っ-●◎○ mailto:sage [2009/04/02(木) 02:20:44 ]: tex.filterMode = cudaFilterModePoint;
576 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 05:33:53 ]: ＞Tesla C870を手に入れたのでCUDAで画像処理をしようとしているのですが、
あー、8800GTXからアナログ回路を減らしてメモリを増やした、最早今となっては1万円ちょっとで買える
8800GTと数割程度しか能力の変わらない癖に値段は10倍以上と言う代物ですね。

テクスチャ関係は私はやってないからお役に立てませんがw
577 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 19:49:08 ]: MV探すのに16x16のSADをCUDAで計算してるんだけど、なんでこんなに遅いんですか？
578 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 23:51:01 ]: 組み方が悪いんでしょ。
579 名前：デフォルトの名無しさん mailto:sage [2009/04/03(金) 00:09:14 ]: SADするのに、組み方どうこうとかあるんですか？
テクスチャ使ってるのに、なんかキャッシュミス多い感じだし。。。
580 名前：デフォルトの名無しさん mailto:sage [2009/04/03(金) 00:29:06 ]: >>575
ありがとうございます。
cudaFilterModePointでググったら、それらしいものが見つかりました。
ttp://forum.nvidia.co.jp/EokpControl?&tid=10733&event=QE0004
これから勉強します。
581 名前：デフォルトの名無しさん mailto:sage [2009/04/03(金) 10:15:13 ]: >>579
コードも晒さず、自分の無知を曝け出し、文句だけ言うなんて、馬鹿なの?
582 名前：デフォルトの名無しさん mailto:sage [2009/04/08(水) 12:16:06 ]: なんでこう沸点低いの？馬鹿なの？
583 名前：デフォルトの名無しさん mailto:sage [2009/04/14(火) 20:59:29 ]: ION採用ミニデスクトップAcer AspireRevo、オンライン予約開始
japanese.engadget.com/2009/04/14/ion-acer-aspirerevo/
584 名前：デフォルトの名無しさん mailto:sage [2009/04/15(水) 18:41:51 ]: Mac用の2.1ってツールちゃんと入ってる？
585 名前：デフォルトの名無しさん mailto:sage [2009/04/16(木) 23:29:47 ]: 誰かN10JでCUDA使ってる人いる？
N10Jにtool kitインスコしようとすると失敗するんだけど。。。
586 名前：デフォルトの名無しさん mailto:sage [2009/04/18(土) 23:08:34 ]: 今、ブロック数を増やして並列度をあげてみるといったことを
作った行列の積の計算にあててみようと思ったんだが

tech.ckme.co.jp/cuda_diff.shtml
に書いてるブロックを複数使った場合の問題は、カーネル内でブロック間の同期を
とる方法が存在しない点である。そのため、下記のプログラムでは、1回計算するたびに、
カーネルを終了し同期をとっている。

というのは1回毎の計算をホストにコピーしてやりたい回数分ループさせるというので
いいのかな？
587 名前：デフォルトの名無しさん mailto:sage [2009/04/19(日) 00:37:24 ]: >>586
いちいちホストにデータ転送してたら時間もったいないでしょ？

つか参考にしてるページ見たけど、かなり酷いコードなんだが。。。
>>586が何をしたいかが具体的に判らないから、アドバイスしづらい。
588 名前：デフォルトの名無しさん mailto:sage [2009/04/19(日) 02:08:47 ]: １ブロックの最大スレッド数を使った計算じゃ、GPUの処理速度がCPUに対して上回らなかったので
ブロック数を増やして計算しようと思ったんですが、１ブロック制限に到達した時、どうやって次のブロックに
移動すんのかが、記述の仕方がかなりよくわからないんです。

dim3 grid(16, 1, 1);
dim3 threads( 512, 1, 1);

testKernel<<< grid, threads, mem_size*2+sizeof( float)*2 >>>( d_idata, d_odata);

カーネルのほうの計算にこの値を元に何か記述すればいいとはわかってるんですが・・・
何か参考になるとこありませんか？
589 名前：デフォルトの名無しさん mailto:sage [2009/04/19(日) 03:34:08 ]: >>588
大いに勘違いしている希ガス。
先ず第一に、>586のサイトは参考にならない。
第二に、スレッド数は必ずしも多いほど速いと言う訳ではないし、共有メモリは使わないで済むなら使わない方がいい。
第三に、行列の積の計算なら、NVIDIAのプログラミングガイドにそれなりのサンプルがある。
590 名前：デフォルトの名無しさん mailto:sage [2009/04/19(日) 21:23:36 ]: >>589
レスサンクス、ガイドとＳＤＫもう一回見てきます
591 名前：デフォルトの名無しさん mailto:sage [2009/04/20(月) 22:01:56 ]: CUDAスレって何でこんなに勢いが弱いの？
592 名前：デフォルトの名無しさん mailto:sage [2009/04/20(月) 23:13:01 ]: ぶっちゃけ2年後位には廃れてると思うからやる気がしない
日本語資料少ないし

.netでもやってる方がつぶしがきく
593 名前：デフォルトの名無しさん mailto:sage [2009/04/21(火) 14:56:41 ]: そうか、ＧＰＧＰＵだと他にまともな環境はないだろ
594 名前：,,・´∀｀・,,）っ-○◎○ mailto:sage [2009/04/21(火) 20:06:27 ]: GPUにこだわる意味がないっていう
595 名前：デフォルトの名無しさん [2009/04/21(火) 20:59:48 ]: みんなcellで思い知っただろ？
そういうことだ。
596 名前：,,・´∀｀・,,）っ-○◎○ mailto:sage [2009/04/22(水) 05:34:39 ]: .NETかGPGPUか選べる立場なら前者でいいんでない？
宗教上の理由でGPUの中でしか選択できない人がいるのももちろん知っております
597 名前：,,・´∀｀・,,）っ-○◎○ mailto:sage [2009/04/22(水) 05:44:26 ]: 強いて言えばOpenCLか？
www.nvidia.com/object/io_1240224603372.html
598 名前：デフォルトの名無しさん mailto:sage [2009/04/22(水) 12:06:34 ]: ドトネトなんてLinuxで動かないじゃん。
*BSDでも動かない。糞。

とにかくGCCで動くようにしろよ。話はそれからだ。
599 名前：デフォルトの名無しさん mailto:sage [2009/04/22(水) 16:21:07 ]: .NETはmonaで動くだろ
600 名前：デフォルトの名無しさん mailto:sage [2009/04/22(水) 16:25:47 ]: ﾓﾅｰ
601 名前：デフォルトの名無しさん mailto:sage [2009/04/22(水) 17:03:27 ]: .NETはMONOで動くが、GCCで.NETアプリってコンパイルできたっけ？

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef