- 588 名前:デフォルトの名無しさん mailto:sage [2009/04/19(日) 02:08:47 ]
- 1ブロックの最大スレッド数を使った計算じゃ、GPUの処理速度がCPUに対して上回らなかったので
ブロック数を増やして計算しようと思ったんですが、1ブロック制限に到達した時、どうやって次のブロックに 移動すんのかが、記述の仕方がかなりよくわからないんです。 dim3 grid(16, 1, 1); dim3 threads( 512, 1, 1); testKernel<<< grid, threads, mem_size*2+sizeof( float)*2 >>>( d_idata, d_odata); カーネルのほうの計算にこの値を元に何か記述すればいいとはわかってるんですが・・・ 何か参考になるとこありませんか?
|

|