- 591 名前:493 mailto:sage [2013/11/25(月) 15:27:38.56 ]
- またよくわからない状態になったので再度質問に来ました。
よろしくお願いします。(過去の質問>>493 >>521) 以前の状態からいろいろやってみて二次元配列においてCUDAを用いて 数値探索をできるようになったのですがどうも領域の確保というか ブロックやスレッドの使い方が理解できずスレッドの最大数(?)である 512個以上のデータを扱おうとした場合に正しくない結果が出てしまう状態になってしました。 そもそも使っているのがthreadIdx.xだけでそこに代用として blockDim.x*blockIdx.x + threadIdx.xなどを入れてみてやったところ 一定周期でソートされていて全体ではソートされていないという出力になってしました。 まだよくわかったないことが多いですが512以上のデータを扱う場合に どのようブロックなどを扱えばよいのでしょうか?
|

|