- 24 名前:4 mailto:sage [2007/10/12(金) 19:29:53 ]
- >>21
>20の処理は、最初に定数テーブルを仕込んでおいて幾つかパラメータを渡して計算させるのがメイン。 >20に書いているのは最後の集計部なんだけど、結果はarとaiに入るのでそれを転送するだけ。 集計をGPUにやらせられないとなるとtmpを転送しなければならないので、それをなんとかしたかったわけ。 で、未だその後修正掛けていないけど、begin, endのペアをidxの値の分だけを定数テーブルに 仕込んで置けることが判ったからなんとかなりそう。そうすればidxの値の分だけ並列に走らせられることだし。
|

|