【GPGPU】NVIDIA CUDA質問スレッド at TECH
[2ch|▼Menu]
25:デフォルトの名無しさん
07/10/15 12:09:23
>>24
状況はわかったけど最後の方で言ってる意味が良くわからん…俺の頭がヘタレなのか。

今のとこ、並列で集計処理するのに一番早そうかなって思ってるのはデータを半分ずつ加算してく方法。
例えば処理したいデータがnコなら、n/2コのスレッドで2コずつデータ加算。後はリカーシブにやる。
(めんどいからとりあえずnは偶数としてね)
これならlog_2 nのオーダーで集計出来んじゃね?ってかんじ。

実装したことないがスレッド数が変わるのが厄介かな…今は
if(tx==0) {
 for(i=0;i<BLOCKSIZE;i++)
  sum+=data[i];
}
みたいに横着してる。他で十分高速化してるんでとりあえず後回し中。


次ページ
続きを表示
1を表示
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

4426日前に更新/252 KB
担当:undef