[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 07/04 21:41 / Filesize : 200 KB / Number-of Response : 849
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

GPGPU



1 名前:デフォルトの名無しさん mailto:sage [2005/10/08(土) 23:15:20 ]
いつの間にやらCPUを超える演算性能を持ってしまったGPUに計算させてみるという
GPGPUについて語りましょう

参考リンク

総本山? gpgpu.org
www.gpgpu.org/
GPUをCPU的に活用するGPGPUの可能性
pcweb.mycom.co.jp/articles/2005/09/06/siggraph2/


601 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 09:50:02 ]
BrookGPUで各ユニットで共通の変数を利用したい場合ってどうすればいいのでしょうか?

例えば、
for(int i=0; i<128; i++)
out[i]=i;


for(int i=0; i<128; i++)
out[i]=out[i]+5;

このようなパターンです。

602 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 09:55:56 ]
>>601
まず、後者の場合、reduceを使う

void reduce sum(reduce float res<>){
res=res+5;
}
こんな感じ

前者の場合。
イテレーターを使うんだと思うんだけど、ちょっと俺にもわからん。


603 名前:602 mailto:sage [2007/04/27(金) 09:57:59 ]
って、うわ・・・
後者も間違ってる。。sumの問題じゃなかったのね。
すまん。

その場合普通に
kernel void (out float o<>){
o=o+5;
}
でいいじゃん。

604 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 10:35:23 ]
>>601

void reduce func(reduce float i<>, out float o<>){
o=i;
i=i+1.0;
}

後者は何が言いたいのかわからん。
普通で

605 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:19:43 ]
お前らCUDAやりなさい。

ところで、CgがあるのにCUDAを出す意義って?
nVIDIAは言語の乱立を自重汁

606 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:46:51 ]
Cgはシェーダー言語。HLSLのベースになった時点であるいていど成功。
CUDAはプログラミング言語。

607 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:49:41 ]
>>606
はあプログラミング言語ねえ

608 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 03:02:44 ]
>>595
conditional move とか select とか、そういう類の命令を持つ CPU とか GPU があるのね。
だから3項演算子とか>599のようなことで問題なし。
そんなことを気にするよりも、まずは動くものを作ってこことかどっかに投げないと、何が聞きたいのかわからんというか、何を答えても的外れになりそうな気分になって答えられない。

609 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 13:22:28 ]
BrookGPUって、intは使えないよね?
データがint型で、ストリームに送る前にキャストしても返ってくる値がおかしいから困る・・・。

こういうのってどうすればいいんだ?



610 名前:デフォルトの名無しさん mailto:sage [2007/05/03(木) 08:20:49 ]
桁落ちが原因だろ。>値がおかしくなる。
落ちない範囲に収めるor諦める

611 名前:デフォルトの名無しさん mailto:sage [2007/05/03(木) 18:01:20 ]
コーヒーブレイク
ttp://www.forum-3dcenter.org/vbulletin/showthread.php?p=5449565#post5449565
ttp://www.forum-3dcenter.org/vbulletin/showthread.php?p=5450755#post5450755
R600のリークスライドなんですが、SuperScalar,SIMD,VLIW等
並列実行のキーワードが並んでます。
詳しい人、どうなんでしょうこのGPU。

612 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 00:36:29 ]
電気馬鹿食いDQNカードだぞ?

613 名前:デフォルトの名無しさん [2007/05/04(金) 13:22:12 ]
これからGPGPUに入門しようと思って、手始めに3Kのテキストデータの文字列に+1するだけの単純コードで実験してみた。
BrookGPUが簡単だったので、こいつを使った。

kernel void func(float i<>, out float o<>){
o=i+1.0;
}

//streamRead(in1,inc1);
//func(in1,in1);
//streamWrite(in1,inc1);
for(i=0; i<2048;i++){
inc1[i]=inc1[i]+1;
}

//GPU:18秒
//CPU:9秒

…全然だめじゃん。GPGPUって
環境は、Athlon64 X2 4200+,GF8600GTS
これより式を複雑にしたら、もっとスーパースカラーなCPUがより有利になるでしょ。
GPUは、和積演算だけは、同時実行出来るんだっけ?


614 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 13:36:48 ]
>>613
それは計算量少なすぎ。
明らか転送のネックの方が大きいだろw

615 名前:613 mailto:sage [2007/05/04(金) 13:40:38 ]
>>614
CPUの時も、streamReadとstreamWriteだけやるようにしてみました。
それでもCPU:16秒でした^^;

616 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:10:15 ]
>>615
それはつまり、GPUの処理時間は2秒ということだね。
……だからなに?

617 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:20:32 ]
転送時間を差し引いても、演算速度がCPUよりGPUの方が遅いって話だろ

そんなの冷静に評価してるやつはみんな言ってるじゃん
たまに『GPUはCPUの数十倍』とか夢見たいな話してる脳内お花畑さんが居るがw



618 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:49:27 ]
BrookGPUはデバッカはついてるのかな?
ブレークポイント設定してステップ実行とか出来るの?

今、主にHLSLで組んでいるんだけど
GPUデバッグがやりずらくて困ってるんけど
同じかな?

619 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:11:56 ]
>>618
BrookGPUって、単なるコンバータだよ。
結局Cgのデバッグ作業になるが・・・。
Cgは、nVIDIAがそういうツールを提供してる。



620 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:39:12 ]
>>613

大量にデータを送り込めば数で勝るGPUは高速
しかし、BrookGPUのstreamは2048くらいしか要素を確保出来ない。
その程度では、GPUコア全てを使い切れないので、CPUの方が高速。

これの意味はもう分かるよな?

さっさと、CUDAでも覚えるんだ。

621 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:44:08 ]
BrookGPUなんて海外じゃもう糞確定してるって見方が大半だよ。GPGPUで
最先端いってるやつらに、BrookGPUwって感じで笑われるしなぁ。




622 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:50:31 ]
BrookGPUはお遊び言語なのは知ってるけど
じゃあ、何が良い言語なんだ?
CUDA出る前からGPUは騒がれてたんだから、CUDA以前から扱いにくくともCPUよりちゃんと速度が出るのはあるんだろうね?

SHとか使ったが、あれは、ちょっとなぁ・・・

623 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:58:54 ]
実際に海外の優秀なやつはら暇つぶし程度にしかいまのところやってないよ
速度云々は別にどうでもいいって感じだよ。ただできましたって感じだよね




624 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:59:51 ]
…おい
誰も何でつっこまんの?
行列演算させずに、1次元計算させてどうするんだ。

まずは、GPUに計算させる前に、Gridにデータを落としこむべきだろ。
Gridにデータを落とし込むような価値の無い計算ならば、するな。


本当にレベル低いな、おい…

625 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 16:03:56 ]
>>624
何マジレスしてるんだよw?

626 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 16:17:52 ]
行列に落とし込むくらいだったら、CPUに演算させた方が・・・w

たまに出てくるGPGPUで有効な例とする
for(i=0;i<SIZE_N;i++){
out[i]=in[i]+1;
}
こういう処理を否定してちゃあ、世間のジャーナリストは嘘つきだなw


627 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 18:55:00 ]
ttp://mumei24.run.buttobi.net/cgi-bin/upload.cgi?mode=dl&file=971

DLパス:gpu

トーラスをランバートのシェーディング(cg)で表示するだけのプログラムなのですが
どうも動かないです。OPENGLです。

誰か助けてください。

628 名前:デフォルトの名無しさん mailto:sage [2007/05/06(日) 00:11:23 ]
>>611
リンク先は流し読みしただけだけど。

SuperScalarやらSIMDやらは今更な感じがする。
今までってSuperScalarじゃなかったんだっけ?
少なくともSIMDだったよな。

VLIWはちょっと気になるな。
GPUに既存のCPUのアーキテクチャでやられたヤツを色々持ち込むのはいいんだけど、
効率(性能)が向上するかは未知数だし、
GPGPU的に使いやすいかは別問題だったりするし、
どうなるんだろうね。

と、思ったことを適当に書いておく。参考にならんな。

629 名前:デフォルトの名無しさん mailto:sage [2007/05/07(月) 01:27:32 ]
GPUはSPMDだろ。
まぁCUDAで言えばWarpはSIMDだが、いずれにしてもGridレベルのSPMD。



630 名前:デフォルトの名無しさん mailto:sage [2007/05/09(水) 18:24:24 ]
627ですが…反応ないですか

631 名前:デフォルトの名無しさん mailto:sage [2007/05/09(水) 22:08:54 ]
>>630
激しくスレ違い。
ここはコンピュータグラフィックス関連のスレじゃないよ。

632 名前:デフォルトの名無しさん mailto:sage [2007/05/10(木) 19:04:59 ]
…スレ違いなんですか
他スレの方が汎用コンピューティングとあったのでこちらで聞いたのですが


633 名前:デフォルトの名無しさん mailto:sage [2007/05/10(木) 22:31:23 ]
GPUスレと勘違いしてないか?
GPGPUスレだぞ。汎用的にGPUを使おうってスレで、本来のグラフィックス処理がらみはスレ違い。


634 名前:デフォルトの名無しさん mailto:sage [2007/05/11(金) 00:05:44 ]
OpenGLスレとかその辺かな。

635 名前:デフォルトの名無しさん mailto:sage [2007/05/13(日) 22:58:51 ]
このスレッドの人ってあかでみっくぽすとの人が多いのかな

636 名前:デフォルトの名無しさん mailto:sage [2007/05/14(月) 01:27:35 ]
中途半端に賢い人が多いんだよ

637 名前:デフォルトの名無しさん mailto:sage [2007/05/15(火) 07:05:44 ]
>>611
ttp://techreport.com/reviews/2007q2/radeon-hd-2900xt/index.x?pg=3
float MAD serial以外は、概ね速い。

638 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 02:43:02 ]
最近シェーダを学び始めた者です。

調べた結果、自分の中で結論出たようなものなのですが、
最後の確認として質問させてください。

シェーダで、32bit整数を扱うことは可能でしょうか?(ベクトル型で)
もし可能であれば、シェーダモデルやベンダ拡張等問いません。

GPGPUな目的で学習していますので、このスレで質問させて頂きました。

よろしければご教授お願いします。

639 名前:デフォルトの名無しさん mailto:sage [2007/05/18(金) 11:28:03 ]
Cgでint4が出来れば扱えるんじゃない



640 名前:デフォルトの名無しさん mailto:sage [2007/05/18(金) 22:35:37 ]
CUDAは、さっさとXP x64とVistaに対応するべきだ。
俺、この2つのデュアルブートだから、せっかく8シリーズ買ったのに・・・。
これのために買ったのになぁ・・・orz

641 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 00:02:18 ]
>>639
ありがとうございます。
試してみます。

642 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 21:48:38 ]
ATI RADEON X800 XTで
Cgの中でforやらbreakが使えないみたいなエラーが出たんだけど

これってどこで確かめれるの?

643 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 23:25:09 ]
>>640
ゲフォ8800なんて買う変態がXP 32bitにするわけがないからなぁ。







本当に本腰入れたいんならVista&XP×32bit&64bit全部入りだろうけど。
とりあえずコンパイルしてエミュで動かしてみたが速度とかどうってより
operatorやらtemplateやらが通るのに吹いた


644 名前:デフォルトの名無しさん mailto:sage [2007/05/20(日) 01:18:59 ]
>>643
CUDAのこと? あれ、だってコンパイルにはgcc使ってるもの。

645 名前:デフォルトの名無しさん mailto:sage [2007/05/20(日) 14:17:03 ]
あーそりゃそうだな

646 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 21:56:13 ]
ねねCUDAで

if(input == 'a'){
...
}
else if( input == 'b'){
...
}

て処理書きたいんだけどどうやって書けばいいか教えてください

647 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 21:58:16 ]
無理

648 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 22:57:06 ]
なんだとぉ
ふざけるんじゃねーよ教えてくれよマジ切れするぞ
ゆとり世代は沸点低いんだよ忘れたのか?

649 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 23:35:02 ]
>ゆとり世代は沸点低いんだよ忘れたのか?
ちょっと地面に穴掘って埋まってきたら?
圧力掛かると沸点高くなるっしょ。



650 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 23:56:46 ]
>>649
なめてんのかコラいいかげんにさっさと教えろよ

651 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:00:20 ]
マジレスしてやるよ
CUDA SDKにはエミュついてるから、自分で試しヤガれ
コンチクショー

652 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:23:39 ]
だから無理だって言ってるだろ。
GPUには、条件分岐するキーワードは無い。
予めCで分岐してから、各処理を呼び出すしかない。

653 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:38:12 ]
じゃあ
abcdefjを128bitのhexとかに予め変換してとか小細工しても

strstr()なんかを作ることは無理なのか?


654 名前:デフォルトの名無しさん [2007/05/27(日) 11:33:06 ]
>>653
もちっと、じぶんのあたまでよくかんがえてからしつもんしよう。
ぺたっ (もうすこしがんばりましょう)


655 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 11:34:31 ]
>>654
わかんねーからきいてるんだろうが
こちとら時間ねーだんよささっと情報晒せ


656 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:11:24 ]
時間ないなら諦めたら?

657 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:12:27 ]
>>656
悪かった取り乱してしまった。すまいと反省している。
ね?ね?ヒントでいいかなんか情報くださないな

658 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:56:58 ]
なかなか釣れませんね

659 名前:デフォルトの名無しさん mailto:sage [2007/05/29(火) 01:34:39 ]
あのー誰か教えてよぉもう2日もがんばってるけど
できないよ



660 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 08:32:29 ]
>>659
そもそもなぜGPUでstring処理を行いたいのでしょうか??

いくらCUDAでGPUを汎用プログラミング用途に使えるようになったと
言っても、やはりGPUが得意とするのは大量の単精度浮動小数点データ
に対する演算だと思うのですが。


661 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 13:59:24 ]
余計なお世話だろ

662 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 14:36:51 ]
すみませんでした

663 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 00:38:24 ]
>>660

1024bitとかまぁもっと長いbit列の処理をさせた場合
現状どの程度優位(もしくは無意味か)データが採りたいんですよ。

だれか具体的にいくらって数値出していただけるならうれしいのですが
そんなもん自分でやれっていわれるのはまちがいないのでCUDAで
どうやって作ればいいのかちょっと聞いてみたかったんですよ。
未だにできないでうーむってうなってますよw

664 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:00:22 ]
>>663
CUDA SDK付属のエミュでまずは作れ。
そしたら実機で回してみせるよ。

665 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:02:10 ]
>>663
CUDA SDK付属のエミュでまずは作れ。
あうあう?うーんうーん?エミュってどこにあるの
それいってくださいよーもー


666 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:08:06 ]
まずはダウソしてインスコしてビルド汁
話はそれからだ

developer.nvidia.com/object/cuda.html

667 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:22:09 ]
64bitじゃ無理じゃーん
どうしろっていうんだorz

668 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 02:35:44 ]
俺もXP x64とVistaのデュアルブートだから無理だったんだよな・・・prz

669 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 07:54:50 ]
>>667
欲張って64bitのマシンを買うからだ



670 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 09:40:38 ]
大丈夫、漏れは64bit機で32bitRedHat入れている。
#勿論、CUDAは問題なく動く。

671 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:27:42 ]
grape.astron.s.u-tokyo.ac.jp/~makino/articles/future_sc/note048.html
jp.arxiv.org/pdf/astro-ph/0703100

実用の計算で150Gflopsなら立派なもんだね。

負け惜しみで発熱に文句付けてるけど、
1年半すればミドルレンジ、3年後にはノースのおまけになるのがGPU。

残念ながらGrapeはお終い。

672 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:32:08 ]
演算アクセラレータボードを作っている会社も危ない状況ですね。
某社のボードなんか100万とかする挙句に開発環境がそれの倍以上だもんなぁ。

673 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:52:47 ]
ねぇねぇubuntu x64環境でどうやってCUDAするの?
toolとcudaいれたけどVideoのドライバがインスコできない
なんで?

674 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:54:34 ]
ERROR: this .run file is intended for the
Linux-x86 platform, but you appear to be
running on Linux-x86_64. Aborting installation.

とか出るのですが原因が判りません。

675 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:59:43 ]
>>674
日本語の参考書が出るまで、あんたにはCUDAは使えない。
日本語の参考書が出たらまたどうぞ。

676 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 00:26:47 ]
>>671
いやさすがに3年後でmGPUにはならないでしょ…

677 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 01:30:32 ]
>>674
エラーメッセージにダメな原因がはっきりと書いてあると言うのに、
これでも文章の意味が分かりませんか。はぁーーーーー。

# 日本の英語教育がよくないのか、それとも674氏特有の問題なのか。

ネイティブスピーカーが何を言っているのかなかなか分からない私で
すが、文字として書かれていれば、これくらいの文章は普通に理解で
きないものですかねぇ。

なんだかんだ言っても実質的に世界標準言語は英語なわけで、GPGPU
とか言い出す前に、まずは中学・高校レベルの英文は読めるようになる
必要があると思います。

# それができないなら、675氏の言う通りだと思います。


678 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 01:34:26 ]
いや、日本語の参考書が出てもダメでしょ。

679 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 03:14:22 ]
>>671のサイトのはGRAPEの製作者のところなので
自分たちのシステムの優位性をアピールしたいんだろうが
その人たちですら、性能面でのGPUの優位性はもはやみとめざるを得ないと言う事だろうな。





しかしまぁ、CUDAの実行環境の話もそうだけど
さっさとGPGPUの環境整えてくれ。Vistaやx64非対応ってやる気あんのかと



680 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 03:16:42 ]
一般人は、エラーメッセージの内容を信用しないって所があるんじゃね?
多分、そのメッセージが日本語でも同じ。

理由は、Windowsのような、全くもって何の解決にもなってないようなエラーを吐く環境に鳴れたせいかと。
アプリケーションの強制終了の時のエラーダンプを、アプリケーションの作者に送っても殆ど無意味だし。
ブルースクリーンのエラーメッセージをコンピュータのサポートに送っても無意味だからなぁ


681 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 23:10:00 ]
おいハードディスク買ってきたから32bitOS入れるから
教えてくれるよね?

682 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:26:11 ]
環境は今からそろえるつもりとして、はじめるとしたらCUDAとCgどちらがいいですか?


683 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:33:49 ]
両方やれば?

684 名前:デフォルトの名無しさん [2007/06/02(土) 15:37:28 ]
ねぇねぇねぇ
CUDAで
NVIDIA: could not open the device file /dev/nvidiactl (No such device or address).
とかでるんだけどさ、なんで?
NVIDIA-Linux-x86-1.0-9751-pkg1.tar.gzこれいれたんだけどさ。
いまカードはGeforce7950GTXなんだけどエミュで動かせるって聞いたけど違うのかな?
カード走って買ってこないとダメ?

685 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 16:17:50 ]
GPUチップを認識できてないとそうなった希ガス。
nvcc動かすだけなら大丈夫だと思うけど。

686 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 02:02:23 ]
エミュ用のディレクトリのを実行した?

687 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 12:43:44 ]
サンプル動いたぉ

688 名前:おしえてちゃん mailto:sage [2007/06/03(日) 14:27:02 ]
gpgpu志向のプログラム作ろうとしてます。
ですがいきなり分からないことが、出てきました。

点を二つ作り、その点の大きさをgl_PointSizeを使って
大きくしたら、点が重なりました。その重なった部分の混合色は
どのようにつくられるのですか?

1,(vertex + fragment シェーダでの処理を一単位と考えて)
二度シェーダプログラムを呼んで色の混合を作る。
2,(上と同じ考えで)一度で処理する。
3,そのほか

同じカーネルに、複数の色を叩き込むということなので、
その色の混合処理の方法がわからないのです。

一体どれなんでしょうか?

689 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 18:14:52 ]
あまりGPGPU指向の話じゃないねぇ



690 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 19:24:42 ]
ちょいCUDAで質問
とりあえずCUDAの手順として
デバイス初期化
メモリ初期化(host,dev)
計算
終了処理
という感じになっているが、なんでkernelの関数呼び出す時こんな
キモい呼び出しになってるの?すっげーキモくて違和感ありありなんだが

testKernel<<< grid, threads, mem_size >>>(d_idata, d_odata);

こんなアフォな呼び出ししたくねーよw

691 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 19:55:22 ]
その呼び出しのどの部分がキモいのか具体的にお願いします。

692 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 20:43:48 ]
逆にそれだけで済んでしまうところが肝なんだが。

693 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 21:10:34 ]
今エミュだけだからよーわからんのだけど
__device__と__global__って再帰呼び出し禁止だけど

2つの関数交互に呼ぶのはOKなのかなぁ?
エミュだとOKに見えるのだが実機だと動かなそうだがうーん



694 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 22:12:09 ]
ソース上げてくれたらテストするよ。

695 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 23:13:18 ]
__device__ hogeから__device__hoge1を呼び出せないのは痛いなぁ。

inline展開できない場合は処理不可能なのかぁうーむ。これにはちと
まいったな


696 名前:デフォルトの名無しさん mailto:sage [2007/06/07(木) 23:58:14 ]
なぁなぁ

Geforce8800GTXでCUDAするとき
sharedメモリいくらになるの?
各ブロックはいくらになるの?

その辺の情報がいまいちよーわからんのだが

697 名前:デフォルトの名無しさん [2007/06/08(金) 07:41:27 ]
CUDAが未だにVistaやx64に対応できないのは何か理由があんの?
もうかなり経つよね。

698 名前:デフォルトの名無しさん mailto:sage [2007/06/11(月) 00:43:57 ]
GPGPU完全死亡
pc.watch.impress.co.jp/docs/2007/0611/kaigai364.htm

699 名前:デフォルトの名無しさん mailto:sage [2007/06/11(月) 02:23:44 ]
>>698
こんなのセルと大してかわらへん
並列度が低すぎる




700 名前:・∀・)っ-○◎● mailto:sage [2007/06/11(月) 03:08:05 ]
IA命令セットと互換ってのがみそだろ。
どうせSSEだろうけど。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<200KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef