1 名前:デフォルトの名無しさん mailto:sage [2005/10/08(土) 23:15:20 ] いつの間にやらCPUを超える演算性能を持ってしまったGPUに計算させてみるという GPGPUについて語りましょう 参考リンク 総本山? gpgpu.org www.gpgpu.org/ GPUをCPU的に活用するGPGPUの可能性 pcweb.mycom.co.jp/articles/2005/09/06/siggraph2/
601 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 09:50:02 ] BrookGPUで各ユニットで共通の変数を利用したい場合ってどうすればいいのでしょうか? 例えば、 for(int i=0; i<128; i++) out[i]=i; や for(int i=0; i<128; i++) out[i]=out[i]+5; このようなパターンです。
602 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 09:55:56 ] >>601 まず、後者の場合、reduceを使う void reduce sum(reduce float res<>){ res=res+5; } こんな感じ 前者の場合。 イテレーターを使うんだと思うんだけど、ちょっと俺にもわからん。
603 名前:602 mailto:sage [2007/04/27(金) 09:57:59 ] って、うわ・・・ 後者も間違ってる。。sumの問題じゃなかったのね。 すまん。 その場合普通に kernel void (out float o<>){ o=o+5; } でいいじゃん。
604 名前:デフォルトの名無しさん mailto:sage [2007/04/27(金) 10:35:23 ] >>601 void reduce func(reduce float i<>, out float o<>){ o=i; i=i+1.0; } 後者は何が言いたいのかわからん。 普通で
605 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:19:43 ] お前らCUDAやりなさい。 ところで、CgがあるのにCUDAを出す意義って? nVIDIAは言語の乱立を自重汁
606 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:46:51 ] Cgはシェーダー言語。HLSLのベースになった時点であるいていど成功。 CUDAはプログラミング言語。
607 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 00:49:41 ] >>606 はあプログラミング言語ねえ
608 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 03:02:44 ] >>595 conditional move とか select とか、そういう類の命令を持つ CPU とか GPU があるのね。 だから3項演算子とか>599のようなことで問題なし。 そんなことを気にするよりも、まずは動くものを作ってこことかどっかに投げないと、何が聞きたいのかわからんというか、何を答えても的外れになりそうな気分になって答えられない。
609 名前:デフォルトの名無しさん mailto:sage [2007/05/02(水) 13:22:28 ] BrookGPUって、intは使えないよね? データがint型で、ストリームに送る前にキャストしても返ってくる値がおかしいから困る・・・。 こういうのってどうすればいいんだ?
610 名前:デフォルトの名無しさん mailto:sage [2007/05/03(木) 08:20:49 ] 桁落ちが原因だろ。>値がおかしくなる。 落ちない範囲に収めるor諦める
611 名前:デフォルトの名無しさん mailto:sage [2007/05/03(木) 18:01:20 ] コーヒーブレイク ttp://www.forum-3dcenter.org/vbulletin/showthread.php?p=5449565#post5449565 ttp://www.forum-3dcenter.org/vbulletin/showthread.php?p=5450755#post5450755 R600のリークスライドなんですが、SuperScalar,SIMD,VLIW等 並列実行のキーワードが並んでます。 詳しい人、どうなんでしょうこのGPU。
612 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 00:36:29 ] 電気馬鹿食いDQNカードだぞ?
613 名前:デフォルトの名無しさん [2007/05/04(金) 13:22:12 ] これからGPGPUに入門しようと思って、手始めに3Kのテキストデータの文字列に+1するだけの単純コードで実験してみた。 BrookGPUが簡単だったので、こいつを使った。 kernel void func(float i<>, out float o<>){ o=i+1.0; } //streamRead(in1,inc1); //func(in1,in1); //streamWrite(in1,inc1); for(i=0; i<2048;i++){ inc1[i]=inc1[i]+1; } //GPU:18秒 //CPU:9秒 …全然だめじゃん。GPGPUって 環境は、Athlon64 X2 4200+,GF8600GTS これより式を複雑にしたら、もっとスーパースカラーなCPUがより有利になるでしょ。 GPUは、和積演算だけは、同時実行出来るんだっけ?
614 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 13:36:48 ] >>613 それは計算量少なすぎ。 明らか転送のネックの方が大きいだろw
615 名前:613 mailto:sage [2007/05/04(金) 13:40:38 ] >>614 CPUの時も、streamReadとstreamWriteだけやるようにしてみました。 それでもCPU:16秒でした^^;
616 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:10:15 ] >>615 それはつまり、GPUの処理時間は2秒ということだね。 ……だからなに?
617 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:20:32 ] 転送時間を差し引いても、演算速度がCPUよりGPUの方が遅いって話だろ そんなの冷静に評価してるやつはみんな言ってるじゃん たまに『GPUはCPUの数十倍』とか夢見たいな話してる脳内お花畑さんが居るがw
618 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 14:49:27 ] BrookGPUはデバッカはついてるのかな? ブレークポイント設定してステップ実行とか出来るの? 今、主にHLSLで組んでいるんだけど GPUデバッグがやりずらくて困ってるんけど 同じかな?
619 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:11:56 ] >>618 BrookGPUって、単なるコンバータだよ。 結局Cgのデバッグ作業になるが・・・。 Cgは、nVIDIAがそういうツールを提供してる。
620 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:39:12 ] >>613 大量にデータを送り込めば数で勝るGPUは高速 しかし、BrookGPUのstreamは2048くらいしか要素を確保出来ない。 その程度では、GPUコア全てを使い切れないので、CPUの方が高速。 これの意味はもう分かるよな? さっさと、CUDAでも覚えるんだ。
621 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:44:08 ] BrookGPUなんて海外じゃもう糞確定してるって見方が大半だよ。GPGPUで 最先端いってるやつらに、BrookGPUwって感じで笑われるしなぁ。
622 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:50:31 ] BrookGPUはお遊び言語なのは知ってるけど じゃあ、何が良い言語なんだ? CUDA出る前からGPUは騒がれてたんだから、CUDA以前から扱いにくくともCPUよりちゃんと速度が出るのはあるんだろうね? SHとか使ったが、あれは、ちょっとなぁ・・・
623 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:58:54 ] 実際に海外の優秀なやつはら暇つぶし程度にしかいまのところやってないよ 速度云々は別にどうでもいいって感じだよ。ただできましたって感じだよね
624 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 15:59:51 ] …おい 誰も何でつっこまんの? 行列演算させずに、1次元計算させてどうするんだ。 まずは、GPUに計算させる前に、Gridにデータを落としこむべきだろ。 Gridにデータを落とし込むような価値の無い計算ならば、するな。 本当にレベル低いな、おい…
625 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 16:03:56 ] >>624 何マジレスしてるんだよw?
626 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 16:17:52 ] 行列に落とし込むくらいだったら、CPUに演算させた方が・・・w たまに出てくるGPGPUで有効な例とする for(i=0;i<SIZE_N;i++){ out[i]=in[i]+1; } こういう処理を否定してちゃあ、世間のジャーナリストは嘘つきだなw
627 名前:デフォルトの名無しさん mailto:sage [2007/05/04(金) 18:55:00 ] ttp://mumei24.run.buttobi.net/cgi-bin/upload.cgi?mode=dl&file=971 DLパス:gpu トーラスをランバートのシェーディング(cg)で表示するだけのプログラムなのですが どうも動かないです。OPENGLです。 誰か助けてください。
628 名前:デフォルトの名無しさん mailto:sage [2007/05/06(日) 00:11:23 ] >>611 リンク先は流し読みしただけだけど。 SuperScalarやらSIMDやらは今更な感じがする。 今までってSuperScalarじゃなかったんだっけ? 少なくともSIMDだったよな。 VLIWはちょっと気になるな。 GPUに既存のCPUのアーキテクチャでやられたヤツを色々持ち込むのはいいんだけど、 効率(性能)が向上するかは未知数だし、 GPGPU的に使いやすいかは別問題だったりするし、 どうなるんだろうね。 と、思ったことを適当に書いておく。参考にならんな。
629 名前:デフォルトの名無しさん mailto:sage [2007/05/07(月) 01:27:32 ] GPUはSPMDだろ。 まぁCUDAで言えばWarpはSIMDだが、いずれにしてもGridレベルのSPMD。
630 名前:デフォルトの名無しさん mailto:sage [2007/05/09(水) 18:24:24 ] 627ですが…反応ないですか
631 名前:デフォルトの名無しさん mailto:sage [2007/05/09(水) 22:08:54 ] >>630 激しくスレ違い。 ここはコンピュータグラフィックス関連のスレじゃないよ。
632 名前:デフォルトの名無しさん mailto:sage [2007/05/10(木) 19:04:59 ] …スレ違いなんですか 他スレの方が汎用コンピューティングとあったのでこちらで聞いたのですが
633 名前:デフォルトの名無しさん mailto:sage [2007/05/10(木) 22:31:23 ] GPUスレと勘違いしてないか? GPGPUスレだぞ。汎用的にGPUを使おうってスレで、本来のグラフィックス処理がらみはスレ違い。
634 名前:デフォルトの名無しさん mailto:sage [2007/05/11(金) 00:05:44 ] OpenGLスレとかその辺かな。
635 名前:デフォルトの名無しさん mailto:sage [2007/05/13(日) 22:58:51 ] このスレッドの人ってあかでみっくぽすとの人が多いのかな
636 名前:デフォルトの名無しさん mailto:sage [2007/05/14(月) 01:27:35 ] 中途半端に賢い人が多いんだよ
637 名前:デフォルトの名無しさん mailto:sage [2007/05/15(火) 07:05:44 ] >>611 ttp://techreport.com/reviews/2007q2/radeon-hd-2900xt/index.x?pg=3 float MAD serial以外は、概ね速い。
638 名前:デフォルトの名無しさん mailto:sage [2007/05/17(木) 02:43:02 ] 最近シェーダを学び始めた者です。 調べた結果、自分の中で結論出たようなものなのですが、 最後の確認として質問させてください。 シェーダで、32bit整数を扱うことは可能でしょうか?(ベクトル型で) もし可能であれば、シェーダモデルやベンダ拡張等問いません。 GPGPUな目的で学習していますので、このスレで質問させて頂きました。 よろしければご教授お願いします。
639 名前:デフォルトの名無しさん mailto:sage [2007/05/18(金) 11:28:03 ] Cgでint4が出来れば扱えるんじゃない
640 名前:デフォルトの名無しさん mailto:sage [2007/05/18(金) 22:35:37 ] CUDAは、さっさとXP x64とVistaに対応するべきだ。 俺、この2つのデュアルブートだから、せっかく8シリーズ買ったのに・・・。 これのために買ったのになぁ・・・orz
641 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 00:02:18 ] >>639 ありがとうございます。 試してみます。
642 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 21:48:38 ] ATI RADEON X800 XTで Cgの中でforやらbreakが使えないみたいなエラーが出たんだけど これってどこで確かめれるの?
643 名前:デフォルトの名無しさん mailto:sage [2007/05/19(土) 23:25:09 ] >>640 ゲフォ8800なんて買う変態がXP 32bitにするわけがないからなぁ。 本当に本腰入れたいんならVista&XP×32bit&64bit全部入りだろうけど。 とりあえずコンパイルしてエミュで動かしてみたが速度とかどうってより operatorやらtemplateやらが通るのに吹いた
644 名前:デフォルトの名無しさん mailto:sage [2007/05/20(日) 01:18:59 ] >>643 CUDAのこと? あれ、だってコンパイルにはgcc使ってるもの。
645 名前:デフォルトの名無しさん mailto:sage [2007/05/20(日) 14:17:03 ] あーそりゃそうだな
646 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 21:56:13 ] ねねCUDAで if(input == 'a'){ ... } else if( input == 'b'){ ... } て処理書きたいんだけどどうやって書けばいいか教えてください
647 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 21:58:16 ] 無理
648 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 22:57:06 ] なんだとぉ ふざけるんじゃねーよ教えてくれよマジ切れするぞ ゆとり世代は沸点低いんだよ忘れたのか?
649 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 23:35:02 ] >ゆとり世代は沸点低いんだよ忘れたのか? ちょっと地面に穴掘って埋まってきたら? 圧力掛かると沸点高くなるっしょ。
650 名前:デフォルトの名無しさん mailto:sage [2007/05/26(土) 23:56:46 ] >>649 なめてんのかコラいいかげんにさっさと教えろよ
651 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:00:20 ] マジレスしてやるよ CUDA SDKにはエミュついてるから、自分で試しヤガれ コンチクショー
652 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:23:39 ] だから無理だって言ってるだろ。 GPUには、条件分岐するキーワードは無い。 予めCで分岐してから、各処理を呼び出すしかない。
653 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 00:38:12 ] じゃあ abcdefjを128bitのhexとかに予め変換してとか小細工しても strstr()なんかを作ることは無理なのか?
654 名前:デフォルトの名無しさん [2007/05/27(日) 11:33:06 ] >>653 もちっと、じぶんのあたまでよくかんがえてからしつもんしよう。 ぺたっ (もうすこしがんばりましょう)
655 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 11:34:31 ] >>654 わかんねーからきいてるんだろうが こちとら時間ねーだんよささっと情報晒せ
656 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:11:24 ] 時間ないなら諦めたら?
657 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:12:27 ] >>656 悪かった取り乱してしまった。すまいと反省している。 ね?ね?ヒントでいいかなんか情報くださないな
658 名前:デフォルトの名無しさん mailto:sage [2007/05/27(日) 12:56:58 ] なかなか釣れませんね
659 名前:デフォルトの名無しさん mailto:sage [2007/05/29(火) 01:34:39 ] あのー誰か教えてよぉもう2日もがんばってるけど できないよ
660 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 08:32:29 ] >>659 そもそもなぜGPUでstring処理を行いたいのでしょうか?? いくらCUDAでGPUを汎用プログラミング用途に使えるようになったと 言っても、やはりGPUが得意とするのは大量の単精度浮動小数点データ に対する演算だと思うのですが。
661 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 13:59:24 ] 余計なお世話だろ
662 名前:デフォルトの名無しさん mailto:sage [2007/05/30(水) 14:36:51 ] すみませんでした
663 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 00:38:24 ] >>660 1024bitとかまぁもっと長いbit列の処理をさせた場合 現状どの程度優位(もしくは無意味か)データが採りたいんですよ。 だれか具体的にいくらって数値出していただけるならうれしいのですが そんなもん自分でやれっていわれるのはまちがいないのでCUDAで どうやって作ればいいのかちょっと聞いてみたかったんですよ。 未だにできないでうーむってうなってますよw
664 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:00:22 ] >>663 CUDA SDK付属のエミュでまずは作れ。 そしたら実機で回してみせるよ。
665 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:02:10 ] >>663 CUDA SDK付属のエミュでまずは作れ。 あうあう?うーんうーん?エミュってどこにあるの それいってくださいよーもー
666 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:08:06 ] まずはダウソしてインスコしてビルド汁 話はそれからだ developer.nvidia.com/object/cuda.html
667 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 01:22:09 ] 64bitじゃ無理じゃーん どうしろっていうんだorz
668 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 02:35:44 ] 俺もXP x64とVistaのデュアルブートだから無理だったんだよな・・・prz
669 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 07:54:50 ] >>667 欲張って64bitのマシンを買うからだ
670 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 09:40:38 ] 大丈夫、漏れは64bit機で32bitRedHat入れている。 #勿論、CUDAは問題なく動く。
671 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:27:42 ] grape.astron.s.u-tokyo.ac.jp/~makino/articles/future_sc/note048.html jp.arxiv.org/pdf/astro-ph/0703100 実用の計算で150Gflopsなら立派なもんだね。 負け惜しみで発熱に文句付けてるけど、 1年半すればミドルレンジ、3年後にはノースのおまけになるのがGPU。 残念ながらGrapeはお終い。
672 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:32:08 ] 演算アクセラレータボードを作っている会社も危ない状況ですね。 某社のボードなんか100万とかする挙句に開発環境がそれの倍以上だもんなぁ。
673 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:52:47 ] ねぇねぇubuntu x64環境でどうやってCUDAするの? toolとcudaいれたけどVideoのドライバがインスコできない なんで?
674 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:54:34 ] ERROR: this .run file is intended for the Linux-x86 platform, but you appear to be running on Linux-x86_64. Aborting installation. とか出るのですが原因が判りません。
675 名前:デフォルトの名無しさん mailto:sage [2007/05/31(木) 23:59:43 ] >>674 日本語の参考書が出るまで、あんたにはCUDAは使えない。 日本語の参考書が出たらまたどうぞ。
676 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 00:26:47 ] >>671 いやさすがに3年後でmGPUにはならないでしょ…
677 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 01:30:32 ] >>674 エラーメッセージにダメな原因がはっきりと書いてあると言うのに、 これでも文章の意味が分かりませんか。はぁーーーーー。 # 日本の英語教育がよくないのか、それとも674氏特有の問題なのか。 ネイティブスピーカーが何を言っているのかなかなか分からない私で すが、文字として書かれていれば、これくらいの文章は普通に理解で きないものですかねぇ。 なんだかんだ言っても実質的に世界標準言語は英語なわけで、GPGPU とか言い出す前に、まずは中学・高校レベルの英文は読めるようになる 必要があると思います。 # それができないなら、675氏の言う通りだと思います。
678 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 01:34:26 ] いや、日本語の参考書が出てもダメでしょ。
679 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 03:14:22 ] >>671 のサイトのはGRAPEの製作者のところなので 自分たちのシステムの優位性をアピールしたいんだろうが その人たちですら、性能面でのGPUの優位性はもはやみとめざるを得ないと言う事だろうな。 しかしまぁ、CUDAの実行環境の話もそうだけど さっさとGPGPUの環境整えてくれ。Vistaやx64非対応ってやる気あんのかと
680 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 03:16:42 ] 一般人は、エラーメッセージの内容を信用しないって所があるんじゃね? 多分、そのメッセージが日本語でも同じ。 理由は、Windowsのような、全くもって何の解決にもなってないようなエラーを吐く環境に鳴れたせいかと。 アプリケーションの強制終了の時のエラーダンプを、アプリケーションの作者に送っても殆ど無意味だし。 ブルースクリーンのエラーメッセージをコンピュータのサポートに送っても無意味だからなぁ
681 名前:デフォルトの名無しさん mailto:sage [2007/06/01(金) 23:10:00 ] おいハードディスク買ってきたから32bitOS入れるから 教えてくれるよね?
682 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:26:11 ] 環境は今からそろえるつもりとして、はじめるとしたらCUDAとCgどちらがいいですか?
683 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 14:33:49 ] 両方やれば?
684 名前:デフォルトの名無しさん [2007/06/02(土) 15:37:28 ] ねぇねぇねぇ CUDAで NVIDIA: could not open the device file /dev/nvidiactl (No such device or address). とかでるんだけどさ、なんで? NVIDIA-Linux-x86-1.0-9751-pkg1.tar.gzこれいれたんだけどさ。 いまカードはGeforce7950GTXなんだけどエミュで動かせるって聞いたけど違うのかな? カード走って買ってこないとダメ?
685 名前:デフォルトの名無しさん mailto:sage [2007/06/02(土) 16:17:50 ] GPUチップを認識できてないとそうなった希ガス。 nvcc動かすだけなら大丈夫だと思うけど。
686 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 02:02:23 ] エミュ用のディレクトリのを実行した?
687 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 12:43:44 ] サンプル動いたぉ
688 名前:おしえてちゃん mailto:sage [2007/06/03(日) 14:27:02 ] gpgpu志向のプログラム作ろうとしてます。 ですがいきなり分からないことが、出てきました。 点を二つ作り、その点の大きさをgl_PointSizeを使って 大きくしたら、点が重なりました。その重なった部分の混合色は どのようにつくられるのですか? 1,(vertex + fragment シェーダでの処理を一単位と考えて) 二度シェーダプログラムを呼んで色の混合を作る。 2,(上と同じ考えで)一度で処理する。 3,そのほか 同じカーネルに、複数の色を叩き込むということなので、 その色の混合処理の方法がわからないのです。 一体どれなんでしょうか?
689 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 18:14:52 ] あまりGPGPU指向の話じゃないねぇ
690 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 19:24:42 ] ちょいCUDAで質問 とりあえずCUDAの手順として デバイス初期化 メモリ初期化(host,dev) 計算 終了処理 という感じになっているが、なんでkernelの関数呼び出す時こんな キモい呼び出しになってるの?すっげーキモくて違和感ありありなんだが testKernel<<< grid, threads, mem_size >>>(d_idata, d_odata); こんなアフォな呼び出ししたくねーよw
691 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 19:55:22 ] その呼び出しのどの部分がキモいのか具体的にお願いします。
692 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 20:43:48 ] 逆にそれだけで済んでしまうところが肝なんだが。
693 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 21:10:34 ] 今エミュだけだからよーわからんのだけど __device__と__global__って再帰呼び出し禁止だけど 2つの関数交互に呼ぶのはOKなのかなぁ? エミュだとOKに見えるのだが実機だと動かなそうだがうーん
694 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 22:12:09 ] ソース上げてくれたらテストするよ。
695 名前:デフォルトの名無しさん mailto:sage [2007/06/03(日) 23:13:18 ] __device__ hogeから__device__hoge1を呼び出せないのは痛いなぁ。 inline展開できない場合は処理不可能なのかぁうーむ。これにはちと まいったな
696 名前:デフォルトの名無しさん mailto:sage [2007/06/07(木) 23:58:14 ] なぁなぁ Geforce8800GTXでCUDAするとき sharedメモリいくらになるの? 各ブロックはいくらになるの? その辺の情報がいまいちよーわからんのだが
697 名前:デフォルトの名無しさん [2007/06/08(金) 07:41:27 ] CUDAが未だにVistaやx64に対応できないのは何か理由があんの? もうかなり経つよね。
698 名前:デフォルトの名無しさん mailto:sage [2007/06/11(月) 00:43:57 ] GPGPU完全死亡 pc.watch.impress.co.jp/docs/2007/0611/kaigai364.htm
699 名前:デフォルトの名無しさん mailto:sage [2007/06/11(月) 02:23:44 ] >>698 こんなのセルと大してかわらへん 並列度が低すぎる
700 名前:・∀・)っ-○◎● mailto:sage [2007/06/11(月) 03:08:05 ] IA命令セットと互換ってのがみそだろ。 どうせSSEだろうけど。