- 1 名前:デフォルトの名無しさん mailto:sage [2008/03/22(土) 11:13:52 ]
- このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。 CUDA使いが優しくコメントを返しますが、 お礼はCUDAの布教と初心者の救済をお願いします。 CUDA・HomePage www.nvidia.com/cuda 関連スレ 【GPGPU】NVIDIA CUDA質問スレッド pc11.2ch.net/test/read.cgi/tech/1190008468/ GPUで汎用コンピューティングを行うスレ pc11.2ch.net/test/read.cgi/tech/1167989627/ GPGPU#2 pc11.2ch.net/test/read.cgi/tech/1188374938/
- 724 名前:デフォルトの名無しさん [2009/06/20(土) 14:41:38 ]
- Mac でCUDAをやろうとしています。
/Developer/CUDA/lib/にあるライブラリをライブラリのサーチパスに含めるには どの環境変数を設定すればよいのでしょうか? LD_LIBRARY_PATHに追加してみたのですが、サーチしてくれません
- 725 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 14:43:15 ]
- >>724
DYLD_LIBRARY_PATH
- 726 名前:デフォルトの名無しさん [2009/06/20(土) 15:02:09 ]
- >>725
早速の回答ありがとうございます。 DYLD_LIBRARY_PATH に追加してみたのですがやはりうまくいきません。 ちなみに-Lで指定すればうまくいきます。
- 727 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 18:11:27 ]
- Coalesced、Non-Coalescedって簡単にいうとどういうこと?
- 728 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 18:14:29 ]
- >>108
- 729 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 18:18:03 ]
- >>728
よくわからん
- 730 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 20:19:04 ]
- ttp://noridon.seesaa.net/article/105559613.html
- 731 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 21:42:57 ]
- 大前提として、ブロック内でデバイスメモリにアクセスするアドレスが連続していたら、コアレス。
んで対応アーキテクチャによってスレッド単位でアドレスが連続している必要があったりする。 まぁ簡単に言うと、バス幅有効活用できまっせ適な使い方をイメージすればいいかと。 なんでそのバス幅でアクセスできるアラインを考える事になる。
- 732 名前:デフォルトの名無しさん mailto:sage [2009/06/20(土) 23:08:40 ]
- >>726
実行時じゃなくて、ビルド時のリンクのこと? DYLD_LIBRARY_PATHは関係ないから-Lでやってね。
- 733 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 01:03:25 ]
- >>726
LIBRARY_PATHでできなかったっけ?
- 734 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 06:52:13 ]
- 配列で最初と最後の変数だけ別の処理をしたいのですが、
どのように書けばよいのでしょうか? 従来のプログラムの場合、配列がa[N]だったばあい、 for(i=1;i<N-1;i++)と書けばよいのですが、 CUDAのカーネルで処理する場合どのようにすればよいのでしょうか?
- 735 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 07:45:47 ]
- >>734
とりあえず、現状のカーネル書いてくれれば教えやすいのに
- 736 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 14:51:04 ]
- NVIDIAが配布しているということで、PhysXの質問をさせて下さい。
キネマティックなアクターが物体と接触した時に受ける力の取得方法が分かりません。 ご存知の方がいらっしゃいましたらご教示下さい。
- 737 名前:734 [2009/06/21(日) 17:50:38 ]
- >>735
例えば、今は __global__ void test(int thread_size, int one_size, float *res_d) { int bx = blockIdx.x; int tx = threadIdx.x; int pos = bx * thread_size + tx; if (pos==0) res_d[pos] = cos(res_d[pos]); else res_d[pos] = sin(res_d[pos]); } このように、if文で0とN-1の場合だけ別の処理をするようにしているのですが、if文は遅くなるので、避けたいのですが。 具体的にやりたいのは、3次元の偏微分方程式を解く際の境界条件部分の計算です。 この場合各面、各辺、各頂点合わせてif文が20個以上になってしまいます。 何か良い方法はないでしょうか?
- 738 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 18:12:51 ]
- >>737
最初と最後だけ別の処理なら、そこはCPUに任せて、 残りをGPUにやらせればいいと思うけど、それじゃだめなん? posを+1して、並列数をN-2にすればいけそうだと思うけど。 あと、そのソースだと N-1 の処理が別になってない気がするのと、 posがN以上かどうかのチェックが無いのが気になる。 (ソースは単に省略しただけで、チェックはそもそも必要ないように組んでるのかも知れないが)
- 739 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 18:53:40 ]
- >>737
一般的にアセンブリレベルで分岐をなくしたいときは、こんなテクニックを使ったりする。 // i == Nのときだけsinをcosにする float s = sin(なんとか); floac c = cos(なんとか); int b = i == N; // true が (int)1に変換されることを期待する return (c * i) + (s * (1 - i)); もちろん3行目は実装依存なので、プロセッサのマニュアル見ながらいちいち確認はした方がいいんだが、 だいたいのプロセッサで使えるテクニック。
- 740 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 19:09:54 ]
- >>737
それだと全てのパターンでsinとcosの両方が計算されるから float s = sin(なんとか + b * PI / 2); にすれば?
- 741 名前:740 mailto:sage [2009/06/21(日) 19:11:22 ]
- ごめん安価ミスった
>>740は>>739へのレスです
- 742 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 19:37:25 ]
- CUDAにはsincosねーの?
また三項演算子でいいんじゃねーの?
- 743 名前:デフォルトの名無しさん mailto:sage [2009/06/21(日) 23:01:37 ]
- >>737
あらかじめ、特殊条件について位相を補正しときゃいいんじゃないの?と思うのは俺だけ?
- 744 名前:デフォルトの名無しさん mailto:sage [2009/06/22(月) 00:12:40 ]
- >>736
PhysXスレがゲーム製作技術にあるからそっち行け
- 745 名前:736 mailto:sage [2009/06/22(月) 01:52:13 ]
- >>744
誘導ありがとうございます
- 746 名前:デフォルトの名無しさん mailto:sage [2009/06/22(月) 10:53:08 ]
- >>742
あるよ。但し、ストリームプロセッサに一個しか超越関数演算機がないから使い方間違うと遅くなるけど。
- 747 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 08:26:25 ]
- >>746
超越関数演算機なんてハード的に存在したっけ?倍精度演算機じゃなくて?
- 748 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 14:47:11 ]
- >>747
SFU(Super Function Unit)がある。 ただし、4SPで共有で、>>747のいうように8SPで共有するのは倍精度演算器。 sin()、cos()、tan()は確かに遅いけど、 sinとcosについては__sinf()と__cosf()を使えば、 精度は悪くなるけど1op/clockでできる。 除算以外の算術演算が8op/clockでできることを考えたらそれでも遅いことには変わりないけど。
- 749 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 15:22:26 ]
- 超越関数がレイテンシ1なんて凄いね
SFUだけ100倍のクロック数とか してるのかなぁ
- 750 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 18:30:15 ]
- www.khronos.org/opencl/
OpenCL 1.0 リリース
- 751 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 18:36:49 ]
- First OpenCL demo on a GPU
www.youtube.com/watch?v=r1sN1ELJfNo
- 752 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 18:43:26 ]
- www.nvidia.com/object/cuda_opencl.html
ドライバ一式は登録しないといけないようだ
- 753 名前:デフォルトの名無しさん mailto:sage [2009/06/23(火) 21:47:02 ]
- >>748
SFUなんてあったのか、しらなかった。DPみたいに実行はSPと並行してできるのかな?
- 754 名前:デフォルトの名無しさん mailto:sage [2009/06/24(水) 07:13:15 ]
- やっとFortran対応の話出てきたけど、有料なんかね
PGI and NVIDIA Team To Deliver CUDA Fortran Compiler ttp://eu.st.com/stonline/stappl/cms/press/news/year2009/t2399.htm
- 755 名前:デフォルトの名無しさん mailto:sage [2009/06/24(水) 07:18:14 ]
- ていうかいつのまにかに2.3のベータ出てたのか
- 756 名前:デフォルトの名無しさん mailto:sage [2009/06/26(金) 12:01:06 ]
- GTX 285でようやくおれのようなへっぽこでも普通にcpuを凌駕するコードが書けるように
なったようだね。 後は(値段はともかく)消費電力が下がってくれれば、大ブレイクしそう。
- 757 名前:デフォルトの名無しさん mailto:sage [2009/06/27(土) 12:19:52 ]
- 300Wなんてクアッドコアマシンを4台くらいクラスタリングしたような消費電力だからな
- 758 名前:デフォルトの名無しさん mailto:sage [2009/07/01(水) 03:13:56 ]
- >おれのようなへっぽこでも普通にcpuを凌駕する
だったらCPU要らんがな。 むしろCPU<->GPU間の通信がボトルネックなので、CPU無くして GPUに直接I/O繋げられるようにしろや!
- 759 名前:デフォルトの名無しさん mailto:sage [2009/07/01(水) 21:14:50 ]
- >>758
それなんていうTesla?
- 760 名前:デフォルトの名無しさん mailto:sage [2009/07/01(水) 23:30:38 ]
- >>759
それTeslaでもない。
- 761 名前:デフォルトの名無しさん [2009/07/02(木) 07:45:08 ]
- CUDAで乱数を効率的に生成する方法を教えてください
- 762 名前:デフォルトの名無しさん mailto:sage [2009/07/02(木) 09:23:34 ]
- >>761
コアごとに違う種から乱数生成すればいいんじゃね?
- 763 名前:デフォルトの名無しさん [2009/07/03(金) 00:25:57 ]
- 質問なんですが、SDKに付いてたサンプルをmakeしようとしたところ
以下のようなエラーが出てうまくいきません、何か足りないものがあるのでしょうか /usr/bin/ld: cannot find -lXi collect2: ld はステータス 1 で終了しました make[1]: *** [../../bin/linux/release/nbody] エラー 1 OSはfedora10です。色々初心者なのでどうかお願いします。
- 764 名前:デフォルトの名無しさん mailto:sage [2009/07/03(金) 00:52:49 ]
- libXiというパッケージをインストールできないかね
俺もfedoraはよく記憶にないんだが
- 765 名前:デフォルトの名無しさん [2009/07/03(金) 07:55:20 ]
- >>764
libXiというのがインストールされていないということだったのですか 早速インストールしたいと思います。どうもありがとうございました。
- 766 名前:デフォルトの名無しさん [2009/07/05(日) 04:21:12 ]
- teslaとgeforceって何が違うの?
- 767 名前:デフォルトの名無しさん mailto:sage [2009/07/05(日) 05:03:33 ]
- OpenGL向けかDirectX向けか
- 768 名前:デフォルトの名無しさん mailto:sage [2009/07/05(日) 10:40:00 ]
- >>767
それquadroとgeforceでしょ。 >>766 teslaはhpc専用ボードで、ディスプレイの出力ポートがない。 NVIDIAがボードの製造まで一貫して行ってて、テストもしっかり通している…らしい。 あとメモリが4GB乗ってる。
- 769 名前:デフォルトの名無しさん mailto:sage [2009/07/06(月) 09:01:42 ]
- CUDAというよりハードウェアの話なんですが質問させてください
TESLA C1060をMM3500に刺したいんですが、この状態だとBIOSが拝めません ビープ音「−・・(長短短)」って音がするんでAwardで調べたらビデオアダプタ不良らしい マザーボードだけを他のに変えたら正しく起動するので、電源やTESLAが悪いわけではなさそうです TESLAなしのMM3500だけならUbuntuのBoot CDからMemtestが走るとこまで行きました
- 770 名前:デフォルトの名無しさん mailto:sage [2009/07/06(月) 09:34:48 ]
- スレ違いどころか板違いだ
判ってるなら該当板いけよ
- 771 名前:デフォルトの名無しさん mailto:sage [2009/07/06(月) 22:26:16 ]
- >>769
買ったとこに聞いた方が良いかと...
- 772 名前:デフォルトの名無しさん mailto:sage [2009/07/07(火) 00:46:08 ]
- >>772
ありがとう まずはVIAにメールしてみます
- 773 名前:NVIDIAの営業の受け売りw mailto:sage [2009/07/07(火) 09:05:04 ]
- ・GeForce
NVIDIAはパーツ選択にはノータッチ。各社さんが勝手に安い部品を積んでいるから動作しなくても当然。 プロならそんなアキバ的発想はやめて、QuadroFXかTeslaを使ってください。 ・QuadroFX NVIDIAの厳しいテスト基準に合格した高品質の出力を保証しているから決して安くありません。 プロにも安心してお使いいただけます。 ・Tesla QuadroFX以上に品質に重点を置いてテストを行なっています。HPCにはこれ以外の選択肢はありえません。
- 774 名前:デフォルトの名無しさん mailto:sage [2009/07/07(火) 09:07:57 ]
- >>768
OpenGL向けもDirectX向けもないよ。>773にもある通り、NVIDIAがテストしているかどうかの違い。 なんせ、GeForceの製造販売を行なっているELSAの営業の前で堂々と>773みたいなことを仰ってる。 10倍の価格差も、当然ということなのでしょう。
- 775 名前:デフォルトの名無しさん mailto:sage [2009/07/07(火) 22:07:57 ]
- そりゃカノプーが手を引くわけだよな
どうしたってGeForceは価格競争になっちまう
- 776 名前:デフォルトの名無しさん mailto:sage [2009/07/08(水) 00:28:37 ]
- 不特定多数の客向けのプログラムでGPGPUを使うコードを書くやつはアホウ、ってことだな。
- 777 名前:デフォルトの名無しさん [2009/07/08(水) 06:57:16 ]
- 全てアホウと決め付けるのはねぇ
中には超やばいものを開発するかもよ(世界は広い) 特にロシア東欧は要注意!
- 778 名前:デフォルトの名無しさん mailto:sage [2009/07/09(木) 00:40:40 ]
- >>777
アホウと言っているのが、nVIDIAの営業ってことだよ。
- 779 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 00:02:30 ]
- 「阿呆」とは言わなかったけれど、「動かなくても当然ですから」くらいのことは言ってたなぁ。
- 780 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 00:17:01 ]
- 今月末に CUDA2.3 が出るとさ。
PGI compiler 9.0 は2週間体験できるから、Fortran で単純な行列積の コードを書いて試してみたけど、Core2 Quad + GeForce9800GTX で CUDA 2.0 という古い組み合わせのせいか, !$acc region の設定の効果が全く現れなかった。 pgf95 -ta=nvidia:cc11 matrix.f というコマンドでいいと思うんだけど。
- 781 名前:デフォルトの名無しさん [2009/07/11(土) 19:31:18 ]
- CUDA用の姫野ベンチをGTX285で実行しようとしたのですけど動きませんでした。
何が原因かわかりません、どなたかわかる方いらっしゃいましたらお願いします。
- 782 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 20:08:49 ]
- 原因はわかりますが、何をお願いされているのかわかりません。
- 783 名前:デフォルトの名無しさん [2009/07/11(土) 21:19:47 ]
- その原因について詳しく教えて頂きたいのですが
- 784 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 22:37:16 ]
- >>783
原因なら簡単ですよ。 あんたが人間じゃなくて人だからです。
- 785 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 23:13:59 ]
- 動くかどうかも保障してないものが普及するとか思ってるのか?
- 786 名前:デフォルトの名無しさん mailto:sage [2009/07/11(土) 23:20:06 ]
- >>785
>779のことを言っているのなら、QuadroFXとTeslaがあるから大丈夫だと思っている 頭に蛆が涌いているとしか思えないNVIDIAの営業に言ってあげてください。 無駄だけどw
- 787 名前:デフォルトの名無しさん mailto:sage [2009/07/15(水) 19:53:47 ]
- visual profilerについて質問です
プロファイラの項目GPUTimeを見ると全体で3000くらいなのですが、 プログラム中で cutCreateTimer( &timer) を使って計測すると 18ms〜60msのバラけた値が出ます これってどちらが正しい値なのでしょうか?
- 788 名前:デフォルトの名無しさん mailto:sage [2009/07/15(水) 21:31:07 ]
- >>781
バイナリのCUDA SDK1.1だからだろ
- 789 名前:デフォルトの名無しさん mailto:sage [2009/07/15(水) 23:02:02 ]
- >>787
cutCreateTimer()の実装を見てみた?
- 790 名前:デフォルトの名無しさん mailto:sage [2009/07/20(月) 19:00:37 ]
- Fixtarsの資料面白いね、祝日に更新ご苦労さんだわ
この調子で本家資料全部訳してくれないかなw ttp://gpu.fixstars.com/index.php/CUDA%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0TIPS
- 791 名前:デフォルトの名無しさん mailto:sage [2009/07/22(水) 08:05:55 ]
- 2.3来たね、やっと64bit版で32bitコンパイルできるようになった
- 792 名前:デフォルトの名無しさん mailto:sage [2009/07/23(木) 13:44:49 ]
- Mac版の2.3.0ドライバーインストールしてみたら、一回目libcuda.dylibだけ入らなかったことに気付かなくて、全然見当違いの所で原因探してて苦労したよ。
一発で入るようにしてください、nVidia様
- 793 名前:デフォルトの名無しさん mailto:sage [2009/07/25(土) 22:10:54 ]
- ttp://www.nv-info.com/cuda_for_highschool/
20年前の高校生は参加しちゃダメかな?
- 794 名前:デフォルトの名無しさん mailto:sage [2009/07/25(土) 22:13:36 ]
- Teslaプレゼントしろよ
相変わらず一貫してないな
- 795 名前:デフォルトの名無しさん [2009/07/26(日) 23:27:14 ]
- CUDAで動くトリップ検索ツール頂ける方いらっしゃいませんか
- 796 名前:デフォルトの名無しさん [2009/07/27(月) 00:50:11 ]
- ノシ
- 797 名前:デフォルトの名無しさん mailto:sage [2009/07/27(月) 03:25:45 ]
- 【レポート】中高生がCUDAにチャレンジ! NVIDIAがGPUコンピューティングの体験イベント開催 | パソコン | マイコミジャーナル
journal.mycom.co.jp/articles/2009/07/27/cuda/index.html
- 798 名前:デフォルトの名無しさん mailto:sage [2009/07/27(月) 10:10:10 ]
- >>795
あれ?まだ誰も作ってなかったの?
- 799 名前:デフォルトの名無しさん mailto:sage [2009/07/27(月) 10:43:20 ]
- あと6年早ければ・・・
- 800 名前:デフォルトの名無しさん mailto:sage [2009/07/27(月) 11:08:28 ]
- >>798
らしいです
- 801 名前:デフォルトの名無しさん mailto:sage [2009/07/27(月) 22:53:08 ]
- じゃぁ俺が作るか。
まずはCUDA無いバージョンのソースがあるURL教えてw
- 802 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:02:52 ]
- まあ、待て屋。
- 803 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:07:41 ]
- >>802
それはラデ用のしかなかったような…
- 804 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:11:46 ]
- CUDA無しを所望のようだからこれで良くね?
CPU用のコードも当然あるよ。
- 805 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:17:31 ]
- >>804
nVIDIAのVGAしか持ってないんだorz
- 806 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:22:33 ]
- >>805は>>795か?
俺は>>801に向けて書いたんだが・・・
- 807 名前:デフォルトの名無しさん mailto:sage [2009/07/28(火) 00:26:42 ]
- >>806
あ、はい。 俺は>>805であり、>>795です。 ID出てないと面倒だね
- 808 名前: ◆hEpdoZ.tHU mailto:sage [2009/07/28(火) 06:51:10 ]
- >>807
トリップ使ってけれw
- 809 名前: ◆DokuomoeW. mailto:sage [2009/07/28(火) 16:50:48 ]
- >>808
おk >>807です
- 810 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/07/29(水) 21:19:39 ]
- Larrabee向けのソースコードなら多分あるんだがwwwww
- 811 名前: ◆DokuomoeW. mailto:sage [2009/07/30(木) 12:59:13 ]
- まだ手元にある定額給付金で
ラデ買ってくるかな… それも一つの選択肢
- 812 名前: ◆DokuomoeW. mailto:sage [2009/07/31(金) 21:10:00 ]
- かつてTripcode ExplorerのCUDA版があったらしいね
でも、今はもう消えてる…
- 813 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/07/31(金) 21:52:43 ]
- ギコハハハ
- 814 名前:デフォルトの名無しさん mailto:sage [2009/07/31(金) 22:14:27 ]
- >>812
がはは!それはネタだからーw
- 815 名前: ◆DokuomoeW. mailto:sage [2009/07/31(金) 23:11:08 ]
- >>814
そうなんだwwwwww
- 816 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/07/31(金) 23:31:10 ]
- ふふふ
- 817 名前:デフォルトの名無しさん mailto:sage [2009/08/01(土) 05:48:13 ]
- あらあらふふふ
- 818 名前:デフォルトの名無しさん mailto:sage [2009/08/01(土) 07:37:39 ]
- これでいいじゃん
tmkk.hp.infoseek.co.jp/tripper/
- 819 名前:デフォルトの名無しさん mailto:sage [2009/08/02(日) 20:49:45 ]
- 300Wも消費する物体を数週間動かすとは恐ろしいw
- 820 名前:デフォルトの名無しさん mailto:sage [2009/08/03(月) 07:25:23 ]
- shared memoryって,CPUで言うL1キャッシュみたいなもん??
- 821 名前:デフォルトの名無しさん mailto:sage [2009/08/03(月) 08:04:31 ]
- >>818
これって使うとどれくらい寿命減るの? 作った人って絶対に高負荷かけて石を壊そうとしてるよね・・・
- 822 名前:デフォルトの名無しさん mailto:sage [2009/08/03(月) 15:36:31 ]
- >>821
なにいってるの・・・ まあたしかにファンがクソだと熱で死ぬ可能性はあるが
- 823 名前:デフォルトの名無しさん mailto:sage [2009/08/04(火) 03:54:01 ]
- >>820
大分違う。つーか、CPUとは考え方を変えないと使いこなせないよ。
- 824 名前:デフォルトの名無しさん mailto:sage [2009/08/04(火) 10:08:33 ]
- >>820
CPUで言うレジストリみたいなもんだ
|

|