【GPGPU】くだすれCUDAスレ part6【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 05/30 06:39 / Filesize : 210 KB / Number-of Response : 866
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2012/09/23(日) 23:17:47.58 ]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://hibari.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
toro.2ch.net/test/read.cgi/tech/1314104886/
55 名前：デフォルトの名無しさん mailto:sage [2012/10/19(金) 12:39:47.00 ]: Linuxなら、GUI止めないとカーネルによっては処理速度ががた落ちする。
使えるGVRAMも激減する。
56 名前：デフォルトの名無しさん mailto:sage [2012/10/19(金) 19:37:02.47 ]: CUDA + GUIつっても、サンプルでXが関わるところなんてウィンドウの枠だけじゃないか？
あとはOpenGLで描画されていると思うが
57 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 00:42:13.70 ]: >>55
Windowsのほうがガタ落ちだし、使えるメモリも少ない。
グラフィックスを使うと遅くなるのはXの問題だから。
58 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 16:27:41.31 ]: dynamic parallelism は GeForce じゃ無理なんですか
59 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 17:35:11.22 ]: うん。
60 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 17:41:18.83 ]: 調べたなかではＧＤＲＡＭのみのように見えるんだけど、
テスラだとＬ１、Ｌ２、シェアードメモリもＥＣＣ保護されてるの？
それともＬ１、Ｌ２くらいの容量なら気にしなくてもいいのかな？
61 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 20:24:55.79 ]: レジスタも。
62 名前：デフォルトの名無しさん mailto:sage [2012/10/20(土) 20:47:40.75 ]: >>58
今のところTesla K20のみだったはず
63 名前：デフォルトの名無しさん mailto:sage [2012/10/22(月) 20:36:15.81 ]: 一般人向けは2014年まで待てとか遅すぎる
64 名前：デフォルトの名無しさん mailto:sage [2012/10/22(月) 21:06:37.69 ]: GK110はいつになったら一般向けで出てくるのやら…
65 名前：デフォルトの名無しさん mailto:sage [2012/10/22(月) 23:32:49.15 ]: >>64
ないと思うのは俺だけか
66 名前：デフォルトの名無しさん mailto:sage [2012/10/22(月) 23:35:31.31 ]: >>65
gtx780とかじゃないか？
来年の春だった気がする。
67 名前：デフォルトの名無しさん mailto:sage [2012/10/23(火) 04:53:17.04 ]: GTX 780はKepler1の改良版だって聞いたぞ。
68 名前：デフォルトの名無しさん mailto:sage [2012/10/23(火) 08:47:20.31 ]: 一般人向けでダイナミックなんちゃらが使えるのはMaxwellからとか

AMDが2013年中に簡単にOpenCL対応アプリをかけるようにしてきたらどうするんだろ
69 名前：デフォルトの名無しさん mailto:sage [2012/10/23(火) 16:30:26.65 ]: NVIDIA Visual Profiler v4.2をCentos6.2で使おうとしてるんだけど、

No Timeline
Application timeline is required for the analysis.

と出て解析できない。
調べたらLD_LIBRARY_PATHに/usr/local/cuda/lib64やらを追加せよとあったんでやってみたけど状況変わらず。
どなたか同様な症状に出くわした方はいらっしゃいませんか？
70 名前：デフォルトの名無しさん mailto:sage [2012/10/23(火) 22:26:20.49 ]: >>69
CUDAプログラミングはまだまだ敷居が高いね･･･
71 名前：デフォルトの名無しさん mailto:sage [2012/10/24(水) 10:52:47.74 ]: nvcc ***.cu -O2 -Xcompiler -O2
のようにO2を重ねるのは無意味ですか？
前者のO2はGPU用，後者のO2はCPU用と勝手に思っていたんですが，
同じ事を繰り返しているような気がしてきました．
72 名前：デフォルトの名無しさん mailto:sage [2012/10/24(水) 12:32:18.86 ]: >>71
意味があるのか、どのような意味があるのかまでは分からんが、
とりあえず、「同じ事を繰り返しているのかどうか」については、
出力されたファイルを比較すれば直ぐに分かると思うぞ。

バイナリで比較してもいいし、アセンブラコードで比較してもいい。
73 名前：71 mailto:sage [2012/10/24(水) 13:25:43.83 ]: ptxで２つある場合，前者のみ，後者のみ，両方無い場合を比較しましたが，
冒頭の***.iファイルの名前が微かに違うのみで差はありませんでした．
両方消しても差が出ないのは？ですが，
重ねても意味は無さそうであることが分かりました．

>>71
ありがとうございました．
74 名前：デフォルトの名無しさん mailto:sage [2012/10/24(水) 14:43:07.65 ]: >>73
今のgccのディフォルトが-O2相当なんで、書かなくても変わらないのはその所為。
試しに、-O3とか-O1との組み合わせを試してみたら?
75 名前：デフォルトの名無しさん [2012/10/25(木) 04:28:58.35 ]: 登録ユーザーサイトが復旧したよ
76 名前：デフォルトの名無しさん mailto:sage [2012/10/25(木) 21:42:51.21 ]: k20はやっぱり高いな。
38万だそうだ。
20万切ってくれないと買えない。
77 名前：デフォルトの名無しさん mailto:sage [2012/10/27(土) 22:36:10.01 ]: dynamic parallelism対応のGeforce（GTX8XX?)が出たら
画像とか動画を扱うソフトは瞬く間にCUDA完全対応になるのかね?
78 名前：デフォルトの名無しさん mailto:sage [2012/10/28(日) 00:23:20.16 ]: んなわけない
79 名前：デフォルトの名無しさん mailto:sage [2012/10/28(日) 00:40:32.58 ]: dynamic parallelismができるからCUDAが劇的に簡単になるわけじゃないから。
Reductionとかで効果はあるけど。
80 名前：デフォルトの名無しさん mailto:sage [2012/10/28(日) 03:58:28.19 ]: そもそもReductionはマルチパスにしないで
2パスで済ませた方がいいのは、
CUDAのreductionトレーニングでも明らか
81 名前：デフォルトの名無しさん mailto:sage [2012/10/29(月) 13:40:34.37 ]: CUDAのプログラム作って動かしたいです
自分のMacbookは、グラフィックのチップがIntel GMA X3100なんですけど、
NVIDIAじゃないとCUDAは使えないんですか？
82 名前：デフォルトの名無しさん mailto:sage [2012/10/29(月) 15:35:40.18 ]: ここで聞いて良いのか分からないので、不適切なら誘導お願いします。

GeForceの省電力の状態(P0～P12)をGetLastInputInfo-GetTickCountに
応じて切り替えるようなソフトを作りたいのですが、
P0～P12を切り替えるAPI関数はありませんか?
83 名前：デフォルトの名無しさん mailto:sage [2012/10/29(月) 18:51:19.74 ]: NVAPIをhackすればできる
84 名前：デフォルトの名無しさん mailto:sage [2012/10/31(水) 14:40:39.17 ]: CUDAカーネルの中で呼び出す関数に特定の処理を入れるとカーネル自体が読み込まれなくなります
具体的にはプロファイラで実行時間見てみるとカーネル自体が表示されず、一瞬で動作終了する状況です
一応、その特定の処理の部分をコメントアウトするときちんと実行されます（当然正しい結果は出ませんが）
こういったことはどういう状況で起こり得るのでしょうか？
85 名前：デフォルトの名無しさん mailto:sage [2012/10/31(水) 14:43:09.18 ]: >>84
カーネル呼び出した時にエラーが起きてるんでしょ。
エラーチェックしていないんじゃないの?
86 名前：デフォルトの名無しさん mailto:sage [2012/10/31(水) 14:54:52.27 ]: >>84
cudaGetLastError()は何と言っている?
87 名前：デフォルトの名無しさん mailto:sage [2012/10/31(水) 14:58:04.91 ]: >>85
即レスありがとうございます
正にその通りでした。単にメモリの要求量がおかしかっただけみたいです
初歩的すぎるミスに自己嫌悪…
88 名前：デフォルトの名無しさん [2012/10/31(水) 16:49:46.93 ]: NVIDIAR Nsight? Visual Studio Edition 3.0 CUDA Preview
Nsight Visual Studio Edition Early Access | NVIDIA Developer Zone
https://developer.nvidia.com/rdp/nsight-visual-studio-edition-early-access
89 名前：デフォルトの名無しさん [2012/11/03(土) 02:08:23.38 ]: Nvidia Geforce forum is back from the dead
www.fudzilla.com/home/item/29337-nvidia-geforce-forum-is-back-from-the-dead
90 名前：デフォルトの名無しさん mailto:sage [2012/11/07(水) 15:17:37.33 ]: CRS形式の行列格納サンプルコードってどこかにない？
91 名前：デフォルトの名無しさん mailto:sage [2012/11/07(水) 15:59:46.17 ]: いくらでもあるだろ
圧縮方法を理解できたらサンプルもいらんな

1 2 3 4
2 5 6 7
3 6 8 9
4 7 9 10
92 名前：デフォルトの名無しさん mailto:sage [2012/11/08(木) 02:56:28.41 ]: >>91
圧縮方法はわかったんですがコードに上手く起こすことができなくて困っていたんです。何かいいサンプルがあれば教えていただけると助かります。
93 名前：デフォルトの名無しさん mailto:sage [2012/11/08(木) 10:51:49.85 ]: 馬鹿には無理。
94 名前：デフォルトの名無しさん [2012/11/12(月) 06:21:00.64 ]: CUDA5は既存のGPUに入れると遅くなるの？
95 名前：デフォルトの名無しさん mailto:sage [2012/11/12(月) 14:32:24.27 ]: 研究室でCUDA用にGTX680搭載PCの導入が決定してしまったんだが評判悪いとはいえ流石に今使ってる560Tiよりは性能いいよね？
96 名前：デフォルトの名無しさん mailto:sage [2012/11/12(月) 23:48:40.00 ]: Tesla K20きたぞ
97 名前：95 mailto:sage [2012/11/13(火) 01:28:48.03 ]: >>96
予算処理上の都合だったらしい。
98 名前：デフォルトの名無しさん mailto:sage [2012/11/13(火) 03:25:03.66 ]: 最近プログラム入門した
CUDAとか聞くとワクワクするけど物理の知識も科学の知識も特にないので
数百万スレッド並列で処理するネタが思いつけなくて悲しい思いになる
もっとちゃんと勉強しておけば良かった
99 名前：デフォルトの名無しさん mailto:sage [2012/11/13(火) 05:46:01.18 ]: 京が3位に
100 名前：デフォルトの名無しさん [2012/11/13(火) 06:14:28.20 ]: 東工大の学生たちはもうGK110貰ってるの？
101 名前：デフォルトの名無しさん mailto:sage [2012/11/13(火) 23:01:28.72 ]: Intelがついに来るぞ
pc.watch.impress.co.jp/docs/news/20121113_572526.html

ソースの改変が少しでパラレル計算ができるとのことだが、実際の所どうなんだろうね。
102 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 00:25:44.33 ]: >>101
nVIDIAが押されて、もうちっと貧乏客を引き込むマーケティングをやってくれんかな。

一般のビデオカードで定格の80%までクロックを公式に落とせかつその速度なら
GPGPUの動作を保証。
これを是非やってほしい。仲がよいベンダーがいくつかあるし。
103 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 16:56:20.91 ]: 開発環境やソフトウェアの安定性とか含めて、XeonPhi強そうだなぁ
104 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 18:03:25.42 ]: XeonPhiは高いぞ
安いGPUは安い
Tesla買うならXeonPhiのほうがよさそうだが
105 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 19:32:13.13 ]: 半年ぐらいしたら、$500くらいのローエンドXeon Phiが出るだろうから、純粋にアクセラレータとしてのteslaは厳しいかもなあ。
106 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 20:08:20.86 ]: Phi触ってみてぇ。
OpenMPで簡単マルチコアプログラミング♪

スレッドオーバーヘッドが小さいことを願う･･･
107 名前：デフォルトの名無しさん [2012/11/14(水) 20:25:15.46 ]: SSEとかAVXみたいなのをちゃんと使える人じゃないと
TESLAのような性能はでないよ。
512bit演算命令が命だから。

ただのロジックを複数スレッド回したい人なら、
TESLAより速いかもね。かなりの無駄だが(笑)
108 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 20:30:01.47 ]: 512bit演算命令ってのがあるのか？
AVXでも256bitだが・・・
109 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 20:32:10.61 ]: VPUてので512ビット命令を処理するようだな
110 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 20:33:10.12 ]: ま、経験上はベクトル命令はCUDAよりは扱いやすいよ
111 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 20:37:54.55 ]: うん、イントリンシックでベクトリ処理書くの楽♪
条件分岐がめんどいけど、LNIはマスクレジスタをサポートしてたからだいぶ楽に書けそう。
しかも512bitもあるなんて最高すぐる。

あー、Phi触りてぇ～。
112 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 21:32:04.73 ]: OEM向け1000個ロットでXeon Phi 5110Pが2650ドル
らすぃ
なんか価格でもTeslaやばそうだな

Intel，スーパーコンピュータ向けアクセラレータ「Xeon Phi 5110P」発表。60基のx86コアを1チップ上に集積
ttp://www.4gamer.net/games/049/G004963/20121111001/
113 名前：デフォルトの名無しさん [2012/11/14(水) 21:33:53.30 ]: むしろ値下げ合戦になればよい。
114 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 21:47:31.12 ]: 合戦になるほど数競争起きる市場でもないべ
115 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 21:53:57.69 ]: CUDAの強み：先行者利益、CUDAが一応動く環境が多め、設計製造がGPUと共用なので低コスト
Xeon Phiの強み：たぶん使いやすさ

って感じだと思う。HPCを本気でやる人たちはXeon Phiのほうに目がいくんじゃないかな。
Xeon Phiはそれはそれで制約があるんだろうけど、CUDAよりは融通が利きそうだから。

Geforce持ってるしCUDAで遊ぶのはいいけどXeon Phi買うとかありえんわっていう一般人としては、
KeplerはあきらめるとしてMaxwellで再びFermi並にGeforceにもGPGPUの機能を盛り込んでほしいと思う。

しかしFermiのときにNVIDIAはCUDA使いの増殖とCUDAアプリの誕生の期待をこめて
Fermiにもそれなりに機能を持たせたんだと思う。しかし今後CUDAをうまく活用するアプリが
HPC以外で出てくるかというと、結構諦めモードなんじゃないかと。
つまりMaxwellもGeforce製品はGPGPU捨ててくるんちゃうかと。
つまりCUDA使いのおまいらがんばってくださいおながいします
116 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 21:56:39.37 ]: 長文の上に間違えてーらorz
Fermiにもそれなりに機能を持たせたんだと思う→Geforceにもそれなりに機能を持たせたんだと思う
117 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 22:59:58.87 ]: >>115
nVIDIAの株を空売りすれば儲かるということか。
118 名前：デフォルトの名無しさん mailto:sage [2012/11/14(水) 23:57:37.97 ]: phiはCPUに内蔵させるGPUコアと共通化させて
コスト落としつつマーケットシエア取る作戦かな？

そしたら、本気でnVidia終わるな
119 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 00:11:23.74 ]: >>112
Phi、扱い易そうだな。
ベクタ演算器処理の記述法が気になるとこだし、
nVidiaがアセンブラのように複雑ってディスってたけど、
イントリンシック記述だったら簡単だし、
条件分岐のマスクまでサポートしてくれたら文句なしだ。

これ、マジで触ってみたいな。
120 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 04:26:43.84 ]: CUDAは開発環境タダだけどXeon PhiはIntel Compiler必須だよね
121 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 05:55:49.56 ]: ものいりだねえ、 Phi
122 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 11:55:29.66 ]: >>120
GCCが対応するって書いてあったぞ
123 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 15:34:52.68 ]: そもそもintelコンパイラもLinux版はフリーだよな
124 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 18:21:21.39 ]: ここのスレ見てたら、phiを月2、3万位でレンタルする商売が出来そうな気がしてきた…
125 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 20:33:05.20 ]: GPUだってAmazonのクラウドで借りたりできるし
Phiもそういうの出るだろう
126 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 23:35:19.70 ]: >>114
まあ、ATI Streamが出てきたからといってTeslaが安くなったというわけじゃないからな。
しかし、今回の場合Phiの場合はコードの書きやすさからすると、CUDAの比じゃないから、
>>115にあるお互いの強みを生かして、切磋琢磨して値下げ合戦してほしいわ。
両方のコードを書いている身としては安くなってくれればどっちでもいいんだが。
127 名前：デフォルトの名無しさん mailto:sage [2012/11/15(木) 23:36:48.09 ]: Phi、4、5万で買えるようにならないかなぁ～。
128 名前：デフォルトの名無しさん mailto:sage [2012/11/17(土) 12:12:13.46 ]: Phいらないだろ
一晩中PC動かせばいいだけだろ
129 名前：デフォルトの名無しさん mailto:sage [2012/11/17(土) 12:35:26.08 ]: 動画エンコ用途でもあるまいにｗ
すでに一年中計算回してるような人に、これなら一ヶ月で済むよ、って訴求するのが筋の製品だろ
130 名前：デフォルトの名無しさん mailto:sage [2012/11/17(土) 13:00:33.16 ]: 数時間、数日動かして、後から些細なバグに気づいた時の何とも言えない気持ち

これを何とか少しでも解消してくれるシステムが欲しいな

バグを直したら、その部分だけ再計算すればいいような仕組み
131 名前：デフォルトの名無しさん mailto:sage [2012/11/17(土) 14:05:25.11 ]: >>130
とりあえず賽の河原症候群と名付けておくよ
132 名前：デフォルトの名無しさん mailto:sage [2012/11/19(月) 21:17:02.44 ]: phiは本体CPUもXeon使った時の協調性とかで
パワー増すんだろうなぁ
Teslaやばいなぁ…

…投げ売りになってくれると嬉しいなぁ
133 名前：デフォルトの名無しさん mailto:sage [2012/11/19(月) 22:16:34.19 ]: しかし投げ売りの後に待っているのが撤退だとしたら…？
Xeon Phiには縁がなさそうだから気軽に触れるCUDAにがんばってほしいなぁ
134 名前：デフォルトの名無しさん mailto:sage [2012/11/19(月) 22:19:19.97 ]: 自作ゲームにCUDA利用してる奴っている？

いるなら、何に使ってる？
135 名前：デフォルトの名無しさん mailto:sage [2012/11/22(木) 18:48:11.46 ]: 使えもしないのに欲しくなってとりあえずダウンロードしているんだけど
クソミソに通信速度遅い。
25～60KB/sをウロウロしてるけどそんなもん？
ttp://developer.download.nvidia.com/compute/cuda/5_0/rel-update-1/installers/cuda_5.0.35_winvista_win7_win8_general_64-1.msi
136 名前：デフォルトの名無しさん mailto:sage [2012/11/22(木) 19:03:52.66 ]: >>135
ウチじゃ2.0MB/s位出ているぞ。
137 名前：デフォルトの名無しさん mailto:sage [2012/11/22(木) 20:53:34.08 ]: まじすか
一端回線切ってIPアドレス変更とかしても速度出ない・・・

OCN保土ヶ谷
138 名前：デフォルトの名無しさん mailto:sage [2012/11/23(金) 01:07:04.36 ]: >135
遅すぎ
間に無線とか入れてない？
139 名前：デフォルトの名無しさん mailto:sage [2012/11/30(金) 22:59:09.24 ]: 人柱はまだか
www.amazon.co.jp/dp/B00A31Q6QI/
140 名前：デフォルトの名無しさん mailto:sage [2012/12/01(土) 19:38:58.57 ]: >>139
高すぎ。

今だったら34万くらいで買えるだろ。
141 名前：デフォルトの名無しさん mailto:sage [2012/12/01(土) 23:01:57.20 ]: CPU内蔵のiGPUをPCの表示用に、dGPUをCUDA　GPGPU専用にする場合
やdGPUを2つ使って片方をPCの表示用に、もう片方のdGPUをCUDA　GPGPU専用にする場合
ってそれらが出来る(出来ない)マザー、CPU・APU、dGPUってある?
出来るのなら、これをPC表示用、これはGPGPU用って設定とかするの
する場合どうするんですか?
142 名前：デフォルトの名無しさん mailto:sage [2012/12/01(土) 23:12:12.90 ]: >>141
GTX 580/590とASUS Maximus V GeneとCore i7-3770Kの組み合わせなら出来た。
BIOSでどちらを表示用に使うか設定できる。
143 名前：デフォルトの名無しさん mailto:sage [2012/12/01(土) 23:59:21.54 ]: >>142
劇速れすありがとう
マザーのBIOSに設定があれば、iGPUとdGPUの場合は出来ると
思っていいのかな
144 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 00:02:38.36 ]: >>143
CUDAのデバイス指定はアプリケーション次第だよ。BIOSは関係ない。
ちゃんとどのデバイスを使うか指定できるようになっていれば問題ないよ。
145 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 10:03:50.91 ]: >>144
CPU内蔵の（CUDAが使えない）iGPUとグラボ側の（CUDAが使える）dGPUがあったとして、
今dGPUを表示用に使用して、iGUの方は眠らせるようにBIOSが設定されているのなら、
CUDAを使うとひとつのdGPUで表示もCUDAも使うことになると思う。

この場合はBIOSでiGPUを表示用に設定させないとダメなんじゃないか？

あと、ついでに俺も聞きたいんだが、そうやってiGPUで表示してdGPUでCUDAする場合、
cudaGLSetGLDevice関数などを使ったCUDAとOpenGLドライバとの相互運用はできるの？
（DirectXとの相互運用でもいいけど）
146 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 10:25:11.74 ]: >>145
だから、BIOSで設定するのは画面の表示だけってことなんだよ。
CUDAでの利用はそれとは全く別に行えるよ。
BIOSでiGPUを表示用に選んでマザボにディスプレイをつないでから、
CUDA対応アプリでdGPUを選べばいいだけの話。

OpenGLは使ったことないけど、CUDAを使った限りでは相互運用は全く問題ない
ように見える。
147 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 10:35:51.19 ]: >>146
すまん、言い方が悪かった。
その「BIOSでiGPUを表示用に選んでマザボにディスプレイをつないでから」が、
CUDAを使ったプログラム側からは操作できないから、
BIOSをいじる必要があるよねという（当たり前と言えば当たり前の）確認だけだったんだ。

> OpenGLは使ったことないけど、CUDAを使った限りでは相互運用は全く問題ない
> ように見える。

ん？
cudaGLSetGLDevice関数を使った相互運用は、例えばCUDAの結果がVRAMに入ってて、
それを直接OpenGLのテクスチャとして使える（CPUやメインメモリを介さず）、
という事だと俺は認識してるんだが、表示用とCUDA用で分かれててもできるのか？

もしかしたら、俺の認識を根底から改めねばならんかも・・・

誰かこの辺り分かる人いる？
148 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 10:45:06.90 ]: >>145
グラフィックライブラリと相互運用する場合は
出力用GPUとCUDA用GPUは同じな必要があるんじゃない？
俺はそうしてる．
確かめたことがあるわけじゃないから無責任な言い方になるけど．
GTX 580(1)から二画面，GTX 580(2)から一画面のトリプルディスプレイやった時に
SDKのスモークパーティクルとか起動しなかった記憶がある．
149 名前：デフォルトの名無しさん mailto:sage [2012/12/02(日) 16:46:04.44 ]: 表示用デバイスでなくてもOpenGLは動かせるから、cudaと連携できると思う。
150 名前：デフォルトの名無しさん mailto:sage [2012/12/21(金) 19:28:45.07 ]: SDKのマーチングキューブのサンプルで、defines.hの中の #define SAMPLE_VOLUME ってところが
0だとあらかじめ用意された関数が、1（デフォ）だとファイルが読み込まれるんだけど、ここを0にしてもなにも表示されない
コードはそこ以外いじってないんだけどほかにも変更しなきゃいけない部分とかあるのかしら
151 名前：デフォルトの名無しさん mailto:sage [2012/12/22(土) 19:54:35.28 ]: >>150
ごめん自己解決した
VSでコードいじってたんだけど、すべてリビルドしたら表示されるようになった
152 名前：デフォルトの名無しさん mailto:sage [2012/12/26(水) 08:21:21.01 ]: Fermiでスレッドブッロクを512以上を指定すると、カーネルが起動しない。
Fermiはブロックごとに1024スレッド対応しているはずなので、
までレジスタが足りないからなのか、
シンプルなカーネルだと1024スレッドまでいける。
動かないならエラーで落ちて欲しいんだが。
153 名前： ◆4hloUmTGPY [2012/12/27(木) 10:24:29.87 ]: 質問です

CUDA+VisualStudio2012Deskという環境でプログラミングしているのですが、
Intellisenceがうまく動かないんです。

__global__ void kernel(){...}
main() {... kernel<<<1,1>>>(); ...}
の、<<< >>>だけうまく動かないんですよ。

ビルドは一応できて実行もできるんですが、気持ち悪いので何とかならないでしょうか
154 名前：デフォルトの名無しさん mailto:sage [2012/12/27(木) 11:09:28.44 ]: >>153
いんてりせんすがC++以外の表記に対応していないんだろ。
自分でぷらぐいんを書けばなんとかなるんじゃね?
尤も、いんてりせんすに頼るような奴に書けるかどうかは知らんが。
155 名前：デフォルトの名無しさん mailto:sage [2012/12/27(木) 22:41:04.67 ]: 2012じゃCUDAの環境がまだまだなんじゃね？
2010だとようやくこなれてきた感じがあるが。

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef