【GPGPU】くだすれCUDAスレ part7【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/23 11:04 / Filesize : 248 KB / Number-of Response : 1045
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2014/11/20(木) 23:14:46.66 ID:jr3oZn27.net]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
331 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 21:46:57.46 ID:vs1yi7F6.net]: >>321
倍精度乗算器の回路コストは単精度の約4倍
332 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 22:30:54.71 ID:MibI1Q78.net]: バカが住み着いてる
333 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 22:58:36.28 ID:9fNLotPU.net]: 実際に業務で使ってる人は倍精度で運用してるのか？
334 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:10:33.37 ID:BOcjqYcH.net]: >>323
まあ純粋に乗算器だけでいえばそうだけど...

>>322
半精度はさすがにゲームでも足りない
半精度専用GPUなんて出ない
少なくともPC用には
335 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:17:23.47 ID:BOcjqYcH.net]: >>325
業務っていろいろあるが
おれの範疇は単精度、倍精度、疑似4倍精度、多倍長といろいろ
多倍長も、筆算レベルからカラツバ、DFTレベルとさまざま
もちろん普通のレジスタサイズの整数演算も
特殊なジャンルであることは否定しない
336 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:19:49.62 ID:BOcjqYcH.net]: 半精度もIEEE754じゃない独自フォーマットなら使った事はあるが、使った事があるって程度
337 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:27:26.75 ID:dRJvSEmL.net]: >>326
>半精度はさすがにゲームでも足りない

そんなこと分かるかよ
HDRで16bit浮動小数点フォーマットとか普通に使うだろ
メモリ帯域が半分で済むんだぞ
ゲームなんか正確さより速さ優先だから、色を表現するのに16bitで十分な場合がほとんどだろ
338 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 01:51:42.07 ID:LP8V/wwM.net]: だから違うよ
使ったことがあるかじゃねーよ
何でその精度が必要なのかってところよ
4倍精度とか軽々しく言うが
このスケールが本当にわかってるのか
疑わしいぜ
339 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 03:08:21.02 ID:xiUt8T5M.net]: 4倍精度とか専用ハード作れとしか言いようがない
汎用品に求めるものじゃない
340 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 12:53:46.97 ID:ULLNmZyK.net]: >>326
よく嫁
Pascalは基本混合精度
PK104は単精度と半精度の混合
PK100は倍精度の混合らしいが、多分これはテスラ新シリーズとして販売だと思う

もうグラボ価格の倍精度CUDA組はむりぽ

>>331
もうPEZYにお願いするしかないよ、倍々精度
これはマジでそう思ってる
逆を言えば理研＝PEZYの特殊HPCはそこしか生き残りが出来ないのではないか

どうしてもというならARMカスタムとか

倍精度はNVはもうだめぽだから、AMDに期待するしかない
341 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 13:17:56.85 ID:sWHooGm6.net]: 混合精度って単精度と半精度が両方載ってるって事だ�
342 名前：謔ﾈ 仮に1個の演算器の回路規模が1:3として、演算器の回路比率を1:1にし、単精度は半精度の演算も出来るとすると、すべて単精度にした場合に比べて演算器の数は単精度が半分で単精度が2倍か 単精度2倍のインパクトよりも単精度半分のインパクトの方が大きい気がする []: [ここ壊れてます]
343 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 14:24:13.48 ID:ULLNmZyK.net]: 完全にグラフィックス描画効率/深層学習向けの構成だね
データ地獄になるから広帯域メモリも必要になるがHBM規格はAMDが握っているために、（HBM2の）開発が遅れた
GDDR5＋を急遽導入する事になったのはそのため

このスレだとDX12とかVulkanとか一言口にするだけで「スレチガイだ馬鹿！」と怒鳴る奴がいるが、
これは全てが絡み合っている

DX12とVulkanという二つのローレベルAPIがAMD中心による策定である以上、これらのローレベルAPIへの依存を避ける
ワットパフォーマンスGPUに経営路線の舵を切るの必然
344 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 15:52:24.40 ID:MS6gBcZU.net]: >>334
スレチガイだ馬鹿！
345 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 20:33:43.42 ID:ubpTh4Nt.net]: >>334
そのすごいAMDでお前はどんなGPGPUソフト/プログラム作っていいるんだ？
346 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 21:22:14.45 ID:xseyqTiA.net]: cudaだっつうに

hsaスレでやってろ
馬鹿
347 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 22:08:37.37 ID:+ZIKPYce.net]: 雑談は楽しいけど、ここCUDAスレやで
amdの話をするなってことじゃなく、スレチ話をいつまですんねんってこと
348 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 22:41:10.14 ID:NB4DG1EG.net]: Visual Studio 2015対応になるのはいつですかねぇ
349 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 12:08:39.46 ID:15l+1fC7.net]: >>336　>>337
自演乙
わざわざ自作板から出張ご苦労様
350 名前：デフォルトの名無しさん [2016/02/03(水) 12:56:39.94 ID:d3Nc4Jqw.net]: バカな上の病気なんだな
351 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 14:19:34.04 ID:15l+1fC7.net]: Pasacalこけそうで危機感いっぱいだは
352 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 22:25:31.36 ID:hEPpn7Fg.net]: だはｗ
353 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/03(水) 22:25:59.26 ID:gpz71jEo.net]: TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ
354 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 13:10:48.29 ID:lq8BoEbf.net]: >>344
お前が使い方を知らないだけ
355 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 13:11:30.26 ID:lq8BoEbf.net]: >>344
お前は半精度だけで十分
356 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 18:29:53.21 ID:TT5D/Cpx.net]: Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな
357 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:00:25.29 ID:o+ucOEnp.net]: 単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。
358 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:13:21.23 ID:d8M6zG1u.net]: Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし
359 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:15:36.92 ID:TT5D/Cpx.net]: FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる
360 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/04(木) 23:21:52.01 ID:zdF89aL0.net]: いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん
361 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 23:28:29.99 ID:3r7tJtQx.net]: 深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？
362 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 00:42:53.10 ID:TcXSJNY1.net]: 半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ
363 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 01:21:13.26 ID:p946S2WD ]: [ここ壊れてます]
364 名前：.net mailto: >>351
＞ゲームで倍精度なんて使わないじゃん

団子！
お前はインテルスレとﾜｯﾁｮｲIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ []: [ここ壊れてます]
365 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 04:09:45.89 ID:iPwofUfz.net]: 倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>353
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。
366 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 07:52:28.94 ID:X6eE9Wue.net]: すまんがゲーマーは帰ってくれないか？
367 名前：デフォルトの名無しさん [2016/02/05(金) 08:26:49.67 ID:23YXKvG1.net]: なぜ団子がここにいる？

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。
368 名前：デフォルトの名無しさん [2016/02/05(金) 08:45:35.15 ID:bTIbnCX4.net]: いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
369 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 08:50:46.42 ID:KXdvQQGq.net]: 1スレ目に三色団子おるな
370 名前：デフォルトの名無しさん [2016/02/05(金) 12:16:48.26 ID:bTIbnCX4.net]: techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
371 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 12:55:11.71 ID:p946S2WD.net]: >>358
だからお前はインテルスレに帰れっつってんだろ団子！
372 名前：デフォルトの名無しさん [2016/02/05(金) 13:02:33.01 ID:bTIbnCX4.net]: また病気か
373 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 13:44:39.13 ID:p946S2WD.net]: >>362
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！
374 名前：デフォルトの名無しさん mailto: []: [ここ壊れてます]
375 名前：sage mailto:2016/02/05(金) 14:31:20.41 ID:3SvgNTFs.net [ 団子ってなに？ ]: [ここ壊れてます]
376 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 14:36:57.91 ID:3a93fntK.net]: どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね
377 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 16:33:49.39 ID:3vmCyKKd.net]: 倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに
378 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 16:34:59.76 ID:3vmCyKKd.net]: バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい
379 名前：デフォルトの名無しさん [2016/02/05(金) 16:48:34.33 ID:bTIbnCX4.net]: ほとんど関係ない
www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
380 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 23:50:50.50 ID:TcXSJNY1.net]: はやく4倍精度のせろ！
381 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 12:36:05.76 ID:pRi/vsC+.net]: それをPEZYに言ってくれ
382 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 18:18:06.14 ID:xHoLN9eE.net]: お前その会社好きだな
一般向けに売ってもいないのに
383 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 20:15:07.20 ID:pRi/vsC+.net]: PEZY以外に応じてくれないぞ
384 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 20:47:57.74 ID:xHoLN9eE.net]: それでそこの製品は使ってるのか？
385 名前：デフォルトの名無しさん mailto:sage [2016/02/08(月) 05:05:55.45 ID:z0FWqNRt.net]: いい加減にないものねだりはやめろ。
386 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/08(月) 22:05:16.73 ID:ZbGdhM32.net]: 「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ
387 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/08(月) 22:24:56.08 ID:lyi6FC/t.net]: もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな
388 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 00:34:13.76 ID:LI1PJjMq.net]: >世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。
389 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 13:10:44.06 ID:i8FfOnoz.net]: >>376
あなたはどこの大学ですか？
390 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 14:10:52.05 ID:rPxo0Z4x.net]: 最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は
391 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 17:12:26.87 ID:CgzlKX4i.net]: そこそこの分解能ならTeslaやTitanで十分だろ
392 名前：デフォルトの名無しさん [2016/02/09(火) 17:14:02.43 ID:uHp67F+7.net]: べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無
393 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 17:32:39.26 ID:i8FfOnoz.net]: 登場かな
394 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 18:40:55.41 ID:OHQNRB+7.net]: nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる
395 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:05:34.27 ID:Z0SOCsIU.net]: でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない
396 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:07:27.62 ID:dBPqK+gq.net]: まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな
397 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:15:52.47 ID:CgzlKX4i.net]: >>384
黎明期はデファクトスタンダードの取り合いだから当然の流れ
398 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:20:58.08 ID:OHQNRB+7.net]: >>384
よそが勝手に投げ出しただけじゃん
399 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:27:05.49 ID:C4h+tGmi.net]: >>384
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？
400 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:32:42.77 ID:OHQNRB+7.net]: dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな
401 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 20:43:41.18 ID:YFSBhYG5.net]: >ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk
402 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:14:42.66 ID:q4H41fNH.net]: 米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという
403 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:20:54.23 ID:IR1D3KHq.net]: 単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。
404 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:34:25.12 ID:DH+vdKhf.net]: >ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな
405 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/09(火) 21:47:11.85 ID:SI3uOwiZ.net]: どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが
406 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 22:14:14.05 ID:5ErhaZ8p.net]: 今日は団子がいっぱいいるなあ
407 名前：デフォルトの名無しさん [2016/02/10(水) 00:25:10.96 ID:u83LBvNZ.net]: 倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない
408 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 00:37:19.11 ID:ZwcaN/9X.net]: 団子分身の術か
もうここもワッチョイの時期かね？
409 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 00:56:31.15 ID:pL5WuRkY.net]: だから団子ってなんだよ？
410 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 01:41:12.63 ID:JsTfqJoq.net]: 団子は団子。
411 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 02:29:40.13 ID:FSPq21yA.net]: amd信者っていう精神病患ってるよな
412 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 08:25:30.16 ID:gHO8h5ZQ.net]: 倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)
413 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 08:35:12.26 ID:IPR+3W8l.net]: 倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。
414 名前：デフォルトの名無しさん [2016/02/10(水) 08:39:26.22 ID:5rSlusQ0.net]: バカはhello worldから始めなさい
415 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 08:48:59.74 ID:gHO8h5ZQ.net]: 件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ
416 名前：デフォルトの名無しさん [2016/02/10(水) 08:57:23.58 ID:5rSlusQ0.net]: まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど
417 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 12:31:36.49 ID:zvpoME6O.net]: 何とか倍精度不要論に持っていこうと必死な団子でした
418 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 12:36:21.64 ID:qcpMLBSZ.net]: アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ
419 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 13:03:35.72 ID:VS1+7AWR.net]: >>402
団子だけ隔離出来れば良い
420 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 23:12:49.82 ID:7x9wHVqL.net]: >>405
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？
421 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 23:48:08.15 ID:pL5WuRkY.net]: ここだけの話
K10はシェールガス探査特化モデルだよ
422 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 23:52:02.41 ID:7x9wHVqL.net]: 倍精度推しの池沼君がどんな世の中の役に立つソフト作ってて
LINPACKベンチ以外なんの実務に役立ってるのかは興味あるね
423 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 03:51:57.10 ID:Q8jkKaXt.net]: eyerissはgpuじゃなくdl専用
424 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 09:23:41.72 ID:pqlF/R5A.net]: 団子は倍精度に親でも殺されたか？
425 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 09:24:20.60 ID:pqlF/R5A.net]: 豚に真珠
団子に倍精度
426 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 09:27:55.02 ID:qHP8+I1C.net]: >>411に答えてね
427 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 09:37:09.50 ID:qHP8+I1C.net]: 俺は必要だっていう人の言い分は理解してるし
それに合わせたチップを選べばいいと思うのだけどね

倍精度ハードウェアがTeslaはともかく一般消費者向けのGeForceに
載らないといけない理由はない
一般消費者が倍精度のスループットを見てGPUを選ぶトレンドを作りたいなら
まずてめえが倍精度載せる価値のあるソフト作って示せばいい
428 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 13:14:12.26 ID:Dgt4YBtM.net]: 科学技術演算に倍精度は必要不可欠

はい論破完了
簡単だったね
429 名前：デフォルトの名無しさん [2016/02/11(木) 13:23:19.60 ID:U2ZcAFvs.net]: へー
それって
一般消費者向けの
GeForceに？
430 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 13:27:04.20 ID:yn/CS7EG.net]: 一般消費者が科学技術計算する必要あることがまったく示せていない
431 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 13:28:21.16 ID:pqlF/R5A.net]: 豚に真珠
団子に倍精度
432 名前：デフォルトの名無しさん [2016/02/11(木) 13:35:33.57 ID:U2ZcAFvs.net]: あたまわるそう
433 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 13:37:15.86 ID:Dgt4YBtM.net]: ここは何スレだったっけ？
単発団子よ
434 名前：デフォルトの名無しさん [2016/02/11(木) 13:39:04.93 ID:U2ZcAFvs.net]: また病気か？
435 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 13:42:27.10 ID:yn/CS7EG.net]: TSMCのウェハ価格体系的に用途別に倍精度が削れる用途向けには削ったほうが
コストダウンになるからそうするでしょうよ

Maxwell世代のTeslaがないのは大型スパコン案件もないからっての大きいと思う
436 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 13:45:25.92 ID:yn/CS7EG.net]: >>422
お前理解してないから出てけよ
437 名前：デフォルトの名無しさん [2016/02/11(木) 13:47:41.45 ID:U2ZcAFvs.net]: Tesla M40「・・・」
Teala M4 「・・・」
438 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 13:56:21.86 ID:yn/CS7EG.net]: すまん、倍精度版ね
439 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 15:18:50.25 ID:FNR4nKd2.net]: 今年の流行語大賞は売精奴
440 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 17:25:56.22 ID:R5nKPKgb.net]: 普通に考えて一般向けGPUに倍精度はいらないよな
32bitと16bit浮動小数点しか使わねーよ
それでも贅沢なぐらい
441 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 18:10:05.08 ID:0bpwaMQp.net]: ほんとそれ
一般向けとしてはオーバースペックなくらい
442 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 18:51:28.54 ID:pqlF/R5A.net]: 団子がいっぱい
443 名前：デフォルトの名無しさん mailto:sage [2016/02/11(木) 20:13:55.90 ID:Dgt4YBtM.net]: 駄目だ、団子の性でここも腐ってきた
444 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/11(木) 21:01:08.64 ID:yn/CS7EG.net]: だからお前の発言のどこが論破なんだよ

論理破綻の略か？
445 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 02:22:44.00 ID:m8Kq2x0U.net]: シールズ脳
446 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 13:14:15.71 ID:10CGBYPs.net]: ここがCUDAスレだと何度言えば分かるんだ！団子
科学技術演算も出来ないGPUじゃ話にならんわ
447 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 17:49:19.72 ID:igghQz0I.net]: まあ、倍精度じゃないと、イタレーティブソルバーは収束しないわな。4倍精度ぐらいあれは、CG法で反復回数が極端に減るかもね。
448 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 20:54:47.44 ID:okDGKGY+.net]: 売性奴
449 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 21:37:49.48 ID:ws+NUeAo.net]: 風俗業みたいな書き方だな
450 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 22:41:27.77 ID:10CGBYPs.net]: 今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ
451 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 22:42:28.23 ID:okDGKGY+.net]: じゃあ倍精度使ってんの？
452 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 22:42:32.12 ID:7+E8+eHE.net]: 100倍精度くらいいるな
453 名前：デフォルトの名無しさん mailto:sage [2016/02/12(金) 22:43:21.37 ID:7+E8+eHE.net]: 倍精度なんて普通に使う
水や空気のように
454 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 00:10:37.29 ID:KZpZDJLQ.net]: ただし、グラフィックスには要らない
455 名前：デフォルトの名無しさん [2016/02/13(土) 00:16:44.75 ID:X+VeUhDc.net]: ①No double precision, no life.
②Double precision make me happy.
456 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 00:47:18.16 ID:vQuqpgIG.net]: ここではMaxwellやPascalはおよびじゃない
457 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 00:48:53.57 ID:dx+PFg0T.net]: CUDAをなんのために使うかだよなあ。
グラフィックスだけならOPENGLだけでええんのとちゃうか？
458 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 00:54:32.58 ID:LMFsV4x8.net]: >>439
だったら何
そんなのはGPUであつかう問題じゃないから
459 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 01:59:47.65 ID:KZpZDJLQ.net]: GPUはグラフィックスを扱うのが本分なので
一般向けGPUは倍精度無しでも文句は言えない
460 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 05:22:35.21 ID:zAv3sSPP.net]: BSD!　BSD!　BSD!
461 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 11:28:45.10 ID:EDACvSC3.net]: >>448
お前の文句なんかどうでもいい
GPGPUってのはこういうことのために使うんだぜ！？団子

-----------------------------------------------------------------------
645 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:56:12.20 ID:oUDSwd87
>>626
別に2ちゃんだから適当に幾らでも変なことでも聞いていいんじゃね？

人間の頭で考えないと絶対にダメな部分が最も大きい

相対論も標準理論も量子力学も計算機だけでは絶対無理

計算機が答を出すというより、計算機は望遠鏡とか温度計のような「測定器の一種」という感覚が近いと思う

GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり

スパコンに関してはそれ自体がすごいというより、スパコン目当てに優秀な人が集まる効果のほうが大事という気がする、2020年のオリンピックみたいにスパコンという祭りに人が集まるから、良い方にも悪い方にも転ぶだろう
646 : 名無しのひみつ＠転載は禁止2016/02/12(金) 22:57:56.72 ID:eXgf7vm3
462 名前：デフォルトの名無しさん [2016/02/13(土) 12:08:27.34 ID:c+BFT1nX.net]: いろいろ探して結局コピペ
463 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 13:38:06.14 ID:LMFsV4x8.net]: 結局何が言いたいの？
理想のものが欲しければ自分が計算機設計の専門家になればいいじゃん
手遅れかもしれないけど
464 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 14:55:58.29 ID:dwcfM3wy.net]: 自然言語処理や画像認識、いま産学連携で資金集まってるのはこういう分野
データサイエンス分野は文系の学者さんも研究に参画してるし応用範囲広いんだよね
何の金にもならない倍精度行列積で1位じゃないとダメなんですか？とかホントどうでもいい話
465 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 15:03:24.00 ID:dwcfM3wy.net]: スパコンに倍精度演算性能が必要なのは誰も否定してないじゃん
個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。

コピペで代弁してもらったつもりになってるのかもしれないけど
実質的に何の主張にもなってないわけよ
466 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 17:16:53.26 ID:EDACvSC3.net]: >>454
＞個人のゲームやお絵かき用のパソコンにそれが必要かという話であって。

ホントここが何スレか分かってない池沼
Async煽りをしてた団子が攻守入れ替わるとこれだからな
467 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 17:49:57.42 ID:pMfjul4g.net]: GPUとGPGPUの区別もつかないのか？
468 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:00:36.66 ID:dwcfM3wy.net]: > Async煽りをしてた団子が攻守入れ替わるとこれだからな
それこそお前の妄想じゃん

RadeonのGPGPUプログラミングの話をしたいなら超過疎のHSAスレへ
469 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:03:11.84 ID:dwcfM3wy.net]: > GPGPUは使いまくってるはずだけど、半ば問題に特化して設計するスパコンもあり

って引用しつつ、倍精度性能が不要な用途に特化する意義は認めないんだね
470 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:11:06.88 ID:dwcfM3wy.net]: ついでに攻められてるのがどっちなのかすら理解してない
471 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 18:14:06.59 ID:vpwmEJlM.net]: 団子消えろ邪魔
472 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 18:17:25.51 ID:vpwmEJlM.net]: GPの意味わかるか？
473 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:25:02.18 ID:dwcfM3wy.net]: >>439の言ってるLIGOのリサーチに協力したのはうんこFireProではなくXeon Phiなんだよね
www.hpcwire.com/off-the-wire/taccs-stampede-supercomputer-assists-ligo-research/

重力演算は1格子点あたり小数点以下3桁程度の精度があれば十分といわれる分野
Stampedeに載ってるKNCは除算ユニットは遅く逆数・逆数平方根命令の
有効桁は14ビットだ。
まあこんだけあればニュートン法すら要らないわけよ。
倍精度で分解能を上げて遅い倍精度に単精度（実効精度14ビット）で格子点を
大量に捌くほうがより正しいシミュレーションができる。

ニュートン法不要ってのはﾆﾀﾄﾞﾘ=ｻﾝの受け売りだが
474 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:42:17.05 ID:dwcfM3wy.net]: 14ビットは間違い。SkylakeXeonで使えるAVX-512Fのほうだね。

KNCのrcp23ps/rsqrt23psのスループットは23ビット。
つまり単精度の除算は乗算1回との合計2ステップで割り切りなしの十分な精度が得られる
475 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 18:45:56.87 ID:vpwmEJlM.net]: スレ違い
476 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 18:48:25.54 ID:dwcfM3wy.net]: 倍精度必要論が否定されるから都合が悪いだけだろう？

重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。
477 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 19:06:49.99 ID:dwcfM3wy.net]: ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ
478 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 19:49:28.20 ID:LMFsV4x8.net]: でもGRAPEは6倍精度実装してるじゃん
天文学と一纏めにしてるけど連星とかブラックホールが近接するような場合は高い精度が要求されるよね
逆に宇宙の大規模構造とかだと桁増やすより分解能上げた方が精度上がるのかもしれないけど
479 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/13(土) 19:57:12.93 ID:dwcfM3wy.net]: 否定しない。
いずれにしてもどれも個人のパソコンに必要な要件ではない。
個人のパソコンのパーツを組み合わせて大規模演算ができるのはコストメリット的に重要だけど
個人のパソコンに倍精度が必要な理由の説明としては本末転倒です
480 名前：デフォルトの名無しさん mailto:sage [2016/02/13(土) 21:14:52.93 ID:EE+8Wdg+.net]: 結局自分じゃ使えもしないのに
倍精度倍精度連呼してるのが滑稽だってこった
481 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 00:27:03.46 ID:cgGYXXdh.net]: スレタイも読めないアホ
482 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 00:51:54.56 ID:QIqkGWdy.net]: スレタイに即した話題振ってくれよ
483 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 00:57:10.67 ID:cgGYXXdh.net]: お前が消えたらな
484 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 00:57:39.60 ID:QIqkGWdy.net]: お前が行くべきスレ（HSAスレ）に行けば平和になるよ
485 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 01:39:56.33 ID:lXFnYTTq.net]: AMDな人が来てCUDAの話無・CUDA使っていない奴の雑談スレになったな
AMDのGPGPUスレ過疎すぎでこっちにきたんだろうが
486 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 02:02:42.36 ID:vcWFNaoW.net]: そもそも初代CUDAの時期に倍精度なんてサポートされてなかったし
メインストリームのGeForceが倍精度強かった時代なんて一度もないのに
いつから馬鹿の一つ覚えの倍精度連呼が始まったやら
487 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 07:18:27.73 ID:feLPD2f/.net]: 豚に真珠
団子に倍精度
488 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 09:14:03.10 ID:vcWFNaoW.net]: >>476の名前は団子っていうそうです
489 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 09:20:16.22 ID:SumOf5e2.net]: 団子がいっぱい
490 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 15:01:21.31 ID:LdUYpatK.net]: そもそもCUDAは科学技術演算を必要とする人のスレなのにな
いつの間にか糞団子はゲームに必要かどうかに論点をすり替え
491 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 16:23:41.37 ID:vcWFNaoW.net]: > そもそもCUDAは科学技術演算を必要とする人のスレなのにな

意味が分からない
492 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 16:26:10.17 ID:vcWFNaoW.net]: CUDAでハローワールドも書けないレベルのnoobが気取ってみても
頭の悪さは隠せないよ
493 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 16:42:03.99 ID:k6vnuBvm.net]: cudaで今nvidia的にイチオシの用途がdlで、half性能が効いてくるという奴じゃないの？
494 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 16:58:17.35 ID:MYivShEO.net]: と言うよりGPGPU自体がDLバブルに乗っかってるからな
ボリュームゾーンに合わせた製品仕様になるのは当然の流れ
495 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 17:32:35.33 ID:vcWFNaoW.net]: ﾊﾞｲｾｲﾄﾞﾏﾝｾｰ「俺がボリュームゾーンだ！俺のためのGPUを作れ！」
496 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 17:54:26.87 ID:vcWFNaoW.net]: DOE案件みたいな大口需要があるときだけ倍精度特化版作って
それ以外は民間需要重視でいくってのは間違いじゃないと思うよ

次のDOE案件はVoltaだ
逆に言うとそれまでは倍精度特化版は出ないということだな
497 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 20:43:02.26 ID:feLPD2f/.net]: 団子うざい
498 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 20:43:29.15 ID:feLPD2f/.net]: スレちがい
きえろ
499 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 20:45:40.73 ID:vcWFNaoW.net]: 認めろよ負け犬

お前らの需要は民間需要とみなされてないんだよ
500 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 21:07:00.02 ID:vcWFNaoW.net]: 残念だけどGeForceに倍精度が必要な理由を説くには
ゲームなどの目的で使って一般ユーザーが必要であることは絶対必要な条件だ

まさかそんな単純な理屈もわからないのか？
だからお前は俺ごときに言い負かされてるんだよ
501 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:17:16.56 ID:3MzGEHLi.net]: でもdoeの評価アプリはほとんどが単精度なのだ
502 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:20:27.80 ID:q4Y9hkYF.net]: やっぱり次のスパコンはGPU入れてくるのかな。
CPUだけで今の１００倍は難しいよね？
503 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 21:20:35.19 ID:vcWFNaoW.net]: Top500ランキングに使うLINPACKベンチは倍精度だからそれのためだけに必要なんだよ
ちなみにHPCGだと倍精度ユニットいくらあってももてあそぶから倍精度厨には逆風だね
504 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:29:25.60 ID:q4Y9hkYF.net]: maxwellが発売されて２年たつが、pascalはいつごろ発売になるのだろうか。
505 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:30:32.20 ID:feLPD2f/.net]: 豚に真珠
団子に倍精度
506 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:34:09.88 ID:3MzGEHLi.net]: pascalは今年
voltaは来年

pascalは大きな変更になり
voltaは小改良
507 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:39:33.62 ID:LdUYpatK.net]: 倍精度の必要性すら認めない奴がどうしてこのスレにいる？
508 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:46 ]: [ここ壊れてます]
509 名前：:01.01 ID:3MzGEHLi.net mailto: dlはもうeyerissの系統でいくんだろうな
機会学習はもう大きな需要が在るのわかってるから
専用設計のチップでも儲かるのが見えてる

gpuはある種汎用的なHPC向けになるんだろうな
pascalで階層型のスケジューラやレジスタファイルが実装されてると
そのコントローラー（こんぱいら）ようにcpuが搭載され
レンダリングはタイルになりそうだけど []: [ここ壊れてます]
510 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 21:47:24.48 ID:vcWFNaoW.net]: そんな人は一人もいませんよ？
消費者向けGPUに倍精度が必要みたいなアホなこと言う負け犬君を馬鹿にしてるだけですよ
511 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:47:51.57 ID:VLtYVTYt.net]: Geforceで科学技術計算なんてことあるの？
2秒間の壁や1週間も１００％負荷で連続使用したら過熱して壊れそう。
512 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:51:42.44 ID:k6vnuBvm.net]: 必要性もなにも倍精度演算自体は可能だろ。積和で単精度の1/32くらいの速度だけど。
それで不満な人間がCUDAにこだわる意味がわからん。
そもそもCUDA対応ハードで倍精度強かったのってfermiとkeplerの時期だけで、しかもコンシューマ向けで開放されたのもその極一部じゃない。
513 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 21:52:57.52 ID:3MzGEHLi.net]: それはfuryでもおなじだけどな
514 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 21:53:10.10 ID:vcWFNaoW.net]: 倍精度が必要な人は必要らしくマイノリティ税を払って4桁ドルのTeslaを使えばよろしい
515 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 22:08:24.09 ID:vcWFNaoW.net]: 防衛上の理由として

北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう
516 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 22:18:41.75 ID:k6vnuBvm.net]: 倍精度演算を単精度の1/4より速く実行するのは基本的に無駄なはずなんだよね。
keplerは別回路で使わなければ完全に無駄だったし、fermiの1/2にもからくりがあって、整数演算器の方に少し回路を付け足せば単精度性能を倍にできるのを抑えた感じ。
納入先との契約で倍精度性能は単精度の1/2にすることみたいな縛りでもあったのかね。

1/4にしないでもっとけちれば次は1/16になるのが自然
なのにmaxwellは1/32
517 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 22:57:17.12 ID:MYivShEO.net]: >>503
＞防衛上の理由として
＞
＞北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
＞消費者向けGPUは倍精度を削るのは当然でしょう

中共とかなに時代錯誤なこと言ってんだよ
Nvidiaはファブレスで製造はTSMCだぞ
そもそも弾道計算にGPU要らんし
518 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 23:02:24.40 ID:vcWFNaoW.net]: 今存在している政権を時代錯誤と言ってみたり台湾と中国の区別がつかなかったり
いろいろ論外すぎる
519 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 23:28:08.25 ID:MYivShEO.net]: >>506
いやいや、中共が買い漁るとか言ってるのが時代錯誤なんだよ
ココム時代かよ

スパコンの現状見て今更「弾道計算に使われたら困るからGPUから倍精度削りました」とか寝言としてもありえ無いぞ
520 名前：デフォルトの名無しさん mailto:sage [2016/02/14(日) 23:32:03.43 ID:MYivShEO.net]: >>506
あ、そうそう
TSMCに限らず台湾メーカーは当然中国工場持ってるからな
中台の政治はアレだが経済はズブズブなんだよ
521 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/14(日) 23:34:42.85 ID:vcWFNaoW.net]: その寝言で米国政府が天河1号Aおよび2号のパーツ供給打ち切る命令を下してりゃ世話無いわ
522 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 00:10:01.72 ID:tk+f5azn.net]: つーか今さらだよなぁ。
既に世界一のスパコン輸出した後で規制するとか、アメリカはアホなのか。
523 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 00:38:07.27 ID:vFZf1/EN.net]: >>509
お前それ反論になって無いぞ
もしかしてGeForceに倍精度のせないのはマジで米政府が関与してるとか思ってるわけ？
お前正気か？
もう少しまともな奴だと思ってたが買い被り過ぎだったようだな
524 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 01:27:27.22 ID:WsLHcQ2 ]: [ここ壊れてます]
525 名前：x.net mailto: 弾道計算ｗｗｗｗ
不安定なGPUなんか使うわけがないｗｗｗｗ
そんなものは化石CPUで十分 []: [ここ壊れてます]
526 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 06:50:35.29 ID:iMQPxQqI.net]: 2018年にかけて米国でknlとpascal,voltaでスパコンが更新されていくからな
天河はもう過去のものになる

日本はもう一番目指してないし
527 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 12:37:26.72 ID:WsLHcQ2x.net]: 計算機なんて数増やせば良いだけだから単体性能よりコスパで1位を目指すべきだと思うんだが
528 名前：デフォルトの名無しさん [2016/02/15(月) 13:15:29.44 ID:GXDoYvGw.net]: そんなん日本じゃ無理じゃん
529 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 18:36:52.42 ID:jliXXPJr.net]: >>514
なんもわかってないな
ノード数の2乗に比例してインターコネクトは複雑になる
なんのために大きなスパコンが必要だと思う？

莫大なメモリ空間がないとできないことがあるからだ
530 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 19:35:35.81 ID:ZpISfAaX.net]: >>513
そーは言ってもあの国はコンシューマ向けGPUかき集めてでもスパコン作るから
現に初代天河1号でそれやったし

中国のPCゲーム市場は拡大しててGPUメーカーにとってもおいしい市場だ
軍事転用の懸念から輸出規制かけられたらNVIDIAだって大損なわけよ
だから最初から倍精度ハードは載せない
その理屈は最低限理解してほしいのだけど・・・
531 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 20:03:17.93 ID:dHmco+xc.net]: そもそも倍精度はいらないって持論言ってなかった？
それなら軍事用途でも倍精度なしでいいってことだよね？
そうすると、中国はいくらでもGeForceを軍事転用して作れるんじゃない？

倍精度載せないのが軍事転用を防ぐためってのは無理がないか？
532 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 20:06:18.36 ID:ZpISfAaX.net]: もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう
533 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 20:37:26.50 ID:dHmco+xc.net]: ハイエンド以外はそうでしょうね。

でもハイエンドはTeslaとマスクを別にするほどメリットはないでしょう。
だからTeslaに搭載されている以上、ハイエンドにもつくだろうね。
ドライバや回路切断で無効化措置がとられるかもしれないけど。
534 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 20:41:01.96 ID:dHmco+xc.net]: GeForceに倍精度を載せないのはビジネス面からの理由で、
Teslaに倍精度が必要かどうかとはまた違う議論だよね

それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
必要な人がいたからじゃないのかな。
４倍精度以上のライブラリがあることからも精度が必要な人はいると思うよ。

単品の精度はfloatでいいけど、累積誤差のせいで途中段階ではより高精度が必要という局面は多いんじゃないだろうか。
倍精度完全ゼロにしたらTeslaはこけると思う。
535 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:09:32.48 ID:3Z78wnsj.net]: Nvidiaが倍精度どころか単精度ですら要らないんじゃね？路線になった理由は明快
（AMDの）MantleがDirectX12とVulkanの取り込まれたから
ゲーム機は完全にAMD一色になったから、もはやゲームはAMD中心に動いている

全てのAAAゲームはCS機のローレベルAPIで組まれ、その成果をPCに持っていく形が定着した
従ってPCゲームは今までのように互換性や異種GPU間の翻訳を行うのをやめた
DirectX12はそこの所が根本的に違う

しかし団子はそこの理解がないから最初っから倍精度不要論をぶっていればまだかわいげがあったが、
ゲームに倍精度は不要だ！と言い出したのは、Pascalの仕様が明らかになってからｗ

それまでの団子は、NVはPascalに倍精度路線を復活させる！（�
536 名前：Lリッ の一点張りだった []: [ここ壊れてます]
537 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 21:12:20.04 ID:ZpISfAaX.net]: > GeForceに倍精度を載せないのはビジネス面からの理由で、
> Teslaに倍精度が必要かどうかとはまた違う議論だよね

それは誰も否定してる人はいない

> それからKeplar世代Teslaも最初1/12くらいだったのが1/3にまで上げられたのは
> 必要な人がいたからじゃないのかな。

大型スパコン案件があったから。
Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった
538 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:22:31.09 ID:jCwjLRdK.net]: 団子>弾道計算には倍精度が必要！（キリッ
↑
マジでアホ
539 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 21:23:17.67 ID:ZpISfAaX.net]: 必要だけど？
540 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 21:24:28.08 ID:ZpISfAaX.net]: 惑星探査機なんか発射時刻1秒のずれすら許されないレベル
541 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:33:03.42 ID:PRVxDG3b.net]: 弾道計算といったら大砲の弾やせいぜい弾道ミサイルといったイメージ
人工衛星は軌道計算というのが一般的だろう
542 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:34:44.35 ID:WsLHcQ2x.net]: GPUはいらないけどな
543 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:39:07.56 ID:iMQPxQqI.net]: で
このhello worldも書けない倍精度バカは何が言いたいんだ
544 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 21:45:08.13 ID:ZpISfAaX.net]: スパコンは数増やせばいいとか言っちゃうレベルの超絶バカには理解できんだろう
545 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 21:50:22.85 ID:ZpISfAaX.net]: 呼ばれてもいないAMDファンボーイが勝手にわめいてるだけでしょ

Async Shader（笑）なんてスパコンでは全く需要がないんですよ。
繰り返すけど、需要がないんですよ。

何千並列のGPUが動く環境ではそもそも同じGPUで複数スレッドを
動かす必要性そのものが疑問だし本当に別々のスレッドを多並列で動かしたい用途には
60コア240スレッドのXeon Phi向けの問題だったりする。帯短襷長。
546 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 21:54:15.47 ID:dHmco+xc.net]: >>523
＞大型スパコン案件があったから。
Titanとかだよね。ということはやっぱりむこうの研究者もより精度がほしいってことなんだな。

＞Maxwell世代にはなくて、民間需要を探したら結局単精度しか需要が無かった
そもそも民間にGPGPUの需要があるのかも疑問だな。
大学以外でほとんど導入してる事例を見聞きしたことがない。

F1や飛行機の気流計算とかには大規模サーバに積んでシミュレーションしたりしてるのかな？
あとは建築における風の影響とかさ。

普通は世代ごとにプログラミングとテストし直す手間考えるとCPU増設するよって考えに至りそう。
547 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 22:24:29.68 ID:iMQPxQqI.net]: >>522
pascalの仕様がいつ明らかになったんだ？
548 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 22:34:24.26 ID:jCwjLRdK.net]: >>526
＞惑星探査機なんか発射時刻1秒のずれすら許されないレベル
その昔3ビットコンピュータの時代に米国は有人月探査をやってるんだが？
中共は弾道計算()にスパコンが必要なんだw
549 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 22:38:59.79 ID:ZpISfAaX.net]: 月がいつ惑星になったんだ
的が大きすぎてスイングバイのタイミング計算も必要ないぞ
550 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 22:44:09.45 ID:iMQPxQqI.net]: 月には本当に行ったのかね
よく帰ってこれたな

てかランディングよくできたな
よく月から離れられたな
551 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 22:48:44.77 ID:iMQPxQqI.net]: 核開発はおいそれと実験できないので
シミュレーション主体だろうけど
552 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 23:23:28.51 ID:jCwjLRdK.net]: >>535
弾道計算がいつの間にか惑星探査に成るよりマシ
スウィングバイの計算ですらスパコンいらないのに弾道計算にスパコンが必要な根拠を早く示せよw
553 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 23:27:02.18 ID:iMQPxQqI.net]: それは使用者がどの程度の精度を求めるかってだけじゃね

キロか
メートルか
センチか
ミリか
マイクロか
ナノか
554 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 23:33:23.73 ID:iMQPxQqI.net]: ipadのdawソフトだって64bit floatで合成できるし
サンプリンレートだって96khzがつかえる

で、聞いて違いがわかるのかって話だわ

さすがに32khz（昔のrolandのdtm音源とかね)と44.1khzはわかるけど
555 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/15(月) 23:42:05.72 ID:ZpISfAaX.net]: 倍精度くんはDLで使われてる半精度の用途すら理解できてないと思うよ
556 名前：デフォルトの名無しさん [2016/02/15(月) 23:54:48.03 ID:6lA61DJG.net]: 科学技術計算で半精度が使えるのなんて、DLぐらいじゃねーの？
線形方程式を扱う問題は倍精度がないと使いもんになんないよ。
単精度で行けるのは、流体解析とかかな。
557 名前：デフォルトの名無しさん mailto:sage [2016/02/15(月) 23:58:33.47 ID:iMQPxQqI.net]: 必要な部分だけ倍精度で
後は単精度って言う混合精度が普通ですけどね
558 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 00:11:11.75 ID:Rkm/CQ33.net]: >>541
いいからお前は中共がスパコンで弾道計算()する根拠を示せよw
出来ないなら去れ
559 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/16(火) 00:16:10.17 ID:hr2Cmr1D.net]: そこいちいち突っ込むなよ

↓この池沼レスに突っ込んだやつ何人いるよ

427 ：デフォルトの名無しさん [↓] ：2016/02/12(金) 22:41:27.77 ID:10CGBYPs (2/2)
今日の重力波観測にしたってあれは、理論屋が出したシミュレーションに従ってそれと同じデータを観測したわけだろ
そういうのが単精度/半精度で出せるわけねーだろ
560 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 01:05:12.74 ID:zrbNTBh/.net]: くだらないすれになってきたな。
CUDAだけに。
561 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 01:07:09.51 ID:uizCIs9N.net]: 惑星探査機の打ち上げ時に1秒のズレが許されないのは、もし1秒のズレが
起こるとロケット側の打ち上げシーケンスはリアルタイムに変更出来ない以上、
生じたズレを探査機側でカバーする必要があり燃料を大量に消費するから

ロケット発射時の1秒分に相当するズレが軌道計算時の演算精度によって
生じると示されない限りは今回の話の流れで例として出す意味は無い
562 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 01:22:51.47 ID:Rkm/CQ33.net]: >>545
話を逸らすな糞団子
GPUに倍精度が載らない理由としてお前が妄想で持ち上げた米政府陰謀論はどう始末すんだよ
いつの間にか惑星探査の話に誤魔化そうとしてドツボに嵌ってるし
どうやらお前には虚言癖があるようだな
それ精神疾患の初期症状だぞ
563 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 05:14:07.98 ID:JyLDDdd2.net]: こいついいかげんあたまわりーな
geforceにいらねぇってだけで
どこでgpuにいらねぇってかいてんだ

トットトキエロ無関係なamd信者
564 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 08:27:02.86 ID:TSHTNtoJ.net]: 491 名前:,,・´∀｀・,,）っ-○○○ [sage] :2016/02/14(日) 22:08:24.09 ID:vcWFNaoW
防衛上の理由として

北朝鮮や中共がGeForceを買いあさって弾道計算に使われたら困るから
消費者向けGPUは倍精度を削るのは当然でしょう
565 名前：デフォルトの名無しさん [2016/02/16(火) 08:39:42.99 ID:O+KKJC7C.net]: missile guidance
コピペしてあげる

www.rugged.com/sites/default/files/High%20Perfomance%20GPGPU%20for%20Embedded%20Systems.pdf
www.nrl.navy.mil/itd/imda/sites/www.nrl.navy.mil.itd.imda/files/pdfs/HiFiRealtimeASCMModelingGPU.pdf

Accelerating Binary Genetic Algorithm Driven Missile Design Optimization
Routine with a CUDA Coded Six Degrees-Of-Freedom Simulator

https://etd.auburn.edu/bitstream/handle/10415/4900/BentonDaniel_Thesis_Fall2015.pdf
566 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 08:44:44.70 ID:5qdf7tTQ.net]: あたまわりーなっていう書き込みがあたまわるそうw
567 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 12:24:44.18 ID:r3FuaOqG.net]: >>549
てめえのケツは文体から丸見えなんだよ、糞団子！
568 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 13:13:36.31 ID:Rkm/CQ33.net]: >>551
どこに弾道計算()って書いてあるんだ？
今更必死になって資料探してるのが笑える
糞団子www
569 名前：デフォルトの名無しさん [2016/02/16(火) 17:01:16.79 ID:O+KKJC7C.net]: missile guidanceって書いてんですけど
本当にアホなんだ
570 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:19:35.76 ID:Rkm/CQ33.net]: >>555
ミサイル誘導と弾道計算()をゴッチャにして無いか？
571 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:31:16.10 ID:ehtVDEti.net]: お前らってCUDAスレでミサイルの話したいの？
うざいよ
572 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:32:32.16 ID:Got2320i.net]: 団子が消えれば平和になる
573 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:37:49.67 ID:vQzfh9to.net]: そもそも米国初のスパコンは300flopsで
弾道計算目的で作られたわけですけどね
574 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:46:46.20 ID:Got2320i.net]: 団子うざい
575 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:52:40.02 ID:JyLDDdd2.net]: 倍精度バカが消えればいいだけ
576 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:52:56.44 ID:Rkm/CQ33.net]: >>559
だからなに？
300flopsでいいならatomでも使えば？

弾道ミサイルと誘導ミサイルの区別もつかない知障が恥の上塗りしてどうする
577 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:53:37.32 ID:JyLDDdd2.net]: 相変わらず
病気ですかｗ
578 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 19:55:56.44 ID:Rkm/CQ33.net]: >>563
なんだよネタ切れか糞団子
早く弾道計算()の根拠を示せよwww
579 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/16(火) 21:31:21.33 ID:n4dpDB+H.net]: ID:Rkm/CQ33
ひまだねこいつ
Teslaなんて買えるご身分じゃないことはわかったよ
580 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 21:46:16.04 ID:JyLDDdd2.net]: c++ampの死亡がよほど悔しかったと見える
581 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 21:52:57.09 ID:Rkm/CQ33.net]: >>565
お前さぁ何で個人ユース前提で話進めてんの？貧乏F蘭学生か？
悪いけどプライベートでゴリゴリコード書かんから家ではオンボードチップのみだよ

んなこといいから早く弾道計算()のソース探して来いや
582 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/16(火) 21:54:13.47 ID:n4dpDB+H.net]: AMDの株価がまたダダ下がりしてるよ
年内に潰れるんじゃないの？（煽
583 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 22:55:41.72 ID:Rkm/CQ33.net]: >>568
お前、俺がAMD信者だと思いたいわけ？
残念だが単なるツールに思い入れは無い
そもそもプライベートではインテルHDだしな

ぶっちゃけ、AMDでもNVでも倍精度でも単精度でもどうでもよろしい

糞団子がおかしな事言ってるから突っ込んでるんだよ
さぁ話を逸らさず、早く弾道計算のソース探して来いやwww
584 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 22:59:58.46 ID:r3FuaOqG.net]: 結局Asyncとか煽ってたのは団子だよ
そして株価ガーとまたぞろ論破された悔しさから関係ないバカッターぶり
585 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 23:03:30.71 ID:JyLDDdd2.net]: おまえだろｗ
586 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 23:04:56.35 ID:r3FuaOqG.net]: 糞団子は及びじゃねーんだよ
倍精度が嫌なら自作板帰れや
587 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/16(火) 23:19:32.08 ID:n4dpDB+H.net]: Async（笑）はお呼びじゃねーから
588 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/16(火) 23:22:10.95 ID:n4dpDB+H.net]: 倍精度CUDAでAMDの倒産時期のシミュレーションをしようず
589 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 23:55:31.06 ID:TSHTNtoJ.net]: この糞団子って奴はNV信者なのか？
かなりキショいな
590 名前：デフォルトの名無しさん mailto:sage [2016/02/16(火) 23:58:08.83 ID:Rkm/CQ33.net]: >>574
お前、先にやる事あんだろ
早く弾道計算()のソース探して来いや
糞団子
591 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 03:31:12.34 ID:0fWAF1mS.net]: amd信者はスレのレベルを下げるの上手だよな
どこでも
592 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 07:30:57.92 ID:rf0k3qKD.net]: 団子うざい消えろ
593 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 07:57:37.34 ID:VmCK2l0E.net]: お前何なの？
団子団子団子って
この固ハン好きなの？
594 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 09:30:58.37 ID:rYEbraru.net]: 団子を知らんなんてもぐりだな。
595 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 12:25:17.76 ID:OFL0xTOo.net]: sssp://o.8ch.net/7vw7.png
596 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/17(水) 21:53:22.36 ID:vQUlaZXp.net]: だんごさんはアイドルだからな
597 名前：デフォルトの名無しさん mailto:sage [2016/02/17(水) 22:38:37.14 ID:ftw2nvyT.net]: お、おう
598 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 00:59:56.44 ID:yA7sr9oe.net]: 507 ：,,・´∀｀・,,）っ-○○○：2016/02/15(月) 20:06:18.36 ID:ZpISfAaX
もちろんそれが一番の理由だなんて言う理由はない
どうせ倍精度なんて使えてもそれこそ豚に真珠を与えるがごとき日曜プログラマの道楽のために
NVIDIAは会社を傾ける気はないのは確かだろう

団子いいこと言うな、その通りだよ
お前ごときが倍精度の存在意義なんかわかりゃしないんだから
そのままここから消えろ
599 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 01:34:33.83 ID:BdjwVjbv.net]: 人間の脳細胞も半精度
600 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 15:31:31.41 ID:k3R63z0a.net]: アンチの方が邪魔で迷惑というのは、嫌儲や嫌韓と変わらんな。
601 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 20:51:58.59 ID:8FWPXGjX.net]: >>586
団子ははっきり言ってやらんと分からんアスペだから
602 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 22:55:07.89 ID:yHWNW4Hi.net]: 確実に言えることは
こいつはCUDAより団子のほうが
興味があるようだってこと
CUDAスレなのにな
迷惑だから他でやって欲しい
603 名前：デフォルトの名無しさん mailto:sage [2016/02/18(木) 23:48:14.62 ID:dPaFikXI.net]: >>588
お前が一番しつこいよ
消えろ
604 名前：デフォルトの名無しさん mailto:sage [2016/02/19(金) 12:26:53.00 ID:3s8ITFfM.net]: 団子はインテルNVマンセー馬鹿に過ぎない
Fermiの時代は倍精度の必要性を謳ってたのまた団子
現在倍精度不要論をぶってるのはこいつが工作員である証拠
くだスレにはまったく不要
605 名前：デフォルトの名無しさん mailto:sage [2016/02/19(金) 18:46:26.08 ID:ktnruegg.net]: >>587
団子はいくら言っても分からないようだから、そろそろ諦めてくれないか。
邪魔だし迷惑。

団子だけならNGできるんで、団子たたきはやめて、キッチリ完全スルーしてくれ。
606 名前：デフォルトの名無しさん mailto:sage [2016/02/19(金) 19:43:08.21 ID:3s8ITFfM.net]: >>591
＞、団子たたきはやめて、キッチリ完全スルーしてくれ。

NGだけなら簡単だが、こいつは倍精度を否定してるんだよ
そして名無しで煽ってるから問題だろうが
607 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 01:44:55.38 ID:C1beyHUM.net]: 病人乙
608 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 02:13:53.70 ID:yfJQw59R.net]: 俺がこのスレで名無しになったことなんて1度たりともない
609 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 02:18:16.51 ID:yfJQw59R.net]: 一般消費者向けのGPUで倍精度の性能は必要ないとしか言ってないんだけどな俺は
なぜなら、一般消費者の用途で倍精度の性能が必要でないからだ
トートロジーを並べてるだけだけどこれは普遍の真理。

倍精度特化のTeslaが使いたい人は使えばいい
だからこそなおさらGeForceが倍精度に特化しなければいけない理由はない
いつ倍精度そのものを否定したんだ？
610 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 02:22:37.26 ID:yfJQw59R.net]: ドァンゴが、午前２：２２くらいをお知らせします
611 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 06:16:50.67 ID:2KEvBzOT.net]: Teslaがいつ倍精度に特化したって？
612 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 08:36:03.80 ID:deWWtRHc.net]: >>595
はいはい
一般消費者向けのGPUから倍精度が削除されたのは米政府の陰謀なんだろw

お薬増やしおきますね～
613 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 08:42:57.95 ID:wJmoGGP6.net]: お前のGPGPUプロジェクトが
どのように許容誤差見積を出して
倍精度を必要とそっちを語った方が
反論になるだろう
出せ
614 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 09:07:06.30 ID:mQDXSMnA.net]: >>597
Teslaにも倍精度に特化してないモデルもある
倍精度が強いのはあくまで「スパコン用のTesla」だ
それの流用版のGeForceやQuadroも副次的に倍精度が強かったこともあったが
GeForceに倍精度の需要があったからではない

GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
ゴミ研究者かなんかだと思ってるが
（そんなものに拘ってるからろくな論文が書けないんだろ）
615 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 09:53:53.93 ID:gxBCXYT2.net]: >>600
＞GeForceで倍精度が速くないと困るとか言ってる手合いはろくに研究予算もつかない
＞ゴミ研究者かなんかだと思ってるが
おいおい、GeForceは一般消費者向けが前提じゃなかったのか？
糞団子は論点ズレまくりでまともに議論が噛み合ってない
616 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 10:17:55.46 ID:mQDXSMnA.net]: だから学校から支給される予算じゃTeslaが買えないからGeForce使うしかないんでしょ
617 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 10:18:51.16 ID:mQDXSMnA.net]: あるいは赤ポスにつけなかったおちこぼれか

いずれにしても「一般」消費者でありはしない
618 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 11:09:20.85 ID:mQDXSMnA.net]: 所詮は自分が欲しいかどうかだけが基準点でもっと大きな市場のニーズを
理解できないｱﾌｫでしょう

大学院重点化の弊害ですね
就活失敗したようなレベルのゴミを研究室に引きこもらせたら
ますます世間知らずをこじらせるのも道理
619 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 11:18:36.93 ID:mQDXSMnA.net]: 論文博士という日本独自の制度もたいがいだがな
3年間も通って単位取得だけしかできず学校を放逐されたゴミにも
なまじ希望を与えるからタチが悪いというか
620 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 12:50:45.19 ID:kmGvjPZb.net]: ,,・´∀｀・,,）っ-○○○NGですっきり
621 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 13:08:52.37 ID:kmGvjPZb.net]: >>601
糞団子は論点をずらすと言うより、負け犬になるといつも違う話をする＆名無しでスレ汚しだから
NGだけでは駄目なんだよ

本当はDX12でNVがハブられた事実を認めたくないために架空のでっち上げ話をしてる
その証拠にMaxwell世代以前のNVはﾆﾀﾄﾞﾘｻﾝ（笑い）の話をだして市販のNVGPUが大学研究機関
に納入された事を自慢してたからな

こいつは単なるアンチAMDのステマ部隊

454 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 19:06:49.99 ID:dwcfM3wy
ゴードンベル賞で2度の受賞を経験したﾆﾀﾄﾞﾘ=ｻﾝをして
天文学分野のシミュレーションは半精度程度の分解能があれば十分だって言ってるんだよ

453 ：,,・´∀｀・,,）っ-○○○：2016/02/13(土) 18:48:25.54 ID:dwcfM3wy
倍精度必要論が否定されるから都合が悪いだけだろう？

重力演算のために長崎大がGeForce買いあさって作った激安スパコンだって
単精度特化仕様だったよ？
これもﾆﾀﾄﾞﾘ=ｻﾝが協力している。古事記にも書いてある。
622 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 13:46:11.25 ID:AOSmisIg.net]: >>600
特化の意味わかる？
単精度の1/3の速度じゃ特化じゃないから
623 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 13:53:58.49 ID:T6EctyCF.net]: 特化じゃね。
1/4がイーブン
624 名前：デフォルトの名無しさん [2016/02/20(土) 15:21:16.14 ID:XuC13l9f.net]: 団子さんにコンプレックス持ってる病人がいるなｗ
625 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 15:32:40.26 ID:mQDXSMnA.net]: ただのAMDファンボーイだから
そもそもAMDはCUDAが使えないしCPUもAVXが半速のゴミしか出せないので
科学技術方面では全く役に立ちませんよ
626 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 15:35:44.85 ID:mQDXSMnA.net]: 価格の安いコモディティ製品本来の用途外に流用するのがGPGPUの始まり
用途外を前提に設計しろなんてのは片腹痛い話ですよ
627 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 15:50:28.63 ID:mQDXSMnA.net]: ちなみに仮数の単精度は24ビット、倍精度は53ビット
積和ユニットのの複雑度は仮数のビット数の二乗にほぼ比例するので
実際には倍精度積和ユニットの実装コストは単精度の5倍よりも多い
628 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 15:52:58.65 ID:AOSmisIg.net]: >>609
倍精度特化じゃないCPUが1/2
イメージ的にはこれで普通

特化って言ったら単精度演算器を持たない、昔ながらのスーパーコンピューターみたいなやつ
629 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 16:03:04.79 ID:mQDXSMnA.net]: 先に否定してるのにアホか
630 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 16:14:51.99 ID:T6EctyCF.net]: >>614
要は技術を知らないバカが無謀な要求をしていると自白しているわけだな。

そもそもCPUは倍精度特化で、単精度は搭載している回路の半分だけ利用しておまけでつけているくらいの勢い。
正確には倍精度以上から降りてきたという方が正しいような気もするが。
631 名前：デフォルトの名無しさん [2016/02/20(土) 16:19:59.15 ID:XuC13l9f.net]: うん、じゃCPU使ってなよ病気の人
CUDA関係ないからもう来ないでね
632 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 16:47:44.25 ID:mQDXSMnA.net]: 逆に言うと倍精度をサポートしなければ同じトランジスタの実装コストで
5倍以上の単精度ユニットを実装できるということ

それがCPUとは別方向で進化してきたGPUの速さの根源
それを否定するのはGPUを否定するようなもの
633 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 16:51:35.52 ID:T6EctyCF.net]: >>618
んな事はねぇよ。
回路を流用すれば1/4や1/16での
倍精度演算は殆ど追加コスト無く出来る。それを削ったからといって増やせる単精度性能は20%も無い。

まあ、これが大きいから1/4でなく1/16を選択するのが通常なのだけど。
634 名前：デフォルトの名無しさん [2016/02/20(土) 16:53:25.90 ID:XuC13l9f.net]: もうくんなつったろ
病人
635 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 16:59:15.42 ID:mQDXSMnA.net]: >>619
>>618のいうサポートっていうのはフルスピードの倍精度っていう意味
もちろん単精度を複数回（or複数ユニット）回して倍精度を実現してもいいが
それが現状のMaxwellなどの在り様なわけで
636 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 17:45:22.65 ID:deWWtRHc.net]: うわさではsmxに1個だけdpがあるとかないとか
637 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 17:59:22.63 ID:mQDXSMnA.net]: あったとしてもどういう役回りかわからんでしょ

ぶっちゃけると単精度で分割処理するとはいっても実際には
倍精度フォーマットをデノーマライズして複数の単精度データに変換するハードウェアと
演算結果を組み立てて倍精度フォーマットに書き戻すハードウェアも必要だからね
そのビットフィールドの変換をソフトで処理したら1/16すら出ない
638 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 18:20:08.42 ID:T6EctyCF.net]: 本来遅いハードでもdpどころか64bit整数の乗算も1/9で済むはずなのにそこはサボって24bit乗算器を16bitとしてしか利用していないんだよな。
639 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 19:23:23.87 ID:C1beyHUM.net]: 挙動の違いがあるとまずいから
同じユニット使ってるとか言う
640 名前：デフォルトの名無しさん mailto:sage [2016/02/20(土) 20:26:03.16 ID:kmGvjPZb.net]: >>619
AMDのGCNアーキテクチャーのGPUは複数のコアを使うと倍精度の演算が出来るように設計してある
それがPS4/XBOに搭載されたものだから、ゲームは非常にGPGPUに強いんだよな
DX12とVulkanはGCNで最大性能を発揮できるように設計されたローレベルAPI

これが怖いからMaxwellは半精度FP16GPUになった
描画に特化してGPGPUが弱い
641 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/20(土) 20:39:18.95 ID:mQDXSMnA.net]: 誰も使わないゴミの話に興味ないよ
642 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 00:09:39.56 ID:Qg7TSliE.net]: >>626
ここはCUDA(言語)スレでGPGPUスレではない
AMDのGCNの宣伝したいなら、いまAMDはCUDAもある程度サポートしているらしいから、
AMDでCUDAしたときのベンチぐらい載せて宣伝してくれないか？
GPGPUのすばらしいぞ宣伝ならここでなくGPGPUスレでやれ
643 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 00:46:36.86 ID:qKVvfwew.net]: HSA総合スレを盛り上げてやれよ
プログラムのプの字も書けないゴミには無理か？
644 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 01:26:54.56 ID:fTBqyn4A.net]: >>629
ここはディープラーニングスレじゃねーぞ糞団子
645 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 01:51:21.48 ID:uPvCsAh0.net]: AMDは早くCUDAに対応しろ。
646 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 02:47:38.75 ID:0MRjXIaU.net]: >>613
乗算の回路規模なんてぜんぜん大したこと無いって言ってなかった？
647 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 02:54:22.04 ID:gnD1Eicx.net]: >>632
俺は言った覚えはないがな
648 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 02:55:38.55 ID:gnD1Eicx.net]: >>630
プログラム書けないクソボケが居座る板でもないぞ
DQNのAMDファンボーイは自作PC板で妄想垂れ流してろクソボケ
649 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 02:57:56.81 ID:gnD1Eicx.net]: そもそもAMDのあれはCUDAを実行できるという理解は正しくない
CUDAのCソースをOpenCLに変換するトランスレータを作りましたという話で
PTXを実行できる環境を作るという話ではない
650 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 11:51:35.77 ID:YDVcjdw/.net]: >>634
＞プログラム書けないクソボケが居座る板でもないぞ

ここお笑いですか？糞団子
651 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 11:57:22.58 ID:gnD1Eicx.net]: 倍精度連呼君は倍精度を使って何をやるのかすら提示してないよね
652 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 11:58:40.76 ID:gnD1Eicx.net]: >>636
AMDファンボーイはプログラムを書いたこともないから
AMDの開発環境の圧倒的なひどさを知らんのですよ
知識さえあればNVIDIA一択になる理由がわかる
653 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 12:15:14.37 ID:MzI2quQP.net]: >>633
おまえの偽物か？
態度はおまえそのものだったけど
654 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 12:19:33.63 ID:MzI2quQP.net]: >>637
いろいろと書かれてるのに、すべてお前が一般人は使わないと決めつけてスルーしてるだけ
プログラム板のCUDAスレッドなんだから一般人とは母集団が違うのは当たり前なんだが

お前が不要で、一般人の9割が不要でもこのスレ的には関係ない
655 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 12:21:46.08 ID:hql2OPnW.net]: >>637
レイトレなんかどうだい？
656 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 12:33:02.90 ID:gnD1Eicx.net]: AMDのGPUは母集団そのものに入ってない
その点は理解してくれ
657 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 12:37:43.18 ID:gnD1Eicx.net]: AMD語りはこっちへ

HSA総合スレ【part 3】
peace.2ch.net/test/read.cgi/tech/1400582192/
658 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 12:47:19.67 ID:bDXYj0yt.net]: だれも倍精度不要なんて書いてないのにな。
倍精度特化がコンシューマ向けには必要無いと言うだけで。
659 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 12:56:20.84 ID:gnD1Eicx.net]: 倍精度は必要な人は必要だけどAMDがこのスレに不要
660 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 12:58:04.21 ID:YDVcjdw/.net]: >>644
てめえはすぐに論破されると単発で煽りやがる
こういう奴だからこそこっちは不必要にNGだけでなく相手をしないといけないんだよ馬鹿野郎！

コテならコテだけで通せ！糞団子！

それから、NVがこれからGPGPUを捨てる根拠となるソースだ
実際にここで科学技術演算をされてらっしゃる皆さんもご覧になった方がいい↓
camera-pc.com/?p=578

結局これもCS機をAMDが独占したためなんだよな
661 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 13:15:26.28 ID:gnD1Eicx.net]: ばか？
662 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 13:28:33.48 ID:gnD1Eicx.net]: 科学技術計算でAMDのGPUが上げた実績なんてないし
NVIDIAがHPCを重視する姿勢にも変わりはない

そもそもMaxwell世代に大型のスパコン案件が無かったから倍精度特化版を作ってないだけで
663 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 14:11:49.09 ID:gnD1Eicx.net]: ちなみにその個人ブログの主は科学技術計算に対してあまりに無知でお話にならない
ただカタログスペックのFLOPS数値を上げてヨシとするものではないのだわ

大規模システムはノード間のデータ転送帯域がものすごい重要で
NVLinkもその一環

AMDはカタログスペックありきで中身が無いし
実際2017～18年の米国大型スパコン案件を何一つとして獲得できてない
664 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 14:17:28.22 ID:YDVcjdw/.net]: ascii.jp/elem/000/001/046/1046956/index-3.html
＞Keplerの世代では倍精度浮動小数点のサポートの有無がこれにあたったが、
＞Pascalはこの点ではMaxwellを継承しており、
＞倍精度浮動小数点の性能は非常に低いと思われるので、ここでの差別化は難しい。

Pascalはここのスレ住人にとっては大変残念な事になるだろうな

その理由は先述したとおり、AMD準拠のDirectX12が策定された事でゲーム用GPUでNVは必死になって
電力効率の優位で喰らいつこうとしているためで描画特化でDX12世代に必須になるGPGPUを弱体化させた
トレードオフがある

倍精度とNVの関係は残念ながら離婚前の別居状態のようなさめた状態
665 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 14:23:54.76 ID:gnD1Eicx.net]: 相変わらず知恵おくれだねえ
その記事を読んでもPascalの倍精度特化版が存在しないということは読み取れないがね

大型案件がつけばMaxwellの倍精度特化版も出す用意はあったくらいだし
少なくともPascalには客がついている
666 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 14:35:55.03 ID:gnD1Eicx.net]: 倍精度の性能はスパコンでは今後も重要だけど
足回りの性能に見合わないほどのカタログスペックが必要かと問われれば
「必要ない」のが現実なわけで。

足回りの強化もなしにただ倍精度ユニットだけ並べておけばFLOPS数が稼げる
LINPACKベンチの実用性に疑問符が付くご時世ですからね
news.mynavi.jp/articles/2014/12/25/nvidia_coral/
667 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 14:50:22.3 ]: [ここ壊れてます]
668 名前：5 ID:gnD1Eicx.net mailto: AMDが無様な全敗を喫した2017-18年の案件はDOEではPre-Exa世代という位置づけで
Exaにむけたスケーラビリティのための足回りの

IntelのOmni-Pathしかり、選定されたメーカーの製品には選定されるだけの裏付けがある
AMDにはインターコネクトに対して2018年にただちに用意できる対案が何もない。
そのスパコンの選考がとっくに終わってからこれから倍精度強化だとか
何も理解してないというか既に周回遅れ。 []: [ここ壊れてます]
669 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 15:18:31.73 ID:igZD1LUA.net]: 病気の人は倍精度特化のcpu使うって宣言してんだから
関係のないcudaスレにあらしにくんなよ
670 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 15:30:43.09 ID:gnD1Eicx.net]: Polarisは結局スパコンのデザインウィンを未だ1件たりとも取れてないんだよな
全てが無駄だったね
671 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 15:31:01.75 ID:VEySITtF.net]: 野球ファンがどっちの贔屓チームの方が凄いか喧嘩してるようなアホらしさｗ
672 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 15:40:19.39 ID:gnD1Eicx.net]: たとえるなら阪神ファンがオフシーズンに東京ドームに居座って六甲颪を大合唱するレベルの
あつかましさ
673 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 15:59:16.02 ID:ksxAl9BA.net]: >>646
勝手にくそ団子と同一視するな。
不愉快だ。
674 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 19:49:31.23 ID:YDVcjdw/.net]: >>658
お前も糞の自覚はあるんだな、糞団子
675 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/21(日) 20:00:48.09 ID:gnD1Eicx.net]: うんこくってる時にカレーの話はやめてください
676 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 20:37:09.44 ID:zsQMik7a.net]: 小学生かよ…
677 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 21:06:17.70 ID:igZD1LUA.net]: 米国のエクサスケールではcuda使わないんだけどね
678 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 22:12:15.14 ID:gJEqj33V.net]: www.livevolume.com/?page_id=14&lang=en
このソフト動かしたいんだけど、nvidiaのカードが必要なんですか？
すいません、プログラムのプの字も知らない初心者です
pentium N3700でGPUがintel graphicなんですけど
やっぱりこの環境で動かすことはできないのでしょうか…
現状では「GLSL compile error」と出て描画ができません
もしスレ違いな質問だったら本当にごめんなさい
679 名前：デフォルトの名無しさん mailto:sage [2016/02/21(日) 23:09:10.02 ID:Qg7TSliE.net]: >>663
Minimum system requirementsにNvidiaとあるし、
そして、実際に動かないとなるとnvidiaつけるしかないだろ
680 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/22(月) 02:03:02.55 ID:XUbrDPNF.net]: 果たしてそのマシンにGPUなんてつけられるだろうか？
ノートならG-Tuneあたりのゲーミングノート買うのが一番手ごろじゃなかろうか
（メーカー製ノートでもGeForce搭載機はあんまり見かけない）
681 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/23(火) 17:44:18.03 ID:U0HFk1NZ.net]: スパコン案件の有無が倍精度版の有無を決めるというのは間違いないようで

NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html

とりあえずTesla購入予定の方は何も心配いらないということです
悔しがるのはTeslaが買えない貧乏研究者とAMD厨だけでいいですよ
682 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 18:53:40.49 ID:NTXFP2zz.net]: 研究者しか倍精度を使わないと思ってるところが団子クオリティー
683 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/23(火) 19:57:44.93 ID:U0HFk1NZ.net]: ↑ね、　この負け犬クオリティ
684 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/23(火) 19:59:57.59 ID:U0HFk1NZ.net]: GeForceは個人用のGPUであって倍精度で科学技術演算のためのものじゃないんですよ
倍精度の性能に正規の�
685 名前：ﾎ価を払おうとしない悪質ユーザーの梯子を外されたからって 何が問題なんですかねえ []: [ここ壊れてます]
686 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/23(火) 20:14:34.27 ID:U0HFk1NZ.net]: 倍精度ユニットの実装コストはロハではないので
メインで使う単精度の演算性能向上や電力効率の改善に振ったほうが
大多数のユーザーのためなんですよ

実質TeslaをGeForceの価格で売れと言ってるような倍精度乞食の言葉に
耳を傾ける必要はないのﾃﾞｽ
687 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 21:11:07.44 ID:NTXFP2zz.net]: 単精度布教はいいからCUDAについて書けよ
688 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 22:13:43.75 ID:/ZAu7LIh.net]: NGにしてるから何かいてあるか知らないけど、どうせ相手にする価値がないことは>>671
から読み取れるｗ

このスレは研究者もヲチしてるだろうから言っておくけど、もうNVは倍精度は捨てるね
Felmi時代とは大違い

DirectX12（ウィンドウズ10）になるとAMDだけがローレベルAPIの恩恵に与れることを知ってるから、
Maxwell世代で素早くGPGPU切りの変わり身を演じた
今後は半精度と単精度の混合GPUばかりでCUDAはどんどん腐ってくるｗ
689 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 22:47:19.86 ID:oMRN0TkA.net]: 恥ずかしいやつだなこいつ
690 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 23:01:37.48 ID:/ZAu7LIh.net]: >>673
てめえをNGにして非難合戦のスレ汚しをしたくないのにノコノコ単発で出てくるな！
糞団子！
691 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 23:20:55.12 ID:zq7ECeNv.net]: >>672
なんかAMDが勝ち組でNVが負け組の様に書いてあるけど、実際は真逆だよ
AMDはゲーム機でなんとか持ちこたえてる状況で、NVはDL特需で歴史的な好況
GPGPUはCUDAがデファクトになりつつあるからAMDはほぼ詰んでる
まぁ、先の事は判らないけどね。
692 名前：デフォルトの名無しさん mailto:sage [2016/02/23(火) 23:23:55.28 ID:oMRN0TkA.net]: >>674
お前みたいな負け犬ｱﾑ厨が自作PC板から出てこなきゃ平和なんだけど
693 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 12:20:01.56 ID:Ad4bERAY.net]: >>675 >>675
まだ単発自演で俺をやり込めようってか？糞団子！
NVはもはや半精度でしか生き残りが出来ないんだよ！
このスレは倍精度の行方が一番大事なんだからてめえがいることが一番スレを汚すんだ馬鹿野郎！
694 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 12:31:29.64 ID:dk01eTkb.net]: 倍精度の行方なら団子がソース付きで書いたけどね
結局NVIDIAがHPCから撤退なんてのは出鱈目な言いがかりと
695 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 12:47:40.23 ID:dk01eTkb.net]: ほれ

NVIDIA Pascal based GP100 GPU to boast of 12TFLOPS SP & 4 TFLOPS DP performance
vr-zone.com/articles/nvidia-pascal-based-gp100-gpu-boast-12tflops-sp-4-tflops-dp-performance/106203.html

そらあんだけのシェアとエンプラ向けの大躍進あればコンシューマ向けとHPC向けで
それぞれに合わせた演算ユニット構成のカスタマイズ費用くらい捻出できるだろう

そしてここはAMDについて語るスレでもNVIDIAをネガキャンするスレでもない
誰が場所をわきまえていないのか自覚したら？
696 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 12:47:59.45 ID:jB1Q2gHg.net]: >>677
おいおい糞団子と一緒にするなよ
ここはCUDAスレだぞ
倍精度の行方とかどうでもよろしい
お前自分が糞団子レベルになってる事に気付けよ
697 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 12:58:31.02 ID:jXa1RnbL.net]: 浮動小数点数の精度なんて
コード組む側からすればどれも一緒だよ
倍精度だと収束するが
単精度だと発散するとか
それ単にコードの質が悪いだけだしね
何がそんなに気になるのかわからん
698 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 13:10:46.14 ID:kxdU4ZHF.net]: >>681
えっ？？？
699 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 13:17:56.21 ID:dk01eTkb.net]: FireProがHPC向けでまったといっていいほど使われないのは
分岐粒度が荒過ぎて実効でスペックの半分も出ないとか
特定用途向けの商用ライブラリが用意されてないのか
それ以前の問題としてランタイムが頻繁にクラッシュするとか
結局のところトー�
700 名前：^ルの問題なんだよね 単精度特化の一般のGPUで多倍精度使う場合は遅い倍精度を使うより 単精度DFTのほうがはるかに速い []: [ここ壊れてます]
701 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 14:12:53.97 ID:s8sb75Sy.net]: 中小企業や個人開発のプログラムにもCUDA開発の無償支援してくれる
そういう実績があるからCUDAが鉄板になってるわけで

そういうことをやったためしもなければ大赤字でやれる予算も割けないAMDに
期待できることは何一つとしてない、これが現実
うちの商品はほぼ整数しか使わないだから倍精度実数が速いかどうかなんて
微塵も関係ない
702 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 14:34:29.38 ID:Ad4bERAY.net]: 糞団子はコテ使ってると相手してくれないから寂しくて単発コテはずし作戦に出たのか？
NVはどう考えても半精度中心のグラフィックス/深層学習中心に経営資源をシフトしてるんだがｗ

ascii.jp/elem/000/001/046/1046956/index-3.html
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
＞Pascalはこの点ではMaxwellを継承しており、倍精度浮動小数点の性能は非常に低いと思われるので
↑
大事な事だから二度言うぞ

＞つまりPK100は半精度浮動小数点をサポートするが、PK104はこれをサポートしない(あるいは回路を持たない)可能性がある。
↑
プロセスルール次第だが半精度に重心を置いていることは明白だな
703 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 14:41:47.70 ID:Ad4bERAY.net]: half2floatをPascalでは強化していくから、結局AMD対NVの戦いは「half2float」の描画特化対
「Async」の戦いになっていくんだろうね
704 名前：デフォルトの名無しさん [2016/02/24(水) 14:51:49.40 ID:NAMaIKUn.net]: 今後この馬鹿に一切かまうな
かまうから喜んで荒らし続ける
705 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 15:33:36.04 ID:jXa1RnbL.net]: どっかのニュースのコピペばかりで
うんざりするよ
自分の引き出しは空だと言っているようなものだ
706 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 17:46:05.30 ID:l0DrHc2T.net]: >>686
AMDなんか興味ない
お前は糞団子と同レベルの荒らしだ
失せろ
707 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 17:50:58.28 ID:jXa1RnbL.net]: 一般利用でCUDAが何に使えるのか
ネタ出せよ
ゲームで使えんの？
708 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 17:55:56.67 ID:Ad4bERAY.net]: >>689
お前はAMDに一番興味あるだろうが糞団子！
お前が去ればこのスレは一気にクリーンになるんだよボケ
お前が一番危機感抱いてるのは倍精度をなくす方向のNVに対して非難が集中する事だけだ
だからこそお前が一番イラネーんだよ屑
709 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 18:44:53.08 ID:l0DrHc2T.net]: >>691
お前病院行けよw
710 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 18:55:34.70 ID:Ad4bERAY.net]: >>692
糞団子よヒヨッたなｗ
711 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 21:04:29.34 ID:Nmttufaz.net]: >>693
お前はいったい何と戦ってるんだ？
日和ったの意味も違うしな
ここのみんなはAMDにもNVにも思い入れはないから
迷惑だから糞団子と一緒に消えてくれ
712 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 22:15:50.14 ID:teBWCRhn.net]: 団子よりヤバイ真性のキチガイが団子以外も団子に見えているらしい。
713 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 22:27:56.59 ID:zahm20jW.net]: 団子消えろ
714 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 22:37:00.33 ID:l5BeTFuC.net]: >>695
ほんと真性基地だよな。日中でも必死カキコっていうのもな
この人、プログラムに関する話がでないことからして、プログラムやったことないんだろうな
715 名前：デフォルトの名無しさん mailto:sage [2016/02/24(水) 22:56:49.71 ID:teBWCRhn.net]: >>683
分岐粒度が荒すぎってCPUとの比較なら未だしも、NVIDIAとの比較だったら普通そんなに差は出ないぞ。
差が出るのは64のうち前半もしくは後半の32がほぼ埋まっているのに、反対の32が完全に空みたいな状況が頻発する場合だけ。

まあCUDAからのベタ移植ならあり得ないこともないのだろうが。
716 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 08:17:21.70 ID:qdgy2oNb.net]: プログラムの話しようぜ
そうすれば団子その他プログラム書けない人が消えるだろうから
717 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 08:22:03.55 ID:qdgy2oNb.net]: >>698
まあそうだな
今のnVidia32、AMD64の設定は回路効率と性能効率を考えて美味しいところなんだろうか？
ただの惰性？
718 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 08:23:54.24 ID:YDhqTq2/.net]: 将来的に4にするっていこうだが
実行レベルでは
warpは32のままだろうけど
719 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 13:05:41.93 ID:FCdE8jm8.net]: >>692-695 >>697
糞団子は黙ってろ！
文句があるならコテ付けろやコラ！
テメエが鬱陶しいんじゃ、ボケ！

>>698
それも糞団子の自演だよ
NVIDIAの優位性は3dfxを買収した事で得られたソフトノウハウだな

自作板でもそうだけど、よくよく考えるとおかしな文面でごまかすのが団子
たいてい論破されるとどうでもいい専門用語を並べてイカスミ作戦に出る
720 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 14:04:40.68 ID:Sn2492Ux.net]: >>702
まずお前がコテつけてくれ
721 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 14:47:28.30 ID:Ey2CZbRS.net]: 不用意に3dfxとか使うと歳がばれるぞ
722 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 17:48:12.65 ID:8lu6Pire.net]: >>702
あの程度の文面を理解できないほど技術に疎いのだな。

そもそも団子認定連呼廚のスタンスがよくわからん。
723 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 18:22:40.32 ID:Ey2CZbRS.net]: 好きなんだろ
恋だよ恋
724 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 19:23:25.50 ID:JdxelD2D.net]: 糞団子もイカスミも同レベル
725 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 19:39:25.49 ID:tc7lGvfi.net]: 団子が消えれば平和になる
726 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 19:52:29.05 ID:JdxelD2D.net]: 団子既に消えてるじゃん？
イカスミが煽るから戻って来るんだよ
727 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 20:58:58.26 ID:qdgy2oNb.net]: 誰だよイカスミって
728 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 23:01:45.88 ID:OUVaT1r5.net]: nvidia ってC++AMPって力いれてるの？
CUDAが主力なのはわかるんだが。

OpenMPのようにC++AMPがいいところまでいってからtoolkitにマージするつもりなのか
それともC++AMPが自然消滅するのを待っているのかわからん。
729 名前：デフォルトの名無しさん mailto:sage [2016/02/25(木) 23:56:26.32 ID:y8R9vLq2.net]: >>710
>>702=イカスミ
730 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/25(木) 23:58:06.25 ID:VFYZCeUD.net]: C++ AMPは事実上終了したよ
MSはいまNVIDIA ThrustをベースにしたParrarel STLに注力中
731 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/26(金) 00:00:42.44 ID:au4AtN7W.net]: Pallarel STLね
732 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 00:04:42.12 ID:sfGjrhZB.net]: >>705
NVはC++AMPとか言うより倍精度をボリュームゾーンから外しにかかってるな
Pascalには全く期待できんよ
IBMの場合は大口契約だから安く調達するだろうけど、それだけ
いずれGPGPU用（テスラ）は値段を上げざるを得ないだろうなあ
733 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 00:18:06.49 ID:XrDeqd+8.net]: それなら死んでないでしょう。
スラストがCUDA用のライブラリと同様に
C++AMPで使うためのものだろうから。
734 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/26(金) 00:46:50.10 ID:au4AtN7W.net]: Pallarel STLのバックエンドはC++AMPに限らずOpenACCやOpenMP(4.0), TBBでもいい
NVIDIAが推してるのはOpenACC, IntelはOpenMP
735 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 00:49:09.70 ID:jDU7chRF.net]: >>704
俺3dfxを知らないからググッタよ。イカスミ、かなりの歳なひとなんだな

C++AMPを使っている奴どれぐらいいるんだ？
736 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 01:09:31.01 ID:puLBdTvq.net]: >>714
ミス指摘してさらにひどくミスすんなって
737 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/26(金) 01:13:08.03 ID:au4AtN7W.net]: parallelサーセンｗｗｗｗｗ
738 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 01:36:18.43 ID:1N9hBdg9.net]: >>715
最初の頃のテスラは円高もあり、20万位だったが、いまじゃ80万くらいになってもうた。まあA30とかは120万くらいしたんだけど。
739 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 01:38:37.56 ID:XrDeqd+8.net]: >>717
そうだOpenACCだ。勘違いしてたよ。
C++AMPではなかった。
MSだけだとC++AMPはきびしいだろうね。
まだOpenACCのほうがめはあると思う
740 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 01:42:47.55 ID:XrDeqd+8.net]: >>721
その頃とくらべると開発環境がかくだんに良くなってる。
HWのコストだけでなく、そういうの含んでの価格だろうね。
741 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 03:40:06.50 ID:VdCPJ0Vc.net]: >>702
後半はまったくその通りだな団子
どこかで調べた用語を使うが、意味を良く分からずに使うからおかしな日本語になる
742 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 05:22:49.16 ID:YzxqLjh+.net]: nvはpgi買収してopenaccのコンパイラも力入れてるよ
doeのエクサスケールで使うのもcudaじゃなくてopenaccだし
743 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 05:38:13.56 ID:mUz9Cfpw.net]: 「,,・´∀｀・,,）っ-○○○」って鳥屋氏でしょ。
悪いけどここに同じレベルの人はいないんじゃない。
744 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 07:10:07.81 ID:VdCPJ0Vc.net]: 何のレベル？
745 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 08:03:13.43 ID:lqbLzerX.net]: イカスミが同レベル
どっちも要らない
746 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 08:04:45.81 ID:VdCPJ0Vc.net]: 鳥屋氏ってだ～れ？
747 名前：デフォルトの名無しさん mailto:sage [2016/02/26(金) 11:35:24.33 ID:J+QrFB1k.net]: NVの工作員
GPGPUはVLIW時代のATIGPUを持ち出してネガキャン
748 名前：デフォルトの名無しさん mailto:sage [2016/02/27(土) 13:53:00.79 ID:VbYYT6/A.net]: 鳥屋でググるとこれが出てきた
potato.2ch.net/test/read.cgi/software/1205766220/
749 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/27(土) 19:58:40.83 ID:WSIY1iVq.net]: 俺がいてもいなくてもCUDAプログラミングの話ができない無能集団のスレ
750 名前：デフォルトの名無しさん mailto:sage [2016/02/27(土) 20:22:31.94 ID:VXpwyn8O.net]: 囲碁ソフトにディープラーニングが使われ始めてるんだが、
ＣＵＤＡ対応ソフトもそろそろ来るかもしれん。
一般人にも身近な技術になるかもね。
751 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/27(土) 20:27:20.16 ID:WSIY1iVq.net]: そのうち教えられたことだけしかコーディングできないクソPGもAIにとって代わられるんだろうな
752 名前：デフォルトの名無しさん mailto:sage [2016/02/27(土) 22:07:54.84 ID:unQVppL1.net]: なるほど糞団子が嫌われるわけだ
753 名前：デフォルトの名無しさん mailto:sage [2016/02/27(土) 22:34:12.86 ID:VbYYT6/A.net]: 鳥屋ってただのサンデープログラマーだからな
知ったか決めてりゃ嫌われる
754 名前：デフォルトの名無しさん mailto:sage [2016/02/27(土) 23:58:13.35 ID:Fq+Tn6zB.net]: >>736
鳥屋氏の書いたコード見たことないでしょｗ
申し訳ないけど、ここにいる人たちとは次元が違うよ。
頭が良すぎて理解されないタイプ。
755 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 00:21:01.28 ID:4gv2LXai.net]: >>731
,,・´∀｀・,,）っ-○◎●
と持っている団子が違うが同じ人なのか？　
756 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 00:32:14.81 ID:5Pz55yFT.net]: 君はその名前欄に●入れてそのまま表示されるか試したことがあるかい？
757 名前：,,・´∀｀・,,）っ-○◎○ mailto:sage [2016/02/28(日) 00:34:20.80 ID:lm9zk8qN.net]: テスト
758 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 00:34:46.41 ID:lm9zk8qN.net]: むう、表示されんのう
759 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 00:53:04.73 ID:4gv2LXai.net]: 別人なのか？
,,・´∀｀・,,）っ-○◎●
が持っているのは焼き鳥
で
,,・´∀｀・,,）っ-○○○
が持っているのは団子
ということか
760 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 00:58:05.10 ID:9kjNwUs3.net]: 鳥屋氏が両方つかってるの見たことあるから本人なんじゃない?
761 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:03:49.87 ID:4gv2LXai.net]: なら、次は,,・´∀｀・,,）っ-○◎● で書き込んでくれるな
762 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:06:06.88 ID:9kjNwUs3.net]: っていうか●が名前欄に使えなくなった経緯も知らないんじゃ、鳥屋氏のことを知らなくても無理は無いね。
763 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:17:52.65 ID:4gv2LXai.net]: >>745
俺もだが団子と言っている奴は鳥屋時代のこと知らないだろ
>>737の言うような奴ならすごいCUDAコード披露して欲しいが
でも、雑談に必死なコテの荒らしって感じだからな。
とりあえず、鳥屋時代のコードどっかにないのか?　見てみたい気がする
764 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:18:45.52 ID:TGNAvpkz.net]: 糞団子がどんなコード書く
765 名前：か知らんけど、弾道計算の件でシドロモドロになった事実は消えんぞ 所詮その程度の知的レベル []: [ここ壊れてます]
766 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:43:25.37 ID:9IJglbed.net]: >>725
速度自体は生でcudaやったほうが速いらしいから
これは開発効率を優先してPGIなのかね？
あるいは現時点ではいまいちでも今後の成長を鑑みてとかさ

さすがにdod,doeでも世代ごとのコード書き換えは負担なんだろうか
767 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 01:50:50.47 ID:9IJglbed.net]: キャッシュの増量やシャッフルIA、HyperQ,DP等を全部こみこみで考えると
１コアあたりの実効性能（flaot）はfermi, keplar, maxwellと上がってると考えていいのかね？

flops/core/clockではなくてflops/coreという意味で、かつ理論値での比較ではなくていかに実測値がでるかという意味で。
768 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 02:02:26.76 ID:5Pz55yFT.net]: 俺は中村氏じゃねーから
769 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 02:05:54.35 ID:5Pz55yFT.net]: 2009年当時なら団子はやっぱり団子だったぜ？
www.openwall.com/john/doc/CREDITS.shtml

当時書いてたのも別に変態的でもない普通のCコードですけどね
download.openwall.net/pub/projects/john/contrib/bitslice-des/dango.chu.jp/
770 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 03:07:32.07 ID:9kjNwUs3.net]: >>750
あれ、中村氏もそのAAつかってなかったっけ?
とにかく鳥屋氏(=中村氏)はプログラミングの技術も問題に対するアプローチの仕方も異次元の存在だったな。
771 名前：デフォルトの名無しさん [2016/02/28(日) 09:32:39.66 ID:kqHim0z9.net]: やっぱり団子って複数人いるよね？
すごく詳しい話をするとおもったら、なんか急に低レベルだったり、
てにをはが変わったりする。
772 名前：デフォルトの名無しさん [2016/02/28(日) 09:40:16.99 ID:uncqUlBQ.net]: たまに二人の団子が会話することもあるぞ
773 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 11:21:05.00 ID:5Pz55yFT.net]: > あれ、中村氏もそのAAつかってなかったっけ?
なにそれ見たことない
774 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 11:43:53.32 ID:F3rkrfCl.net]: 結局鳥屋が馬鹿団子の振りしてるだけかもだが、詐欺の天才は結局馬鹿より有害
NVのやる事は何でもマンセーではスレ汚しとしか言いようがない
CS機をAMDが独占したからNVは倍精度に手を出せなくなった、と言うといつも発狂
これでは冷静な議論が出来ない
775 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 11:46:36.13 ID:1t5d585j.net]: おまえはcuda関係ないんだからくるなよ
かまってちゃん
776 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 11:51:31.77 ID:5Pz55yFT.net]: そっち界隈しばらくチェックしてなかったけど海外のﾊｶｰ面白いことやってるね。

ちょうどCUDAに特化した話題だ。
MaxwellのLOP3.LUT命令を使ったビット演算の高速化テクニックについて興味ある人は
一度この講演ビデオ観ておくといいと思う。
www.irongeek.com/i.php?page=videos/passwordscon2014/bitslice-des-with-lop3lut-steve-thomas

実際問題AVX-512のvpternlogもLOP3.LUTと引数互換なんだわ
ぶっちゃけソース置換するだけで移植可能
777 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:03:43.36 ID:F3rkrfCl.net]: >>757
鳥屋＝糞団子！テメエこそCUDAの何が分かるんだボケ！
778 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:06:45.18 ID:1t5d585j.net]: ハイハイお薬の時間でちゅよ
779 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:18:13.04 ID:F3rkrfCl.net]: 単発のお時間がきまちゅたね～

鳥屋＝糞団子が自作板からこっちのスレの巡回時間が来たみたいｗ
本当に鳥屋が使える天才なら２ちゃん談義なんかしねえな

１０�
780 名前：N前ならゲーム業界か、少し前なら京に関わるか 或いはアメリカでイラン向けバックドアを仕掛けるお仕事か… どっちにしろヒマを持て余すようではお里は知れてる []: [ここ壊れてます]
781 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:24:17.80 ID:1t5d585j.net]: ハイハイお部屋に戻りましょうねぇ
782 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/28(日) 12:37:00.70 ID:5Pz55yFT.net]: https://community.amd.com/thread/197348
AMDのGPUにはLOP3.LUT相当の命令がないことにユーザーからも不満が噴出しているようです
783 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:44:20.68 ID:F3rkrfCl.net]: 単発でも見事につられまちゅね～wwwww
団子＝鳥屋ちゃんピンチでちゅね～wwwwww
784 名前：デフォルトの名無しさん mailto:sage [2016/02/28(日) 12:51:25.16 ID:1t5d585j.net]: ハイハイご飯時間ですよおじぃちゃん
785 名前：デフォルトの名無しさん mailto:sage [2016/02/29(月) 16:54:00.73 ID:XMRi5hV6.net]: なんだかすごく質問しにくい流れなんですがいいですか？
バイトニックソートのプログラムを作ってみまして、
要素数512を境にGPUの方が速くなったのは良かったんですが、
要素数8192くらいからGPUの時間増加の傾きがCPUより悪化してしまって、
1048576ともなるとほとんど大差ないくらいになってしまいました。
これが普通なのか、おかしいのか、
おかしいなら原因として何がありそうか教えてほしいです。
一応可能なところはshared memory使ってますが、要素数256以降は
比較の組がとびとびになるはずなのでglobal memoryを直接読んでます。
以下、ソートを10000回繰り返した際の1回あたりの所要時間です。
要素数 CPU[s] GPU[s] CPU/GPU
2 0.00000 0.00004 0.004
4 0.00000 0.00005 0.008
8 0.00000 0.00005 0.011
16 0.00000 0.00006 0.020
32 0.00000 0.00007 0.036
64 0.00001 0.00008 0.099
128 0.00002 0.00009 0.229
256 0.00005 0.00010 0.522
512 0.00013 0.00013 1.027
1024 0.00031 0.00016 1.909
2048 0.00076 0.00025 2.975
4096 0.00179 0.00036 4.919
8192 0.00423 0.00068 6.248
16384 0.00933 0.00202 4.627
32768 0.02142 0.00637 3.363
65536 0.04903 0.01776 2.761
131072 0.10829 0.05003 2.165
262144 0.24928 0.13078 1.906
524288 0.54765 0.32437 1.688
1048576 1.22586 0.77101 1.590
786 名前：デフォルトの名無しさん mailto:sage [2016/02/29(月) 17:56:37.64 ID:+ARXUC0S.net]: 鳥屋、答えてやれよ
787 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/29(月) 23:54:40.69 ID:72g2TQWh.net]: >>767
バードショップ氏と話しがしたいなら @chapuni に凸ってきたら？
788 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 00:01:36.14 ID:9XwMWslZ.net]: バイトニックソートはキャッシュメモリで収まる範囲内の小さなデータ集合に対して有効
サイズが大きくなるとGPUのローカルメモリから外れて大幅にパフォーマンスが落ちる
CPUのほうが低レイテンシ・大容量のキャッシュ積んでる分だけ有利になるわけだ

CPUのキャッシュに収まらない量になれば再びGPUのほうが上回るはずだ
まあそのレベルに達する段階でO(n log n)のソートの検討の余地があるが
789 名前：デフォルトの名無しさん mailto:sage [2016/03/01(火) 00:02:13.26 ID:epSXE3Ge.net]: >>766
Nvidiaならおかしいことはよくある。気にするな
GPGPUでおかしいことをさけたいなら倍精度の自慢のAMDを使う
790 名前：デフォルトの名無しさん mailto:sage [2016/03/01(火) 00:33:31.30 ID:k65RqU8V.net]: 質問者がシェアードメモリって言ってるのにキャッシュとかいい加減なこと言ってる
シェアードメモリに言及しないなんてあり得ない
そもそもCUDA使ったことないんだろうな
やっぱ糞団子は低レベルだな
791 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 00:41:11.27 ID:9XwMWslZ.net]: いったい何年前の話をしてるんだ
Fermiから階層型キャッシュ導入してるが
www.gdep.jp/column/view/2
792 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 00:46:09.76 ID:9XwMWslZ.net]: GPUについてはどっちにも解せる「ローカルメモリ」と言い換えてる
ちゃんと読めない子は呼吸を止めて1秒あなた新鮮だけど煮魚
793 名前：デフォルトの名無しさん [2016/03/01(火) 12:21:21.56 ID:/z3eDKB8.net]: >>771
結局団子を買いかぶってた奴は団子自身だろwwwwwwwwww
糞っぷりを言い触らされたくないﾁﾝｹなプライドが虚勢を張りたくなる理由なんだろう
794 名前：デフォルトの名無しさん mailto:sage [2016/03/01(火) 12:24:00.41 ID:CYOvNsDD.net]: ケンタッキーフライドチキンがどうしたって
795 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 12:31:48.31 ID:iam2QPf0.net]: GMにマッピングされたメモリは一定の局所性があればキャッシュにマッピングされる
常識が通じないバカが勝手に自爆してるな
796 名前：754 mailto:sage [2016/03/01(火) 15:10:24.97 ID:oQoWs5hY.net]: >>769
キャッシュメモリ……
すいません、当方キャッシュについては不勉強でして、よくわかってません。
多分L1とかL2とか書いてあるやつだと思うのですが、手元の参考書が古い(6年前)もので……。
DeviceQueryだとL2 Cache Size: 524288 bytes って出るのでこれでしょうか。
Total amount of shared memory per block: 49152 bytes とか
Total number of registers available per block: 65536 とかもあります。
英語版Wikiの平均計算時間O(log(n)^2)parallel timeもよくわかってなかったりします。
log(n^2)なのか(log n)^2なのかよくわからんとです。
>>770
倍精度だと性能がうんたらとややこしかったので、単精度整数のソートなんです。
正確には同サイズの単精度整数配列2つを作り、
片方を基準にソートして、もう片方を一緒に並び替えてます。
構造体にしてもいいんですが、一緒に並び替えたほうだけが後々必要なデータでして。
最終的にはソートした結果を使って色々処理するためのプログラムなんですが、
現状だとこのソートで全体の8割くらい時間食っちゃってるんですよね。
ソートしなかったらもっと遅い(というかO(n^2)になる)ので無意味ってわけでもないんですが。

忘れてましたがGeForce GTX 760を使ってます。
以前機会があったので、別のGPU(GTX570だった気がする)でほぼ同じ計算させてみたこともあるんですが、
そっちだともっとマシでした。CPUより確実に速い、と胸を張って言えるくらい。
スペックの違いを加味しても、うちのGPUだけ下手したらCPUより遅いってのも変だなあ、と。
797 名前：デフォルトの名無しさん mailto:sage [2016/03/01(火) 15:16:26.28 ID:oDNKlTv2.net]: たぶんfermi世代とkepler世代でのL1Dの扱われ方の違いとか？

news.mynavi.jp/column/architecture/335/
798 名前：デフォルトの名無しさん [2016/03/01(火) 20:11:04.94 ID:/z3eDKB8.net]: 要約すると団子の答えは答えになってない
799 名前：754 mailto:sage [2016/03/01(火) 21:01:21.25 ID:oQoWs5hY.net]: >>778
参照先読みました。キャッシュの話だったので自信はありませんが、
Fermi(GX570)世代のキャッシュは容量超えると(多分)通信の速いL1D等に退避されてたけど、
Kepler(GTX760)世代だと通信の遅いglobalに退避されるようになった、ってことですか？
さすがにアーキテクチャの仕様だと自分のスキルじゃ対応できません……。
>>779
答えになってないというか、私の知らない範囲の回答だったんでよくわからなかった感じです。
言ってることは766さんの参照先と多分同じなんだと思います。自信はありませんけど。

で、みなさん改善する方法はないでしょうか……。
大
800 名前：規模計算にウンタラ使うとカンタラがヤバいから避ける、みたいなことありませんか？ オプションにホニャララって追加すれば設定が変わる、とか(実はオプションもよくわかってない)。 大規模の時、キャッシュ代わりにあえてsharedを定義しても意味ないのかな…普通はないよな… []: [ここ壊れてます]
801 名前：デフォルトの名無しさん [2016/03/01(火) 22:50:15.99 ID:1eMSB1ZO.net]: また団子が知ったかぶりをかましたのか！（呆れ）
802 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 22:57:33.44 ID:xcdR7XnG.net]: そもそもキャッシュはシェアードメモリの退避先ではなくグローバルメモリの一部の読み書きを高速化するためのもの
シェアードメモリに収まらないデータのソートで遅くなる問題なのでシェアードメモリは全く関係ない

アホが自爆すんなよ
803 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/01(火) 23:00:19.76 ID:xcdR7XnG.net]: データ全体がキャッシュに収まらない場合はキャッシュローカリティを意識した演算順序の最適化をする
これはCPUでもGPUでも理屈は変わらない
804 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/02(水) 00:01:12.12 ID:Lh/popYV.net]: 自分の答えを示さず謂れのないイチャモン付けに必死になる奴ほど
スレにとって邪魔な存在はないね
805 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 01:05:18.36 ID:WNl5zi/w.net]: 団子はレスをまとめることを覚えて
806 名前：754 mailto:sage [2016/03/02(水) 01:23:35.90 ID:n1GLxV/f.net]: >>782-783
キャッシュローカリティって何さ…となったので、Google先生に勧められた
wikiの『参照の局所性』を読んで、ちょっとわかった気がします。
自分が作ったバイトニックソートは大規模データの場合、
各threadがほとんど毎回前回と異なる&近傍でもないメモリ参照することになるので
時間的にも空間的にも最適化ができてないみたいです。
ない知恵絞ってif文減らして実質1つにした結果がこれだよ！
あ、いや、thread単位はそうでも、warpとかblock単位で見れば近傍データなのか…？これはバンクの話か…？
実装のややこしさを飲み込めばシェアソートの方が参照の局所性は大きくしやすいのかな…？

まだよくわかってないことが1つありまして、
プログラム上では何万何十万の計算を並列に扱ったとしても、
物理的にはハード側の制限があるわけじゃないですか。
GTX760ならCUDAコア1152基なわけで、一万を並列化しても
実際には同時じゃなくて9回くらいに分けて順に処理する、みたいな。
となると、その9回で各CUDAコアは別のメモリを参照するわけなんですが、
この時前回のキャッシュって残るんでしょうか？　残らない…ですよね？
それともカーネルとしての処理が終わるまでは残るんでしょうか？
はたまたプログラムが終わるまでは念のため残しておく、とか？
キャッシュの利用自体が悪いんじゃなくて、
キャッシュにも収まらないデータ量がよくないってのはわかってるんですが、
なんかこのあたりの理解がまだ曖昧なんです。
807 名前：754 mailto:sage [2016/03/02(水) 01:46:45.38 ID:n1GLxV/f.net]: だらだら長文書いたわりに今自分の気になることからは逆に離れた気がする。
手っ取り早く要約すると、CPU↔メモリ(キャッシュ)の速度は
CUDAコア↔各種メモリの速度のどの当たりに相当するのか、でしょうか？
GPU内ならレジスタ＞shared(キャッシュ)＞globalの順で速いとかは聞きますけど、
もう一歩踏み込んで『この不等号の列に割り込ませるなら』CPUの速度はこのあたり、という指標が見つからないんですよね。
もちろん機種によって千差万別だとは思いますが、
傾向としてはこのくらいかなあ、みたいな話でもいいので教えていただけたら幸いです。
あ、もちろん>>786の質問も答えていただけると助かります。
キャッシュがよくわかってないのも確かなので。
808 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/02(水) 01:48:15.90 ID:Lh/popYV.net]: 後続の処理が走ってもデータが保持されるかどうか？
これについては実装依存としかいいようがない
なにせGPUはCPUと比べてもキャッシュの容量は小さいので
いつまでも今処理してないデータを保持し続ける理由も乏しい。

処理順序の並べ替えが可能なら、データアクセスの局所性に合わせて並べ替えることをお勧めする。
809 名前：デフォルトの名無しさん [2016/03/02(水) 15:13:17.26 ID:XnY+JUNw.net]: この会話を分かりやすく噛み砕くとこういう感じか

754
GPUの並列化の最適化を教えてください

団子
シェアードメモリーガー

754
あの…ですからデータの並列化を…

団子
データアクセスの局所性ガー

754
・・・・（その並び替えが分からないんだけどなー）・・・・まあいいです
810 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 16:29:21.57 ID:epqhA4MI.net]: おきゅんぱしー
811 名前：754 [2016/03/02(水) 17:56:48.93 ID:n1GLxV/f.net]: あっ
812 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 18:46:16.76 ID:nVGVVFPp.net]: >>787
うーん、速さといってもデータ転送なのかレイテンシなのかで答えようが無いね。
レイテンシに関してはコアに近いところだとCPUの方がクロックが高いから圧倒的にCPUだね。
813 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 19:06:15.16 ID:2uJZVygs.net]: >>773
いやいや、CUDAユーザーならローカルメモリなんて言い方はしない
そもそもローカルではないし

SRAMはキャッシュとシェアードだけ
ボロ出しまくり糞団子
814 名前：デフォルトの名無しさん [2016/03/02(水) 20:08:27.14 ID:n1GLxV/f.net]: >>788
なるほど。基本的に残ってないと考えた方がよさそうですね。
バイトニックソートは綺麗に並列化できちゃうので、並び替えは無理っぽいです。
>>790
Occupancy確認しました。ビンゴでした。4%とかなにそれクソ使えてない。
というか、よくよく確認したらsharedもまだまだ余裕があったので、
要素数256でsharedの利用を切り替えていたのを2048まで拡張しました。
8192越えたあたりで悪化し始める、という性質こそ変わりませんでしたが
sharedの恩恵を受けられる範囲が増えたおかげか悪化しつつも
約100万要素でもCPUより7倍強速くすることができました。これでOccupancyは50%。
100%にするにはsharedのサイズの設定を変えなきゃならないけどやり方わかんない…。
しかし、こんなアホみたいな理由で遅くなっていたなんて。
みなさまにはご迷惑おかけしました……。
>>792
やっぱりCPUですか。GPUの性能をフルに発揮させるには
それなりに大きい規模を並列化して誤魔化さないといけないわけですね。
815 名前：754 mailto:sage [2016/03/02(水) 20:12:34.57 ID:n1GLxV/f.net]: 名前入れ忘れたりsage忘れたりしてますが>>794は754です。
IDで察してくださいすみません。
816 名前：デフォルトの名無しさん [2016/03/02(水) 20:36:32.21 ID:XnY+JUNw.net]: 迷アドヴァイスを見るに見兼ねたスレ住民のおかげで助かりましたとさめでたしめでたし
817 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 21:24:19.27 ID:ewxUegIs.net]: >>794
シェアードをローカルとか言う奴の事は聞かないように
GPUはシェアードメモリを使ってなんぼだから
818 名前：デフォルトの名無しさん mailto:sage [2016/03/02(水) 21:47:03.61 ID:mhOGU3Or.net]: っていうかgpgpuでソートが
そもそも間違ってるよなあ
819 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/02(水) 23:53:33.06 ID:Vx/0gvlz.net]: てかFermi以降のSMはキャッシュを構成するSRAMの一部を
GMとは独立した空間のスクラッチパッドメモリとして割り当ててるだけなんだけどね
SMXが実質的なコアとみなすならシェアードメモリって別にシェアードでもなんでもないぞ
820 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 00:02:42.09 ID:L7+NtMAj.net]: ますます支離滅裂だな
シェアードメモリがシェアードじゃないとかCUDAの概念を全否定する発言じゃねぇか
つまりお前はCUDAの事なんか全く判ってない
ここはCUDAのスレだぞ
そろそろ出て行けや糞団子
821 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 00:24:01 ]: [ここ壊れてます]
822 名前：.33 ID:HcahvuJO.net mailto: まったく技術論になってないぞ
NVIDIAの用語がインチキ用語なのは今に始まったことじゃない
AMDのBulldozerのコア詐称以前からのコア数水増しやってるのがNVIDIA

命令ストリームレベルで見ればSMXが本来のコアで
CUDA Coreと呼んでるものはSIMDユニットの1エレメントにすぎない []: [ここ壊れてます]
823 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 00:48:19.47 ID:OHZiW0+6.net]: 確かにCUDAというかNVIDIAの定義しているシェアードメモリは一般的なシェアードメモリとは違うね。どちらかというとローカルメモリといった方が正しいかもしれん。
824 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 01:01:39.27 ID:HcahvuJO.net]: 同じコアだからこそメモリを介さずレジスタ上でシフト・シャッフルができる（Kepler以降）

CUDAのSIMTとは単純に32要素1024ビットのSIMDを32スレッドと読み替えてるだけ
この点はG8x世代から変わらないね
825 名前：デフォルトの名無しさん [2016/03/03(木) 01:48:33.97 ID:TCZfqrpq.net]: 自演会話すれば糞団子が味噌団子に変化するじゃないぞ？団子さんよお
826 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 07:58:21.23 ID:HcahvuJO.net]: 自演認定しても頭がよくなりませんよ、他所者君
CUDAをちゃんと勉強してる人にはみんな知ってる事実だ
827 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 08:43:19.76 ID:dzwxxNC2.net]: また夜中の自演が始まったか
バレてないと思うところが糞団子だね
何度も言うがここはCUDAのスレ
僕の考えたシェアードメモリ論ならチラシの裏に書いとけ
828 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 09:02:21.96 ID:HqLf1iVZ.net]: CUDAでいうシェアードメモリはCPUでいう一次キャッシュだし、CELLで言うところのLSだから、SMメモリとかコアメモリとかにしておけばよかったのにね。
CUDAの黎明期はGPUをスパコンって呼ぶ戦略があったから、1スレッドを一コアに見立て、共有メモリだと言っていたのかもしれないね。
829 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 09:17:45.89 ID:dzwxxNC2.net]: >>807
それを言うならオンチップメモリ
少なくともソフトレイヤーではキャッシュとシェアードは別物
そもそもMaxwellではデータバスも異なる
んでここはCUDAのスレだ
スペオタと糞団子は去れ

>>804
cudaDeviceSetCacheConfigは試してみたのかな？
830 名前：デフォルトの名無しさん [2016/03/03(木) 12:05:39.08 ID:DYrHTZ2H.net]: >>804
俺に聞かれてもなｗ
Occupancy確認してからスムースになってきたみたいだし、使わなくても順調ならそれでいいという
考えもある
831 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 12:34:58.87 ID:Z97pa2Hq.net]: ソフトレベルって言ってもなぁ
.cuやPTXのレベルならそうだろうがcubinレベルでみて言ってるんじゃないんだろ？

実際Sharedなんて言ってもSMX（実質上のコア）の中でしか参照できないんじゃ名前に偽りありとしか
SPMDをオレオレ用語で置き換えた概念で説明すればSharedなんだろうが物理的にはCellのSPUのLSと同じトポロジにすぎん
832 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 14:52:54.35 ID:Qh2UpiXS.net]: 逆に複数のsmx間で共有されてたら
くそ遅いだろう
ローカルだから他のsmx気にしなくていいわけで
833 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 14:54:11.01 ID:DdRI0anx.net]: >>810
相変わらず頓珍漢なこと言ってるな
お前がどう思うかは全く興味がないから
ここはCUDAスレだ
CUDA使った事ない糞団子は去れ
834 名前：754 mailto:sage [2016/03/03(木) 14:57:08.65 ID:FhaRPDaV.net]: >>808
CUDA_Occupancy_Calculator.xlsで確認してたんですが、
CC3.0だと48kb/16kbと16kb/48kbの他に32kb/32kbがあるっぽくて、
32kbなら100%になる、みたいな謎結果が出てたんです。
で、うちの古い参考書にはその設定のやり方が載ってなかったんです。
だけどそのあと.xlsファイルを開き直したらなぜが100%になってました。
なんでやねん。
835 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 15:08:31.08 ID:IfmnFgwQ ]: [ここ壊れてます]
836 名前：.net mailto: >>812
お前がCUDA使ったことないゴミだと自己紹介してることはわかったよ
俺は初代の8系から触ってるんだがな
墓穴ほり過ぎ []: [ここ壊れてます]
837 名前：デフォルトの名無しさん [2016/03/03(木) 17:12:24.19 ID:fEIbv9/m.net]: また低脳の団子が自演かよ!?
いい加減にして欲しい
コイツがいるとスレが腐るんだけど（怒）
838 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 19:52:45.84 ID:dqlRC1xd.net]: >>814
初代から使ってそのレベルならお前には向いてないからもう諦めろ
結局質問者には何ひとつ有益な情報を与えられない低レベル糞団子
839 名前：デフォルトの名無しさん [2016/03/03(木) 20:01:58.72 ID:TCZfqrpq.net]: >>813 （>>766）
ああいう大人（団子）みたいになったらだめですよ（笑い
840 名前：デフォルトの名無しさん [2016/03/03(木) 20:19:52.39 ID:4mtdR8td.net]: 団子ちゃんは詳しいと思う。
841 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 20:29:28.69 ID:n6tvCzB6.net]: 文句言うだけの奴より団子のほうがこのスレの役に立っている。
842 名前：デフォルトの名無しさん [2016/03/03(木) 21:01:42.18 ID:KusOhd2G.net]: 　　　　　　　　　　　　　　　【親米涙目】　★　　　ロシアがアメリカを一発ＫＯ　　　★　【反中逃亡】

　　宇宙人側からの申し入れは、とにかく核の利用と戦争をやめなさい、もう一つは宇宙人の存在を公表しなさい。
　つけ足したのが、６０年の猶予を与えましよう、２０１４年には発表しなければならなかったんですね、宇宙人の存在を。
　　　　　ロシアという大国の首相がね、あれは冗談だよでは済まないですね、しかも２回も言ってるんだからね。
　　　　　　　　　　　　　　　　　　　　　https://www.youtube.com/watch?v=FIRXKetUkq8

　　　　　　　　　　　【親米屈辱】　★　　　宇宙人いない派のおバカさん残念ｗｗｗ　　　★　【反中赤面】

　　　　　　NASAは、UFOに対して長年取ってきた態度のために、無用な組織とされることを恐れています。
　　　　　　　　　　　　　　　　　マイトレーヤが公に現れるにつれて、UFOが姿を表すでしょう。
世界平和の脅威は、イスラエル、イラン、アメリカです。イスラエルの役割は跪いて、パレスチナに許しを請うことです。
　　　　　　　　　　　　　　　　アメリカによる他国の虐待に反対の声を上げなければなりません。
　　　　彼らは今世紀（21世紀）をこの帝国が出来上がるアメリカの世紀と呼ぶ。しかし、そうはならないだろう。
　　彼らが世界中に‘民主的’制度を確立したいという衝動をコントロールするのは、マイトレーヤの任務である。
Q 経済崩壊が2015年から、テレパシー世界演説が2017年の初めなら、2016年に大戦でしょうか。A 大戦は起こりません。

　　　【親米命乞い】　★　　　マイトレーヤのテレパシーによる世界演説は英国ＢＢＣが放送　　　★　【反中土下座】
　　　　　　　　　　　　　　　　　　　　　https://www.youtube.com/watch?v=6cOvo6n7NOk

　　　　　　　　　　　　　　　　マイトレーヤが世界に向かって話をする準備は良好に進行している。
　　25分か35分くらいかもしれませんが、歴史上で初めて、世界的規模のテレパシーによる接触が起こるのです。
　　テレビ中継はこの出来事のために存在するのであり、この時、初めてご自身の本当の身分を明らかにされます。
843 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 21:02:13.41 ID:L7+NtMAj.net]: はい、単発来ましたw

糞団子のどこが有益なんだ？
シェアードメモリの
844 名前：割り当て変更にも答えられずに、ローカルメモリとか嘘の情報垂れ流してる奴だぞ？ まともなCUDAユーザーならローカルメモリとシェアードメモリが別物なんて事は常識以前の問題だ 糞団子の自論なんか誰も聞きたくない 嫌われ者の糞団子は去れ！ []: [ここ壊れてます]
845 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 22:03:27.41 ID:vD1NzbLA.net]: 他人のレスで我が物顔してるだけじゃん
無益な厨房だな
846 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 22:12:39.51 ID:vD1NzbLA.net]: つーか自称シェアードメモリが実質的なLocalStorageでしかないことは知っておかないとハマる事例もあるんだけどね
SIMTはAVXユニットを8コア、Xeon Phiの1コアを16コアって読み替えるトンデモ抽象化
847 名前：デフォルトの名無しさん [2016/03/03(木) 22:33:11.46 ID:a8cmYHdA.net]: 自演するな！糞団子
848 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/03(木) 22:34:50.71 ID:vD1NzbLA.net]: 別に何も間違ったことは書いてないんだが理解できないバカがいる
849 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 22:51:35.86 ID:L7+NtMAj.net]: シェアードメモリをローカルメモリとか言う嘘を垂れ流してる事はスルーなんだな
簡単な初期化関数すらアドバイス出来ない低レベル糞団子

ちなみにシェアードメモリは自称でもなんでもなく公式な名称だ
気に入らないなら自分で会社起こして俺の考えた最強のGPUでも作ればいいさ
まぁ、お前のレベルじゃディスクリートすら無理な事は明らかだがな
早く去れよ糞団子
850 名前：デフォルトの名無しさん [2016/03/03(木) 22:52:03.02 ID:tH72Ij/h.net]: さっき、Anacondaの最新バージョンである2.5.0(64-bit　python3.5.1)を入れたの
だけど、それにコマンドプロンプトがデフォルトで入っていないので、pip installが
出来なくて困っています。ipythonやインタラクティヴシェルは入っています。

前のAnacondaのバージョン(python2.7で使っている)であれば、ipythonや
対話シェルからq()やquit()で、普通に、コマンドプロンプトに戻れて、そこから
pip installなどが出来たのになぜなのでしょうか。

普段使っているコマンドプロンプトはpython2.7用になっているので、そこから
python3.5.1用のpip installも出来ません。コマンドプロンプトをpythonのヴァージョン
ごとに切り替えることができるのかもしれないけど、その方法も分かりません。

どなたか、知っている人がいたら教えて下さい。
よろしくお願いします。m(__)m
851 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 23:25:12.80 ID:L7+NtMAj.net]: >>827
恐ろしくスレ違いなんだけど
python2系と3系を共存させるならパスを適切に設定しないとダメだよ
詳しくはググってくれ

取り敢えずコマンドプロンプトでpyって打ってからpipしてみたら？
852 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 23:27:56.45 ID:Qh2UpiXS.net]: >>821
どう違うの？
853 名前：デフォルトの名無しさん mailto:sage [2016/03/03(木) 23:45:09.31 ID:L7+NtMAj.net]: >>829
なぜググらない？
www.gdep.jp/page/view/252
854 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 00:05:36.72 ID:oWoP2ITQ.net]: ha?
855 名前：デフォルトの名無しさん [2016/03/04(金) 00:13:03.67 ID:HJiU7/Cc.net]: >>828
パスは、最新のAnacondaをインストールする時に、パスを自動設定するなら
チェックを入れよという欄があって、チェックを入れてインストールを終了
すると、新しい環境設定が入っています。

念のためシステムで環境設定でパスをチェックしたけど、Anaconda3で、
新しいのが入っている。Anacondaは、3ヴァージョン使っている
のだけど、新しくなるほど使いにくくなっている感じですね。

q()でコマンドプロンプトに戻れると>>827で書いたのは、間違えだった。
それは、R言語のやり方だった。
856 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 00:16:41.20 ID:oWoP2ITQ.net]: nv用語だとローカルにないものが
ローカルメモリなんだなこりゃややこしい
857 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 00:25:56.51 ID:HJiU7/Cc.net]: 今更の問題だけど、pythonはやはり、2系と3系の互換・移植性が
悪いのが問題かな。今日買った、

基礎 Python (IMPRESS KISO SERIES) 単行本（ソフトカバー） – 2016/3/4

大津真 (著)

ttp://www.amazon.co.jp/%E5%9F%BA%E7%A4%8E-Python-%E5%A4%A7%E6%B4%A5-%E7%9C%9F/dp/484438015X

が、3系で、ちょっと変わった雰囲気のコードの使い方があったので、面白いの
だけど、2系と併用だと>>827みたいになって、pip　installも出来ないし、
ipythonでしか、3系が使えないのが困りもの。2系で使える3系のものも
あるけれど…。

2系を全部消せば3系を使えるのは分かっているのだけど、2系の方が
出来ることがまだまだ多い感じがするからね。まだ2系が多数派でしょ。

あ、仮想環境ヴァージョンを切り替えてやればいいのかな。
858 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 00:38:24.47 ID:HJiU7/Cc.net]: あ、pythonのクダスレだと、勘違いしてました。
失礼いたしました。
859 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 00:40:30.37 ID:UJ4KYtRn.net]: >>833
何を今更
だからこそ嘘を垂れ流す糞団子はここから去れよ
860 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/04(金) 01:07:12.95 ID:qzn/KKB0.net]: ウソ扱いしてるお前が自覚のないウソつきなんだけど
861 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/04(金) 01:15:03.88 ID:qzn/KKB0.net]: >>833
もっとも、スピルされたレジスタのデータが真っ先に格納されるのはGDDR*ではなく
キャッシュだけどな
なぜならキャッシュはDRAMの読み書きを高速化するためにあるから
862 名前：デフォルトの名無しさん [2016/03/04(金) 02:24:38.67 ID:pNMSyXd+.net]: 自覚のない荒らし
それが団子の糞風味クオリティ
863 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 07:49:00.48 ID:o39fhgVG.net]: >>837
何が嘘なのか具体的に示せよ
俺は具体的に示したろ
糞団子は去れ
864 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 07:50:34.02 ID:o39fhgVG.net]: >>838
＞なぜならキャッシュはDRAMの読み書きを高速化するためにあるから
そんなパソコン教室の初日に教わる様な内容を語るスレじゃねぇよ
糞団子は去れ！
865 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 08:15:25.08 ID:uG62vIs+.net]: 匿名で俺って言い張られてもｗ
866 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 09:40:06.12 ID:sQ9JXJsj.net]: >>842
流れが読めないなら黙ってればいいのに
867 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 09:48:28.02 ID:/J2AWB0A.net]: Talk me.
868 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 10:12:42.01 ID:uG62vIs+.net]: オレオレ、俺だよ俺
俺だよ

かまってよ

ってかｗ
869 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 11:01:16.11 ID:z53XqiUN.net]: お前つまんねぇよ
870 名前：デフォルトの名無しさん [2016/03/04(金) 11:46:47.03 ID:pNMSyXd+.net]: 団子ちゃん悔しいだろホントはおともだちをつくってワイワイ話したいんだろ？
じゃあ自作板帰ろうな
871 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 12:02:03.20 ID:uG62vIs+.net]: オレオレ主張したいんならコテハンつけろよ
872 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 15:46:55.78 ID:XhYLrWiK.net]: 俺だよ
873 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 19:33:33.59 ID:o39fhgVG.net]: 答えに窮すると何故か匿名になる
安定の自演糞団子
874 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 19:39:28.79 ID:dJLsGuAT.net]: 自分がやってるからって
他人もそうだと思うなよ
病気の人
875 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 21:27:27.28 ID:nvZ+jZcm.net]: まだやってんのかよっw。
シェアードメモリはローカルメモリだよwww。
876 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/04(金) 21:40:33.21 ID:qzn/KKB0.net]: 方言のない一般名称でいうと「スクラッチパッドメモリ」か
877 名前：デフォルトの名無しさん [2016/03/04(金) 21:49:33.06 ID:pNMSyXd+.net]: ぼろ出してもコテでい続けるのは正直苦痛だろ？

な、団子
878 名前：デフォルトの名無しさん mailto:sage [2016/03/04(金) 22:01:24.79 ID:WoARA1cN.net]: >>852
>>830
879 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/04(金) 23:13:53.73 ID:qzn/KKB0.net]: 名無しばっかりだと不安で団子認定に必死な病気の癖に
880 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 04:38:45.77 ID:GYxVvQjW.net]: いい加減通常時に戻ってください
正直どっちもどっちなんだよね
どっちも邪魔
881 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 07:19:08.49 ID:dgmAi0Ww.net]: マジで糞団子は去ってくれ
嫌われてるの自覚しろ
882 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 07:44:33.94 ID:I9HpfPeT.net]: コテの人はいい加減ブログでもなんでも始めたらいいよ
荒らし行為だよ

コテ煽る人もやめてよ
883 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 09:30:50.56 ID:pYtkFW+i.net]: 団子さん
お願いです。
あなたが来てからこのスレは機能しなくなりました。
ここは数少ないCUDAの情報交換の場です。
もう、ここに来ないで下さい。
884 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 09:48:51.08 ID:7wCpFrY5.net]: 実際の荒しは倍精度、精神病の人ですけどね
885 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 10:46:20.52 ID:we9m+Baq.net]: こいつ一人が団子団子連呼してて
すげー気持ちわりーよ
886 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 10:51:01.60 ID:7wCpFrY5.net]: 好きなんだろ
付き合っちゃいなよ
887 名前：デフォルトの名無しさん [2016/03/05(土) 11:18:09.46 ID:nqZZ4Fac.net]: 最近は傷心の団子をおもちゃにするうんこごっこが流行ってるのか？
888 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 11:20:03.53 ID:7wCpFrY5.net]: いいえ
精神病の人をどうバカにするかが流行ってます
889 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 14:14:59.66 ID:oAjMaO0h.net]: つーかまともな話しようとすると団子認定されるのは書き込む気を無くさせるためなのだろうか。
技術的な話をすると内容がどうでも団子にされるから、そういう話が理解できないのと、ある意味団子崇拝が酷いのだろうな。
890 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 15:25:30.62 ID:PxQJKL1y.net]: >>861
団子はある程度(正しいかは別にして)技術的話が出来るけど、
その人はAMDは倍精度がすごいよ、GPGPUの勝者はAMDで決まり！と
I　love 団子だけだからな。
891 名前：デフォルトの名無しさん [2016/03/05(土) 16:26:59.56 ID:nqZZ4Fac.net]: あんまり団子をおもちゃにするなって
ウンコの匂いが充満するじゃないかｗ
892 名前：デフォルトの名無しさん [2016/03/05(土) 16:43:06.41 ID:hF4tqJh9.net]: こんにちは。

CUDA では、__device__ 修飾された関数は、GPU内部から呼び出せますが、
再帰コールが出来ないのはなぜですか？

以下はできますよね？

__device__ int aaa(int x) {
　return x * 2;
}

__device__ int bbb(int y) {
　return aaa(y) + 3;
}

では、以下は駄目ですか？
__device__ int kaijou(int y) {
　if ( y == 1 ) {
　　return y;
　}
　else {
　　return y * kaijou(y-1);
　}
}
893 名前：デフォルトの名無しさん [2016/03/05(土) 17:05:18.01 ID:nqZZ4Fac.net]: 団子は答えなくて結構
894 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 17:17:05.46 ID:oAjMaO0h.net]: ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。
895 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 19:01:23.69 ID:wCUhFShW.net]: 最適化の邪魔になるから最初から再帰はやめてねーんってことかな。
896 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 20:36:21.36 ID:pXJbdtfw.net]: >>870
おまえが正解答えてやれば
あれずに済むだろ
897 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/05(土) 21:10:49.87 ID:18qofrJ5.net]: >>873
俺ならその無駄レス書いてる暇で書けるぞ>>870は無能だから理解できないだけで

>>871
CUDAの自称コアが要素毎プレディケートつきのSIMDユニットを
マルチコアって言い張ってるだけから本物の独立したコアでないから
で終わりなんだけどね。
命令ポインタは「自称コア」ごとに独立してないんだ

「分岐」も本物の分岐ではなく、if-else節を全部一列のコードに展開してプレディケート
しているだけ。プレディケートビットの全要素が0あるいは1になって初めて関数を
飛び越えることができる。

SIMDの要素（自称）ごとに命令ポインタと関数コールスタックを管理できて別々の
命令ステートを独立して持てるならそれは既にSIMDじゃない
898 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/05(土) 21:25:15.51 ID:18qofrJ5.net]: ベクトルを隠蔽しない、1ワープを1つのスレッドとして処理できるプログラミングモデルが
提供されるなら再帰は理屈上可能
それはCPUのSIMDの在り方と同じってことだけど
899 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 21:53:08.36 ID:LlD1+gMh.net]: 独立したコア�
900 名前：ﾆいう前提だから、コア毎のレジスタで表現できる範囲の処理しか出来ないって事だと思ってたけど違うのか。 []: [ここ壊れてます]
901 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:00:09.02 ID:oAjMaO0h.net]: 基本はSIMDプロセッサでの本当の分岐だよ。
簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法

状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
902 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/05(土) 22:00:10.11 ID:18qofrJ5.net]: 再帰だけならCell SPUすら出来てるからね
命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう

末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど
903 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:04:28.99 ID:0d+Ags99.net]: 可能な限り手を抜くのがハードにとってのＧＰＧＰＵという物かも
904 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/05(土) 22:12:52.44 ID:18qofrJ5.net]: 実害は具体的にはバックトラッキング型の探索アルゴリズムが使えない
（実装方法に制限がある）とかかな
905 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:24:17.32 ID:oAjMaO0h.net]: cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。
で結局、SIMTでプログラミングするメリットを感じなくなる。

scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス１つ計算すればすむのに無駄だなぁと。

で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。

まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
906 名前：デフォルトの名無しさん mailto:sage [2016/03/05(土) 23:05:45.56 ID:wCUhFShW.net]: >>877
>状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく
横からですが参考になります。
再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。
907 名前：デフォルトの名無しさん [2016/03/06(日) 08:40:29.75 ID:e28R5O2W.net]: 最近は、5,000円くらいの低価格GPUでも、Keplerコアを使っていて、
Fermiコアの上位互換だから、再帰コールも出来るのですか？

でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、
関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール
できなさそうですが。
908 名前：デフォルトの名無しさん [2016/03/06(日) 11:18:07.40 ID:5MH1CF8G.net]: あーあまた糞団子が答えちゃった
このスレの事情を知らん奴が見ると余計に迷うぞ
909 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 11:35:37.89 ID:ejwavTIm.net]: 答えられないクズは存在する価値ないでしょ
とっとと失せろよゴミ
910 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 11:48:38.53 ID:ejwavTIm.net]: つーか俺も含めてまだ正解出してないんだけどな

んで正解はこれ、Kepler以降なら再帰に【一応は】対応
developer.download.nvidia.com/assets/cuda/files/CUDADownloads/TechBrief_Dynamic_Parallelism_in_CUDA.pdf

誰かツッコミ入れると思ったけど期待外れだったなあ
まあ、俺の説明も何も間違ってないのだけど
(>>874も「出来ない」という説明をしてるのではなく制約を説明しているだけ）
911 名前：デフォルトの名無しさん mailto:sage [2016/03/06(日) 13:04:30.88 ID:ZW4nksfm.net]: 確かにこの団子は鳥屋氏じゃないな。
鳥屋氏はこういう物言いはしない。
912 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 13:12:58 ]: [ここ壊れてます]
913 名前：.97 ID:ejwavTIm.net mailto: お前は、中村ちゃぷにちゃんが中身の団子が存在すると思ってるんだ
そこから既に間違ってるよ []: [ここ壊れてます]
914 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 13:18:27.49 ID:ejwavTIm.net]: ドァンゴが、１３：１８くらいを、お伝えします
915 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 13:20:55.68 ID:ejwavTIm.net]: ちゃぷにさんはだんごやさんを嫌ってるはずなので彼がその顔文字を使う理由はないんだよ
自分でNGキーワードに入れてる宣言してたし
916 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 13:22:13.40 ID:ejwavTIm.net]: 更に言うと彼は精神が壊れて自作PC板で機械翻訳コピペを貼るだけの人に成り下がってしまった
917 名前：デフォルトの名無しさん [2016/03/06(日) 13:49:39.00 ID:5MH1CF8G.net]: 団子＝鳥屋でも別にいいじゃねーか
糞撒き散らすだけならどっちもNGだ
918 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 13:52:02.23 ID:ejwavTIm.net]: 中村ちゃぷに君と一緒にしないでくれる？
919 名前：デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:37:46.02 ID:ZW4nksfm.net]: >>891
鳥屋氏に何かあったの? そっちが気になる。
920 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 14:39:09.93 ID:ejwavTIm.net]: >>894
だから本人に直接聞いて来いよTwitterアカウントあるだろ
921 名前：デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:42:36.51 ID:ZW4nksfm.net]: 別に本人と直接連絡とれるけどなんか聞きにくいじゃん。
おしえてよ。
922 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 14:43:25.75 ID:ejwavTIm.net]: 俺なら聞けるのか？ｗ
デタラメ言っちゃうけど？
923 名前：デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:47:00.65 ID:ZW4nksfm.net]: 本人に根掘り葉掘り聞くよりいいよ。
924 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/06(日) 14:48:10.37 ID:ejwavTIm.net]: ちなみに彼は10年以上前から初心者の質問板で「メンヘル屋」と呼ばれてたぞ
925 名前：デフォルトの名無しさん mailto:sage [2016/03/06(日) 23:01:58.93 ID:YHBwXFpN.net]: 日曜日の真昼間に2ch張り付きかよ
さすが糞団子だな
926 名前：デフォルトの名無しさん mailto:sage [2016/03/07(月) 07:46:57.77 ID:7lblB3Ic.net]: 平日の日中ならいいのかｗ
927 名前：デフォルトの名無しさん [2016/03/07(月) 12:32:22.52 ID:+p3ICmyk.net]: 頼むからNGの外に出てくるな>>901＝糞団子
928 名前：デフォルトの名無しさん [2016/03/07(月) 17:04:45.58 ID:GuUCesj8.net]: マジで氏ねよ！ここ糞団子！！
お前のせいでスレがめちゃくちゃ！
929 名前：デフォルトの名無しさん mailto:sage [2016/03/07(月) 19:13:33.67 ID:IaXW9rhX.net]: >>901
なんでそう思ったの？
930 名前：デフォルトの名無しさん mailto:sage [2016/03/07(月) 21:28:52.80 ID:Xyilrqi/.net]: 病気の人が召還してる
931 名前：デフォルトの名無しさん mailto:sage [2016/03/08(火) 00:17:54.26 ID:zUXR2K3c.net]: 糞団子は>>900が効いてる様だなw
932 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/08(火) 01:03:04.66 ID:4ClxYf7a.net]: 普通ジャン
933 名前：デフォルトの名無しさん mailto:sage [2016/03/08(火) 06:06:38.08 ID:sCq0/cKi.net]: 家でpcにかじり付いてる人なんだろ
病気の人は
934 名前：デフォルトの名無しさん mailto:sage [2016/03/08(火) 07:07:19.82 ID:zUXR2K3c.net]: 日曜日に一日中2chが普通なんだ
さすが糞団子
935 名前：デフォルトの名無しさん mailto:sage [2016/03/08(火) 22:50:34.72 ID:f+sFTvrc.net]: 2chやっているおっさんなら起きてから寝るまで2chが普通だろ
いまはスマホで仕事サボって2chしているおっさんが多いからな
936 名前：デフォルトの名無しさん [2016/03/08(火) 22:59:24.25 ID:8p7AV+as.net]: >>910
今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。
937 名前：デフォルトの名無しさん mailto:sage [2016/03/08(火) 23:40:27.24 ID:SNBHGm11.net]: そんなにトイレが好きならドアを接着剤で止めてやろうかと思った
938 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 00:03:43.04 ID:QI7bsFp8.net]: 平日仕事サボって2chなら、まぁわからなくも無い
理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
939 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/09(水) 00:29:18.66 ID:EC2EcKU9.net]: スマホゲーの体力ゲージ消化してるだけじゃね？
2chなんてとっくにブーム終わってるだろ
940 名前：デフォルトの名無しさん [2016/03/09(水) 12:01:37.54 ID:Bn2mru1A.net]: >>913
話し相手が欲しいんだよ
スレをウンコ臭くしておいて
941 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 17:46:55.52 ID:+SKBM1r7.net]: へえ、お前、寂しがり屋なんだな
942 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 19:21:18.15 ID:QI7bsFp8.net]: 糞団子が急に大人しくなって笑える
かなり効いた様だなw
943 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 19:28:24.12 ID:n0++16X2.net]: かまってちゃん
乙
944 名前：デフォルトの名無しさん [2016/03/09(水) 21:45:15.09 ID:Bn2mru1A.net]: コテ団子をNGにして華麗にスルーしないとね
名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
945 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:07:10.45 ID:F7KphU9Z.net]: そんなにかまってほしいのか
946 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:13:39.55 ID:QI7bsFp8.net]: それはお前だろ
さっきからチョロチョロウザい
947 名前：デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:45:09.81 ID:F7KphU9Z.net]: おまえがそれを言うのか
948 名前：デフォルトの名無しさん mailto:sage [2016/03/10(木) 00:12:27.45 ID:lJwnXkdm.net]: なんだ
やっぱり、かまってちゃんか？
949 名前：デフォルトの名無しさん mailto:sage [2016/03/10(木) 05:26:45.85 ID:ElNFIbXj.net]: っ鏡
950 名前：デフォルトの名無しさん mailto:sage [2016/03/10(木) 20:04:24.43 ID:lJwnXkdm.net]: いや、朝の5時から鏡出されても…
951 名前：デフォルトの名無しさん mailto:sage [2016/03/10(木) 22:07:55.24 ID:Kwch6Nj+.net]: ここはプ板のかまってちゃんが集うところです
Nvidiaユーザーってへんなやつ多いよね。どう？
952 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/03/10(木) 23:24:17.96 ID:36+0Q/RN.net]: ミラーマン！
植草教授！
953 名前：デフォルトの名無しさん mailto:sage [2016/03/11(金) 00:12:19.52 ID:0VtVfbcA.net]: はい
かまってちゃんの変な奴来ました
954 名前：デフォルトの名無しさん [2016/03/12(土) 13:14:03.96 ID:7MrNfl0C.net]: 誰も居ない？
955 名前：デフォルトの名無しさん mailto:sage [2016/03/14(月) 00:27:24.09 ID:tMjTpPPM.net]: 糞団子が荒らして過疎ったな
ホントろくでもねぇ奴だったな
956 名前：デフォルトの名無しさん mailto:sage [2016/03/15(火) 19:07:06.06 ID:NepgFCLn.net]: では素人が質問してもいいですか
オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね？
消しても動くのでいらなさそうではあるんですけど一応残してます
957 名前：デフォルトの名無しさん mailto:sage [2016/04/06(水) 05:42:39.04 ID:b0ehB924.net]: https://devblogs.nvidia.com/parallelforall/inside-pascal/
https://devblogs.nvidia.com/parallelforall/wp-content/uploads/2016/04/gp100_SM_diagram.png
958 名前：デフォルトの名無しさん mailto:sage [2016/04/06(水) 19:11:29.54 ID:7FwwXsE8U]: NVIDIA DGX-1がダサいだー
959 名前：デフォルトの名無しさん mailto:sage [2016/04/08(金) 23:49:33.98 ID:Oe8UeTI2.net]: >>874
この辺りからの流れはとても勉強になる
960 名前：デフォルトの名無しさん mailto:sage [2016/04/13(水) 00:20:39.50 ID:vTxSOF48.net]: >>930
CUDAを使ったことがない連中がたくさん来場してたからな
CUDAは映像･画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに
なってきたからな。
961 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/04/13(水) 00:37:51.36 ID:uE1XEE4+.net]: レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね
アクセスレイテンシはでかそう
962 名前：デフォルトの名無しさん mailto:sage [2016/04/13(水) 18:30:01.95 ID:P1TlabSM.net]: 言っているそばからw
963 名前：デフォルトの名無しさん mailto:sage [2016/04/18(月) 20:53:52.86 ID:npM92plo.net]: 以前エクサスケールへむけての改良点てやってたけど
warpサイズが4になったりレジスタファイルの階層化とか
やってるのかな
964 名前：デフォルトの名無しさん mailto:sage [2016/04/29(金) 07:41:21.25 ID:H9O34uIX.net]: >>935
機械学習はマルチGPU
965 名前：デフォルトの名無しさん [2016/04/29(金) 19:49:33.11 ID:F6Ql+W8p.net]: Pascalは忘れられてるけど、倍精度も強化されてるんだよね
単精度を徹底的に削った思い切った方針には目を見張った
966 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/04/29(金) 21:17:01.56 ID:RuK53SvA.net]: 大型スパコン案件に特化して設計したものをGPUに流用してるだけで
それが全部だと言い張られても困りますが
967 名前：デフォルトの名無しさん mailto:sage [2016/04/29(金) 22:49:34.54 ID:wZxrhoKH.net]: なんでおまえが困るんだよw
968 名前：デフォルトの名無しさん mailto:sage [2016/04/30(土) 00:41:27.46 ID:oV2mml7H.net]: ＧＰＧＰＵは深層学習のブレークで
969 名前：今後一気に需要が高まる？ []: [ここ壊れてます]
970 名前：デフォルトの名無しさん [2016/04/30(土) 11:52:36.46 ID:xhIIf3AZ.net]: 高まるだろうね
倍精度と半精度がちょうどいい具合

そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
971 名前：デフォルトの名無しさん mailto:sage [2016/04/30(土) 22:20:59.01 ID:4IpkHcLg.net]: その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは
972 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/04/30(土) 22:33:42.88 ID:wNNJHcCv.net]: あれはCNNに特化したものでGPUほどのプログラマビリティはない
ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
973 名前：デフォルトの名無しさん mailto:sage [2016/04/30(土) 22:45:19.47 ID:tL+Fobdg.net]: CNNに特化て具体的には行列演算てこと？
974 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/04/30(土) 23:20:42.71 ID:wNNJHcCv.net]: 疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素
って覚えておけば大体間違いない
実はGPUの特性と正反対（GPUは密行列なら得意）
975 名前：デフォルトの名無しさん mailto:sage [2016/04/30(土) 23:25:48.76 ID:WnEgJTfp.net]: fermi世代ってdouble⇒floatで倍速なはずだよね？
ちっとも速くならないんだが。
976 名前：デフォルトの名無しさん mailto:sage [2016/05/01(日) 05:03:39.83 ID:IAB0IXGv.net]: 大分前だけど構造体でデータを渡すとdouble扱いになったことはある
原因は不明
977 名前：デフォルトの名無しさん mailto:sage [2016/05/01(日) 10:04:45.15 ID:c2Ftkl1w.net]: >>950
thx。

調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。

fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
978 名前：デフォルトの名無しさん [2016/05/01(日) 10:24:43.67 ID:tKi6j9CT.net]: 匿名通信（Tor、i2p等）ができるファイル共有ソフトBitComet（ビットコメット）みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい！って人居ませんか？

Covenantの作者（Lyrise）がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーｗ

The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
ｈ
979 名前：デフォルトの名無しさん mailto:sage [2016/05/01(日) 11:36:33.54 ID:4G1NPxxh.net]: eyerissは大量のデーターが複数のフィルター処理されるのに向いてる
980 名前：デフォルトの名無しさん [2016/05/09(月) 19:46:40.50 ID:ZKk/r1uF.net]: 質問があります
環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です

#include <stdio.h>

__global__ void a(char *A){
}

int main(){
a<<1, 1>>(); // (1)
}

(1)で「expression must have integral or enum type」とエラーが出て困っているのですが
ホストコンパイラを呼び出す際に何か間違えているのでしょうか

コンパイルに使用したコマンドは
windows
　nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu
linux
　（失念したが大体同じ）
です
981 名前：デフォルトの名無しさん mailto:sage [2016/05/09(月) 23:47:16.41 ID:+C4ZnXlR.net]: >>954
≪≫のところじゃない？
二重カッコじゃなくて、三重カッコにすべきかな

二重カッコだと別の演算子になって、意味が変わってくる
982 名前：デフォルトの名無しさん [2016/05/09(月) 23:54:10.06 ID:ZKk/r1uF.net]: ああ、3重括弧でしたか
間抜けなミスで騒いでしまって申し訳ないです
ありがとうございます
983 名前：デフォルトの名無しさん mailto:sage [2016/05/20(金) 21:20:51.03 ID:OCEBmLiZ.net]: グーグルがTensolFlow用のTPUとかいうの作ってたらしいがどうなの？
984 名前：sage [2016/05/23(月) 17:33:55.45 ID:w8cwn6FF.net]: CUDA fortranで一つの配列に対して2GB以上のメモリを
アロケートすることが出来ず、
PGIのサイト見たら「2GBの壁」とかって説明されているのですが、
これってどうにか克服出来ないですかね？
985 名前：デフォルトの名無しさん mailto:sage [2016/05/23(月) 18:16:51.67 ID:rInNNyjw.net]: >>958
何gbくらい必要なの？
986 名前：デフォルトの名無しさん mailto:sage [2016/05/23(月) 18:47:01.54 ID:hrdyo10f.net]: >>958
fortranなんか使っているからだよ。
987 名前：デフォルトの名無しさん mailto:sage [2016/05/23(月) 19:56:12.00 ID:Y87SDCLt.net]: ３２ビットの壁ってこと？
988 名前：デフォルトの名無しさん mailto:sage [2016/05/23(月) 22:17:34.30 ID:COcpIksW.net]: CU_LIMIT_MALLOC_HEAP_SIZE か cudaLimitMallocHeapSize を拡げりゃいいんじゃないかな。
989 名前：デフォルトの名無しさん mailto:sage [2016/05/24(火) 12:32:54.07 ID:eVw6ZtsBc]: >>959
6GB位ですかね
990 名前：デフォルトの名無しさん [2016/06/01(水) 19:25:08.39 ID:XXwwXNx4.net]: ttps://developer.nvidia.com/cudnn
>Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs.
のTegra K1の文字を見て、サポート復活を喜んでいたのですが、
Tegra K1は32bitでして、
必要なCUDA7.5は64bit必須
もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか？
991 名前：デフォルトの名無しさん mailto:sage [2016/06/03(金) 02:14:25.16 ID:qw00fiPh.net]: CUDA APIで１番始めに呼んだAPIは時間がかかるとのことですが、
時間計測に影響が出ないように事前にどんな関数を呼んでますか？
慣習だったり、よく使われる関数があれば教えてください。
992 名前：デフォルトの名無しさん mailto:sage [2016/06/04(土) 23:09:31.90 ID:EzTgQ+dX.net]: 工学じゃなくて物理系でもcuda覚える価値ってある？
993 名前：デフォルトの名無しさん mailto:sage [2016/06/04(土) 23:54:08.10 ID:64JgiXiE.net]: 安く実験したいなら
N体や粒子法なんかは普通のCPUじゃたいしたことはできない
994 名前：デフォルトの名無しさん mailto:sage [2016/06/05(日) 01:52:52.19 ID:2/2r2xD9.net]: むしろ、科学計算したい人のための技術だと思う
995 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 02:11:09.53 ID:F98p4y3q.net]: 他人にも聞こえんの？
996 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 12:50:48.33 ID:4gtPrZLr.net]: この部分がエラー吐くんだが
cuda7.5

struct cuComplex {
float r;
float i;
cuComplex( float a, float b ) : r(a), i(b) {}
__device__ float magnitude2( void ) {
return r * r + i * i;
}
__device__ cuComplex operator*(const cuComplex& a) {
return cuComplex(r*a.r - i*a.i, i*a.r + r*a.i);
}
__device__ cuComplex operator+(const cuComplex& a) {
return cuComplex(r+a.r, i+a.i);
}
};
997 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 13:24:56.47 ID:MCoM6cvm.net]: CUDA by EXAMPLEのサンプル？
<cuComplex.h>の定義とぶつかってるんじゃね？
998 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 13:39:51.78 ID:4gtPrZLr.net]: >>971
そうそう
エラーはこんな感じ

Documents/Visual Studio 2013/Projects/template/cuda_by_example/chapter04/julia_gpu.cu(43): error
: calling a __host__ function("cu_Complex::cu_Complex") from a __device__ function("julia") is not allowed
999 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 13:50:41.56 ID:MCoM6cvm.net]: 試してないけど、コンストラクタに__device__付けてないのが悪いと言っているような。
1000 名前：デフォルトの名無しさん mailto:sage [2016/06/12(日) 14:09:28.62 ID:4gtPrZLr.net]: >>973
ありがとうございます
解決しました
1001 名前：デフォルトの名無しさん [2016/06/15(水) 14:42:46.55 ID:d2Xou3GL.net]: 【GPGPU】くだすれCUDAスレ part8【NVIDIA】
echo.2ch.net/test/read.cgi/tech/1416492886/
1002 名前：デフォルトの名無しさん mailto:sage [2016/06/15(水) 14:44:14.63 ID:d2Xou3GL.net]: 誤爆

【GPGPU】くだすれCUDAスレ part8【NVIDIA】
echo.2ch.net/test/read.cgi/tech/1465969275/
1003 名前：デフォルトの名無しさん mailto:sage [2016/06/16(木) 14:11:42.71 ID:hLUHI1zp.net]: 615 ：名前は開発中のものです。：02/06/10 21:48 ID:???
>将来的にはスカートの頂点を触ってヒラヒラさせたりしたいので、どうせシステムメモリーに
ボーンでやる気なのか？つらそー。

616 ：◆CKmHzWpc：02/06/11 03:48 ID:zXaLQtp.
みなさんありがとうございます
１．モデルを分割するのが嫌→頂点シェーダ－を使うorシステムメモリに置いてソフトでやる
２．モデルを分割してもいい→ハードのジオメトリブレンドを使ってやる・・
というのが考えられる・・・んですよね
色々組み合わせを試して、高速なのを選びたいと思います

>>627
これは、スカートの頂点をCPUで直接操作しようと思っています
ボーンでやらずに、簡単なクロスシュミレーションのような事を目指しています
どうせモデルの一部をシステムメモリに置くなら、もう全部システムメモリにし
てもいいか、と思ったのです
1004 名前：デフォルトの名無しさん [2016/07/08(金) 23:35:06.27 ID:6MyfUlG7/]: >>958
CUDAじゃなくてFortranでの問題かもしれんね
mcmodelオプションかなあ
しかし1変数に6GBとかちょっと信じがたい
1005 名前：デフォルトの名無しさん [2016/07/20(水) 14:03:52.95 ID:S0wpPWZM.net]: tess
1006 名前：デフォルトの名無しさん [2016/09/02(金) 13:17:38.94 ID:W3BuWeJb.net]: erlangならね
1007 名前：デフォルトの名無しさん [2016/09/06(火) 19:38:14.96 ID:MfZbc6Jb.net]: まだ埋まってなかった
1008 名前：デフォルトの名無しさん mailto:sage [2016/10/03(月) 10:11:13.82 ID:1bWakqV9.net]: pascal titan xでcudaを動かしている人に質問�
1009 名前：ﾅすが高負荷時にクロックダウンは起きませんか []: [ここ壊れてます]
1010 名前：デフォルトの名無しさん [2017/02/11(土) 05:41:42.45 ID:GCRxMqXs.net]: 埋め
1011 名前：デフォルトの名無しさん mailto:sage [2017/03/01(水) 20:35:36.75 ID:G4g91z/5.net]: は最多か
1012 名前：デフォルトの名無しさん mailto:sage [2017/03/03(金) 13:35:21.41 ID:nBceVUOh.net]: サクラ
1013 名前：デフォルトの名無しさん mailto:sage [2017/03/03(金) 14:59:54.92 ID:GURukhR9.net]: 浜田
1014 名前：デフォルトの名無しさん mailto:sage [2017/03/06(月) 16:46:29.52 ID:7tw9lmnR.net]: かいな
1015 名前：デフォルトの名無しさん [2017/05/07(日) 11:40:19.10 ID:ehHyxLGM.net]: a.exe: a.cu
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe

ウインドーズでメイクファイルで上みたいにやってクダーCコンパイラーでコンパイルしたんですけど
コマンドラインにちゃんと
nvcc -Xcompiler "/wd 4819" a.cu -o a.exe
と表示されたあと
wd
4819
c1xx: fatal error C1083: ソースファイルを開けません。'略':No such file or directory
a.cu
c1xx: fatal error C1083: ソースファイルを開けません。'4819':No such file or directory
と出ます。たぶん"に囲まれた中の/がメタ文字じゃないのになぜか消されているとおもうんですけど
なぜエラーになるのか教えてください。
/を//あるいは-に置き換えたらちゃんとコンパイルできました
よろしくお願いします。
" /wd 4819"と"と/の間にスペースを入れても出来ました。
1016 名前：デフォルトの名無しさん mailto:sage [2017/05/07(日) 11:42:54.14 ID:ehHyxLGM.net]: ＞＞９７３
は新スレに移行しました
1017 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:44:51.57 ID:ch8ppFz8.net]: 975
1018 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:45:16.89 ID:ch8ppFz8.net]: 976
1019 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:45:35.47 ID:ch8ppFz8.net]: 977
1020 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:46:09.62 ID:ch8ppFz8.net]: 978
1021 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:46:43.41 ID:ch8ppFz8.net]: 979
1022 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:47:04.64 ID:ch8ppFz8.net]: 980
1023 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:47:23.30 ID:ch8ppFz8.net]: 981
1024 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:47:46.15 ID:ch8ppFz8.net]: 982
1025 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:48:12.14 ID:ch8ppFz8.net]: 983
1026 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:48:31.31 ID:ch8ppFz8.net]: 984
1027 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:48:48.87 ID:ch8ppFz8.net]: 985
1028 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:49:04.73 ID:ch8ppFz8.net]: 986
1029 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:49:28.95 ID:ch8ppFz8.net]: 987
1030 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:49:46.87 ID:ch8ppFz8.net]: 988
1031 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:50:13.50 ID:ch8ppFz8.net]: 989
1032 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:51:07.97 ID:ch8ppFz8.net]: 990
1033 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:51:27.98 ID:ch8ppFz8.net]: 991
1034 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:51:48.54 ID:ch8ppFz8.net]: 992
1035 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:52:08.22 ID:ch8ppFz8.net]: 993
1036 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:52:26.37 ID:ch8ppFz8.net]: 994
1037 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:52:42.66 ID:ch8ppFz8.net]: 995
1038 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:53:11.93 ID:ch8ppFz8.net]: 996
1039 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:53:27.63 ID:ch8ppFz8.net]: 997
1040 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:53:44.96 ID:ch8ppFz8.net]: 998
1041 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:54:02.51 ID:ch8ppFz8.net]: 999
1042 名前：デフォルトの名無しさん mailto:sage [2017/10/21(土) 21:54:28.40 ID:ch8ppFz8.net]: 1000
1043 名前：1001 [Over 1000 Thread.net]: このスレッドは１０００を超えました。
新しいスレッドを立ててください。
life time: 1065日 22時間 39分 42秒
1044 名前：過去ログ ★ [[過去ログ]]: ■ このスレッドは過去ログ倉庫に格納されています

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef