【GPGPU】くだすれCUDAスレ part7【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2ch.scのread.cgiへ]
Update time : 09/23 11:04 / Filesize : 248 KB / Number-of Response : 1045
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2014/11/20(木) 23:14:46.66 ID:jr3oZn27.net]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
toro.2ch.net/test/read.cgi/tech/1314104886/
【GPGPU】くだすれCUDAスレ part6【NVIDIA】
ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
321 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 14:48:07.70 ID:iOXOBOCM.net]: いらん
DNNではな
322 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 14:59:29.79 ID:9fNLotPU.net]: >>308
でもシミュレーションにGPGPU使ってる人いるだろ
たいして速度でないのに倍精度でやってんのか
xeon phi使った方が良さそう
323 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 15:05:12.00 ID:CUSF99yG.net]: >>312
指数分の大きさではなくて仮数部の大きさ(幅)だよね。
仮数部の幅分大きさの違う数値を加減算すると0を加減算したのと同じになると思うけど。
324 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 15:07:09.85 ID:CUSF99yG.net]: 増分解法では致命的になる場合あり。
325 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 15:07:56.23 ID:SiSRa9Ib.net]: 装置もんで数万枚/日のリアルタイム画像処理に使ってるけど、普通にdoubleが使えると楽なんだけどな。
速度も考慮すると大きい数と小さい数の計算前、画像処理の前後でdouble、float変換してるからCPU圧迫してくる。
でも、シンプルで意図した通りに動くからCUDAは組みやすい。
んー、この辺がジレンマだな。
326 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 15:44:31.42 ID:fSUYSvsK.net]: それは倍精度が必要な理由になってないような
やっぱ盲信が多そうだな
327 名前：デフォルトの名無しさん [2016/02/01(月) 16:07:14.05 ID:oiE/5K5n.net]: >>311
そこの製品一般人で買えるルートあんのかよ
328 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 18:24:22.88 ID:BOcjqYcH.net]: 大きな行列の計算、FFT、急峻なカーブの音声フィルター、レイトレーシング、物理シミュレーション、空間認識、...
倍精度以上の精度が必要な用途はいろいろとある

単精度のハードで倍精度相当の演算をすると、十数倍の時間がかかる
倍精度のハードで4倍精度相当の演算も同様に十数倍
多倍長演算も倍精度や4倍精度ハードがあれば、単精度よりもずっと速く計算が可能
329 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 18:32:19.85 ID:BOcjqYcH.net]: 簡単な画像フィルターや音声フィルターなら単精度でいいし、ディープラーニングなら半精度でも良かったりする

半精度～4倍精度までのハードがあるのが一番なんだけど

倍精度演算ハードがあれば単精度も同じ速度で計算が可能だが、単精度のハードで倍精度相当の演算をするには十数倍の時間がかかる
ゲーム用途など、単精度を使うことがはっきりしてる時じゃなければ倍精度を積んでおくのが無難

4倍精度はさすがにGPUに積むのは規模が大きくなりすぎるが、CPUには積んで欲しい
半精度は、単精度との変換だけでとりあえずは良い
330 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 20:19:15.33 ID:Ucvj9UOE.net]: www.4gamer.net/games/251/G025177/20160105002/
www.4gamer.net/games/251/G025177/20160105002/
＞また，Huang氏が示したスライドで，第2世代Maxwellアーキテクチャベースの「GeForce GTX TITAN X」とDrive PX 2を比較すると，
＞単精度浮動小数点演算性能は前者が7TFLOPSなのに対して後者は8TFLOPSと，
＞劇的には高速化していない点も気になった。

↓その一方で…
＞ちなみにHuang氏は，Drive PX 2の性能指標として，ディープラーニング処理の演算性能を示す
＞「DL TOPS」を示しているが，これだとデュアルPascalはGeForce GTX TITAN Xの3倍以上というスコアになっている。

これ、完全にゲーム特化とビッグデータ特化GPUじゃん、Pascalwwwwww
俺の言ったとおりもう科学技術GPGPUはオワコンなんだよ
完全に半精度依存、完全にワットパフォーマンス/描画特化GPU路線だはwwwwww 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)
331 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 21:46:57.46 ID:vs1yi7F6.net]: >>321
倍精度乗算器の回路コストは単精度の約4倍
332 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 22:30:54.71 ID:MibI1Q78.net]: バカが住み着いてる
333 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 22:58:36.28 ID:9fNLotPU.net]: 実際に業務で使ってる人は倍精度で運用してるのか？
334 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:10:33.37 ID:BOcjqYcH.net]: >>323
まあ純粋に乗算器だけでいえばそうだけど...

>>322
半精度はさすがにゲームでも足りない
半精度専用GPUなんて出ない
少なくともPC用には
335 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:17:23.47 ID:BOcjqYcH.net]: >>325
業務っていろいろあるが
おれの範疇は単精度、倍精度、疑似4倍精度、多倍長といろいろ
多倍長も、筆算レベルからカラツバ、DFTレベルとさまざま
もちろん普通のレジスタサイズの整数演算も
特殊なジャンルであることは否定しない
336 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:19:49.62 ID:BOcjqYcH.net]: 半精度もIEEE754じゃない独自フォーマットなら使った事はあるが、使った事があるって程度
337 名前：デフォルトの名無しさん mailto:sage [2016/02/01(月) 23:27:26.75 ID:dRJvSEmL.net]: >>326
>半精度はさすがにゲームでも足りない

そんなこと分かるかよ
HDRで16bit浮動小数点フォーマットとか普通に使うだろ
メモリ帯域が半分で済むんだぞ
ゲームなんか正確さより速さ優先だから、色を表現するのに16bitで十分な場合がほとんどだろ
338 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 01:51:42.07 ID:LP8V/wwM.net]: だから違うよ
使ったことがあるかじゃねーよ
何でその精度が必要なのかってところよ
4倍精度とか軽々しく言うが
このスケールが本当にわかってるのか
疑わしいぜ
339 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 03:08:21.02 ID:xiUt8T5M.net]: 4倍精度とか専用ハード作れとしか言いようがない
汎用品に求めるものじゃない
340 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 12:53:46.97 ID:ULLNmZyK.net]: >>326
よく嫁
Pascalは基本混合精度
PK104は単精度と半精度の混合
PK100は倍精度の混合らしいが、多分これはテスラ新シリーズとして販売だと思う

もうグラボ価格の倍精度CUDA組はむりぽ

>>331
もうPEZYにお願いするしかないよ、倍々精度
これはマジでそう思ってる
逆を言えば理研＝PEZYの特殊HPCはそこしか生き残りが出来ないのではないか

どうしてもというならARMカスタムとか

倍精度はNVはもうだめぽだから、AMDに期待するしかない
341 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 13:17:56.85 ID:sWHooGm6.net]: 混合精度って単精度と半精度が両方載ってるって事だ�
342 名前：謔ﾈ 仮に1個の演算器の回路規模が1:3として、演算器の回路比率を1:1にし、単精度は半精度の演算も出来るとすると、すべて単精度にした場合に比べて演算器の数は単精度が半分で単精度が2倍か 単精度2倍のインパクトよりも単精度半分のインパクトの方が大きい気がする []: [ここ壊れてます]
343 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 14:24:13.48 ID:ULLNmZyK.net]: 完全にグラフィックス描画効率/深層学習向けの構成だね
データ地獄になるから広帯域メモリも必要になるがHBM規格はAMDが握っているために、（HBM2の）開発が遅れた
GDDR5＋を急遽導入する事になったのはそのため

このスレだとDX12とかVulkanとか一言口にするだけで「スレチガイだ馬鹿！」と怒鳴る奴がいるが、
これは全てが絡み合っている

DX12とVulkanという二つのローレベルAPIがAMD中心による策定である以上、これらのローレベルAPIへの依存を避ける
ワットパフォーマンスGPUに経営路線の舵を切るの必然
344 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 15:52:24.40 ID:MS6gBcZU.net]: >>334
スレチガイだ馬鹿！
345 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 20:33:43.42 ID:ubpTh4Nt.net]: >>334
そのすごいAMDでお前はどんなGPGPUソフト/プログラム作っていいるんだ？
346 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 21:22:14.45 ID:xseyqTiA.net]: cudaだっつうに

hsaスレでやってろ
馬鹿
347 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 22:08:37.37 ID:+ZIKPYce.net]: 雑談は楽しいけど、ここCUDAスレやで
amdの話をするなってことじゃなく、スレチ話をいつまですんねんってこと
348 名前：デフォルトの名無しさん mailto:sage [2016/02/02(火) 22:41:10.14 ID:NB4DG1EG.net]: Visual Studio 2015対応になるのはいつですかねぇ
349 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 12:08:39.46 ID:15l+1fC7.net]: >>336　>>337
自演乙
わざわざ自作板から出張ご苦労様
350 名前：デフォルトの名無しさん [2016/02/03(水) 12:56:39.94 ID:d3Nc4Jqw.net]: バカな上の病気なんだな
351 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 14:19:34.04 ID:15l+1fC7.net]: Pasacalこけそうで危機感いっぱいだは
352 名前：デフォルトの名無しさん mailto:sage [2016/02/03(水) 22:25:31.36 ID:hEPpn7Fg.net]: だはｗ
353 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/03(水) 22:25:59.26 ID:gpz71jEo.net]: TeslaでもXeon Phiでもなく一般ピープル向けGPUに倍精度性能が必要だって言ってるのは
ろくに科研費申請が通らない貧乏研究室くらいでしょ
354 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 13:10:48.29 ID:lq8BoEbf.net]: >>344
お前が使い方を知らないだけ
355 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 13:11:30.26 ID:lq8BoEbf.net]: >>344
お前は半精度だけで十分
356 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 18:29:53.21 ID:TT5D/Cpx.net]: Maxwellは擬似的な倍精度も出来ないんだよ
それくらいしっておこうな
357 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:00:25.29 ID:o+ucOEnp.net]: 単精度と比べると凄い遅いだけで
倍精度演算自体はハードで実装している。
物凄い遅いといっても1/32で1/16のradeon furyと比べると半分だから大差ないと言えば無い。
358 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:13:21.23 ID:d8M6zG1u.net]: Maxwellは倍精度の演算器が排除されただけで疑似倍精度は実装されている
そもそもソフトレベルでも実装できることだし
359 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 20:15:36.92 ID:TT5D/Cpx.net]: FURYはMaxwellを参考にしてるからな
HBMの容量の少なさが祟って何じゃこりゃ状態だったけど、Polarisは一層Maxwell類似のワッパ路線がとられる
これでNVはもう倍精度を完全に捨てにかかる
360 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/04(木) 23:21:52.01 ID:zdF89aL0.net]: いや実際半精度が4倍速いほうが使いどころあると思うよ
ゲームで倍精度なんて使わないじゃん
361 名前：デフォルトの名無しさん mailto:sage [2016/02/04(木) 23:28:29.99 ID:3r7tJtQx.net]: 深層学習がはやったらＧＰＧＰＵももっと市民権を得るかな？
362 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 00:42:53.10 ID:TcXSJNY1.net]: 半精度を4倍速くしたら半精度専用になるな
そんなもの売れないぞ
363 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 01:21:13.26 ID:p946S2WD ]: [ここ壊れてます]
364 名前：.net mailto: >>351
＞ゲームで倍精度なんて使わないじゃん

団子！
お前はインテルスレとﾜｯﾁｮｲIPの次世代AMDスレに帰れ

倍精度使わんGPGPUなんか炭酸のないコーラと同じ
ここは管スレ []: [ここ壊れてます]
365 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 04:09:45.89 ID:iPwofUfz.net]: 倍精度を高速化したらどれだけ売り上げが見込めるのかをnvに分かるように説明したら。

>>353
頂点シェーダは単精度が必要でも、実行時間のかなりがフラグメントシェーダなんだから、別に半精度専用になって売れないとはならないだろう。

住みわけがある訳だろ。で、倍精度頑張ったのは期待の売り上げが出なかったわけだろ多分。
願望を語るスレであるより、アリモノでなんとかするスレであった方が建設的だと思うがね。
366 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 07:52:28.94 ID:X6eE9Wue.net]: すまんがゲーマーは帰ってくれないか？
367 名前：デフォルトの名無しさん [2016/02/05(金) 08:26:49.67 ID:23YXKvG1.net]: なぜ団子がここにいる？

まあ、CUDAもかなり広く使われてくるようになったから、
数値演算の枠組みだけじゃなくなってきているのはわかるが。
368 名前：デフォルトの名無しさん [2016/02/05(金) 08:45:35.15 ID:bTIbnCX4.net]: いやこのひとはかなり初期からCUDAつかってるの
それこそnvにgeforceくれてやるからCUDA使ってちょって
誘われるような時代から
369 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 08:50:46.42 ID:KXdvQQGq.net]: 1スレ目に三色団子おるな
370 名前：デフォルトの名無しさん [2016/02/05(金) 12:16:48.26 ID:bTIbnCX4.net]: techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/?bpnet&d=1454641873634
CNN専用チップ、NVIDIAなどがGPUの改良で開発

techon.nikkeibp.co.jp/atcl/event/15/020100028/020400019/160204NVIDIAp0.jpg

Eyerissは、グラフィックス処理プロセッサー（GPU）と同様、SIMD（single instruction multiple data）などから成る
プロセッサー・エレメント（PE）を多数集積したICである。

ただし、GPUとはデータの移動を最小限に抑えた設計にした点が異なる。
具体的には、EyerissはSRAMから成るオンチップメモリー108Kバイトを備えており、
CNNの各層の演算結果をオンチップメモリーにバッファリングさせることで、
チップ外の主記憶に書き戻す頻度を大きく減らした。

また、PEに入力するデータ列に共通部分がある場合は、その共通部分を保持して差分だけを入力する。
さらに、複数のPEに同じデータを入力する場合は、各PEにそれぞれ送るのではなく、
途中まで1つのデータとして送り、そこからPEの個数分データをコピーして入力する。いわゆるマルチキャストである。
これらによって、データ処理時のデータの移動を最小限に抑え、消費電力を大幅に低減した。

加えて、データを主記憶に書き戻す時は圧縮し、読み出す時に伸長する。
CNNの畳み込み演算後のデータはフィルターを通すことで圧縮しやすい形になっていて、メモリー帯域の節約効果が高いという。

　作製したEyerissの動作をNVIDIA社のGPU「TK1」と比較すると、
EyerissはデータのスループットこそTK1の約1/2だったが、消費電力はTK1の最小約1/37と大幅に低い。
主記憶に出し入れしたデータの帯域も、TK1の1120Mバイト/秒に対し、Eyerissは127Mバイト/秒だったとする。
371 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 12:55:11.71 ID:p946S2WD.net]: >>358
だからお前はインテルスレに帰れっつってんだろ団子！
372 名前：デフォルトの名無しさん [2016/02/05(金) 13:02:33.01 ID:bTIbnCX4.net]: また病気か
373 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 13:44:39.13 ID:p946S2WD.net]: >>362
倍精度イラネ、ここは管スレだぞ！と言ってたのはお前だったのか、団子！
374 名前：デフォルトの名無しさん mailto: []: [ここ壊れてます]
375 名前：sage mailto:2016/02/05(金) 14:31:20.41 ID:3SvgNTFs.net [ 団子ってなに？ ]: [ここ壊れてます]
376 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 14:36:57.91 ID:3a93fntK.net]: どうもこのスレには
CUDAをマシに使っている奴は
いないようにみえるな
ひたすらベンチマークしかやってない感じね
377 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 16:33:49.39 ID:3vmCyKKd.net]: 倍精度よりコンテキスト処理の自由化をだな
Oculasからも苦言言われてるのに
378 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 16:34:59.76 ID:3vmCyKKd.net]: バックグラウンド処理が作りにくいからこそ、Asyncやプログラマブルコンテキストは次のGPUでは絶対に搭載してほしい
379 名前：デフォルトの名無しさん [2016/02/05(金) 16:48:34.33 ID:bTIbnCX4.net]: ほとんど関係ない
www.tomshardware.com/news/vrmark-virtual-reality-benchmark-preview,30820.html
380 名前：デフォルトの名無しさん mailto:sage [2016/02/05(金) 23:50:50.50 ID:TcXSJNY1.net]: はやく4倍精度のせろ！
381 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 12:36:05.76 ID:pRi/vsC+.net]: それをPEZYに言ってくれ
382 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 18:18:06.14 ID:xHoLN9eE.net]: お前その会社好きだな
一般向けに売ってもいないのに
383 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 20:15:07.20 ID:pRi/vsC+.net]: PEZY以外に応じてくれないぞ
384 名前：デフォルトの名無しさん mailto:sage [2016/02/06(土) 20:47:57.74 ID:xHoLN9eE.net]: それでそこの製品は使ってるのか？
385 名前：デフォルトの名無しさん mailto:sage [2016/02/08(月) 05:05:55.45 ID:z0FWqNRt.net]: いい加減にないものねだりはやめろ。
386 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/08(月) 22:05:16.73 ID:ZbGdhM32.net]: 「Teslaを一桁安値で買わせろ」みたいなのは論外だろ
ゲーマーと倍精度が欲しい人は市場が全くかみ合わない
そんなのもう結論出てるだろ
387 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/08(月) 22:24:56.08 ID:lyi6FC/t.net]: もともとTeslaとQuadro/GeForceはECCの有無で差別化してたが
世界最大級のGPGPUスパコンがNonECCで使ってるので
全く差別化になってない

だから倍精度演算器を物理的に廃することでの差別化を行った
それだけ。

Tesla買えばいいだけだろ？
どうせ予算通らないから買えないだけだろ
ろくな論文も出せない底辺大学の研究室あたりがいいご身分だな
388 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 00:34:13.76 ID:LI1PJjMq.net]: >世界最大級のGPGPUスパコンがNonECCで使ってる
これについて詳しく。
389 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 13:10:44.06 ID:i8FfOnoz.net]: >>376
あなたはどこの大学ですか？
390 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 14:10:52.05 ID:rPxo0Z4x.net]: 最初は影でこそこそディープディープ言ってて倍精度いらない、管スレでゲームコンソールを巡る政治的な思惑が
NVの倍精度切りに繋がった事実もスレチガイだ馬鹿野郎！って煽ってたのにな
流れが悪くなったのでコテの正体を出したんだろう

多分Async煽りも正体はこいつだ

ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに
本当に陰険だね、団子は
391 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 17:12:26.87 ID:CgzlKX4i.net]: そこそこの分解能ならTeslaやTitanで十分だろ
392 名前：デフォルトの名無しさん [2016/02/09(火) 17:14:02.43 ID:uHp67F+7.net]: べつにphiでも使えばいいだけだが
teslaとphiの混合機も普通にあるし

とりあえずamdという選択肢は皆無
393 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 17:32:39.26 ID:i8FfOnoz.net]: 登場かな
394 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 18:40:55.41 ID:OHQNRB+7.net]: nvは高校生や高専向けのセミナーもやってるし
ことしのgtcもセッション数は500超える

やってきたことの重みが違いすぎる
395 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:05:34.27 ID:Z0SOCsIU.net]: でも他GPUでは使えないんでしょ？ってのが重すぎる
GPGPUはnvidiaの私物ではない
396 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:07:27.62 ID:dBPqK+gq.net]: まともな研究機関ならTeslaは学割使えるんだが…
GeForceで倍精度が必要な理由なんてほんと世間知らずの戯言だな
397 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:15:52.47 ID:CgzlKX4i.net]: >>384
黎明期はデファクトスタンダードの取り合いだから当然の流れ
398 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:20:58.08 ID:OHQNRB+7.net]: >>384
よそが勝手に投げ出しただけじゃん
399 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:27:05.49 ID:C4h+tGmi.net]: >>384
言ってることが頓珍漢過ぎる
嫌ならopenCL使えばいいじゃん？
400 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 19:32:42.77 ID:OHQNRB+7.net]: dlといえばmitとnvが共同開発したeyerissはflotじゃなくfixedだったな
データ移動を極力控えた構造でcnnの場合データの再利用性が高いので
peからpeへの受け渡しが有効なのだとか

それでもエネルギーコストは
aluからレジスタファイルへの場合を１とすると
peへは3
内部のバッファーへは10
外部dramへは500のエネルギーコストがかかるんだそうな
401 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 20:43:41.18 ID:YFSBhYG5.net]: >ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

言うことがバカすぎて吹いた
まともな法人はこのスレに社運なんてかけませんから

Tesla相当の性能をGeForceにも実装しろという
悪質クレーマーを客だと思わない権利は
NVIDIAにもあるだろjk
402 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:14:42.66 ID:q4H41fNH.net]: 米エネルギー省の評価ソフトがほとんど単精度で
倍精度使うのがlinpackしかいという
403 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:20:54.23 ID:IR1D3KHq.net]: 単精度じゃ足りないけど倍精度なら十分って領域は実は少ない。

単精度用演算器に少量の精度を追加して倍精度を1/4の速度でやるのが一番利に叶っている。
まあこれすら普及帯ではけちられて1/16になるのが倍精度の立ち位置

倍精度用の演算器積むくらいだったら単精度の演算器で可能なbit数で複数組み合わせると簡単に多倍長精度演算を実現できるような命令を用意してくれた方がよっぽどありがたい。
404 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 21:34:25.12 ID:DH+vdKhf.net]: >ここのスレで倍精度がどうなるかは大学企業にとっても死活問題なのに

糞ワロタwww
このスレすごいんだな
405 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/09(火) 21:47:11.85 ID:SI3uOwiZ.net]: どっかのバKaveriは512SPで倍精度50GFLOPS未満
CPU1コアより遅いんだが
406 名前：デフォルトの名無しさん mailto:sage [2016/02/09(火) 22:14:14.05 ID:5ErhaZ8p.net]: 今日は団子がいっぱいいるなあ
407 名前：デフォルトの名無しさん [2016/02/10(水) 00:25:10.96 ID:u83LBvNZ.net]: 倍精度が高ければ許される
倍精度が低ければ、メモリが多くてもメモリ幅が多くても消費電力が低くても許されない
408 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 00:37:19.11 ID:ZwcaN/9X.net]: 団子分身の術か
もうここもワッチョイの時期かね？
409 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 00:56:31.15 ID:pL5WuRkY.net]: だから団子ってなんだよ？
410 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 01:41:12.63 ID:JsTfqJoq.net]: 団子は団子。
411 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 02:29:40.13 ID:FSPq21yA.net]: amd信者っていう精神病患ってるよな
412 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 08:25:30.16 ID:gHO8h5ZQ.net]: 倍精度ハードフル実装マンセー
↓
トランジスタが増える
↓
ウエハ1枚あたりのチップ採れる数が減る（&歩止まり率も減る）
↓
製造コスト上がる
↓
(,,・´∀｀・,,)
413 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 08:35:12.26 ID:IPR+3W8l.net]: 倍精度の話しないと死んじゃう人は点呼取ってくれる？
「倍精度でCUDA」スレと、「実在のGPUでCUDA」スレに分けた方がいいよね、多分。
414 名前：デフォルトの名無しさん [2016/02/10(水) 08:39:26.22 ID:5rSlusQ0.net]: バカはhello worldから始めなさい
415 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 08:48:59.74 ID:gHO8h5ZQ.net]: 件の赤い会社が帳簿の赤も解消しないのは、市場価格に対して製造原価が高すぎるからだよ
会社を潰れかけの状態にしてまで実装コストの高い倍精度ハードを実装するのは模範的な企業とは思えんがねえ

QuadroとTeslaのブランドが分かれてないようなもんだ
416 名前：デフォルトの名無しさん [2016/02/10(水) 08:57:23.58 ID:5rSlusQ0.net]: まぁDLのおかげでteslaでも倍精度無しのものもあるけどね
ただ今後、DLはEyerissの方向で行きそうなんで
完全にDLは別ラインの製品でいくのか
GPU自体がEyerissの発展形になるか

GPUのデータ移動減らすとかレジスタファイルの階層化って研究はしてるようだけど
417 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 12:31:36.49 ID:zvpoME6O.net]: 何とか倍精度不要論に持っていこうと必死な団子でした
418 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 12:36:21.64 ID:qcpMLBSZ.net]: アホがいるね

特定のアプリケーションに特化して結果的に倍精度性能落とした製品は、その目的の用途から外れなきゃ何の問題もねーじゃん
ディープラーニングにもゲームにも倍精度の性能は必要ないから

倍精度が必要な用途にはK80やその後継あるいはPhiを買えばいい
科学技術演算用に設計されてないGPUに倍精度が必要だとかいうのはただのデムパ
419 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 13:03:35.72 ID:VS1+7AWR.net]: >>402
団子だけ隔離出来れば良い
420 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2016/02/10(水) 23:12:49.82 ID:7x9wHVqL.net]: >>405
Teslaの単精度特化版は1スロット版のK8ならそうだけどK10なら発表は2012年で
ディープラーニング言い出す前の話
ダイ本体はGTX600番台そのものだからそれ専用に設計されてるわけではないしね

EyerissがよくわらんのだけどROPやテクスチャユニットも削ってるわけ？
421 名前：デフォルトの名無しさん mailto:sage [2016/02/10(水) 23:48:08.15 ID:pL5WuRkY.net]: ここだけの話
K10はシェールガス探査特化モデルだよ

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef