【nVidia】GT300スレ Part8【DX11】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 19:58 / Filesize : 241 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：Socket774 mailto:sage [2009/11/20(金) 06:41:09 ID:tKM8qzYP]: 前スレ
【GPGPU】GT300スレ Part7【PhysX】
pc11.2ch.net/test/read.cgi/jisaku/1257530331/

【後藤弘茂のWeekly海外ニュース】 NVIDIAが次世代GPUアーキテクチャ「Fermi」を発表
pc.watch.impress.co.jp/docs/column/kaigai/20091001_318463.html
NVIDIA，「Fermi」の実機を公開。FermiアーキテクチャベースのDX11 GPUをトップ・トゥ・ボトムで展開へ
www.4gamer.net/games/099/G009929/20091001065/
NVIDIA，Fermiベースの新世代「Tesla」を正式発表。2010年第2四半期に市場投入へ
www.4gamer.net/games/099/G009929/20091116014/

過去スレ
【nVidia】GT300スレ【DX11対応GPU】
pc11.2ch.net/test/read.cgi/jisaku/1253287364/
【nVidia】GT300スレ Part2【DX11】
pc11.2ch.net/test/read.cgi/jisaku/1254621278/
【nVidia】GT300スレ Part3【DX11】
pc11.2ch.net/test/read.cgi/jisaku/1255004051/
【nVidia】GT300スレ Part4【DX11】
pc11.2ch.net/test/read.cgi/jisaku/1255257498/
【信者】GT300スレ Part5【お断り】
pc11.2ch.net/test/read.cgi/jisaku/1255428623/l50
【nVidia】GT300スレ Part6【DX11】
pc11.2ch.net/test/read.cgi/jisaku/1256275899/
481 名前：Socket774 [2009/11/29(日) 13:44:25 ID:kBKICs+9]: DX9世代がなにをいうｗ
482 名前：Socket774 mailto:sage [2009/11/29(日) 14:13:52 ID:A6/T3Aqz]: >そもそもAMDがアピール出来るDX11世代のテクニックって
>テッセレータしかないのかよｗ

現状の不仮定スペックな話でいいけど
GT300はそれ以外に何かあるの？
483 名前：Socket774 mailto:sage [2009/11/29(日) 14:23:45 ID:xQEzGLxg]: 基本的な実行効率
これがだめなら何もかもだめ

歌い手に例えるなら
R600:歌が下手な中居がチープなカラオケBGで必死に歌ってる
RV770:カラオケが豪華になる（ボーカルは聞こえない）
RV870:歌が下手な中居が二人になって、カラオケが更に豪華になる（ボーカルは聞こえない）
484 名前：Socket774 mailto:sage [2009/11/29(日) 14:33:39 ID:huYRZlsE]: それを言ってしまうと
Fermi:「マイクの電源がオフ」とか「曲名だけで配信未定」になってしまう気が・・・
　　　　　　,,,
(　ﾟдﾟ)つ┃
485 名前：Socket774 mailto:sage [2009/11/29(日) 14:36:21 ID:/W7CRSBB]: Fermiは初実装のテッセレータが低性能過ぎて使い物にならないから
テッセレータを無かったことにしたいんだよ。
今まで只管シェーダ使うなを強制し続けてきたように
今後はTWIMTBPでテッセレータ不使用を強制していく。
486 名前：Socket774 mailto:sage [2009/11/29(日) 14:36:49 ID:IeuvZRZW]: GT300はDX11に対応、GPGPU性能が上がる(予定)、ゲーム性能はお察しの製品
487 名前：Socket774 mailto:sage [2009/11/29(日) 14:51:06 ID:RW3XTPFQ]: >>486
そのおかげで自前のレンダラをGPGPUで動かした方が速くて綺麗！っつー状況になればDirectXがいくら遅かろうとかまわないんだが。
488 名前：Socket774 mailto:sage [2009/11/29(日) 14:51:43 ID:QjhDqPYB]: DirectXSDKに、CS4.0で動かせるテッセレーターのサンプルが入ってるけど88GTSで300fpsちょい出てるぞ。
Fermiのテッセレーションが使い物にならないって言ってる連中は何を根拠にしてるんだ？
489 名前：Socket774 mailto:sage [2009/11/29(日) 15:11:03 ID:A6/T3Aqz]: >R600:歌が下手な中居がチープなカラオケBGで必死に歌ってる
>RV870:歌が下手な中居が二人になって、カラオケが更に豪華になる

あれ？それってなんてボカロ？
しかも前者のが愛されるフラグ？
490 名前：Socket774 mailto:sage [2009/11/29(日) 15:24:22 ID:1h4UPkzo]: GT300はDirectXが苦手、だけど5870の1.5～2.5倍速いです＾＾ｖ
491 名前：Socket774 mailto:sage [2009/11/29(日) 15:34:42 ID:pOxAFfdK]: なんにしても現時点で絵に描いた餅は何を言っても絵に描いた餅だな
492 名前：Socket774 mailto:sage [2009/11/29(日) 15:36:45 ID:huYRZlsE]: 早く実機＆ベンチ出ないかね
妄想ばかりでさすがに飽きたよ・・・
493 名前：Socket774 mailto:sage [2009/11/29(日) 15:39:30 ID:ue5TAg/N]: 333GTX
494 名前：Socket774 mailto:sage [2009/11/29(日) 15:39:54 ID:pw6nt9ko]: 静かに待とうぜ
煽り煽られしてると疲れるよ
495 名前：Socket774 mailto:sage [2009/11/29(日) 15:46:40 ID:0UVLWSbA]: GT300はともかく、性能劣化でどうしようもないG2xxとGT21x～24x、
しぶとく生き残ってる9800GTとGTS250。製造中止で市中在庫減少
してきているGTX2xx。これでどうやって年末年始を戦うんだ。
496 名前：Socket774 mailto:sage [2009/11/29(日) 16:19:48 ID:fHyvCozG]: 出てもいないもののネガキャンって頭おかしいの？
信者だろうか
497 名前：Socket774 mailto:sage [2009/11/29(日) 16:20:29 ID:fHyvCozG]: GT210はHD4350より低消費電力　XPなら2Dの速度も落ちない
498 名前：Socket774 mailto:sage [2009/11/29(日) 16:28:17 ID:OvTxa0yr]: ↑それじゃゲフォ房はお布施しないと…ｗ
499 名前：Socket774 mailto:sage [2009/11/29(日) 16:32:06 ID:ZFGAEcyL]: お布施はFermiにしたいでしょうな
500 名前：Socket774 mailto:sage [2009/11/29(日) 16:42:59 ID:G1kIooHY]: お布施しなくてもOEMで売れてんだろ
黒字だし
501 名前：Socket774 mailto:sage [2009/11/29(日) 16:45:20 ID:1h4UPkzo]: GTX390がGTX380Dual、3GB*2 1250MHzで6万円なら2枚分お布施する
502 名前：Socket774 mailto:sage [2009/11/29(日) 17:04:15 ID:rD/hN9gc]: メモリ価格がこの先どうなるか知らんが、
最近の店頭価格の盛り具合が酷いから10万越え確実な気が・・・
503 名前：Socket774 mailto:sage [2009/11/29(日) 17:16:01 ID:G1kIooHY]: Sandy BridgeのSocketB2に
メモリ4GB×6、GF100で幸せになりたい
2010年末にはシュリンク版出るかもしれんが
504 名前：Socket774 mailto:sage [2009/11/29(日) 17:30:42 ID:lO1RZ9+Z]: NVIDIA自身がシュリンクされてなきゃいいね
505 名前：Socket774 [2009/11/29(日) 17:33:24 ID:QG8VqMZu]: よくわかりませんがとりあえずノコギリ置いておきますね

　＿＿＿＿＿＿＿＿＿＿
.│　　　　　　　　　l------'
　WWWWWWWWW
506 名前：Socket774 mailto:sage [2009/11/29(日) 17:36:59 ID:UuUXznGj]: nvidiaもだけどTSMCが心配…
ここ数世代のプロセス移行はトラブル続きだし、次世代プロセスでのhigh-kの採用にも問題抱えてるって話しだし

最先端プロセス持ってるIntelと32nmバルクからGFで生産できるAMDに比べてそこんとこがビミョー
507 名前：Socket774 mailto:sage [2009/11/29(日) 18:27:48 ID:huYRZlsE]: >>501
GTX380が1枚10万円前後で済めばマシくらいじゃないか？
デュアルは2枚買うより若干安くなって16~18万円。
NVIDIAのためには価格を気にせず買わなきゃダメでしょ
508 名前：Socket774 mailto:sage [2009/11/29(日) 18:28:50 ID:TsGGlNK1]: >>501
それは、買わないという宣言と捉えてよろしいのですね？
509 名前：Socket774 mailto:sage [2009/11/29(日) 18:57:40 ID:1mrhyXIp]: >>485
テッセレーション使ってポリゴンが増えるとクロック*ropsが余計に必要なんだろう
Fermiはシェーダー偏重だろうから描画力不足は予想できる
HD5xxxだって性能不足
510 名前：Socket774 mailto:sage [2009/11/29(日) 19:03:46 ID:tM/Fwztj]: 無理に頂点数増やさなくていいから、負荷削減にもテッセ使ってほしいぜ。
511 名前：Socket774 mailto:sage [2009/11/29(日) 19:08:24 ID:xQEzGLxg]: >クロック*ropsが余計に必要

(笑)
512 名前：Socket774 mailto:sage [2009/11/29(日) 19:38:11 ID:G1kIooHY]: 以前、結局ハードウェアテッセレータを使うことにしたって話があったな。
グラフィックス向けのfeatureに関しては続報を待ってネ的なノリだったけど、
GF100は今も謎謎謎。早く続報こねぇかな～。CES09が待ちきれぬ。
513 名前：Socket774 mailto:sage [2009/11/29(日) 19:40:44 ID:G1kIooHY]: CES 2010か
514 名前：Socket774 mailto:sage [2009/11/29(日) 19:45:09 ID:kbw/liwk]: CES2010で実機デモも新規発表もなかった夢を見た・・・
515 名前：Socket774 mailto:sage [2009/11/29(日) 19:52:07 ID:iLbENVdS]: 覗いてみりゃゲフォ儲の低レベルな主張に言い負けてて情けないったらないな。
低レベルしかいないのか。

とりあえずFermiにおめでたい楽観視を述べているやからは
一番新しいFermiの情報を読んでテンション下げとけ。
japan.cnet.com/special/story/0,2000056049,20401079-2,00.htm

Dally氏はさらに、Fermiが当初、ゲーム用チップではなくスーパーコンピュータチップとして宣伝されていた理由についても、次のように説明した。「これはゼロサムゲームだ。ダイ（チップ）の面積は決まっており、使用できる電力も決まっている。
事実として、われわれはダイ面積の多くの部分を倍精度浮動小数点演算に割り当て、ダイ面積の多くの部分を誤り訂正符号（ECC）に割り当てた。ゲーム用グラフィックスアプリケーションでは、それらの恩恵を、科学用アプリケーションほどには得られない」。
倍精度浮動小数点演算は、科学的コンピューティングの分野で頻繁に使用される。ECCは、実行中にデータエラーを訂正できる技術だ。
516 名前：Socket774 mailto:sage [2009/11/29(日) 19:55:41 ID:ZFGAEcyL]: 増えた要素で処理が重くなるのはPhysXなんかと同じか
517 名前：Socket774 mailto:sage [2009/11/29(日) 19:57:01 ID:jhhLXFDT]: 5万台で買えるかしら？
518 名前：Socket774 [2009/11/29(日) 20:00:02 ID:kBKICs+9]: 一番低レベルな奴がきたｗ
519 名前：Socket774 mailto:sage [2009/11/29(日) 20:00:29 ID:8lS3qC4O]: 10月7日が一番新しい情報なのか
520 名前：Socket774 mailto:sage [2009/11/29(日) 20:03:20 ID:iLbENVdS]: おう、>>518お前朝からずっと張り付いてるのか。
何でも論破してやるぞ。
521 名前：Socket774 [2009/11/29(日) 20:10:01 ID:kBKICs+9]: AMDがていこうりつなのはなぜでちゅか？
522 名前：Socket774 mailto:sage [2009/11/29(日) 20:11:25 ID:uhWNKG7e]: ゲフォを生き残らせる為だよきっと
523 名前：Socket774 mailto:sage [2009/11/29(日) 20:15:17 ID:iLbENVdS]: >>521
低効率とはどのソースを元に言っているのかな。
そのソースについて具体的に答えよう。

Fermiがグラフィックスで低効率なのは倍精度演算、エラー訂正だけでなく、
制御系の肥大も大きな要因だね。
GT220,240のトランジスタ効率は9000系コアの効率に比べると酷いね～
NVIDIAは旧世代のコアの方がグラフィックスでははるかに優秀だね。
524 名前：Socket774 mailto:sage [2009/11/29(日) 20:22:55 ID:xQEzGLxg]: いつまでもその幻想に追いすがっていたいんだろうけど
実際AMDは遅いから

演算効率自体に難がありすぎるだamdは
なんといっても10240bitの演算粒度だから

ttp://www.youtube.com/watch?v=pmBd9HQgTCQ

shader主体の描画で描画異常も起こしてるし
最低の構造だ
525 名前：Socket774 mailto:sage [2009/11/29(日) 20:25:52 ID:ZFGAEcyL]: それ、ゲームの話？
526 名前：Socket774 mailto:sage [2009/11/29(日) 20:29:12 ID:xQEzGLxg]: amdが大量にsp乗っけてるのって何のためなの
527 名前：Socket774 mailto:sage [2009/11/29(日) 20:29:37 ID:iLbENVdS]: >>524
そんなファビョらず落ち着いて。
特定環境のバグの動画をようつべから持ってきたな・・・
528 名前：Socket774 mailto:sage [2009/11/29(日) 20:31:33 ID:xQEzGLxg]: >特定環境

AMD限定のな
529 名前：Socket774 [2009/11/29(日) 20:32:37 ID:kBKICs+9]: 何のための？

カタログスペックのためだろ
530 名前：Socket774 mailto:sage [2009/11/29(日) 20:34:03 ID:iLbENVdS]: 特定環境のバグの動画で主張

とってもう～んｗ
531 名前：Socket774 [2009/11/29(日) 20:34:04 ID:yC343zu3]: 1600SPのHD5870君が240SPしかないGTX285君を上回りました
これはめでたい
532 名前：Socket774 mailto:sage [2009/11/29(日) 20:35:34 ID:0UVLWSbA]: カウントの基準が違うって何度出たっけ？
533 名前：Socket774 mailto:sage [2009/11/29(日) 20:36:35 ID:ZFGAEcyL]: なら512SPいっちゃえば解決だな
534 名前：Socket774 mailto:sage [2009/11/29(日) 20:38:28 ID:pVy1Eyqt]: >>515
>422で既にネタに使われた記事を今頃持って来て大風呂敷広げなくていいからｗ
つか、つか他スレでネタにされたその記事をここに持ってきて、煽ってみようって
考えがみえみえ。少しは自分でネタ発掘してこいよｗ
>>524
10240bitはもう飽きた。君も、もっとこのスレの住人の溜飲が本当に下がるような
有用なネタをもって出直してくるがよろしい。
535 名前：Socket774 mailto:sage [2009/11/29(日) 20:39:23 ID:huYRZlsE]: >>524
これのGTX285とHD5870、GTX295とHD5970の比較が見てみたい
536 名前：Socket774 mailto:sage [2009/11/29(日) 20:39:46 ID:89TJiT+K]: shader主体の描画でなんで異常が起きるんだろうな
遅い上に、まともな演算もできないって？
537 名前：Socket774 mailto:sage [2009/11/29(日) 20:39:59 ID:iLbENVdS]: そしてDally氏は、Fermiを、ゲームやコンシューマー分野で使われる比較的低性能のチップにスケールダウンできることを説明した。
「われわれは現段階では、ほか（のチップ）について話すつもりはないが、コアの数を512個から減らして、これらのコアによる倍精度などの機能を少なくすることで、この部品をスケールダウンできるということは想像できるだろう」
japan.cnet.com/special/story/0,2000056049,20401079-2,00.htm
Geforceは何SP減らされるのかな？
538 名前：Socket774 mailto:sage [2009/11/29(日) 20:42:05 ID:8lS3qC4O]: 1ヶ月前の推測
539 名前：Socket774 [2009/11/29(日) 20:42:13 ID:QyB+Sonq]: 自分の知識で喋らないのって楽でいいね。
技術的な事は何もわからなくてもURL一つで
具体的な反論反証はしなくていいし他のそれっぽい事言ってる風な
レスの印象的な単語に(笑)とか
つけてればおｋだものね。
相手が無視してくれるから脳内で勝利宣言出来る。すばらしい。
540 名前：Socket774 [2009/11/29(日) 20:42:49 ID:kBKICs+9]: また、客寄せパンダ？
541 名前：Socket774 mailto:sage [2009/11/29(日) 20:43:48 ID:xQEzGLxg]: ＞減る見もDX11対応しただけG80から大幅なアーキテクチャの変革はないけどな。
（笑）
542 名前：Socket774 mailto:sage [2009/11/29(日) 20:44:34 ID:iLbENVdS]: ×推測
○NVIDIAのチーフサイエンティストであるBill Dally氏のコメント。
543 名前：Socket774 mailto:sage [2009/11/29(日) 20:45:15 ID:ngXtSvMU]: >>541
自覚あんだなw自分の事だってw
544 名前：Socket774 mailto:sage [2009/11/29(日) 20:46:31 ID:ZFGAEcyL]: そもそもゲームで使わない部分が大幅強化だから過剰反応しないでねって発言じゃね？
545 名前：Socket774 mailto:sage [2009/11/29(日) 20:49:19 ID:iLbENVdS]: >>544
お、守りに入るな～
でもそのおかげでGeforceではSP削られるとしても問題ないと言うのかね？
546 名前：Socket774 mailto:sage [2009/11/29(日) 20:52:47 ID:TxNHU0aO]: www.ngohq.com/news/16710-first-directcompute-benchmark-released.html

DirectComputeベンチマーク
Geforce8以上の人は最新ドライバ+Windows7で動作
RADEONの人はHD5x系+Windows7で動作

とりあえずシェーダー性能の実測を取ろうぜ
547 名前：Socket774 mailto:sage [2009/11/29(日) 20:52:58 ID:ZFGAEcyL]: 誰かさんと間違えてない？

そうなったら見限るだけだよ
548 名前：Socket774 mailto:sage [2009/11/29(日) 20:56:45 ID:s5qoisEM]: >>546
Vistaでも動くみたいだよ
549 名前：Socket774 mailto:sage [2009/11/29(日) 21:07:47 ID:BSiQZwDl]: >>546
HD5870 139141
8800GT 15405
550 名前：Socket774 mailto:sage [2009/11/29(日) 21:11:02 ID:xQEzGLxg]: 572 ：Socket774 [↓] ：2009/11/27(金) 05:09:37 ID:hZfgkrKn
>>571
なんか、OpenCL動かないんだけど、とりあえずDirectComputeだけ
GeForce GTX260: D12577
Radeon HD5750: D96518

Radeonはちゃんとドライバ入れてるのに、OpenCLサポートがNoになるし、
GeForceは、一瞬でベンチが終わってスコアがマイナスになる。
OpenCLは自分の作ったプログラムやSDKのデモは動くんだけどなぁ。
このソフトは内部でNVIDIAとAMDのOpenCL.dllの位置を自動認識しているらしいから、
64bit版とかインストール先をデフォルトじゃない場所にするとだめなのかな。

とりあえず、このベンチを実行したらGTX260が出力する画面が乱れるようになったw

573 ：Socket774 [] ：2009/11/27(金) 07:08:30 ID:knMAqEeD
>>572
一瞬gtx260が12万、5750が9万で260スゲーと思った。

574 ：Socket774 [↓] ：2009/11/27(金) 07:17:00 ID:IAAdAjRq
変なべんちｗ

575 ：Socket774 [↓] ：2009/11/27(金) 07:43:50 ID:hZfgkrKn
たぶん、ベンチマークプログラムが間違っているんじゃないかな？
v.0.25だと、
GTX260: M73704
HD5750: M27967
なので、こっちの方が妥当な結果に見える。
単純な行列演算ではGTX260はHD5750の半分の時間で処理出来るのでね。
551 名前：Socket774 [2009/11/29(日) 21:12:36 ID:kBKICs+9]: 削るわけないだろｗ
552 名前：Socket774 mailto:sage [2009/11/29(日) 21:19:34 ID:xQEzGLxg]: ま、例え削ったところで複数カーネルの並列実行が可能なので
たとえ旧世代と同数になったとしても、効率が段違いなんだが
553 名前：Socket774 mailto:sage [2009/11/29(日) 21:21:41 ID:iLbENVdS]: 削らないならコンシューマーでは無駄な倍精度演算とECC訂正で肥大化したコアのため
TDP225ｗではシェダークロック1GHz～1.23GHzとかなりSP当たりの性能低くなるね。
クロックあげるとTDP上がっちゃうね。
554 名前：Socket774 mailto:sage [2009/11/29(日) 21:26:26 ID:iLbENVdS]: >>552
Fermiはグラフィック向け処理で効率が上がる？
トランジスタは2倍以上なのに、固定機能は1.5倍程度にしか拡張されていない
アンバランスな拡張で効率が下がらず上がるのかね。
555 名前：Socket774 mailto:sage [2009/11/29(日) 21:42:47 ID:xQEzGLxg]: SP数と倍精度は特に関係ないのだが
たとえSPが1/4になったとしても倍精度は扱える
クラスタ数の増減ではなく、客寄せダリーのアホ発言を真に受けるなら
SP自体が簡略化されたものになり、SP自体の数は変わらない
これをやるなら大幅な梃入れ必要なんで、まずないわ

さて、メインストリーム用にクラスタ減らしてゲーム向けにする
そんなことは簡単なこと、ROPを減らさなければいいだけ
fillrateだけあげてやりゃ旧世代ゲームやベンチじゃ十分って話
現存する製品では9600GTがそれだ

で、実際fillrate過多で多画面に走ったamd
556 名前：Socket774 mailto:sage [2009/11/29(日) 21:49:39 ID:ZFGAEcyL]: 555みたいなチップを出す気が無いから...
557 名前：Socket774 mailto:sage [2009/11/29(日) 21:53:42 ID:xQEzGLxg]: ？
読み直すとfermiのCUDA core自体は複数利用ではなく64bit演算が可能なのか
1/2になるのはレジスタ等のリソース側の理由で命令発行しないだけ

となると、cuda core減数ではなく簡略化の線か
ありえるとすれば
558 名前：Socket774 mailto:sage [2009/11/29(日) 21:56:42 ID:ZFGAEcyL]: その「ありえる」が推測の域を出る気配がないじゃん
559 名前：Socket774 [2009/11/29(日) 21:58:36 ID:kBKICs+9]: 次世代じゃ倍精度も等倍か
560 名前：Socket774 mailto:sage [2009/11/29(日) 22:00:47 ID:xQEzGLxg]: ＞その「ありえる」が推測の域を出る気配がないじゃん

なにか不都合でも？
561 名前：Socket774 mailto:sage [2009/11/29(日) 22:04:18 ID:TxNHU0aO]: fermiコアそのままではSP数減らしたものなんか出してもGT200にすら劣るごみに仕上がるけど
完全に設計を作り直したGT100シリーズとして出すと時間が掛かりすぎるという葛藤の中に居る
だから何も言わないのではなく、何も言えない
562 名前：Socket774 [2009/11/29(日) 22:04:49 ID:ZFGAEcyL]: 結局Fermiは無駄を抱えてるって話に戻るじゃん
563 名前：Socket774 mailto:sage [2009/11/29(日) 22:06:09 ID:x+rTncHX]: >>557
ほんと基本的なことが分かっていなよなぁ。

>1/2になるのはレジスタ等のリソース側の理由で命令発行しないだけ
分かってないんだろ？嘘を言うなって。

CUDAコア再設計は有り得ないなぁ。
564 名前：Socket774 mailto:sage [2009/11/29(日) 22:11:46 ID:ngXtSvMU]: あんな馬鹿でかくて歩留まり悪そうなのを2つも量産するのか…。
565 名前：Socket774 mailto:sage [2009/11/29(日) 22:11:52 ID:nodJUc7G]: 倍精度あつかわねーのに演算器だけ64bitにしてたっていみねーだろ・・

g92的シュリンク版じゃレジスタ増量で倍精度も等速か恐ろしい・・
なんと優れた基本構造なのか
566 名前：Socket774 mailto:sage [2009/11/29(日) 22:17:14 ID:nodJUc7G]: 同サイズなら倍のcuda core積めるって？
いろんな意味で64bit offは無いな
567 名前：Socket774 mailto:sage [2009/11/29(日) 22:17:55 ID:x+rTncHX]: 倍精度が等速ってそれ単精度を捨ててるじゃねぇかよ。
CPUの倍精度は1/2倍速なんだって分かってないだろ。
いや、もうなにもかも分かってない。

そういや、IDがiLbENVdSから勝手にかわっとるわ。
568 名前：Socket774 mailto:sage [2009/11/29(日) 22:34:51 ID:G1kIooHY]: >>557
リソースの問題で複数命令発行しないんじゃなくて、
各CUDAコア内部では16SPずつ管理されてるんだから、
倍精度演算時は二つのワープスケジューラが
各々の16SPに同時に命令発行するんだろ。
Dual Issueできないのは必然じゃないか。
569 名前：Socket774 mailto:sage [2009/11/29(日) 22:35:27 ID:TxNHU0aO]: やっぱlarrabeeに期待するしかないのか
画像処理とかで倍精度はけっこう使うからな
570 名前：Socket774 mailto:sage [2009/11/29(日) 22:36:05 ID:nodJUc7G]: pc.watch.impress.co.jp/docs/column/kaigai/20091102_325517.html
「CUDAコアは、それぞれ単精度と倍精度の両方の浮動小数点演算と整数演算ができる。
倍精度は単精度の1/2の比率となっている。
命令発行の面から見た、倍精度演算の際の、単精度との唯一の違いは、同時に2命令の発行ができないことだ。

倍精度では、2つの演算ユニットにまたがって演算を行なうわけではないが、一部のリソースを共有するからだ。

具体的には、この比率は、レジスタ帯域自体の比率と合致している。
単精度演算、倍精度演算、整数演算、SFU、ロード/ストアの全てが、帯域を共有する。
実行帯域だけなら、実際にはもっと供給できるが、(実行ユニットに対してデータを)フィードすることができない」。
571 名前：Socket774 mailto:sage [2009/11/29(日) 22:41:00 ID:G1kIooHY]: 倍精度FMAには単精度の４倍のリソースが必要だが、
単精度FMAには単精度の２倍のリソースが要るので、
その分×二倍のコア数でリソースが足りる
572 名前：Socket774 mailto:sage [2009/11/29(日) 22:45:14 ID:nodJUc7G]: 今世代はダイサイズ的にリソースを抑えたが
先を考えた構造か
573 名前：Socket774 mailto:sage [2009/11/29(日) 22:50:53 ID:G1kIooHY]: 単精度が倍精度の半分て当たり前。
Larrabeeでも一緒。
Larrabeeのコア数とクロックが出てこない事にはどっちが上かは何とも言えない。
574 名前：Socket774 mailto:sage [2009/11/29(日) 22:52:58 ID:x+rTncHX]: >>572
単精度：倍精度が1：2の単純な理屈が分かってないな。
575 名前：Socket774 mailto:sage [2009/11/29(日) 22:55:02 ID:G1kIooHY]: でも物理ベクタ長を隠蔽するCUDAのプログラミングモデルはすごく良いと思う。
ベクトル演算機であることを感じさせない。さすがBrookの開発者というべきか。
簡単でいいんだけど、最適化の名人にはLarrabeeのほうが好みなんだろうな。
実効性能／理論性能の比率をかなり高められると思う。
576 名前：Socket774 mailto:sage [2009/11/29(日) 23:04:46 ID:x+rTncHX]: >>575
並列コンピューティングではね。
この辺の話をグラフィックス処理の話と混同しているやからが多いよ。

でも論理ベクタ長を抑えて物理ベクタ長は2倍の大きさになった結果、
G80/GT200世代よりレイテンシがよりクリティカルになってしまっているが。
そこを追加されたキャッシュでどれだけカバー出来るかだね。
577 名前：Socket774 mailto:sage [2009/11/29(日) 23:31:46 ID:G1kIooHY]: >>576
個人的な考えではGT200世代では、コアレスアクセスできない、
つまり順次アクセスできないランダムアクセスのレイテンシまで
力技でカバーしてしまうことを考えていたように思うんだが、
Fermiの演算機／レジスタがG80と同じバランスに戻ったのは、
ランダムアクセスはキャッシュに逃がしてしまうという設計方針の転換だと思う。
だから上手くやればGT200より稼働率は上がるんじゃないかな。
順次アクセスは今まで通りメモリに直で良いと思うよ。
578 名前：Socket774 mailto:sage [2009/11/29(日) 23:35:02 ID:G1kIooHY]: 今までもリードオンリーのキャッシュはあったけど、
最適化していくと結局、最後はそこがボトルネックだし
579 名前：Socket774 mailto:sage [2009/11/30(月) 06:44:34 ID:aZ365MD/]: 次スレ立てるときはGT100にしてくれよ、GT300はTESLAだし
580 名前：Socket774 mailto:sage [2009/11/30(月) 06:57:23 ID:C48LAxI7]: >並列コンピューティングではね。
>この辺の話をグラフィックス処理の話と混同しているやからが多いよ。

おんなじだっつうのｗ
違うのはどの程度の画質を目指してるか
DX9以前の固定機能の代替としてだけ無駄にshaderを使うか
うえの画質を目指して、こったshaderを書くか

現存するゲームやベンチじゃfillrateだけあげてやりゃそれで済む
RV870ってのはそこを狙って前世代で100fpsだったものを200fpsに上がったから、ホラ速いでしょってやってるだけ
そんなものに興味はないんだよ
581 名前：Socket774 [2009/11/30(月) 07:03:54 ID:mBl6tJSS]: でも一般に売れるのそういうのだ
Pen4しかり
数字がでかけりゃうれる

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef