- 22 名前:17 mailto:sage [2012/10/09(火) 00:40:24.46 ]
- >>20
そのGPUは最新世代のKeplerアーキテクチャだね。 Keplerの前のFermi世代からはメモリ階層が大きく改変されて、 テクスチャ転送に最適化された上りのパスがなくなった。 pc.watch.impress.co.jp/img/pcw/docs/359/423/06.jpg 依然としてテクスチャL1キャッシュを利用できるメリットはあるけどね。 いずれにせよ、内部バスがどれくらいの帯域であるかは公開されていないと思うよ。 クロスバスイッチ接続で調停しながらでもあるから、ちゃんとした数字も出せないだろうし。 Fermiからはキャッシュが噛むようになったから、なおさら。 仮定と実測の両輪でうまく最適化して詰めていくことが醍醐味だろうね。 面倒だけど・・・w まぁ、ハード屋やってると、こういうのは楽しい。 フィルレートはグラフィックスにおいて、画像の画素を埋めていく(フィル)する速さのことだから、 グラフィックス処理用のROPユニットの能力が影響してくると思うし、あまり参考にはならないかもね。 www.nvidia.com/content/PDF/product-comparison/Product-Comparison-Quadro-mobile-series.pdf しかし、このGPU、CUDAコア数に対してメモリ帯域が残念すぎないか? Keplerアーキ自体が以前と比べてそういう傾向あるけど、それにしてもヒドイw キャッシュがあるから大丈夫なんかな? どうであれ、演算/ロード比が相当大きくないと性能出すの難しいかもね。
|

|