- 710 名前:デフォルトの名無しさん mailto:sage [2010/03/26(金) 22:05:03 ]
- >>704
この手の計算の場合はCPUのキャッシュやプリフェッチはあまり効果が無いと思うけど Nehalemだと30GB/s程度メモリ帯域があるのか。 ただCUDAでは単なるメモリ帯域の比較だけでなく、シェアードメモリの利用や 大量のスレッドによるメモリアクセスレイテンシの隠蔽が重要になってくると思う。 >702の記事見たけど、デュアルコア2.4GHzのOpteronの1コアと TESLA S1070の中の1基の比較なのかな・・・ >>708 倍精度だと思ったら、単精度だったのか・・・ そのpptってどこで公開されているんだろ?
|

|