- 704 名前:デフォルトの名無しさん mailto:sage [2010/03/26(金) 05:40:03 ]
- >>703
メモリ帯域が問題になるのはよくわかるんだけど、 それも今のNehalemあたりは30GB/sぐらいあるから、 精々teslsaとは5倍くらいだろう。 それだとメモリ転送時間は1/5、計算時間が1/8になるとして、 CPUのメモリ転送時間をA、計算時間をBとすれば、 実行時間は単純にするとC=A+Bになる。 GPUの場合はCg=0.2A+0.125Bになる。 A=10Bとしたとしても5倍程度にしかならない様な気がするなあ。 CPUの場合巨大なキャッシュがあるし、プリフェッチもあるから その差が縮まるはずなんだけどな。 東工大のクラスのだからCPUのコードがくそだということもなさそうだから、 なんかOpteronのCPU1コアと比較してそうだなあ。 と思っていたら、>>702が書いてくれているね。
|

|