- 1 名前:デフォルトの名無しさん [2008/01/04(金) 14:25:44 ]
- 主にx86系で浮動小数点を扱う話題
- 458 名前:443 mailto:sage [2010/07/01(木) 01:21:40 ]
- >>456
>>457 いろいろと調べてみたら、キャッシュの問題ではなくて、 NUMAノードの設定が問題だったようだ。 メモリの確保をmalloc()ではなく、numa_alloc_onnode()でダイレクトにNUMAノードを指定してあげたら、 ほぼスカラーの倍の速度が得られたよ。 numactlをつかって、--preferred=nodes --localallocとかいろいろといろいろとオプションを つけてやってみたけど、うまく指定したノードでのメモリ割り当てが出来ていなかったみたい。 いずれにしてもSSEの問題ではなかったので、変な質問をして申し訳ない。 レスしてくれた人ありがとう。 ただ、プリフェッチの指定をしていた部分でNehalemではかなり効果があったのが、 Opteronでは全く効果が無いので、プリフェッチの距離とかはOpteron用に考えないといけない様だ。
- 459 名前:デフォルトの名無しさん mailto:sage [2010/07/01(木) 08:56:52 ]
- OpteronのNUMAは諸刃の剣だな。ハマればメモリの許す限りスケールするしな。
ていうかSMP Opteron由来の問題とは俺も気付かなかった。
- 460 名前:デフォルトの名無しさん [2010/07/23(金) 11:32:54 ]
- (000、000)10
ー10、835 とかいう問題
- 461 名前:デフォルトの名無しさん mailto:sage [2010/07/27(火) 16:59:37 ]
- >>458
First touch 問題だね
|

|