- 409 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:16:08 ]
- >>403
逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い (高くしないと性能の出ない)アーキテクチャに向いてるってのはある。 MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。 これはCUDAの実装についての説明。 ソースはCUDA SDKのサンプルにも入ってる。 developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。 要するに依存関係があって、128ビット性能が出ない。 各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。
|

|