- 103 名前:デフォルトの名無しさん mailto:sage [2006/02/17(金) 21:39:40 ]
- そういえば、これ処理が軽いからメモリ速度がボトルネックになるね。
おそらくCで書いたルーチンでもメモリ帯域を使い切っているに近いと思う。 ありえん話だが、メモリがL1キャッシュくらい速い環境ならば >>100氏はCコンパイラに大勝していただろう。 あと、このように毎回実行する余計な処理が4命令もあるので、 ループをアンロールすれば少し速くなると思う。 lea esi, [esi + 2]; lea edi, [edi + 8]; dec ecx; jnz loop_mp; >>102 SP6か。それは残念。後でnasmでも使ってみてください。 Pen4だとALUが速くてMMXが遅いからな。
|

|