- 323 名前:・∀・)っ-○◎● mailto:sage [2007/04/11(水) 00:36:28 ]
- 16bit整数×1億個で計測(10回回してるので10倍になってます)
gcc 3.3 i686-cygwin Celeron 2GHz(Northwood) FSB400MHz 非SIMD 3078ms -O3 1890ms -O3 -funloll-all-loops 3860ms -O3 -funloll-all-loops -msse 3892ms -O3 -funloll-all-loops -march=pentium4 -msse以上のオプションを指定すると無条件でCMOV使う感じ? あと、参考までに SSE(64bit SIMD) 2172ms -O3 -msse 1812ms -O3 -funloll-all-loops -msse 1750ms -O3 -funloll-all-loops -march=pentium4 SSE2(128bit SIMD) 1422ms -O3 -msse2 1407ms -O3 -funloll-all-loops -msse2 1313ms -O3 -funloll-all-loops -march=pentium4 Pentium4って倍速ALUだから非SIMDでもそこそこ速い?
|

|