- 63 名前:名無しさん@お腹いっぱい。 mailto:sage [2010/06/26(土) 11:09:20 ]
- Core2DuoのCULV(低電圧)版のSU2300(1.2GHz, 1MBキャッシュ)を積んだノートを買ったので
テストしてみました(OSはXP Home) ちなみにCore2以降のCPUに載ってるSSE3は 64bit倍精度浮動小数点演算を1クロックに4個実行できるSIMDユニットで このSSE3が有効な場合の理論FLOPSをを計算すると 1.2G(Hz)*4(FLOPS/Clock)*2(Core)=9.6GFLOPS となります。AtomなどにもSSE3のファンクションは載ってますが それを実現するハードウェアはないため、速くはなりません。 GotoBLAS2は新たに1.13をダウンロードしてCygwin1.7上でmakeします makeオプションは www.db.is.kyushu-u.ac.jp/rinkou/cygwin/cblas.html ここのをそのまま使います makeが終わると、exports/にlibgoto2.dllが出来上がってますので これをMingw版Octave 3.2.4のbinのblas.dllと置き換えればOKです その前に環境変数GOTO_NUM_THREADSに2をセットしておき cygwinのbinから、cygwin1.dll、cyggcc_s-1.dll、cyggfortran-3.dllをoctaveのbinにコピーしておきます ベンチマークはいつものを使います n=2000; A=randn(n); B=randn(n);tic; C=A*B; t=toc, MFLOPS=2*n^3/t*1e-6 デフォルト(たぶんatlas.dllを呼んでいる)のblas.dllだと 2.07 GFLOPS GotoBLAS2だと 5.72 GFLOPS で倍以上に速度が上がりました GOTO_NUM_THREADSに1をセットすると 3.24 GFLOPS なのでデュアルコア自体は効いてるようです
|

|