- 339 名前:デフォルトの名無しさん mailto:sage [2023/09/16(土) 21:12:54.47 ID:DZ7YkFqT.net]
- >>326の計測に使ったblasバインディングがgemmとgemvしか参照していなかったので
行列積素朴実装をgemmの形にしてdllにしたらそのまま計測出来た(gemvは呼び出されていなかった) f32 NAIVE ST 3484.623ms 0.616 GFLOP/s 3540.897ms 0.606 GFLOP/s 3567.409ms 0.602 GFLOP/s MT 178.104ms 12.057 GFLOP/s 178.895ms 12.004 GFLOP/s 177.376ms 12.107 GFLOP/s f32 tile ST 31.727ms 67.686 GFLOP/s 32.086ms 66.930 GFLOP/s 32.020ms 67.067 GFLOP/s MT 4.042ms 531.307 GFLOP/s 3.924ms 547.233 GFLOP/s 4.065ms 528.281 GFLOP/s f32 BLIS 目標 アーキテクチャ毎にほぼアセンブリで実装されている ST 14.917ms 143.966 GFLOP/s 14.987ms 143.289 GFLOP/s 15.051ms 142.680 GFLOP/s MT 2.120ms 1012.808 GFLOP/s 2.145ms 1001.183 GFLOP/s 2.108ms 1018.784 GFLOP/s
|

|