- 209 名前:・∀・)っ-○◎● mailto:sage [2007/03/13(火) 19:32:13 ]
- スループットなら倍精度以外はほとんど1だよ。
SPEのLSはレイテンシ6だよ。Coppermineがレイテンシ6だったから 今のCore 2も、独立キャッシュにしてL2のエントリ数削れば それくらいいけるんじゃないのって思うと萎える。 んなわけで、レジスタが128本もあるから、必要なデータは展開して しまった方がいいわけだ。 AltiVecでVSIUパス命令に相当する整数演算命令はレイテンシ2、 あとの命令(VCIU、VPERM相当)は大体レイテンシ4。 あと、浮動小数はfma(積和算)で6、faddで4。 逆数を求めるfrestなんかも4で処理出来、fmaと組み合わせれば レイテンシ10・スループット2で除算ができてしまうんだけど、 estimate(推定値)というぐらいだから精度は絶望的に低いと 思ってくださいな。 それなりに精度の高い除算をやろうと思えばソフトでやるしかない。 平方根も同じく。
|

|