- 495 名前:デフォルトの名無しさん mailto:sage [2011/04/21(木) 22:39:09.84 ]
- ようするに64bitレジスタに8x8のデータを入れて同時に処理出来るのかってことでしょ
streamsdkには専用の命令があると? cudaはそんなものは勝手にやると言ってる人が居るけど、どうやってやるんだ? cudaにはそういう命令は無いよ 内部で処理することが出来るとは思えないけどな 少なくともユーザープログラムからやる方法はないよ 内部的にはそういう命令も持ってるかもしれないけど というかそういうアセンブラレベルの最適化をしなくていいようにしたのがCUDA言語なわけで 複雑化する要因はパフォーマンスを犠牲にしてでも排除されるだろう どうしてもやりたかったら64bit変数を使って自前でやるしかないだろう
|

|