- 486 名前:デフォルトの名無しさん [2011/04/20(水) 22:50:57.29 ]
- >>484-485
CUDAがSIMTなのか、SIMDなのか、SPMDなのかはさておいて… 昔の記述だとCUDAアーキテクチャのレジスタは32bitとかだったと思いますが、 今時のNVIDAのGPUには64bitレジスタ、あるいは128bitレジスタがあって、それを使って padd.u32 みたいな命令により、「1スレッド内の演算において」32bit整数の4並列処理が出来るとかないでしょうか? ということなのですが、いかがでしょうか? Streamでは128bitレジスタで32bit4並列の演算ができるみたいのですが・・・
|

|