- 518 名前:デフォルトの名無しさん mailto:sage [2013/10/19(土) 15:35:37.45 ]
- あるプログラムでビジュアルプロファイラー使ってみたら、
カーネルの実行時間が数マイクロ秒で、 カーネルの起動とcudaThreadSynchronizeの オーバーヘッドが数百マイクロ秒だた。 FermiとKeplerを比べると、 Keplerの方がカーネル実行時間は短くなっているのに、 オーバーヘッドがでかくなって、トータルで遅くなっている。 カーネルの実行時間が数十から数百ミリ秒のプログラムなら 問題にならないんだけど、カーネルちっこいと効率悪い。 エヌヴィディアさん何とかしてください。
|

|