- 491 名前:デフォルトの名無しさん mailto:sage [2010/01/13(水) 11:29:27 ]
- >>489,490さん
早速の返信ありがとうございます。 cudaMemcpyでcudaMemcpyDeviceToHostを消したプログラムで、 プログラムの一番最後にだけ結果を取り出してみたところ、 正しく計算されていました。 次に、カーネルの実行部分のみをコメントアウトした場合、 やはり非常に時間がかかってしまいました。 やはり、GPUからCPUへのデータ転送に(というよりなにか同期の部分の様な気もしますが) 時間がかかっているようです。 計算用マシンなので省電力の設定はしていません。
|

|