- 67 名前:デフォルトの名無しさん mailto:sage [2008/01/11(金) 14:40:01 ]
- >>66
一応>56で指摘済み。 処で、cufftを使ってみた。 SDKのサンプル(convolutionFFT2D)では100MPix/sの処理速度があるような実行結果が得られたけれど、 実際に試してみたら4096x4096の大きな画像を使っても10MPix/sしか出ない。 どうも、オーバヘッドが大きくて速度が出にくいみたいだ。 まぁ、サンプルと違ってテストしたコードは「プラン作成」「メモリ確保」「メモリ転送」「FFT実行」 「メモリ転送」「メモリ破棄」「プラン破棄」を全部実行しているからだとは思うけど。 と言うことで、来週辺りは実際のプログラムに組み込んだ形でテストしてみる羽目になりそうだ。 そうそう、8800GTXをCUDA1.0で動かした場合と8800GTをCUDA1.1で動かした場合で convolutionFFT2Dの所要時間が殆ど変わらなかった。GPUの性能差を埋める程度にはCUDA1.1で改善されたのかな?
|

|