1 名前:デフォルトの名無しさん [2007/08/29(水) 17:08:58 ] いつの間にやらCPUを超える演算性能を持ってしまったGPUに計算させてみるという GPGPUについて語りましょう 前スレ GPGPU pc11.2ch.net/test/read.cgi/tech/1128780920/ 関連スレ pc11.2ch.net/test/read.cgi/tech/1167989627/ 参考リンク 総本山? gpgpu.org www.gpgpu.org/ CUDA developer.nvidia.com/object/cuda.html GPUをCPU的に活用するGPGPUの可能性 pcweb.mycom.co.jp/articles/2005/09/06/siggraph2/
270 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 21:50:38 ] CALを生で使う根性があればAMDの方は自由度高いし面白いと思うよ。 グローバルバッファとか使えるし、適用できる問題の幅も広い。 ただCAL側のリソースをテクスチャにしたり頂点バッファにするみたいな DirectXやOpenGLとの協調はまだ未実装だから、完全に計算しか出来ないけど。 Brook+ははっきり言ってまだ使い物にならない。CPUコード吐かせると 数値リテラルが全部floatになって生成されたcppファイルがコンパイルできないとか。 CALコードだけにすればまぁ何とか使えなくもないけど、CUDAの方が実用的。
271 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 23:12:37 ] >>270 CALちょっといじったことあるけど あれ使うのは大変だったなぁ Brook+はやっぱダメなのかぁ。上に 釣りで学生のおもちゃとか書いてあったけど どうやら本当なんだね
272 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 23:22:28 ] まぁ機能すらフルに実装されていないβVerだから速度に期待するのは酷だね
273 名前:デフォルトの名無しさん mailto:sage [2008/06/02(月) 23:33:07 ] 速度やバグあるのはまぁCUDAも 0.xxxははんぱねぇw状態だったから 別段いいんだけど Brook+の自由度がどの程度なのか いまいち図りきれないのが残念 すぐコンパイルエラーばっかり
274 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:44:32 ] >>271 まぁちと言い過ぎだけどね。 言語としてはシンプルでそれほど悪いわけじゃないし(でも3DAPIと協調するときどーすんだって気はする。ドキュメントにすら記載ないし) CALコードだけならとりあえず動くコードは吐いてくれる。遅いけど。 v1.1-betaなんてバージョンにしちゃったから印象が悪いわけで、実際のところは熟成待ち。 >>373 秋葉原で3850が1万チョイって話もあるし、とりあえず3xxx1枚買ってbrcc -p calオススヌ。 CALバックエンドなCUDAコンパイラを誰かが作ってくれないもんかねぇ
275 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:47:51 ] おっと、書き込んでから思い出した。 ドキュメントにはないけどVC用のusertype.datにこんな文字列があったんだった。 streamToD3D streamFromD3D streamToGL streamFromGL 一応Brook+と3DAPIのやり取りを実装する気ではいる様だ。いつになるか知らないけどw
276 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 00:50:48 ] >>274 今買うより10日に新板でるからそれ 待ってから買った方がいいと思ってます。
277 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 12:17:43 ] 4850は18日
278 名前:デフォルトの名無しさん mailto:sage [2008/06/03(火) 13:06:50 ] ときに次のPhotoshopがGPU使うそうですが。
279 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 03:12:09 ] techreport.com/discussions.x/14788 でもCUDAだーよ ATIの人カワイソス
280 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 07:28:21 ] みんなCUDAで200Wとか280W 電力消費すれよw
281 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 10:05:45 ] >>279 β版の開発環境でプラグイン作るなんてAdobeもATiも迷惑だろ
282 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 16:49:45 ] CUDAは上位互換が保障されてます
283 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 21:44:13 ] CUDAは全ての変更が上位と将来版で 継承されることが保障されている Computexで聞いてきたがAMDの方は 1.5からまた全く違う内容になる。 CLIの実装方式が変更されるから意味 ないんだよな
284 名前:デフォルトの名無しさん mailto:sage [2008/06/05(木) 23:49:12 ] つまり大幅なハードの変更がある訳かね?
285 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 00:17:19 ] また変な改行の人か
286 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 02:10:54 ] この流れでいくとCUDAが圧勝するわけだけど そうなると当然対応ソフトの多さによってnVidiaカードのシェアが伸びる 下手すれば完全に独占してしまうかもしれない AMDはCUDAに対応させるために改造するのだろうか そうなるとnVidiaがすべての仕様をこれから先ずっと作っていくことになってしまう 使い勝手の悪いものが出来たり、上位互換を自分勝手に切り捨てたりするかもしれん ISOのような公式な機関が介入出来る情勢でもないし 混沌としてきそうで嫌だね 洗練された仕様がどのメーカーのVGAでも一様に動作するというのが ユーザーとしては最も望ましいわけだけど このままだとそれは永遠に無いかもね
287 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 07:36:28 ] >>286 いやそれは無い。もう、Intel互換のチプセトも AMD互換のチプセトも作らせて貰えない可能性 高い。本業のグラボも1のつの巨大コアで全部 ぶん回す旧世代のアーキテクチャだよ 弱ったら買い叩かれるのがオチだよ
288 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 12:33:06 ] だから今余裕のあるうちに逃げ道を探して奔走してる訳だね
289 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 16:04:53 ] >本業のグラボも1のつの巨大コアで全部 >ぶん回す旧世代のアーキテクチャだよ 新世代のアーキテクチャのグラボはどれですか?
290 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 16:09:56 ] RadeonはデュアルコアGPUの4870X2が次世代のフラッグシップモデル 性能もnVidia最上位のGTX280より上らしい ttp://www.vr-zone.com/articles/Radeon_HD_4870_X2_R700_Beats_GeForce_GTX_280/5851.html これでStream SDKさえ完成版が出ていたら…
291 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 18:44:28 ] Streaming Computing用途の性能なら 単精度で2倍あるはずだしな。
292 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 19:11:06 ] Stream SDKは1.0β→1.1βまで2か月しか掛かってないし、 4870X2が出る予定の8月までには完成できるんじゃないかな
293 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 19:58:57 ] 4870X2ってただのCrossFire接続だろ? 新世代なんて程のもんじゃ無いな。
294 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:02:34 ] >>293 1枚の板に2つのGPUコア ただのCrossFire接続だったら誰だって4870やGTX280を2枚買うわw
295 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:03:26 ] いや、ただのCrossFireだって・・・ 二重にメモリ積んでるし。
296 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:10:03 ] >>295 メモリ共有でソフト側からは1GPU扱いという話だったが、 メモリ2枚積みのソースは?
297 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:16:24 ] ttp://northwood.blog60.fc2.com/blog-entry-1999.html >Radeon HD 4870X2はATiの次世代ハイエンドカードである。 >このカードは2つのGPUを1つの基板に搭載したものである。 >Radeon HD 4870X2はATiのMulti-GPUソリューションである >CrossFire Xによる2つのGPUをリンクさせるのでドライバのできによって性能が大きく左右される。
298 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:48:26 ] 俺らでCLIの開発してやるから ATI仕様さらせよ 今Linux版解析してるが 実装がヒドイこれやばいだろってもんじゃないなぁ
299 名前:デフォルトの名無しさん mailto:sage [2008/06/06(金) 20:49:07 ] >>297 ただのCrossFireとCrossFireXは世代が違う技術だっての…メモリ非共有ともどこにも書いてないしな 少なくとも単なる大型化のGTX280とは全く別世代のアーキテクチャだ ttp://a96sj096.cocolog-nifty.com/weblog/2008/05/r7002_d82b.html ttp://northwood.blog60.fc2.com/blog-entry-2000.html#more
300 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 19:36:02 ] 800SPの1.2Tflopsだってさ4870 あと4870X2がオンボードCFなのかどうかは不明 PLXじゃない専用ブリッジを乗せるとのうわさもある
301 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 19:39:40 ] >>300 それあってねーよ騙されるな おめぇ一度自作板に勉強しに来いよ
302 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 19:54:12 ] どれが? 800SP? ブリッジ? ちなみに800SPの資料 4850で1Tflops ttp://img68.imageshack.us/img68/1152/rv770slideuj5.jpg
303 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 20:00:28 ] つまり今まで一番もっともらしく出回ってた 480SPってのが単なる妄想スペックだったわけだ
304 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 20:30:00 ] 実製品のFLOPSが妄想スペックを20%近く上回るとか… 逆にこっちの方がフェイクじゃないかと思ってしまうな
305 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 20:39:12 ] フェイクだったりして
306 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 20:42:53 ] 4850とりあえずもう予約したから 初日にベンチしてやるから 何やってほしいか晒せ
307 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 20:52:51 ] >>306 H.264エンコード
308 名前:デフォルトの名無しさん [2008/06/07(土) 21:13:07 ] >>302 よくここまで仕様を隠し通してたなw NVIDIAの方がとっくに発表されてたのに
309 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 21:40:52 ] まぁ、フェイクとしても4870はいずれ1Tflops超えか
310 名前:デフォルトの名無しさん mailto:sage [2008/06/07(土) 22:11:20 ] AでもNでもどっちでもいいからはよH.264エンコーダ作ってクレー
311 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 17:40:29 ] どうでもいいけどラデはム板的に意味なし
312 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 17:43:46 ] CALがあるじゃない
313 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 18:36:05 ] いっこうにCALの話題が無いw 誰かが試したという報告すら聞かない CUDAはかなり普及してきてる
314 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 18:40:29 ] ところでDX10はストリーム演算が出来るとか聞くけど サンプルとかぜんぜん見当たらないんだけど DX9と比較して何がどう違うの? DX10を使ったフレームワークとかあるの?
315 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 20:15:25 ] 4870X2のCFで4.8Tflopsとかわけわかんねぇ パフォーマンス
316 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 20:17:24 ] X2で1.2TF 48レーンのPCI-EXってかなり 限定されるな
317 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 20:39:08 ] いや、多分そうはならない
318 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 22:40:09 ] CALのドキュメントどれ読めばいいの?
319 名前:デフォルトの名無しさん mailto:sage [2008/06/08(日) 22:46:22 ] ProgrammingGuide.pdfとcal_platform_spec.pdfとil.pdf
320 名前:デフォルトの名無しさん mailto:sage [2008/06/09(月) 17:55:47 ] ttp://www.pczilla.net/en/post/36.html According to some insiders, Compute Shader technology in DirectX1 11 will possibly terminate the future of NVIDIA's CUDA technology. 統一が望ましいわな 当然
321 名前:デフォルトの名無しさん mailto:sage [2008/06/09(月) 21:01:12 ] Linuxはどうなるのさ?
322 名前:デフォルトの名無しさん mailto:sage [2008/06/09(月) 22:02:54 ] 何そのいらない子
323 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 05:05:11 ] 結局11が出るまで何も普及しないし実験に付き合わされただけかw
324 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 05:10:09 ] ATIの10.1とかもう何の為にあるのかさえ分からんw ATI詐欺にまた引っかかったなそこの君www
325 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 07:40:27 ] Windowsの方がどんな場合でも 処理性能300%上なのになぜ Linuxなんて存在するんだろう
326 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 09:07:49 ] OpenCLってどうよ?
327 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 12:39:40 ] >>325 タダだから。
328 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 14:22:25 ] >>325 Linusが作りたいからじゃろ
329 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 15:34:51 ] >>325 きみはビル・ゲイツの処理能力の0.0000000000000000000000000001%なのに 同じ人間として存在してるほうが不思議だろ。
330 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 20:29:50 ] >>324 ばか
331 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 23:05:00 ] 10.1は知らんけど、Stream SDKが死産になりそうな感じではあるな
332 名前:デフォルトの名無しさん mailto:sage [2008/06/11(水) 23:12:23 ] Intelの奴が2009年の始めにでるけど それは1枚のカードで4TFらしいね
333 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 01:04:38 ] Intel()笑
334 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 06:18:45 ] なんだその関数
335 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 14:14:08 ] >>334 ワラタ
336 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 16:59:50 ] void intel() { delete palestinian; }
337 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 17:10:52 ] AMDはhavokか
338 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 17:17:42 ] ttp://pc.watch.impress.co.jp/docs/2008/0612/amd.htm AMDとHavok、物理演算をAMDプラットフォームに最適化 最適化はAMD Phenom X4を含むx86プロセッサが対象で、 将来的なATI Radeon GPUでの利用についても取り組む。
339 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 20:03:17 ] またAMD詐欺か
340 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 20:04:15 ] どうでもいいがこのまま消費電力増え続けると地球と家計が爆発するぞ
341 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 20:24:35 ] 詐欺も何もCCCにはR600のころから物理処理に関するヘルプが入っていて havokがintelに買収されてから延々と活かされないままになっていた
342 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 22:12:36 ] 俺のRadeon4870がねぇええええ 悪SKせいだ
343 名前:デフォルトの名無しさん [2008/06/12(木) 22:46:01 ] vistaにcuda2.0入れてサンプルを試しているんだけど simpleD3Dでコンパイルエラーが起きます。 エラーメッセージは以下です。 1>------ ビルド開始: プロジェクト: simpleD3D9, 構成: Debug Win32 ------ 1>カスタム ビルド ステップを実行しています。 1>simpleD3D9_kernel.cu 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(11241): warning: 1> expression has no effect 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(12857): warning: 1> expression has no effect 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\objbase.h(240): error: 1> identifier "IUnknown" is undefined 1>1 error detected in the compilation of "C:\Users\ookawara\AppData\Local\Temp/tmpxft_000016a8_00000000-6_simpleD3D9_kernel.cpp1.ii". 1>ビルドログは "file://c:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\projects\simpleD3D9\Debug\BuildLog.htm" に保存されました。 1>simpleD3D9 - エラー 1、警告 2 ========== ビルド: 0 正常終了、1 失敗、0 更新、0 スキップ ========== 誰か教えてください。
344 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 23:41:43 ] >>343 まさかとは思うが、VC6なんぞを使ってはいないだろうな。つーか、CUDAスレに逝け。
345 名前:デフォルトの名無しさん mailto:sage [2008/06/12(木) 23:59:11 ] 割れ物のVSだとなるようなw おっといけね
346 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 00:20:42 ] >>344 、345 vs2005expressです。
347 名前:デフォルトの名無しさん mailto:sage [2008/06/13(金) 11:55:15 ] >>346 だから、ちゃんと隔離用に作ってあるんだからCUDAスレに逝け。
348 名前:デフォルトの名無しさん mailto:sage [2008/06/16(月) 17:47:08 ] TESLA、Firestreamといったボードは、3DCGでレンダーファームとして今すぐに利用できるのでしょうか?
349 名前:デフォルトの名無しさん mailto:sage [2008/06/16(月) 18:17:35 ] ttp://pc.watch.impress.co.jp/docs/2008/0616/amd.htm AMD、1TFLOPSの演算性能を持つGPGPU 「FireStream 9250」 使用スロットは1スロットのみで、消費電力は150W以下
350 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 06:36:23 ] AMDのHD4850が2万5千円だって ゲフォの次のやつは7万円だって CUDAの一人勝ちかと思ったけどそうでもないかもw
351 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 08:50:24 ] HavokがAMD対応を発表しててFireStream 9250が第3四半期… その頃にはさすがにSDKもβが取れてるだろうからどうなるか分からんね Photoshop CS4も10月頃だから年内にRadeon対応ソフトが現れたらそれほど差は付かない
352 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 09:07:34 ] ttp://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_543~126593,00.html AMDもOpenCL採用
353 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 10:51:26 ] まぁ、安いのはいいことだよなぁ 貧乏学生多そうだしな!w
354 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 11:01:43 ] 値段はともかく発熱量を下げてもらわんと、 ラック当たりの計算量が上がらない。
355 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 19:51:59 ] FireStream 9250は値段半額で発熱同じ、性能2倍じゃん
356 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 22:37:44 ] ゲロビディア氏ね
357 名前:デフォルトの名無しさん mailto:sage [2008/06/18(水) 23:35:37 ] GPU2 6.12 beta 6 for ATIに付いて来るCALランタイムで 今までのドキュメントとは異なるDirectX協調用拡張関数確認。 calD3D9UnmapTexture calD3D9MapTexture calD3D9UnmapVertexBuffer calD3D9MapVertexBuffer calD3D9Associate(これは今まで通り) 引数が判らないしDisassociateはどうしたとツッコミ入れたいけど、とりあえず実装したみたい。
358 名前:デフォルトの名無しさん mailto:sage [2008/06/20(金) 14:14:46 ] pc.watch.impress.co.jp/docs/2008/0620/kurouto.htm RadeonHD 4850/4870 22,980円/34,980円 6月20日より順次発売 RadeonHD 4870 160sp * 2issue * 750MHz = 240GFLOPS RadeonHD 4850/FireStream 9250 160sp * 2issue * 625MHz = 200GFLOPS Tesla C1060 30sp * 2issue * 1500MHz = 90GFLOPS GeForceGTX 280 30sp * 2issue * 1296MHz = 78GFLOPS GeForceGTX 260 24sp * 2issue * 1242MHz = 60GFLOPS
359 名前:デフォルトの名無しさん mailto:sage [2008/06/20(金) 14:30:14 ] 何その変な計算
360 名前:デフォルトの名無しさん mailto:sage [2008/06/20(金) 17:34:08 ] 謎だな つーか、800SPだよな
361 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 07:24:51 ] 倍精度だろ
362 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 09:36:09 ] 単精度で800だよ
363 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 10:06:34 ] だから>>358 の算式は倍精度のパフォーマンス出す式だろ
364 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 13:07:45 ] forums.nvidia.com/index.php?showtopic=70171 CUDAこんなに仕事速くて対応もすごい多いのにAMD何やってるのですかね? やる気あるの?
365 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 14:32:36 ] PowerDirectorがAMDのビデオカードに対応するらしいから、モノ自体はあるんだろうけどね 開発環境も早く公開してくれるといいなぁ、倍精度考えると性能は段違いなんだから
366 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 17:13:37 ] CALのIL.PDFもってる人どこか うぷっていただけませんか? リンク切れててとれない
367 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 17:20:25 ] SDKに入ってるからインスコしろ。
368 名前:デフォルトの名無しさん mailto:sage [2008/06/21(土) 17:24:08 ] >>367 そうなのかありがとう ちょっとRadeon4850もう2枚買ってくる
369 名前:デフォルトの名無しさん mailto:sage [2008/06/23(月) 23:42:11 ] CALのためだけに Radeon4850買ってきますた
370 名前:デフォルトの名無しさん mailto:sage [2008/06/23(月) 23:54:48 ] マゾだなぁ