[表示 : 全て 最新50 1-99 101- 201- 2chのread.cgiへ]
Update time : 08/21 00:56 / Filesize : 53 KB / Number-of Response : 271
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

OpenCLプログラミング#1



1 名前:a36 ◆K0BqlCB3.k [2008/12/10(水) 15:38:25 ]
さてついにOpenCLの仕様が公開されました。

www.khronos.org/opencl/

公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。

159 名前:デフォルトの名無しさん mailto:sage [2009/09/14(月) 10:56:56 ]
とりあえず標準仕様に合わせて書いておけば動くというのは心強いぞ。
現状Intelコンパイラの自動ベクトル化とか糞過ぎるから、今後こういうところで頑張らないと計算分野でGPUに水をあけられる可能性がある。
AMDは…お察し下さい。

160 名前:デフォルトの名無しさん mailto:sage [2009/09/14(月) 17:57:33 ]
将来のハードの進歩でって投げ技が使えていいんじゃないか?

161 名前:デフォルトの名無しさん mailto:sage [2009/09/14(月) 21:00:45 ]
>>155
>ハードの特性を取得して、場合わけするなど
そういった特性とか最適化を担っているのがLLVM。

OpenCL→LLVM→

162 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/09/14(月) 21:30:32 ]
LLVM(笑)

そりゃそんな物に頼ってるからGPUに対応できないわけだ

LLVMは魔法のソフトじゃない。
未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
ハード作った人間が対応投げてたら世話無いわ。



163 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:12:47 ]
何でもいいからWindowsで動く処理系きてくれー

164 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:33:45 ]
何でもいいなら半年ほど前からNVIDIAが出してる

165 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:52:23 ]
>>162
> 未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
> ハード作った人間が対応投げてたら世話無いわ。

あり得ない。コンパイラ技術を知らないアセンブラ人間?

166 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 01:14:34 ]
団子には何言っても主張を曲げないよ
無駄な煽りでスレが荒れるだけ、NG推奨

167 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 01:47:02 ]
両方とも言ってる事がおかしい



168 名前:デフォルトの名無しさん mailto:sage [2009/09/15(火) 03:56:13 ]
OS X ハッキング! 335 ついに姿を現した「OpenCL」、その実力
journal.mycom.co.jp/column/osx/335/index.html

169 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/09/16(水) 00:55:52 ]
>>165
コンパイラはどうやってコード吐くんですか?
どの命令とどの命令が並列実行出来るとかって情報は誰が持ってるんですか?

ああ、今時Javaでもx86のJITフレームワーク触れますよ

170 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/09/16(水) 01:03:34 ]
オープンソースの力を借りるのはある程度動くものができてからの話よ。
CPUだととんでもなく遅いです、GPUだと動きません、じゃ、話にならないでしょ。
そもそもStream 1.0の正式版を出さないうちに2.0のβ(笑)をでっちあげる神経を疑う。

ハードだけ出してソフト丸投げでは、どっかのCell(笑)と同じじゃないの。
それより更に悪い。

171 名前:デフォルトの名無しさん mailto:sage [2009/09/16(水) 08:56:27 ]
OpenCLもOSS化されたGrand Central Dispatch(Cへのブロック追加+OSでの対応+LLVM/Clang)も、
LLVM/Clangが鍵になってるけど、これは言語に対する低レベルなVMであって、
別にJavaなんかと同一視してVMだからどうこうと言っても理解できないかも。

因みにNvidiaもOpenCl実装にLLVM/Clangを利用してるし(今後その実装で続くのかは不明)、
GPU非依存化にはこういう仕組みは不可欠じゃね。

172 名前:デフォルトの名無しさん [2009/09/16(水) 11:02:06 ]
中間コードに落とし込むまではどうでもいいんだよ
実際にターゲットハードウェアで走るコード生成機
GNU開発ツールでいうところのbinutilsみたいなのは
ハードごとに用意しないといけない

それすら満足に作らないまま大風呂敷だけ広げてるから
馬鹿にされるんだって

173 名前:デフォルトの名無しさん mailto:sage [2009/09/17(木) 01:35:08 ]
はあ?

174 名前:デフォルトの名無しさん mailto:sage [2009/09/17(木) 01:41:05 ]
はぁ・・・

175 名前:デフォルトの名無しさん mailto:sage [2009/09/18(金) 00:20:38 ]
はぁ…っ

176 名前:デフォルトの名無しさん mailto:sage [2009/09/19(土) 00:31:25 ]
物分りが悪すぎるぞ
お前のパソコンでLLVMが動くのはLLVMにx86のコードジェネレータが組み込まれてるからであって
コードジェネレータが用意されてなければ動かしようが無い。

コードジェネレータが用意されて無いなら、0からでもそれを作らないと話にならんのよ。
AMDは用意して無い。
だからGPUで動かない。
当然の話だ。


177 名前:デフォルトの名無しさん mailto:sage [2009/09/19(土) 00:39:22 ]
してないの?
Q3中にGPU対応バージョン公開
Q4に正式版公開と公言しているのに。



178 名前:デフォルトの名無しさん mailto:sage [2009/09/19(土) 03:27:54 ]
当然もなにも、当たり前過ぎて。

179 名前:デフォルトの名無しさん mailto:sage [2009/09/19(土) 09:38:17 ]
この馬鹿は俺らを笑い殺すつもりか?

180 名前:デフォルトの名無しさん mailto:sage [2009/09/23(水) 08:36:49 ]
つまりベンダーは OpenCL ランタイムが載ったドライバ開発を急げと?

181 名前:デフォルトの名無しさん mailto:sage [2009/09/24(木) 12:51:14 ]
GPUメーカーに作らせたものなど性能を良く見せるためにCPUが遅くなるように細工してるに決まってるだろ

182 名前:デフォルトの名無しさん mailto:sage [2009/09/24(木) 17:48:12 ]
細工っていうか手を抜く

183 名前:デフォルトの名無しさん mailto:sage [2009/09/25(金) 10:43:31 ]
Khronos groupのOpenCL公式フォーラム
www.khronos.org/message_boards/viewforum.php?f=28

184 名前:デフォルトの名無しさん [2009/09/29(火) 21:30:53 ]
OpenCL Download Page
developer.nvidia.com/object/opencl-download.htm

185 名前:デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:02:32 ]
>>184
CUDAより数倍遅いんだけど

186 名前:デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:03:22 ]
俺に言われてもしらんがな

187 名前:デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:05:19 ]
と思ったがN-Bodyのパーティクル数が違っただけだった



188 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 01:07:29 ]
SDKぶっこんでみたら、DirectCompute用も入ってた

189 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 06:28:55 ]
今OpenCLに対応してるのはヌビディアだけか

190 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 07:41:20 ]
まあいつも通りの事だ
AMDは毎回ポーズだけ

191 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 12:47:44 ]
openclって標準化されてるとはいうけど
NVIDIAでコンパイルしたバイナリをCPUやATIで動かせるようになるんかな?
それぞれ別々にバイナリを作って配布することになるんかな?

192 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 13:41:09 ]
>>191
デバイス毎に定数を調整するとか実装を調整するとか必要になる希ガス。
なので、仮に一つのバイナリだとしても中身は別物になりそう。

193 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 20:31:44 ]
>>191
だから無理だって

194 名前:デフォルトの名無しさん mailto:sage [2009/09/30(水) 23:24:46 ]
>>191
バイナリファイルにコンパイルできるのか
ずっとHLSLみたいに実行時コンパイルだと思っていた

195 名前:デフォルトの名無しさん mailto:sage [2009/10/01(木) 00:23:16 ]
>>194
どうもそうらしい


196 名前:デフォルトの名無しさん mailto:sage [2009/10/01(木) 01:06:26 ]
バイナリ状態でロードして実行も出来るし、実行環境で実行直前にコンパイルすることもできるよ。

197 名前:デフォルトの名無しさん mailto:sage [2009/10/01(木) 10:06:41 ]
>>196
そのバイナリってのは中間コードみたいなものなの?
それともハードウェア依存の完全なバイナリなの?



198 名前:デフォルトの名無しさん mailto:sage [2009/10/01(木) 21:15:46 ]
EarFluid: Experimental QC OpenCL iTunes visualizer
ttp://www.mutantquartz.com/?p=40

199 名前:デフォルトの名無しさん mailto:sage [2009/10/01(木) 23:39:11 ]
>>197
バイナリはハード依存でしょ。
Nvidiaが内部的に中間コード使ってるらしい?
でも当然AMDと互換性はない。

200 名前:デフォルトの名無しさん mailto:sage [2009/10/02(金) 10:33:36 ]
CUDAとOpenCL、言語によってパフォーマンスに差は出ますか?


201 名前:デフォルトの名無しさん mailto:sage [2009/10/02(金) 19:20:28 ]
>>200
現状OpenCLが桁違いに遅い。。。

202 名前:デフォルトの名無しさん mailto:sage [2009/10/02(金) 21:15:18 ]
>>199
llvmの中間コードを使っているのであれば
ポータブルではない。


203 名前:デフォルトの名無しさん mailto:sage [2009/10/03(土) 00:38:14 ]
>>200
最終的には同じになる、ってOpenCLプログラミングセミナーでnvidiaの偉い人が言ってた。


204 名前:デフォルトの名無しさん mailto:sage [2009/10/03(土) 02:31:57 ]
NVIDIAのOpenCLドライバ使ってるんだけど、カーネル実行って同期処理になってない??
キューに入れてから戻るまで時間がかかりすぎで、マルチタスク的な動作が出来ないんですが。。。

>>203曰く、ちゃんと対応されるのかな?
それとも、俺がOpenCLの仕様を読み間違えてるだけ?(汗

205 名前:デフォルトの名無しさん mailto:sage [2009/10/03(土) 13:40:35 ]
>>198
GeForce9400だと5fpsくらいしか出ないけど面白いね
CPU負荷が全く上がらない

206 名前:デフォルトの名無しさん [2009/10/06(火) 11:00:59 ]
OpenCLはサザビーでも使えるの?

207 名前:デフォルトの名無しさん mailto:sage [2009/10/06(火) 11:25:46 ]
エゴだよそれは



208 名前:デフォルトの名無しさん mailto:sage [2009/10/08(木) 03:02:00 ]
>>204
内部でCUDAを使ってるだけだろうし原理としてはそうなる
基本的に同期処理が原則
だからカーネル実行は細分化してやらないとだめ
画像を処理するなら1行処理する関数をカーネル化してCPU側でループするみたいな
やりかたじゃないとだめ

209 名前:デフォルトの名無しさん [2009/10/10(土) 03:43:44 ]
SDK 2.3b released
OpenCL Download Page
ttp://developer.nvidia.com/object/opencl-download.html


210 名前:デフォルトの名無しさん mailto:sage [2009/10/10(土) 06:42:05 ]
そのうちオライリーが一冊本を書くんじゃなかろうか
日本語翻訳版が出るかどうかは知らないけど

211 名前:デフォルトの名無しさん mailto:sage [2009/10/10(土) 11:48:34 ]
CUDAとATI Stream SDKとOpenCLの関係がいまいち分からんけど、
OpenCLの中のオプションとしてCUDAとかATI Stream SDKとか位置づけされるってことなのかな。

今CUDA用に記述してあるソースコードも、OpenCL用にちょこっと書き換えればAMDのGPUでも、
他のOpenCLに対応したGPGPUでも動作するってこと?

212 名前:デフォルトの名無しさん mailto:sage [2009/10/11(日) 03:22:25 ]
>>208
いやいや、CUDAの動作はそれであってるのけど、それはOpenCLの仕様違反だろ?
それに画像処理するならカーネルループとかあり得ないし。カーネル実行のオーバーヘッドの事を理解していないとしか思えないな。

213 名前:デフォルトの名無しさん mailto:sage [2009/10/11(日) 10:06:30 ]
OpenCL Tutorial - Shared Memory Kernel Optimization
www.macresearch.org/opencl_episode6
OpenCL Tutorials
www.macresearch.org/opencl
OpenCL Programming Guide for Mac OS X
developer.apple.com/mac/library/documentation/Performance/Conceptual/OpenCL_MacProgGuide/Introduction/Introduction.html

214 名前:デフォルトの名無しさん mailto:sage [2009/10/11(日) 18:47:07 ]
>>212
物理的にGPUがマルチタスクに対応してないんだからどうしようもないな
オーバーヘッドも含めてGPU処理の性能の限界が現時点でそうなんだからしょうがない

215 名前:デフォルトの名無しさん mailto:sage [2009/10/19(月) 21:09:31 ]
>>213
思ったんだけど、もろにNVIDIA寄りの内容だよね

216 名前:デフォルトの名無しさん mailto:sage [2009/10/19(月) 21:58:59 ]
2009 LLVM Developers' Meeting
llvm.org/devmtg/2009-10/
↑OpenCLなどApple社員系の情報が非公開なのは残念だが参考に。

llvm.org/docs/ReleaseNotes-2.6.html

217 名前:デフォルトの名無しさん mailto:sage [2009/10/22(木) 01:41:00 ]
>>211
違う。

C と C++ と Java みたいなモンで3つとも同じように
CPU 上で動くが各言語間でソースコードの互換性は……だろ?

CUDA は like C、ATI Stream は Book+、OpenCL は OpenCL C という別言語になる。
プログラマは自分の開発環境などに合わせた好きな言語が選べるってだけだ。



218 名前:デフォルトの名無しさん mailto:sage [2009/10/22(木) 12:21:11 ]
新iMacのGPUがRadeonなんだが、OpenCLの対応はどうなの?
SDKあるんだっけ?


219 名前:デフォルトの名無しさん mailto:sage [2009/10/29(木) 23:09:47 ]
なんか在庫買いあさったらしいからこれから最適化進めてくるんじゃない

220 名前:デフォルトの名無しさん mailto:sage [2009/10/31(土) 11:17:42 ]
誰かこの前、秋葉原で開催されたOpenCLセミナー行った人いる?
いたら、簡単な感想聞きたいです。

221 名前:デフォルトの名無しさん mailto:sage [2009/11/01(日) 01:05:25 ]
>>220
いったよ
・nVIDIAの人「Fermiアーキテクチャは凄いぞ!」まぁ凄いけどさ。
・FIXSTARSの人のプログラミング入門は参考になったけどあの内容だけだと即書くのはキツイ。
 最後には「ちゃんとやりたい人向けに終日の有料教室やってるよ!」だったしw
・Appleの話はOpenCLじゃなくて殆どCocoaの話…
・Dellは殆ど営業トーク

内容的にはそんなに深くなかったかなー…って感じ。

222 名前:デフォルトの名無しさん [2009/11/03(火) 04:42:31 ]
オープンクルとオープングルって何か共通点はあるの?

223 名前:デフォルトの名無しさん mailto:sage [2009/11/03(火) 08:17:17 ]
釣られないぞとつぶやいたそこのあなた。
既に釣られてますよ。

224 名前:デフォルトの名無しさん mailto:sage [2009/11/05(木) 12:25:52 ]
OpenCLはCPUのSIMD命令を置き換えられるようなものになるといいな
そのうちCPUにGPUも統合するんだからさ

225 名前:デフォルトの名無しさん mailto:sage [2009/11/05(木) 19:47:54 ]
バイナリが環境依存なのがなあ。
CUDAみたいに、中間コードがあればいいのに。

226 名前:デフォルトの名無しさん mailto:sage [2009/11/05(木) 19:57:30 ]
>>220
基本は221の通りだが、フィックスターズの人が1月に本来出すとか言ってた

227 名前:デフォルトの名無しさん mailto:sage [2009/11/23(月) 18:23:10 ]
ttp://www.alphaworks.ibm.com/tech/opencl



228 名前:デフォルトの名無しさん mailto:sage [2009/11/23(月) 18:28:39 ]
POWER6とcellもopenCLに対応

229 名前:デフォルトの名無しさん mailto:sage [2009/11/23(月) 19:06:30 ]
いろいろ対応してくれるのはいいけど、カーネル・ソースが第三者に丸見えなのは何とかならないの?

230 名前:デフォルトの名無しさん mailto:sage [2009/11/23(月) 23:57:57 ]
暗号化すればいいじゃない

231 名前:デフォルトの名無しさん mailto:sage [2009/11/24(火) 05:03:17 ]
見られて困るほど複雑なアルゴリズムはカーネルだけじゃ作れないから大丈夫だw

232 名前:デフォルトの名無しさん mailto:sage [2009/11/27(金) 22:27:11 ]
ATI Streamを落としてきたけどマニュアルないのな。
KronosにはCのはあるけどC++のはないね。
せっかくStreamにC++のサンプルがあって便利そうなのに。

233 名前:デフォルトの名無しさん mailto:sage [2009/11/27(金) 23:31:48 ]
とりあえず今持ってるコードを

FORTRAN→C→OpenCL C

って感じで進めてみるかなー


234 名前:デフォルトの名無しさん mailto:sage [2009/11/27(金) 23:35:20 ]
独り言は壁に向かってしてくれ

235 名前:デフォルトの名無しさん mailto:sage [2009/11/28(土) 17:26:06 ]
(´・ω・`)ショボーン

236 名前:デフォルトの名無しさん mailto:sage [2009/12/05(土) 23:25:28 ]
最初の世代のLarrabeeは一般には降りてずにHPC専業でいくようだ
たのしみにしてたのに(´・ω・`)

237 名前:デフォルトの名無しさん mailto:sage [2009/12/13(日) 19:17:07 ]
S3のGPUでOpenCL開発するためのSDKってどこ?



238 名前:デフォルトの名無しさん mailto:sage [2009/12/17(木) 16:18:02 ]
質問です

OpenCLを使ったプログラムのバイナリはRadeonでもGeForceでも使えますか?

239 名前:デフォルトの名無しさん mailto:sage [2009/12/17(木) 17:35:20 ]
まずは実際にやる事だ

240 名前:デフォルトの名無しさん mailto:sage [2009/12/18(金) 00:39:28 ]
ソースでも中間コードでもない、ただのバイナリをなんだと思っているんだ

241 名前:デフォルトの名無しさん mailto:sage [2009/12/23(水) 20:27:30 ]
フィックスターズから本出るよ
www.amazon.co.jp/dp/484432814X

242 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/12/23(水) 20:55:25 ]
三木聡しゃちょはんて何処担当してるの?

243 名前:デフォルトの名無しさん mailto:sage [2009/12/24(木) 20:20:23 ]
>>241
>著者からのコメント
>"The free lunch is over."

そんなこといわれてもな・・・

244 名前:デフォルトの名無しさん mailto:sage [2009/12/26(土) 01:03:24 ]
>>238
ソースレベルの互換性しかないので、バイナリは非互換。
ただしランタイムにカーネルのソースをコンパイル出来るので、恰もバイナリ互換があるかのようにコーディング出来る。
とはいえ、そうするとCELLみたいに特殊な構造だとパフォーマンスを発揮するようにコードを書くのがたいへんだろうけど。

245 名前:デフォルトの名無しさん mailto:sage [2009/12/26(土) 13:46:36 ]
Radeonの4650で遊んだ感じでいうとCellのが楽だな

246 名前:デフォルトの名無しさん mailto:sage [2009/12/28(月) 09:34:55 ]
>>242
そこには触れてやるな。みんなおかしいとは思っているがしゃちょーには逆らえない

247 名前:デフォルトの名無しさん mailto:sage [2009/12/28(月) 19:37:20 ]
>>245
techreport.com/discussions.x/18201



248 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2009/12/30(水) 03:30:14 ]
今年(来年?)はプログラミングコンテスト開かないの?


249 名前:デフォルトの名無しさん mailto:sage [2010/01/01(金) 10:53:23 ]
うっせー糞して寝ろ

250 名前:デフォルトの名無しさん mailto:sage [2010/01/05(火) 20:45:23 ]
どっちかっていうと、OpenGL内部のメモリ内容を直接書き換えれるのが大きいな。
描画内容に変更加えて再描画とか、データの高速可視化とか。

個人的にCPUに付加かけずにリアルタイム可視化ができるのがいいな。

251 名前:デフォルトの名無しさん mailto:sage [2010/01/18(月) 19:22:26 ]
OpenCL並列プログラミングって本が25日に出るみたい。

252 名前:デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:04:56 ]
しってるしってる、と思ったらフィクスターズのやつとは別か
ソースキボンヌ

253 名前:デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:14:14 ]
>>252
今日の日経の朝刊1面下の広告

254 名前:デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:18:22 ]
出版社:カットシステム
著者:池田成樹
www.cutt.co.jp

255 名前:デフォルトの名無しさん [2010/01/18(月) 22:19:55 ]
JAL株5円まで来たか
いよいよ明日はクライマックス

256 名前:デフォルトの名無しさん mailto:sage [2010/01/18(月) 23:48:45 ]
うっせー糞して寝ろ

257 名前:デフォルトの名無しさん mailto:sage [2010/01/19(火) 00:15:14 ]
便秘で出ないっす



258 名前:デフォルトの名無しさん mailto:sage [2010/01/19(火) 20:00:15 ]
ケツに目薬をさすと便秘が治るという噂を聞いたことがある

259 名前:デフォルトの名無しさん mailto:sage [2010/01/21(木) 15:08:18 ]
最近GPGPUを始めようと調べ始めたのですが、
cudaとCLの違いって、CUDAはCPU部分もカーネル部分も混在したプログラムを書いてnvccが両者を分離してくれる、
CLはプログラマ自身が最初からCPU用とカーネル用とを分けてプログラムを書く
という認識でよいですか。

カーネルとかグローバルメモリとかの概念はほぼ一緒と考えてよいのでしょうか。
CLの方が拡張言語っぽくないのと共通規格な分気持ちがいいですが、カーネルのコンパイルとか引数設定を明示的にしないといけない分どんくさい感じですね。







[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<53KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef