OpenCLプログラミング#1

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2ch.scのread.cgiへ]
Update time : 09/30 15:14 / Filesize : 179 KB / Number-of Response : 910
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

OpenCLプログラミング#1

1 名前：a36 ◆K0BqlCB3.k [2008/12/10(水) 15:38:25 .net]: さてついにOpenCLの仕様が公開されました。

www.khronos.org/opencl/

公式ページにはAPIのヘッダファイルが公開されており、
まだ実際に動かす事はできないもののプログラミングすることは可能となっています。
ということで、公開に先んじてプログラミングを始めてしまいましょう。
46 名前：デフォルトの名無しさん mailto:sage [2009/02/15(日) 23:06:31 .net]: >>45
あうごめんｗでも答えちゃうよ？

Mac OS X Snow Leopardに実装されるのがOpenCLで、
Windows7/vistaに実装されるのがDirectX Compute Shader。
どちらのGPGPU技術もまあ競合するものだわさ。

スマートフォンへの実装は別にして、DirectX系技術はWindows限定だし、
OpenCLにはオープンな技術というメリットがある。ただし、Windowsが市場を
ほぼ独占してるPC業界にとって、有力なのはやはりDirectX Compute Shader
の方になる。だから当面、OpenCLの主要プラットフォームがとりあえず
Macなのは致し方ない現実、という考え方じゃないのかな？

もちろんマルチプラットフォーム化を重視して、Windows環境下でも
OpenCLを採用する企業も当然存在するとは思うけど。
47 名前：デフォルトの名無しさん mailto:sage [2009/02/15(日) 23:13:48 .net]: >>46
お前の意見なんてどうでもいい
マジで黙ってろクソ野郎
48 名前：デフォルトの名無しさん mailto:sage [2009/02/15(日) 23:18:30 .net]: >>47
あうごめんｗでも答えちゃったよ？
49 名前：デフォルトの名無しさん mailto:sage [2009/02/16(月) 18:57:22 .net]: で、まだかね？
50 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 11:40:11 .net]: マルチコア動作版くらいそろそろ出せよ　ｶﾞｵｰ
51 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 11:44:25 .net]: てかDirectXは独自に実装するみたいだが
MSは意地でも標準化を妨害したいらしいｗ
52 名前：デフォルトの名無しさん mailto:sage [2009/02/17(火) 12:35:14 .net]: 妨害つーか、OpenCLはOpenGLとは連携するが
Direct3Dとは連携しないので、MSが自前で作るしかない。
53 名前：デフォルトの名無しさん mailto:sage [2009/02/21(土) 19:01:40 .net]: MSはどっちかっていうとマルチCore CPUをグラフィックに活かそうとしているよね。
逆。
54 名前：デフォルトの名無しさん mailto:sage [2009/02/21(土) 19:03:43 .net]: >>52
MSはCompute Shaderを準備中。
55 名前：デフォルトの名無しさん mailto:sage [2009/02/26(木) 00:45:30 .net]: 言語はC99ベースだからいいかと思ったけど、再帰が使えないのは痛いな。
Cで書いてコンパイルしたバイナリと、OpenCLで書いてコンパイルしたバイナリを
リンクできればいいな。
56 名前：デフォルトの名無しさん mailto:sage [2009/02/26(木) 11:20:43 .net]: .objが中間コード的なものだったら出来たかもね。
57 名前：デフォルトの名無しさん mailto:sage [2009/02/28(土) 03:39:12 .net]: 再帰なんていらね
58 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 08:17:35 .net]: 並列化しやすい問題で結構使うぞ、再帰探索は
こっち方面はIntelに期待するしかないかもね
59 名前：デフォルトの名無しさん mailto:sage [2009/04/02(木) 23:41:47 .net]: 時間とメモリの使用量が不定になるからねぇ。
OpenCLの主戦場を考えるとどうなんでしょうか。
60 名前：デフォルトの名無しさん mailto:sage [2009/04/03(金) 01:52:09 .net]: 再帰するようなアルゴリズムの場合、命令ポインタの動きに一意性がないし
決してデータレベル並列ではないんだよな。
SIMDでは命令ポインタが要素ごとに独立、というわけにはいかない。
プレディケートをやるのは逆に言うと自由に分岐ができないことの現れだし。
61 名前：デフォルトの名無しさん mailto:sage [2009/04/11(土) 13:13:33 .net]: ほしゅ
62 名前：デフォルトの名無しさん mailto:sage [2009/05/03(日) 23:04:11 .net]: まだ？
63 名前：デフォルトの名無しさん mailto:sage [2009/06/14(日) 18:31:47 .net]: >>55
残念だが OpenCL C は Java や .NET のような中間コードで
OS 上のドライバがリアルタイム翻訳するからリンクは無理。

だが OpenCL を利用する本体は何でもいいから
C や C++、Objective-C なんかで再帰検索すればいい。
64 名前：デフォルトの名無しさん [2009/06/20(土) 18:47:32 .net]: 企画書ってどこで読めるの？
65 名前：デフォルトの名無しさん mailto:sage [2009/06/20(土) 20:41:46 .net]: >>64
OpenCL 1.0 仕様書
ttp://www.khronos.org/registry/cl/specs/opencl-1.0.43.pdf
66 名前：デフォルトの名無しさん mailto:sage [2009/06/21(日) 04:07:00 .net]: Appleが用意したOpenCLの技術解説のpdfのリンク貼っとく
images.apple.com/macosx/technology/docs/OpenCL_TB_brief_20090608.pdf
67 名前：デフォルトの名無しさん mailto:sage [2009/06/29(月) 13:32:04 .net]: OpenCLのCPU動作版って公式で作るのか？
それとも誰か作ってる人が居る？
68 名前：デフォルトの名無しさん mailto:sage [2009/06/30(火) 20:18:36 .net]: Intel か Apple が CPU 用 OpenCL ドライバを作成すれば問題ない。

Windows や Linux の他社 OS や
AMD などの他社 CPU などで動作するドライバは
やっぱり公式待ちかな。

個人で Java VM や GPU Direct3D/OpenGL ドライバを
作ってしまえる人が興味を持ってくれたら話は別だけど。
69 名前：デフォルトの名無しさん mailto:sage [2009/06/30(火) 20:23:54 .net]: スノレパにはCPU用ドライバが付いてくるでしょ

GPUよりも数十倍から100倍以上は処理が遅いCPUで
Open CLを動かす価値が有るかはわからないけれど
70 名前：デフォルトの名無しさん mailto:sage [2009/06/30(火) 20:34:15 .net]: >GPUよりも数十倍から100倍以上は処理が遅いCPU
という夢を見ている
71 名前：デフォルトの名無しさん mailto:sage [2009/06/30(火) 20:46:55 .net]: Core 2 Quad QX9775： 102.4 GFLOPS
Radeon HD4870：1.2 TFLOPS（1200 GFLOPS）

一桁余分だな。
72 名前：デフォルトの名無しさん mailto:sage [2009/06/30(火) 23:19:38 .net]: このスレで言うのもなんだが並列処理って知ってる？
73 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 00:44:41 .net]: CPU と GPU を並列に走らせて 10 が 11 になるよりも、
その１をUIやGPUが苦手な処理を与えたほうがいいんじゃね？

マルチタスク（プロセス）的にも CPU は空けておきたいかも
74 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 02:58:17 .net]: CPUよりGPUのが早いってことになってるけど
それは実は大嘘でちゃんとマルチコアで作りこんだらスピードは大差ない
GPUメーカー製のドライバはCPUでも動くような振りだけは実装するだろうけど
絶対にまともな実装はしない、ばれるから
だからちゃんとしたCPUメーカーか第三者が作ったものが必要
75 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 03:05:43 .net]: >>71
それは理論的な演算速度だけだとそうだけど
メインメモリからデータを取り出して結果を戻すのに要する時間で計算すると
遥かにCPUの方が早い
76 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 06:44:02 .net]: 結局ワークロード次第なのだがGPUが明らかに速い分野なんて非常に限定的で馬鹿にされまくっているのが実情
GPGPUは過去のEPICと被るな
77 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 11:17:39 .net]: >>74
なんでGPUメーカーがCPU用ドライバを作るんだよ。
DirectXですらCPU用ドライバはＭＳが作ってるんだぜ？

>>75
特定分野に関してならメモリアクセスは速いでしょ。
じゃないと3Dレンダリングが使い物にならないものになる。

結局プログラマがどれだけ局所化を行えるかだろうね
78 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 14:42:50 .net]: >>77
３Dは転送する情報量は頂点座標だけなんだからCPUより早いのは当たり前でしょ
CPUのネックはメモリ転送速度だって言ってるでしょ
大量のデータを計算するような用途ではどんな工夫をしようがCPUには勝てない
79 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 14:45:50 .net]: しかも分散処理する部分は複雑に作りこんでないから
計算してる間は描画が止まるからな
計算してる間は文句なしに画面描画が止まる
CPUだと計算負荷に応じて外も動くけど
80 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 14:51:59 .net]: >>78
だからそのCPUでは勝てない分野でGPUを有効活用しようっていうのがGPGPUでしょ

映像のエンコードしかり、ゲノムの解析しかり超大量のデータ処理を肩代わりしたり、
またはAIなどの人工知能やMSのProject Natalみたいなものを実現するため、とか
81 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 14:57:20 .net]: >>79
だからGPUの仮想化とかマルチタスク処理とかがあるんでしょう

3Dゲームとかでもない限り 1/60 秒毎に画面描画を
挟むのはたいした負荷でもないレベルだし。

GPUでは小回りが利かない部分を管理するのがCPUの得意分野
82 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 17:58:11 .net]: >>80
だから今の構造だとCPUでは勝てない分野が３Dポリゴンの描画しかないのｗ
83 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 17:59:09 .net]: >>81
>>GPUでは小回りが利かない部分を管理するのがCPUの得意分野

現状と何も変わらない
84 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:03:26 .net]: 本来ならGPUの機能はCPU内部にあるべきだが、
IBMやINTELはサーバとか大規模計算方面ばかり気にして3Dとかグラフィックとかを軽視していたから、
見るに見かねた人がGPUなんてものを作ったんだよね。
85 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:04:59 .net]: GPUって、本質的に見たらやってることはCPUと変わらないのに、
CPUとバスを経由して通信している分無駄があるんだよね。
だから将来的にGPUはCPUに飲み込まれるのが健全だと思うね。
86 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:11:33 .net]: 行列積とか倍精度でもGPUの方が速いだろ。
87 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:23:10 .net]: >>86
そういう処理をするCPUの命令の一つにしてしまえば良い。
88 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:44:55 .net]: >>86
だから計算対象のデータをGPU側に引き渡してる間にCPUで計算出来るっつー話だわな
89 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 18:47:34 .net]: >>88
いや、まぁ実際にそういうことが多いわけだけど、俺が言いたいのそうじゃなくて、
GPUをCPUに統合するのが健全だと言っているだけであって・・
夢見がちな俺の願望でしかないわけだが。
90 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 21:55:32 .net]: >>89
今その方向に向かっているな。
AMD
91 名前：そのためにATIを買ったんだし、GPU専業のNvidiaは焦っている。 []: [ここ壊れてます]
92 名前：デフォルトの名無しさん mailto:sage [2009/07/01(水) 22:00:36 .net]: ハードだけ買ってもOpenCLはじめソフトがｇｄｇｄ
このままだとIntel最強ってゆー何時もの結論で終了する
93 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 01:07:12 .net]: マカーとして言わせてもらえばQuickTimeとAdobe CSくらいが対応してくれれば対応アプリとしては十分な気がするんだよな
OpenCLが一番活用できそうなのって結局画像動画関連だし
それにCoreImageやCoreVideoがCPUでも動いたようにOpenCLもCPU上で動かせるから未来がどっちに転んでも技術としては問題ないと思う
94 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 01:20:12 .net]: 夜のお供に漫画ビューアにもな。
95 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 10:11:18 .net]: 画像ビューアはCPUで処理したほうが速いだろ

>>89
Intel Larrabee というGPUは Pentium MMX というCPUに
GPU用のベクタプロセッサを沢山積んだモノになるよ。

で、そこで培った技術で後々 CPU 命令に GPU 命令が内蔵される。

>>92
Adobe CS4 はすでに CUDA や ATI Stream に対応しているから
下位互換でしかない OpenCL に対応する意味は余り無い。
96 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 12:51:12 .net]: DCのデモでも、CPUより早く動かすの苦労してたよ。
データ数が半端無く多くないとCPUを上回れない。
97 名前：デフォルトの名無しさん [2009/07/02(木) 12:56:37 .net]: 茸の左をひょいひょい躱した粟生と
リナレスの鬼速ジャブ…

この対決は興味深いぜ
98 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 16:12:28 .net]: CPUとは別に画像処理などに有用なコプロセッサが１つ
PCやMacで眠っているからそれも使おうって方向でいい。
99 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 19:12:15 .net]: 昔はコプロって別売りだったな。
100 名前：デフォルトの名無しさん mailto:sage [2009/07/02(木) 20:12:40 .net]: GPUの得意分野は浮動小数点数のベクタ演算だからなおさらコプロちっく
101 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/07/02(木) 20:52:46 .net]: Larrabeeって次世代の8087って位置づけなんだろうな
102 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 02:14:02 .net]: 数年後にはCPUに統合されるのがわかりきっているけどな
103 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 02:15:26 .net]: そのさらに数年後には独立されるだろう
104 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 02:58:35 .net]: CPUだけじゃ最先端3Dレンダリングを処理しきれないｗって理由で、か
105 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 04:19:19 .net]: 画期的なメモリバス技術でも開発されれば統合プロセッサのまま進化を続けるんじゃないかな
106 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 06:38:34 .net]: ワイドテレビでこんなに広く！→縦が伸びてこんなに広く！→ワイドになって（ｒｙ
107 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 22:50:21 .net]: CPUはある意味CELLの行く道が正しかったのか？
108 名前：デフォルトの名無しさん mailto:sage [2009/07/03(金) 22:56:22 .net]: >>105
ますます家が狭くなるがな
109 名前：デフォルトの名無しさん mailto:sage [2009/07/04(土) 15:37:52 .net]: OpenCL自体は普通にマルチスレッドのフレームワークに使えるから期待してるんだけど
出来ればクラスタリングとかにも対応して欲しいが
110 名前：デフォルトの名無しさん mailto:sage [2009/07/04(土) 17:43:55 .net]: OpenCL って Direct3D のシェーダ言語同様にドライバによる
インタプリタだと認識しているけど並列計算のフレームワークとして使えるの？

OpenMP や Grand Central Dispatch じゃダメなのだろうか
111 名前：デフォルトの名無しさん mailto:sage [2009/07/04(土) 18:47:02 .net]: 演算シェーダ相当の抽象化レイヤと考えて問題ないよ
汎用的な並列計算はOpenMPやGCDの方が適切。そのままマルチコアCPUをターゲットにした方がいい
OpenCL適用できる分野は「並列計算」の中のさらに「GPUに適した」特殊なアルゴリズム分野になる
とにかくデータを小さなブロックに小分けして、延々と同じ処理繰り返すようなの
112 名前：デフォルトの名無しさん mailto:sage [2009/07/04(土) 19:29:33 .net]: 標準化されてることに意味がある
113 名前：デフォルトの名無しさん mailto:sage [2009/08/06(木) 17:03:14 .net]: AMD、業界初のx86 CPU対応OpenCLソフト開発プラットフォームを無償提供
ttp://pc.watch.impress.co.jp/docs/news/20090806_307447.html

米AMDは5日(現地時間)、ATI Stream SDK v2.0 Beta Programの一環として、
新たに「OpenCL for CPU Beta」を無償で提供開始すると発表した。

x86 CPUに対応する業界初のOpenCLソフト開発プラットフォーム。
これを利用することにより、GPUとマルチコアCPUの両方を活用した並列プログラムの開発が容易になるという。

OpenCLは、Khronos Groupが提供するパラレルコンピューティング用オープンスタンダード。
同グループにはNVIDIA、Intel、Appleなども加盟している。
114 名前：デフォルトの名無しさん mailto:sage [2009/08/07(金) 13:07:44 .net]: やっと動きが
115 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 11:10:40 .net]: これRADONには対応しとらんのん？
116 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 11:13:29 .net]: ラドン…だと？新手の北朝鮮ミサイルか？
117 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 12:03:20 .net]: 恐竜だろ
118 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 15:02:36 .net]: 風呂かとおもった
119 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 19:53:25 .net]: サンプル動かしてもGPU全然関係ないな(´・ω・｀)
ATI StreamなのになんでCPUだけなんだよ
120 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 22:02:49 .net]: AMDの対応がまだなんじゃね。
121 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 23:16:43 .net]: ていうか Radeon の OpenCL ランタイムドライバが出来ていないとか？
122 名前：デフォルトの名無しさん mailto:sage [2009/08/11(火) 09:48:44 .net]: CPU対応は優先度が一番高いんだろう
GPUはチップ毎に対応しないといけないし

CPUとGPUの比較をしたり両方使って同時処理するのにも必要
123 名前：デフォルトの名無しさん mailto:sage [2009/08/15(土) 07:49:11 .net]: 俺予想
OpenCLが動くということはnVidiaと同じ土俵でパフォーマンスが比較できるようになる。
現行のRADEONだとOpenCLでパフォーマンスが出ない。
nVidiaと比較されるのがいやなので今はドライバを出さずに
次のGPU(OpenCL向け機能拡張入り)を出すタイミングでドライバを出す。
124 名前：デフォルトの名無しさん mailto:sage [2009/08/15(土) 19:05:49 .net]: >>122
萩原Obj-C(1.0のやつ)をみながらやっているもので。
Tiger使っているので2.0へはまだいけない。
125 名前：デフォルトの名無しさん mailto:sage [2009/08/15(土) 19:07:04 .net]: ごめん間違えた。
126 名前：デフォルトの名無しさん mailto:sage [2009/08/17(月) 10:37:46 .net]: >>122
DX11 Compute Shaderなら(機能は限定されるだろうけど)DX10以降のGPUで動くよ
127 名前：デフォルトの名無しさん mailto:sage [2009/08/18(火) 00:53:33 .net]: はやくCLとDX10こねーかなー
128 名前：デフォルトの名無しさん mailto:sage [2009/08/18(火) 00:54:40 .net]: 11だったどんだけｗｋｔｋして待ってるとおもってんだ
129 名前：デフォルトの名無しさん mailto:sage [2009/08/24(月) 13:36:00 .net]: pc.watch.impress.co.jp/docs/news/20090824_310402.html
先にDirectComputeの方がきちまった
130 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 01:30:39 .net]: AMD DX11 Cypress is Radeon HD 5870 & HD 5850
ttp://vr-zone.com/articles/-rumour-amd-dx11-cypress-is-radeon-hd-5870--hd-5850/7469.html?doc=7469

・1GB GDDR5 memory
・ATI Eyefinity technology with support for up to three displays
・ATI Stream technology,
・Designed for DirectCompute 5.0 and OpenCL
・Accelerated Video Transcoding (AVT)
・Compliant with DirectX 11 and earlier revisions
・Supports OpenGL 3.1
・ATI CrossFireX multi-GPU support for highly scalable performance6
・ATI Avivo HD video and display technology
・Dynamic power management with ATI PowerPlay? technology
・DL-DVI, DL-DVI, DisplayPort, HDMI
・PCI Express 2.0 support
131 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 07:51:29 .net]: AMDの場合、1月頃に出したGPUにも"OpenCL ready"ってスペック表にあったんだよな・・・（遠い目）
132 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 07:54:26 .net]: 実際出してもまともに動かないATI
133 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 11:24:47 .net]: Snow Leopard(10.6)が28日に出るらしいぞ。
技術仕様の中に
「OpenCL
以下のグラフィックカードまたはグラフィックプロセッサのうち、いずれかひとつが必要です。
# ATI Radeon 4850、Radeon 4870」
ってあったから、こっち優先して他のは後回しにされてんじゃね？
134 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 11:52:01 .net]: AMDのOpenCL入門記事「Introductory Tutorial to OpenCL」
ttp://developer.amd.com/gpu/ATIStreamSDK/pages/TutorialOpenCL.aspx
135 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 21:19:55 .net]: >>132
ないない。
ATIのMac版は常に後。再生支援すらまともじゃない笑えない現実がある。
136 名前：デフォルトの名無しさん mailto:sage [2009/08/25(火) 21:55:12 .net]: 再生支援とは別としてOpenCLは力を入れてくるんじゃないか
137 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 08:51:22 .net]: >>135
ATIのOpenCL対応GPUが>>132の二つだけということからも極めて怪しい。
138 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 23:19:23 .net]: ？よくわからんが後回しどころか4800シリーズの二つは既に対応してるんだよな？
139 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 00:17:44 .net]: 後一両日中には分かることさ
140 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 11:05:51 .net]: >>137
nVidiaに比べてしょぼしょぼ。

netkas.org/?p=164
>Radeond OpenCL support is very poor, only few of many apple’s opencl
>demo run on it
141 名前：デフォルトの名無しさん mailto:sage [2009/08/28(金) 20:25:46 .net]: だれかOSXで試してみたやつおる？
142 名前：デフォルトの名無しさん mailto:sage [2009/08/29(土) 07:02:33 .net]: OSXでOpenCL使っているアプリが無い
143 名前：デフォルトの名無しさん mailto:sage [2009/08/29(土) 08:49:38 .net]: ATIは宣伝文句ばっかりでやることはごみ
まさかこんな最新技術を扱うスレでRADEONなんて買ってる情弱はいないと思うが
144 名前：デフォルトの名無しさん mailto:sage [2009/08/29(土) 10:25:26 .net]: >>141
そっちは今からじゃね?
次のiLife系列で対応してきそうだし
145 名前：デフォルトの名無しさん mailto:sage [2009/08/29(土) 14:00:11 .net]: QTXがたいおうしていなかったっけ？
146 名前：デフォルトの名無しさん mailto:sage [2009/09/05(土) 03:48:17 .net]: 対応したところで現在のところ95%のMacに載ってるGPUは使い物にならない性能
Mac ProですらGT120 (9500GT相当) だからな
147 名前：デフォルトの名無しさん mailto:sage [2009/09/11(金) 08:23:44 .net]: >ATI StreamSDK 2.0 beta(Windows, CPU 利用)の
>OpenCL 実装だと、8 秒近くもかかってとてつもなく遅い！
>(SnowLeopard だと 0.0001 秒なのに…)
lucille.atso-net.jp/blog/?p=907

そもそもAMDの実装が糞という話が･･･
148 名前：デフォルトの名無しさん mailto:sage [2009/09/12(土) 22:51:30 .net]: >>146
世に出すってレベルじゃねーな。何かの間違いだとは思うが。
149 名前：デフォルトの名無しさん [2009/09/13(日) 02:25:23 .net]: つ AMD StreamSDK v.20 「ベータ」
150 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 10:34:43 .net]: 1.0すらβな件

αの間違いじゃねーのか？ｗ
151 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 14:21:31 .net]: γはまだ～？
152 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 18:38:32 .net]: >>146
OpenCLって単に実行ファイルを一つにできるというだけで
結局各社のCPUなりGPUなりの特性にあったコードを別々に書かなくちゃ性能出ないの？
153 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 22:39:40 .net]: うん
CPUでも性能出そうと思ったら、CPUごとに最適化しないと駄目だし、しょうがないんじゃね
154 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/13(日) 22:44:14 .net]: 曲がりなりにもC/C++が使えるCellがあんなことになってたりするけど
ハードウェアの特性の違いまでは言語・フレームワークで吸収できるものではありません。
OpenCLの実態も、まあお察し下さい。
155 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/13(日) 22:47:13 .net]: あと、Appleの実装はともかくAppleの力の及ばないWindowsやLinuxまで
NVIDIAとATIのOpenCLコードにバイナリレベルの互換性があるとは限らないぞ
OpenGLが各社独自拡張によってカオスなことになってるようにね。
156 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 22:51:24 .net]: OpenCLの互換性はソースレベルだろ。
それも最低限の仕様だけを使ったものなら
どれでも動くというレベル

ハードの特性を取得して、場合わけするなど
OpenGLとほぼ一緒
157 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 23:09:02 .net]: それじゃ結局各社が出してるGPGPU環境使ってそれぞれに開発した方が効率よくない・・・？
158 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 23:21:12 .net]: それでも同じコードで動くかどうかは重要だよ。
必ずしも全部を最適化する必要なんてないんだし。
159 名前：デフォルトの名無しさん mailto:sage [2009/09/13(日) 23:57:09 .net]: でもカーネルのソース読み込んでオンライン･ビルドってのがなー
この仕様だと製品版でOpenCL対応しましたーって会社でないんじゃないかな？？
160 名前：デフォルトの名無しさん mailto:sage [2009/09/14(月) 10:56:56 .net]: とりあえず標準仕様に合わせて書いておけば動くというのは心強いぞ。
現状Intelコンパイラの自動ベクトル化とか糞過ぎるから、今後こういうところで頑張らないと計算分野でGPUに水をあけられる可能性がある。
AMDは…お察し下さい。
161 名前：デフォルトの名無しさん mailto:sage [2009/09/14(月) 17:57:33 .net]: 将来のハードの進歩でって投げ技が使えていいんじゃないか？
162 名前：デフォルトの名無しさん mailto:sage [2009/09/14(月) 21:00:45 .net]: >>155
>ハードの特性を取得して、場合わけするなど
そういった特性とか最適化を担っているのがLLVM。

OpenCL→LLVM→
163 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/14(月) 21:30:32 .net]: LLVM（笑）

そりゃそんな物に頼ってるからGPUに対応できないわけだ

LLVMは魔法のソフトじゃない。
未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
ハード作った人間が対応投げてたら世話無いわ。
164 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:12:47 .net]: 何でもいいからWindowsで動く処理系きてくれー
165 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:33:45 .net]: 何でもいいなら半年ほど前からNVIDIAが出してる
166 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 00:52:23 .net]: >>162
> 未知のアーキテクチャに対応できるのはハードを知り尽くした人間だけだ。
> ハード作った人間が対応投げてたら世話無いわ。

あり得ない。コンパイラ技術を知らないアセンブラ人間？
167 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 01:14:34 .net]: 団子には何言っても主張を曲げないよ
無駄な煽りでスレが荒れるだけ、NG推奨
168 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 01:47:02 .net]: 両方とも言ってる事がおかしい
169 名前：デフォルトの名無しさん mailto:sage [2009/09/15(火) 03:56:13 .net]: OS X ハッキング! 335 ついに姿を現した「OpenCL」、その実力
journal.mycom.co.jp/column/osx/335/index.html
170 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/16(水) 00:55:52 .net]: >>165
コンパイラはどうやってコード吐くんですか？
どの命令とどの命令が並列実行出来るとかって情報は誰が持ってるんですか？

ああ、今時Javaでもx86のJITフレームワーク触れますよ
171 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/16(水) 01:03:34 .net]: オープンソースの力を借りるのはある程度動くものができてからの話よ。
CPUだととんでもなく遅いです、GPUだと動きません、じゃ、話にならないでしょ。
そもそもStream 1.0の正式版を出さないうちに2.0のβ（笑）をでっちあげる神経を疑う。

ハードだけ出してソフト丸投げでは、どっかのCell（笑）と同じじゃないの。
それより更に悪い。
172 名前：デフォルトの名無しさん mailto:sage [2009/09/16(水) 08:56:27 .net]: OpenCLもOSS化されたGrand Central Dispatch（Cへのブロック追加＋OSでの対応＋LLVM/Clang）も、
LLVM/Clangが鍵になってるけど、これは言語に対する低レベルなVMであって、
別にJavaなんかと同一視してVMだからどうこうと言っても理解できないかも。

因みにNvidiaもOpenCl実装にLLVM/Clangを利用してるし（今後その実装で続くのかは不明）、
GPU非依存化にはこういう仕組みは不可欠じゃね。
173 名前：デフォルトの名無しさん [2009/09/16(水) 11:02:06 .net]
174 名前：中間コードに落とし込むまではどうでもいいんだよ 実際にターゲットハードウェアで走るコード生成機 GNU開発ツールでいうところのbinutilsみたいなのは ハードごとに用意しないといけない それすら満足に作らないまま大風呂敷だけ広げてるから 馬鹿にされるんだって []: [ここ壊れてます]
175 名前：デフォルトの名無しさん mailto:sage [2009/09/17(木) 01:35:08 .net]: はあ？
176 名前：デフォルトの名無しさん mailto:sage [2009/09/17(木) 01:41:05 .net]: はぁ・・・
177 名前：デフォルトの名無しさん mailto:sage [2009/09/18(金) 00:20:38 .net]: はぁ…っ
178 名前：デフォルトの名無しさん mailto:sage [2009/09/19(土) 00:31:25 .net]: 物分りが悪すぎるぞ
お前のパソコンでLLVMが動くのはLLVMにx86のコードジェネレータが組み込まれてるからであって
コードジェネレータが用意されてなければ動かしようが無い。

コードジェネレータが用意されて無いなら、0からでもそれを作らないと話にならんのよ。
AMDは用意して無い。
だからGPUで動かない。
当然の話だ。
179 名前：デフォルトの名無しさん mailto:sage [2009/09/19(土) 00:39:22 .net]: してないの？
Q3中にGPU対応バージョン公開
Q4に正式版公開と公言しているのに。
180 名前：デフォルトの名無しさん mailto:sage [2009/09/19(土) 03:27:54 .net]: 当然もなにも、当たり前過ぎて。
181 名前：デフォルトの名無しさん mailto:sage [2009/09/19(土) 09:38:17 .net]: この馬鹿は俺らを笑い殺すつもりか？
182 名前：デフォルトの名無しさん mailto:sage [2009/09/23(水) 08:36:49 .net]: つまりベンダーは OpenCL ランタイムが載ったドライバ開発を急げと？
183 名前：デフォルトの名無しさん mailto:sage [2009/09/24(木) 12:51:14 .net]: GPUメーカーに作らせたものなど性能を良く見せるためにCPUが遅くなるように細工してるに決まってるだろ
184 名前：デフォルトの名無しさん mailto:sage [2009/09/24(木) 17:48:12 .net]: 細工っていうか手を抜く
185 名前：デフォルトの名無しさん mailto:sage [2009/09/25(金) 10:43:31 .net]: Khronos groupのOpenCL公式フォーラム
www.khronos.org/message_boards/viewforum.php?f=28
186 名前：デフォルトの名無しさん [2009/09/29(火) 21:30:53 .net]: OpenCL Download Page
developer.nvidia.com/object/opencl-download.htm
187 名前：デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:02:32 .net]: >>184
ＣＵＤＡより数倍遅いんだけど
188 名前：デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:03:22 .net]: 俺に言われてもしらんがな
189 名前：デフォルトの名無しさん mailto:sage [2009/09/29(火) 23:05:19 .net]: と思ったがＮ-Bodyのパーティクル数が違っただけだった
190 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 01:07:29 .net]: SDKぶっこんでみたら、DirectCompute用も入ってた
191 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 06:28:55 .net]: 今OpenCLに対応してるのはヌビディアだけか
192 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 07:41:20 .net]: まあいつも通りの事だ
AMDは毎回ポーズだけ
193 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 12:47:44 .net]: openclって標準化されてるとはいうけど
NVIDIAでコンパイルしたバイナリをCPUやATIで動かせるようになるんかな？
それぞれ別々にバイナリを作って配布することになるんかな？
194 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 13:41:09 .net]: >>191
デバイス毎に定数を調整するとか実装を調整するとか必要になる希ガス。
なので、仮に一つのバイナリだとしても中身は別物になりそう。
195 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 20:31:44 .net]: >>191
だから無理だって
196 名前：デフォルトの名無しさん mailto:sage [2009/09/30(水) 23:24:46 .net]: >>191
バイナリファイルにコンパイルできるのか
ずっとHLSLみたいに実行時コンパイルだと思っていた
197 名前：デフォルトの名無しさん mailto:sage [2009/10/01(木) 00:23:16 .net]: >>194
どうもそうらしい
198 名前：デフォルトの名無しさん mailto:sage [2009/10/01(木) 01:06:26 .net]: バイナリ状態でロードして実行も出来るし、実行環境で実行直前にコンパイルすることもできるよ。
199 名前：デフォルトの名無しさん mailto:sage [2009/10/01(木) 10:06:41 .net]: >>196
そのバイナリってのは中間コードみたいなものなの？
それともハードウェア依存の完全なバイナリなの？
200 名前：デフォルトの名無しさん mailto:sage [2009/10/01(木) 21:15:46 .net]: EarFluid: Experimental QC OpenCL iTunes visualizer
ttp://www.mutantquartz.com/?p=40
201 名前：デフォルトの名無しさん mailto:sage [2009/10/01(木) 23:39:11 .net]: >>197
バイナリはハード依存でしょ。
Nvidiaが内部的に中間コード使ってるらしい？
でも当然AMDと互換性はない。
202 名前：デフォルトの名無しさん mailto:sage [2009/10/02(金) 10:33:36 .net]: CUDAとOpenCL、言語によってパフォーマンスに差は出ますか？
203 名前：デフォルトの名無しさん mailto:sage [2009/10/02(金) 19:20:28 .net]: >>200
現状OpenCLが桁違いに遅い。。。
204 名前：デフォルトの名無しさん mailto:sage [2009/10/02(金) 21:15:18 .net]: >>199
llvmの中間コードを使っているのであれば
ポータブルではない。
205 名前：デフォルトの名無しさん mailto:sage [2009/10/03(土) 00:38:14 .net]: >>200
最終的には同じになる、ってOpenCLプログラミングセミナーでnvidiaの偉い人が言ってた。
206 名前：デフォルトの名無しさん mailto:sage [2009/10/03(土) 02:31:57 .net]: NVIDIAのOpenCLドライバ使ってるんだけど、カーネル実行って同期処理になってない？？
キューに入れてから戻るまで時間がかかりすぎで、マルチタスク的な動作が出来ないんですが。。。

>>203曰く、ちゃんと対応されるのかな？
それとも、俺がOpenCLの仕様を読み間違えてるだけ？（汗
207 名前：デフォルトの名無しさん mailto:sage [2009/10/03(土) 13:40:35 .net]: >>198
GeForce9400だと5fpsくらいしか出ないけど面白いね
CPU負荷が全く上がらない
208 名前：デフォルトの名無しさん [2009/10/06(火) 11:00:59 .net]: OpenCLはサザビーでも使えるの？
209 名前：デフォルトの名無しさん mailto:sage [2009/10/06(火) 11:25:46 .net]: エゴだよそれは
210 名前：デフォルトの名無しさん mailto:sage [2009/10/08(木) 03:02:00 .net]: >>204
内部でＣＵＤＡを使ってるだけだろうし原理としてはそうなる
基本的に同期処理が原則
だからカーネル実行は細分化してやらないとだめ
画像を処理するなら１行処理する関数をカーネル化してＣＰＵ側でループするみたいな
やりかたじゃないとだめ
211 名前：デフォルトの名無しさん [2009/10/10(土) 03:43:44 .net]: SDK 2.3b released
OpenCL Download Page
ttp://developer.nvidia.com/object/opencl-download.html
212 名前：デフォルトの名無しさん mailto:sage [2009/10/10(土) 06:42:05 .net]: そのうちオライリーが一冊本を書くんじゃなかろうか
日本語翻訳版が出るかどうかは知らないけど
213 名前：デフォルトの名無しさん mailto:sage [2009/10/10(土) 11:48:34 .net]: CUDAとATI Stream SDKとOpenCLの関係がいまいち分からんけど、
OpenCLの中のオプションとしてCUDAとかATI Stream SDKとか位置づけされるってことなのかな。

今CUDA用に記述してあるソースコードも、OpenCL用にちょこっと書き換えればAMDのGPUでも、
他のOpenCLに対応したGPGPUでも動作するってこと？
214 名前：デフォルトの名無しさん mailto:sage [2009/10/11(日) 03:22:25 .net]: >>208
いやいや、CUDAの動作はそれであってるのけど、それはOpenCLの仕様違反だろ？
それに画像処理するならカーネルループとかあり得ないし。カーネル実行のオーバーヘッドの事を理解していないとしか思えないな。
215 名前：デフォルトの名無しさん mailto:sage [2009/10/11(日) 10:06:30 .net]: OpenCL Tutorial - Shared Memory Kernel Optimization
www.macresearch.org/opencl_episode6
OpenCL Tutorials
www.macresearch.org/opencl
OpenCL Programming Guide for Mac OS X
developer.apple.com/mac/library/documentation/Performance/Conceptual/OpenCL_MacProgGuide/Introduction/Introduction.html
216 名前：デフォルトの名無しさん mailto:sage [2009/10/11(日) 18:47:07 .net]: >>212
物理的にＧＰＵがマルチタスクに対応してないんだからどうしようもないな
オーバーヘッドも含めてＧＰＵ処理の性能の限界が現時点でそうなんだからしょうがない
217 名前：デフォルトの名無しさん mailto:sage [2009/10/19(月) 21:09:31 .net]: >>213
思ったんだけど、もろにNVIDIA寄りの内容だよね
218 名前：デフォルトの名無しさん mailto:sage [2009/10/19(月) 21:58:59 .net]: 2009 LLVM Developers' Meeting
llvm.org/devmtg/2009-10/
↑OpenCLなどApple社員系の情報が非公開なのは残念だが参考に。

llvm.org/docs/ReleaseNotes-2.6.html
219 名前：デフォルトの名無しさん mailto:sage [2009/10/22(木) 01:41:00 .net]: >>211
違う。

C と C++ と Java みたいなモンで３つとも同じように
CPU 上で動くが各言語間でソースコードの互換性は……だろ？

CUDA は like C、ATI Stream は Book+、OpenCL は OpenCL C という別言語になる。
プログラマは自分の開発環境などに合わせた好きな言語が選べるってだけだ。
220 名前：デフォルトの名無しさん mailto:sage [2009/10/22(木) 12:21:11 .net]: 新iMacのGPUがRadeonなんだが、OpenCLの対応はどうなの？
SDKあるんだっけ？
221 名前：デフォルトの名無しさん mailto:sage [2009/10/29(木) 23:09:47 .net]: なんか在庫買いあさったらしいからこれから最適化進めてくるんじゃない
222 名前：デフォルトの名無しさん mailto:sage [2009/10/31(土) 11:17:42 .net]: 誰かこの前、秋葉原で開催されたOpenCLセミナー行った人いる？
いたら、簡単な感想聞きたいです。
223 名前：デフォルトの名無しさん mailto:sage [2009/11/01(日) 01:05:25 .net]: >>220
いったよ
・nVIDIAの人「Fermiアーキテクチャは凄いぞ！」まぁ凄いけどさ。
・FIXSTARSの人のプログラミング入門は参考になったけどあの内容だけだと即書くのはキツイ。
　最後には「ちゃんとやりたい人向けに終日の有料教室やってるよ！」だったしw
・Appleの話はOpenCLじゃなくて殆どCocoaの話…
・Dellは殆ど営業トーク

内容的にはそんなに深くなかったかなー…って感じ。
224 名前：デフォルトの名無しさん [2009/11/03(火) 04:42:31 .net]: オープンクルとオープングルって何か共通点はあるの？
225 名前：デフォルトの名無しさん mailto:sage [2009/11/03(火) 08:17:17 .net]: 釣られないぞとつぶやいたそこのあなた。
既に釣られてますよ。
226 名前：デフォルトの名無しさん mailto:sage [2009/11/05(木) 12:25:52 .net]: OpenCLはCPUのSIMD命令を置き換えられるようなものになるといいな
そのうちCPUにGPUも統合するんだからさ
227 名前：デフォルトの名無しさん mailto:sage [2009/11/05(木) 19:47:54 .net]: バイナリが環境依存なのがなあ。
CUDAみたいに、中間コードがあればいいのに。
228 名前：デフォルトの名無しさん mailto:sage [2009/11/05(木) 19:57:30 .net]: >>220
基本は221の通りだが、フィックスターズの人が1月に本来出すとか言ってた
229 名前：デフォルトの名無しさん mailto:sage [2009/11/23(月) 18:23:10 .net]: ttp://www.alphaworks.ibm.com/tech/opencl
230 名前：デフォルトの名無しさん mailto:sage [2009/11/23(月) 18:28:39 .net]: POWER6とcellもopenCLに対応
231 名前：デフォルトの名無しさん mailto:sage [2009/11/23(月) 19:06:30 .net]: いろいろ対応してくれるのはいいけど、カーネル・ソースが第三者に丸見えなのは何とかならないの？
232 名前：デフォルトの名無しさん mailto:sage [2009/11/23(月) 23:57:57 .net]: 暗号化すればいいじゃない
233 名前：デフォルトの名無しさん mailto:sage [2009/11/24(火) 05:03:17 .net]: 見られて困るほど複雑なアルゴリズムはカーネルだけじゃ作れないから大丈夫だｗ
234 名前：デフォルトの名無しさん mailto:sage [2009/11/27(金) 22:27:11 .net]: ATI Streamを落としてきたけどマニュアルないのな。
KronosにはCのはあるけどC++のはないね。
せっかくStreamにC++のサンプルがあって便利そうなのに。
235 名前：デフォルトの名無しさん mailto:sage [2009/11/27(金) 23:31:48 .net]: とりあえず今持ってるコードを

FORTRAN→C→OpenCL C

って感じで進めてみるかなー
236 名前：デフォルトの名無しさん mailto:sage [2009/11/27(金) 23:35:20 .net]: 独り言は壁に向かってしてくれ
237 名前：デフォルトの名無しさん mailto:sage [2009/11/28(土) 17:26:06 .net]: (´・ω・`)ショボーン
238 名前：デフォルトの名無しさん mailto:sage [2009/12/05(土) 23:25:28 .net]: 最初の世代のLarrabeeは一般には降りてずにHPC専業でいくようだ
たのしみにしてたのに(´・ω・`)
239 名前：デフォルトの名無しさん mailto:sage [2009/12/13(日) 19:17:07 .net]: S3のGPUでOpenCL開発するためのSDKってどこ？
240 名前：デフォルトの名無しさん mailto:sage [2009/12/17(木) 16:18:02 .net]: 質問です

OpenCLを使ったプログラムのバイナリはRadeonでもGeForceでも使えますか？
241 名前：デフォルトの名無しさん mailto:sage [2009/12/17(木) 17:35:20 .net]: まずは実際にやる事だ
242 名前：デフォルトの名無しさん mailto:sage [2009/12/18(金) 00:39:28 .net]: ソースでも中間コードでもない、ただのバイナリをなんだと思っているんだ
243 名前：デフォルトの名無しさん mailto:sage [2009/12/23(水) 20:27:30 .net]: フィックスターズから本出るよ
www.amazon.co.jp/dp/484432814X
244 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/12/23(水) 20:55:25 .net]: 三木聡しゃちょはんて何処担当してるの？
245 名前：デフォルトの名無しさん mailto:sage [2009/12/24(木) 20:20:23 .net]: >>241
>著者からのコメント
>"The free lunch is over."

そんなこといわれてもな・・・
246 名前：デフォルトの名無しさん mailto:sage [2009/12/26(土) 01:03:24 .net]: >>238
ソースレベルの互換性しかないので、バイナリは非互換。
ただしランタイムにカーネルのソースをコンパイル出来るので、恰もバイナリ互換があるかのようにコーディング出来る。
とはいえ、そうするとCELLみたいに特殊な構造だとパフォーマンスを発揮するようにコードを書くのがたいへんだろうけど。
247 名前：デフォルトの名無しさん mailto:sage [2009/12/26(土) 13:46:36 .net]: Radeonの4650で遊んだ感じでいうとCellのが楽だな
248 名前：デフォルトの名無しさん mailto:sage [2009/12/28(月) 09:34:55 .net]: >>242
そこには触れてやるな。みんなおかしいとは思っているがしゃちょーには逆らえない
249 名前：デフォルトの名無しさん mailto:sage [2009/12/28(月) 19:37:20 .net]: >>245
techreport.com/discussions.x/18201
250 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/12/30(水) 03:30:14 .net]: 今年（来年？）はプログラミングコンテスト開かないの？
251 名前：デフォルトの名無しさん mailto:sage [2010/01/01(金) 10:53:23 .net]: うっせー糞して寝ろ
252 名前：デフォルトの名無しさん mailto:sage [2010/01/05(火) 20:45:23 .net]: どっちかっていうと、OpenGL内部のメモリ内容を直接書き換えれるのが大きいな。
描画内容に変更加えて再描画とか、データの高速可視化とか。

個人的にCPUに付加かけずにリアルタイム可視化ができるのがいいな。
253 名前：デフォルトの名無しさん mailto:sage [2010/01/18(月) 19:22:26 .net]: OpenCL並列プログラミングって本が25日に出るみたい。
254 名前：デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:04:56 .net]: しってるしってる、と思ったらフィクスターズのやつとは別か
ソースｷﾎﾞﾝﾇ
255 名前：デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:14:14 .net]: >>252
今日の日経の朝刊1面下の広告
256 名前：デフォルトの名無しさん mailto:sage [2010/01/18(月) 22:18:22 .net]: 出版社：カットシステム
著者：池田成樹
www.cutt.co.jp
257 名前：デフォルトの名無しさん [2010/01/18(月) 22:19:55 .net]: JAL株5円まで来たか
いよいよ明日はクライマックス
258 名前：デフォルトの名無しさん mailto:sage [2010/01/18(月) 23:48:45 .net]: うっせー糞して寝ろ
259 名前：デフォルトの名無しさん mailto:sage [2010/01/19(火) 00:15:14 .net]: 便秘で出ないっす
260 名前：デフォルトの名無しさん mailto:sage [2010/01/19(火) 20:00:15 .net]: ケツに目薬をさすと便秘が治るという噂を聞いたことがある
261 名前：デフォルトの名無しさん mailto:sage [2010/01/21(木) 15:08:18 .net]: 最近GPGPUを始めようと調べ始めたのですが、
cudaとCLの違いって、CUDAはCPU部分もカーネル部分も混在したプログラムを書いてnvccが両者を分離してくれる、
CLはプログラマ自身が最初からCPU用とカーネル用とを分けてプログラムを書く
という認識でよいですか。

カーネルとかグローバルメモリとかの概念はほぼ一緒と考えてよいのでしょうか。
CLの方が拡張言語っぽくないのと共通規格な分気持ちがいいですが、カーネルのコンパイルとか引数設定を明示的にしないといけない分どんくさい感じですね。
262 名前：デフォルトの名無しさん mailto:sage [2010/01/21(木) 15:14:41 .net]: OpenCLはまだまともに動かないからCUDAにしとけ
263 名前：250 mailto:sage [2010/01/21(木) 18:20:06 .net]: cudaとopenclの決定的な違い？

cudaはGPGPU
openclは計算機資源API
GPUに限らず、CPU,(故)Cell/BE,DSPチップ等の演算装置を汎用的な計算機資源として使うためのAPIがCL
GPUを使うならメモリ概念はCUDAとだいたい同じ。

完全にホストプログラムとカーネルプログラムおよび両者間通信を手作業で作らないといけないどんくささ（？）はあるものの
「メインプログラムはホスト実行で,計算機資源だけ別のハードウェアを使う」設計APIなので自由度はかなり高い

ただOpen○○のくせにMac10.6以外はまともに動く環境が少ないとか
JITコンパイルなので実行するまでソースのバグがわからない上に資料がまだ充実してないとか、
けっこうまだまだ問題も多い。
>>260の言う通り今やるならCUDAが良いと思うぞ。
264 名前：259 mailto:sage [2010/01/21(木) 18:49:08 .net]: セルとかララビーとかアムドが本気を出すとか色々可能性があるからCLの方がいいかなと思ってたけど
CUDAの方がいいのかな。
拡張言語ってのが言語仕様的にOpenMPあたりと干渉しそうなのもCLを考えていた要素なんだけど。
265 名前：デフォルトの名無しさん mailto:sage [2010/01/21(木) 22:57:22 .net]: どっちもたいして変わらんどっちもやれ
266 名前：デフォルトの名無しさん mailto:sage [2010/01/22(金) 18:58:59 .net]: OpenMPとOpenCLが干渉？
ホスト管理スケジューリングぐらいじゃねーの？
267 名前：デフォルトの名無しさん mailto:sage [2010/01/22(金) 23:44:42 .net]: radeonでCUDAって出来ないの？
268 名前：デフォルトの名無しさん mailto:sage [2010/01/23(土) 01:25:03 .net]: 無理。Stream使え。
でも、技術デモ程度ではなく実用したいならゲフォ使え。
269 名前：デフォルトの名無しさん mailto:sage [2010/01/23(土) 10:59:33 .net]: スレ違い
270 名前：デフォルトの名無しさん [2010/01/26(火) 01:24:10 .net]: ふぃくすたのOpenCL入門買ったぞ、LinuxでSDKについてきたサンプルコードがコンパイルできなくて死んだ
っていうか
271 名前：普通にアルゴリズムの勉強してからやれクズ []: [ここ壊れてます]
272 名前：デフォルトの名無しさん mailto:sage [2010/01/26(火) 01:27:54 .net]: 二行目どういう意味？
273 名前：デフォルトの名無しさん mailto:sage [2010/01/26(火) 05:29:18 .net]: 268 said s/he was kuzu.
274 名前：デフォルトの名無しさん mailto:sage [2010/03/10(水) 22:33:57 .net]: >>266
GPGPU目的だと、ATI<nVidiaなの？
275 名前：デフォルトの名無しさん mailto:sage [2010/03/10(水) 22:52:32 .net]: ？
276 名前：デフォルトの名無しさん mailto:sage [2010/03/11(木) 20:16:16 .net]: CUDA(nVIDIA)/Stream(AMD) = GPGPU環境
OpenCL = 計算資源利用API ≠ GPGPU

GPGPUのみのなら別スレへ。
とりあえずOpenCL<CUDA(nVIDIA)/Stream(AMD)
かつ開発環境の整備具や資料面ではGPGPUでもnVIDIAに軍配が上がるのが一般論
277 名前：デフォルトの名無しさん mailto:sage [2010/03/12(金) 01:13:55 .net]: CUDAを使った実績はかなりあるけど、
OpenCLをつかってパフォーマンスが上がるって結果はあるのか？
278 名前：デフォルトの名無しさん mailto:sage [2010/03/12(金) 13:56:03 .net]: FLOPSのベンチとか調べればちらほら（程度は）ある。ただFLOPSが高くても転送コストが重かったりする。
実行結果をそのままOpenGLとかで可視化するとか転送コストを挟まない場合には向いてる。レイトレとか。
ただ開発／デバグにかかる時間と労力はCUDAと比較にならないと思うぐらい悪い。慣れれば別。

俺はOpenCL好きだけどね。
279 名前：デフォルトの名無しさん mailto:sage [2010/03/13(土) 13:19:47 .net]: 昔の超不安定なRadeonのせいでRadeonを買うことにトラウマがあるから
GPGPUもGeForceしかしたくない
280 名前：デフォルトの名無しさん mailto:sage [2010/03/13(土) 21:40:13 .net]: いまノートPCでRadeonHD3200
OpenCL使ってみたいけど、使える環境にするにはPC一式を新しく買うしかないよね？orz
281 名前：デフォルトの名無しさん mailto:sage [2010/03/13(土) 22:12:04 .net]: ATIStream版OpenCLのCPUデバイスで我慢すれば
282 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 04:36:42 .net]: ATI、各GPUのドライバまで手が廻らな過ぎ。
283 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 10:20:38 .net]: 正直どこのベンダもOpenCLにそんなに力入れてない気がしてきた。。。
284 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 12:58:43 .net]: いつまでnVidiaに夢見てんだよ
285 名前：デフォルトの名無しさん [2010/03/14(日) 15:29:40 .net]: GeForce GT 240 でOpenCL SDK V2.3のサンプルが動かない。
というかSDKでビルドは成功するが全然動かない。
ドラバは最新の 196.21
GPU-Z.0.3.9で確認するとOpenCLはチェックが入っている。
286 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 15:41:44 .net]: 現状CUDAで十分な気がする
287 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 18:08:04 .net]: CUDAもOpenCLもこのまま消えそうだね
288 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 21:15:50 .net]: ほかで何が残りそうなの
289 名前：デフォルトの名無しさん mailto:sage [2010/03/14(日) 23:21:11 .net]: 調べてないけど、OpenGL 4は、OpenCLと連携するようになってるらしいから
徐々にOpenCLも使われるようになっていくんじゃない
290 名前：デフォルトの名無しさん mailto:sage [2010/03/15(月) 18:48:08 .net]: POWERVR SGX545を採用したモバイル機器での普及の方が先かも知れない。
291 名前：デフォルトの名無しさん mailto:sage [2010/03/15(月) 20:09:26 .net]: >>286
既にOpenGLと連携できるよ。頂点バッファとかテクスチャとかだからGL2.x以降とかな？
292 名前：デフォルトの名無しさん [2010/03/18(木) 17:36:26 .net]: NVIDIAのOpenCLのダウンロードから一通りダウンロードしてきたけど、
コンパイルとかは、どのコマンドを使うの？
OSはLinuxです。
293 名前：デフォルトの名無しさん mailto:sage [2010/03/18(木) 19:40:13 .net]: 何のコンパイル？
294 名前：デフォルトの名無しさん [2010/03/20(土) 03:12:14 .net]: >>290
OpenCL file
295 名前：デフォルトの名無しさん [2010/03/20(土) 05:50:48 .net]: nvcc
296 名前：290 mailto:sage [2010/03/20(土) 08:02:27 .net]: fileてのが何かよくわからんが
NVIDIAサンプルに含まれるホスト側のCソースなら/OpenCL/makeでいけるかと。
カーネル用のCLソースならclBuildProgram()関数でどうぞ。
297 名前：デフォルトの名無しさん mailto:sage [2010/03/20(土) 17:29:53 .net]: CUDA 3.0 Downloads
developer.nvidia.com/object/cuda_3_0_downloads.html
298 名前：デフォルトの名無しさん [2010/03/20(土) 18:17:46 .net]: Mac OS X 10.6を手に入れたんだけど、OpenCLの使い方を教えてください
とりあえず、ドライバだけは入れました。
299 名前：デフォルトの名無しさん mailto:sage [2010/03/20(土) 19:11:03 .net]: ソース書く→コンパイル→実行→happy
300 名前：デフォルトの名無しさん mailto:sage [2010/03/20(土) 20:03:11 .net]: >>295
ttp://developer.apple.com/
301 名前：デフォルトの名無しさん mailto:sage [2010/03/20(土) 20:08:14 .net]: あと
ttp://developer.apple.com/mac/library/navigation/index.html?section=Resource+Types&topic=Sample+Code#section=Frameworks&topic=OpenCL
302 名前：デフォルトの名無しさん [2010/03/21(日) 13:14:54 .net]: LinuxでOpenCLやってるんだけど、倍精度は使えへんの？
303 名前：デフォルトの名無しさん [2010/03/21(日) 14:28:18 .net]: 282だけど
CUDA 3.0 Downloads
で上手くいきました。
ありがとう。＞294
304 名前：デフォルトの名無しさん mailto:sage [2010/03/22(月) 12:45:47 .net]: Linuxと倍精度になんの関係が
305 名前：デフォルトの名無しさん mailto:sage [2010/03/22(月) 13:16:38 .net]: CL C言語での倍精度浮動小数点はGPUベンダーにより任意サポート
306 名前：デフォルトの名無しさん [2010/03/26(金) 00:59:44 .net]: よくわからんけど、倍精度を有効にするスイッチとかあるの？
CUDAだとsm13だけど
307 名前：デフォルトの名無しさん mailto:sage [2010/03/26(金) 08:06:27 .net]: >>303

あるよ

対応しているかは実装依存だけど。

www.khronos.org/opencl/sdk/1.0/docs/man/xhtml/cl_khr_fp64.html
308 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 22:53:00 .net]: struct {
int I;
} tA;

struct {
tA * pa;
} tB;

__kernel void Func (__global tB *b) {
int idx = get_global_id(0);

int B = b[idx].a->I;
}

みたいにすると、int B に値が入らないのってなんで？
書き方が悪いのかな？

教えてエロい人。
309 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 00:52:35 .net]: >>305
君にOpenCLは向いてないよ。。。

ちなみに
b[idx].pa　の参照先が不定もしくは管理領域外だと思われ

通常であればアクセス例外
310 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 01:07:15 .net]: これはコンパイル通るのか？
311 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 02:12:02 .net]: ｔAの実体はいずこ？
ｔBのメンバpaはポインタだぞ。
ポインタは実体ではないぞ。
やるなら、

__kernel void Func (__global tB *b) {
int idx = get_global_id(0);
ｔA　C;
C.I = 1;
b[idx].pa = (tA *)(&C);
int B = b[idx].pa->C;
}

じゃないか？
OpenCLより、ポインタを先に勉強した方がいいぞ。
312 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 02:33:18 .net]: >>308
あ、間違えた。
int B = b[idx].pa.I;
だった。
そもそも根本的におかしいね。
悪い、俺もポインタの勉強が必要だわ。
それ以前に構造体の勉強が必要だ。
313 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 08:10:34 .net]: 305だけど、306の話で知りたいことはわかった。
変な質問でごめんね。みんなありがとう。
314 名前：デフォルトの名無しさん mailto:sage [2010/04/23(金) 01:47:27 .net]: ラデですまんが、vista64でATI Stream 2.01にしたらopen CLのサンプルがVC++ Expressでコンパイルできても動かない(clGetPlatformIDsが-1001を返す）んだけど、こんなことなた人います？
2.0bだと動いたのだが。
Platform SDKの64bitコンパイラを使えばちゃんとサンプルも動かせるけど、MS流儀のコンパイルオプションやmakefileの書式が面倒くさい・・・
LinuxのCUDA機を購入する前にPCでOpen CLのお勉強をしようと思ったのにつまらんところで時間をくってしまった。
315 名前：デフォルトの名無しさん [2010/04/23(金) 11:34:25 .net]: SDKサンプルのoclBandWidthTestやったらホスト・デバイス間で５３００MB/sくらいだったんだけど
この数値ってグラボだけじゃなくマザーとメインメモリも影響するよね？
GPGPUの処理がハードウェア的にどう依存してるのか良くイメージ出来てないんだけど
i7のQPIとかは影響するの？
316 名前：デフォルトの名無しさん mailto:sage [2010/04/23(金) 12:28:21 .net]: >>311
developer.amd.com/support/KnowledgeBase/Lists/KnowledgeBase/DispForm.aspx?ID=71
317 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 00:44:55 .net]: >>313
そこを読んだけど、それにはデフォルトを呼び出すんじゃなくてclGetPlatformIDsを呼び出してセレクトしろってことでしょ。
で、2.01の64bit版にはちゃんと32bit版のOpenCL.dllが入っているのに、32bitでコンパイルしたらclGetPlatformIDsがなにやら不明なエラーを返してしまうことが問題で・・・
318 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 01:01:40 .net]: SDKを削除＞再インストールしてみたらどう？
こんな話があるし↓

ttp://absolutearea.blogspot.com/2010/04/opencl-ati-stream-sdk_05.html
319 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 01:06:52 .net]: >>315
それはビルドができないってことでしょ。
ビルドはできるんだよねぇ。実行もできる。ただOpenCLの関数が怪しい物を返すので。
OpenCL.dllの日付は32bit版と64bit版も同じだからバージョン違いが残ってるわけでもないしなぁ。
320 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 03:20:56 .net]: >>316
中身読んでくれてないのね…
この人も-1001 返ってるって書いてあるし、
貴方とおんなじかなって思ったんだけど

> 「デバッグ」メニューから「デバッグなしで開始」を選択
> HelloCL!
> Getting Platform Information
> Platform::get() failed (-1001)
> 続行するには何かキーを押してください . . .
> ありゃ？なんでじゃ？
>
> ATI Stream SDK をインストーラでリペアしてもだめだった。
> しかたがないので、ATI Stream SDK をアンインストール後、再びインストールした。
> サンプルをコンパイルして動作確認。うまくいった。
321 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 03:37:42 .net]: >>317
あら、本当だ。
ごめんなさい。
ダラダラとビルドできないことが書いてあったからこれはちゃうなと。
-1001なら同じだわ。
322 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 10:55:01 .net]: ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
323 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 15:07:22 .net]: そんなwwwとか書くなよ・・・実際のところ既にアンインストール後再インストールは試してるしなぁ。
324 名前：デフォルトの名無しさん mailto:sage [2010/04/24(土) 17:53:49 .net]: なんで出されたもの読まずにコメント出来るのか理解不能ではある
325 名前：デフォルトの名無しさん [2010/04/25(日) 01:04:34 .net]: >>320
後だし情報で言い訳ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
326 名前：デフォルトの名無しさん mailto:sage [2010/05/09(日) 03:00:01 .net]: >>321
出されたものを読まないでコメントするようだから
結局解決まで時間がかかる人なんだよ。理解できる。
327 名前：デフォルトの名無しさん mailto:sage [2010/05/09(日) 09:39:11 .net]: ヤギだからじゃないのか？
328 名前：デフォルトの名無しさん mailto:sage [2010/05/14(金) 23:31:43 .net]: GF9400　(CUDA 3.0)のマシンとHD4850 (ATI Stream 2.1)のマシン両方で起こっているのだけれど、
clEnqueueNDRangeKernelで実行したカーネルのイベントがclGetEventInfoで状態を見るとCL_QUEUEDのまま変わりません(queueはインオーダー実行にしてあります）。
kernel自体はきちんと実行終了して希望の結果が得られて、clEnqueueWaitForEventsにイベントを入れて待ってもきちんとCL_SUCCESSで戻ってくるのに、そのイベントの状態を見るとCL_QUEUEDのまま。
そのために、clGetEventProfilingInfoでカーネルの実行時間を調べようとしてもCL_PROFILING_INFO_NOT_AVAILABLEが返ってきて調べられない始末（CL_COMPLETEになっていない証拠）。
clEnqueueWriteBufferなどのイベントはちゃんとCL_COMPLETEになっている。

なんか再現する簡単なプログラムを付けたいけれど、OpenCLはカーネル動く例を書こうとしてもオマジナイが多すぎて改行多すぎで載せられないし・・・

・kernelは正しく実行されている
・WaitForEventも正しく戻る
・でもイベントはqueuedのまま
329 名前：デフォルトの名無しさん mailto:sage [2010/05/14(金) 23:59:03 .net]: うｐろだに上げればよかろうよ
330 名前：デフォルトの名無しさん mailto:sage [2010/05/16(日) 13:46:46 .net]: 並列処理の基本であるキューにためつつキューの中身を取り出して処理するみたいなことは出来るの？
331 名前：デフォルトの名無しさん mailto:sage [2010/05/16(日) 21:32:19 .net]: えっ
332 名前：デフォルトの名無しさん mailto:sage [2010/05/16(日) 22:10:17 .net]: そのためのキューです
333 名前：デフォルトの名無しさん mailto:sage [2010/05/17(月) 00:17:50 .net]: キューはＣＰＵ側で実装すればいいのか
334 名前：325 mailto:sage [2010/05/17(月) 10:55:56 .net]: clEnqueueWaitForEventなんか使ってちゃダメだな。
clWaitForEventで待機したらeventがCL_COMPLETEになりました。

queueのインオーダーだと勝手にブロッキングになると勘違いしていてwaitなんて入れても入れんでも一緒ダロとか思ってました。

ところで、アウトオブオーダーの時にclEnqueueWaitForEventなんか使ったらqueue内の順序無視してwaitを先にやっちゃって止まるなんてことにはならんのだろうか・・・
335 名前：デフォルトの名無しさん mailto:sage [2010/05/17(月) 23:56:26 .net]: windowsのリモートデスクトップ経由でOpenCLのプログラムを実行するとplatformの取得に失敗するのな。
びっくりした。windows使えねぇｗ
336 名前：デフォルトの名無しさん mailto:sage [2010/05/18(火) 00:18:59 .net]: それはNVIDIAのドライバのせいでは？
ATIのOpenCLでもそうなる？
337 名前：デフォルトの名無しさん mailto:sage [2010/05/18(火) 00:39:34 .net]: そうなる。Windowsの仕様。
公式でもVNC使えって言ってる。
ttp://developer.amd.com/gpu_assets/App_Note-Running_ATI_Stream_Apps_Remotely.pdf
338 名前：デフォルトの名無しさん mailto:sage [2010/05/18(火) 05:11:24 .net]: NVIDIAのドライバのせいだなw
339 名前：デフォルトの名無しさん mailto:sage [2010/05/18(火) 09:44:11 .net]: VNCは遅い上にリモートの画面のロックは解除されたりキーボードやマウスでいじり放題になるので目の届かないコンピュータをいじるもんじゃないわな。
迂闊にエロサイトなんて見てしまったら・・・
340 名前：デフォルトの名無しさん mailto:sage [2010/05/18(火) 10:36:11 .net]: cygwinでsshdを起動してssh経由でやっても動かないぜ。
mpiでやっても当然ダメなんだろうな。
こんな状態でHPC市場を狙ってるんですかねマクソさんは。
341 名前：デフォルトの名無しさん mailto:sage [2010/05/19(水) 13:04:33 .net]: スクリーンセーバーにしてしまおうかと真剣に考えたw
342 名前：デフォルトの名無しさん mailto:sage [2010/05/20(木) 22:39:47 .net]: 個人的な覚書

ATI Stream 2.1のcl_platform.hはこのままだとmingw-gccで使えない。
38行目の#include <stdint.h>を削除して
77行目 #else /* !_WIN32*/の次の行に入れる必要あり。

khrnosの配っているcl.hpp　(\date $Date: 2010-04-23 10:16:50 -0500 (Fri, 23 Apr 2010) $は
namespace cl　のなかでstd::pairと呼び出してる箇所を全て ::std::pairと修正、
#if defined(__CL_ENABVLE_EXCEPTIONS)
#include <exception>
#endif
をnamespace clの外側に移動する必要あり。
343 名前：デフォルトの名無しさん [2010/06/03(木) 07:06:02 .net]: ワープって何よ。
亜空間跳躍となにか関係あるのか?
344 名前：デフォルトの名無しさん mailto:sage [2010/06/03(木) 23:01:30 .net]: OpenCLはワープサイズやウェイブフロントサイズをとってこれないのが難点だな。
これが取れないとポータビリティのある最適化はできないよ～。
345 名前：デフォルトの名無しさん mailto:sage [2010/06/04(金) 13:26:57 .net]: ワープとかの概念が無用なプラットフォームも OpenCL の対象範囲。
どうせハードウェアごとの最適化が入る部分は、CL がどうこうする部分じゃないよ。
その辺は #ifdef で。
346 名前：デフォルトの名無しさん mailto:sage [2010/06/04(金) 22:55:03 .net]: ワープサイズに依存しない機種の場合はワープサイズ1でも返してくれればいいんだけど。
347 名前：デフォルトの名無しさん [2010/07/01(木) 23:02:44 .net]: コードのコンパイル、デバイスの生成、データ転送に喰われてスケールしないんだが。
ありがた味のわかるサンプル教えてくれ。
348 名前：デフォルトの名無しさん mailto:sage [2010/07/01(木) 23:05:51 .net]: コンパイルやデバイスの生成やデータ転送と比べものにならないくらい長時間のデータを計算させる。
349 名前：デフォルトの名無しさん [2010/07/03(土) 00:48:14 .net]: openclでGPGPUするかどうかの判定ラインって何？
やってみないとわからんのか。
350 名前：デフォルトの名無しさん mailto:sage [2010/07/03(土) 12:42:13 .net]: 計算量がNの3乗くらいなら有効だと思うよ。
ループが3重にネストしているような奴。
351 名前：デフォルトの名無しさん mailto:sage [2010/07/24(土) 22:38:24 .net]: 水を差すようだけど，OpenCLだからと言ってO(N^3)がO(N^2)に落ちる訳ではないんだから
それだけでは何の基準にもならないよね．
滅茶重い計算だとNも単純に大きくてデバイスローカルなメモリに収まらなかったりするし
対象デバイスのwarp sizeを想定しながらブロック化とか，結局ifdef祭り．
352 名前：デフォルトの名無しさん mailto:sage [2010/07/24(土) 23:00:12 .net]: うるせえだまってろ
353 名前：デフォルトの名無しさん mailto:sage [2010/07/25(日) 08:00:33 .net]: でっていう
354 名前：デフォルトの名無しさん mailto:sage [2010/09/02(木) 01:36:07 .net]: もう少しなんかあっても良いよね。
355 名前：デフォルトの名無しさん mailto:sage [2010/10/10(日) 01:30:39 .net]: 文字列処理のサンプルってないですか？
356 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 00:50:26 .net]: 新しいMacBookPro買ったんだけど
clCreateContextFromTypeでGPU指定したら、そこからCL_SUCCESSが返ってこない・・・
Appleのサイト見てもGeForce GT 330Mはサポートされてるのに
357 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 01:04:56 .net]: >>353
nVidiaが公開してるCUDAドライバ入れた？
358 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 01:33:46 .net]: >>354
SnowLeopardはOSでサポートされてるんじゃないの？
ちょっとぐぐってきます・・・
359 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 10:40:54 .net]: ドライバもなしにハードを動かそうとな？
360 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 16:18:23 .net]: yanoshin.jp/entry_154.html
いつのバージョンかわからんけど
＞＊必ずToolkit、Driver、SDKの順にインストールすること！（なぜか？）

ドライバだけで、他は必要ないのかな？
journal.mycom.co.jp/column/osx/335/index.html
developer.apple.com/library/mac/#documentation/Performance/Conceptual/OpenCL_MacProgGuide/OpenCLontheMacPlatform/OpenCLontheMacPlatform.html
361 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 16:21:17 .net]: 今までRadeonユーザーにOpenCL使ってもらうには
SDKインストールしてもらわないといけなかったんだが、
最新ドライバから、OpenCLランタイムをインストールできるようになったらしい。
めでたいことだ。
362 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 17:39:16 .net]: Radeonって全然高速じゃないし使う意味ないよなぁ
363 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 18:35:46 .net]: Radeonユーザーの場合はDirectCompute使った方が良いね
364 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 18:41:34 .net]: Core i　……　RADEON HD 6xxx
Phenom II　……　GeForce GTX 4xx
365 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 19:48:56 .net]: RadeonだとN体 24Gぐらいしかでないしな
Geforceだと500Gぐらい平気で出るんだけどねぇ
366 名前：デフォルトの名無しさん mailto:sage [2010/10/24(日) 23:22:24 .net]: >>356
秀和システムのOpenCL入門を読んだら
Mac：Xcodeあればいい
Win：ドライバダウンロード必要
としか書いてなかったからてっきり。
>>357
インストール順番さっそくミスった
実はMacは初めてだからアンインストールの仕方ぐぐらんと
367 名前：363 mailto:sage [2010/10/27(水) 09:01:28 .net]: やっぱり動かない・・・
よく見たらApple英語サイトはGeForceGT３３０M書いてあるけど
日本語のほうは載ってないし
www.apple.com/macosx/specs.html
www.apple.com/jp/macosx/specs.html
368 名前：デフォルトの名無しさん mailto:sage [2010/10/27(水) 11:20:00 .net]: それ、OSの必要条件じゃん。だから何?
369 名前：デフォルトの名無しさん mailto:sage [2010/10/29(金) 07:17:55 .net]: developer.apple.com/library/mac/#samplecode/OpenCL_Hello_World_Example/Introduction/Intro.html
> __kernel square
を
> __kernel void square
に置換。

のサンプルも動かない？
370 名前：デフォルトの名無しさん mailto:sage [2010/10/29(金) 16:50:26 .net]: >>365
ごめん　それは関係なかった
>>366
カーネル以前にclGetDeviceIDsでGPU指定だと止まる。CPUでは動く。。。
試しに>>357の参考してCUDAのサンプルも動かしてみたら
CUDA使用可能なデバイスが見つからないというエラーがでる(´･ω･`)
でも動くのもあって、oceanFFTとかnbodyとかは動いてくれるんだけど
371 名前：デフォルトの名無しさん mailto:sage [2010/10/29(金) 19:14:57 .net]: そりゃ変だな。ちなみにこちらは Radeon HD 5670 の iMac だが普通に動いてる。
CUDAのドライバにSDKは入れてる（入れただけで放置してたが）。
372 名前：デフォルトの名無しさん mailto:sage [2010/11/06(土) 16:01:55 .net]: gccはOpenCLに興味ないみたいだね
代わりにclang使うしかないのか?UNIXでは
373 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 00:02:23 .net]: >>369
gccは開発技術レベル落ちまくってて
本業のコンパイラもLLVM連中やMSに
抜き去られてやばいらしい
374 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 00:11:37 .net]: つってもGCC死んだらUNIX系が基盤から崩壊するから、
どうにかしなきゃいかんだろうしどうにかするだろ
375 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 00:29:49 .net]: マルチアーキ型のgccの最適化処理がx86特化型であるmsのソレ以上だったことなんてあったか？
376 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 00:30:00 .net]: GCCってそんな立ち位置だったっけ？
広く愚直にというイメージがあるんだが
377 名前：,,・´∀｀・,,）っ-○○○ mailto:!sage [2010/11/07(日) 01:03:36 .net]: GNUソフトウェアはいつだって言いだしっぺの法則が適用されるんだぜ。
Cell B.E.だってSCEが自らABIを公開してGCCやLinuxカーネルのパッチをコミットした。

NVIDIAやAMDがGCCにコミットしない限り動かんだろ。
378 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 05:02:21 .net]: >>371
もうどうにもならん
ORACLEのせい
379 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2010/11/07(日) 05:21:45 .net]: なんだかんだでHPCなんて所詮はサーバ市場の１％未満のニッチ市場だよ。
そのなかのGPGPU用の言語の一つのために必死になる奴もそうそういない。
なんならRailsやZend使ってWebサービスを構築してるSIerにでもGPGPUの素晴らしさを説いてくれｗ
380 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 10:51:44 .net]: >>376
動画のエンコード・デコードはダメなの？？
381 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 13:34:36 .net]: ffmpegと同等の画質を達成すればGoogle様が興味を示す

かも
382 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 13:44:30 .net]: なんでGPUを使う→低画質という思考になるの？
383 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 14:24:23 .net]: 馬鹿だから
384 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2010/11/07(日) 15:08:22 .net]: ブロックサイズを細かく分けて並列処理しないとGPUのスループットの強みを生かせないから。
CPUで処理するレベルの高画質エンコードは構造的に不向き。せいぜいフィルタだけやらせておけというレベル。
385 名前：デフォルトの名無しさん mailto:sage [2010/11/07(日) 20:04:27 .net]: ブロックサイズ1ピクセル単位とかにでもしないとGPUの優位なんて出てこないんだろうなｗ
386 名前：デフォルトの名無しさん [2010/11/17(水) 00:02:22 .net]: IntelがCoreプロセッサ向けOpenCL SDKのアルファ版を公開: 新 masafumi's Diary
ttp://masafumi.cocolog-nifty.com/masafumis_diary/2010/11/intelcoreopencl.html
387 名前：デフォルトの名無しさん mailto:sage [2010/11/17(水) 01:07:04 .net]: Windows Onlyか
388 名前：デフォルトの名無しさん mailto:sage [2010/11/17(水) 15:57:12 .net]: Core2Duoなのに入れられない！と思ったら45nm版Core2以降かよ…SSE4使うのな
389 名前：デフォルトの名無しさん mailto:sage [2010/11/17(水) 19:24:56 .net]: そろそろQ6600に引導渡してやるか・・・
Cougar Pointの仕様が色々と半端なので、GPUだけ強化してIvy Bridgeまで引っ張るつもりだったんだが
390 名前：デフォルトの名無しさん mailto:sage [2010/11/21(日) 00:35:46 .net]: 来年からAMDが大攻勢、NVは苦しくなるな。
もうグラフィックボードすら不要になってくる。
391 名前：デフォルトの名無しさん mailto:sage [2010/11/21(日) 00:38:40 .net]: CPUで使う場合も、OpenCL的なメモリコピーを挟まないといけないのでしょうか？
392 名前：デフォルトの名無しさん [2010/11/27(土) 07:53:49 .net]: OpenCLって、いつになったら動かせるようになるの？
組み込み向けにGPGPUしたいんだけど、CUDAだと発熱すごすぎグラフィックボード
がどうしても必要なんで、オンボードGPUをOpenCLで動かしたいのだが。
393 名前：デフォルトの名無しさん mailto:sage [2010/11/27(土) 08:38:35 .net]: まるでオンボードGPUだと発熱しないと言わんばかりの意味不明な発言。
394 名前：デフォルトの名無しさん [2010/11/27(土) 10:03:51 .net]: 信頼性は違うだろ？
395 名前：デフォルトの名無しさん mailto:sage [2010/11/27(土) 13:28:35 .net]: オンボードのチップの方が信頼性が高いの?
マザボ丸ごと道連れになるくらいならカード交換で済む方がいい気もするんだが。
今までの経験からすると、寧ろ電源が死ぬことのほうが多いけどね。
396 名前：デフォルトの名無しさん mailto:sage [2010/11/27(土) 14:29:27 .net]: RadeonでもGeForceでもPhenomでもCore 2(45nm以下)以上でも動くよ>>OpenCL
397 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2010/11/27(土) 14:34:16 .net]: SSE4.1以上に限定する意味は一応あるのね。
insertps/extractpsがgather/scatterとして、vlendvpsがプレディケートに使えるから
SPMDのカーネルモデルを容易に実現できる。
398 名前：デフォルトの名無しさん mailto:sage [2010/11/29(月) 14:16:12 .net]: OPENCLってグラフィックカードの計算につかうCPUで
普通のプログラミングも計算するってことですか？
399 名前：デフォルトの名無しさん mailto:sage [2010/11/29(月) 19:38:51 .net]: 日本語でおｋ
400 名前：デフォルトの名無しさん mailto:sage [2010/11/29(月) 22:13:20 .net]: >>395
コストが無駄になるので特定の用途向けの計算に使います。
401 名前：デフォルトの名無しさん mailto:sage [2010/12/01(水) 11:07:07 .net]: じゃあ、グラフィックカードの付いてないノートパソコンでは無意味ということだな。
402 名前：デフォルトの名無しさん mailto:sage [2010/12/02(木) 01:56:33 .net]: C言語っぽく書いて、コンパイラがうまいことSIMDに変換してくれるから意味あるよ。
403 名前：デフォルトの名無しさん mailto:sage [2010/12/04(土) 11:20:13 .net]: GPUでmalloc作った論文どこだっけ？
404 名前：デフォルトの名無しさん mailto:sage [2010/12/18(土) 09:11:15 .net]: 外付けと内蔵グラフィック切り替えるタイプのノートでopenCL使うとどうなるの
NVkernelそこまで対応してるのかな？
405 名前：デフォルトの名無しさん mailto:sage [2010/12/25(土) 19:51:36 .net]: 全ワークアイテムでは同期とれないんだね。ワークグループ内のみか。
さて、どうやって同期とるか・・・
406 名前：デフォルトの名無しさん mailto:sage [2010/12/31(金) 18:12:58 .net]: OpenCLを始めようと思ってサンプルコードを動かしてみたんですが
コンテキストを作るところで躓いてしまいました。
何がいけないんでしょうか？

具体的には
cl_int status;
cl_context context = clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU, NULL, NULL, &status);
とやると、status に CL_INVALID_PLATFORM が返ってきます。

clGetPlatformInfo 関数は、たとえば CL_PLATFORM_VERSION を引数にして実行すると
"OpenCL 1.0 CUDA 3.2.1" という文字列が返ってくるので
OpenCLドライバが入ってないわけではなさそうなんですが・・・

環境はCore2Duo E8400、GeForce9600GT、Windows7 32bitです。
407 名前：デフォルトの名無しさん mailto:sage [2010/12/31(金) 18:39:37 .net]: 第一引数がNULLだとそうなるのがある
ならないのがあるのかは知らん
秀和の本読んでると思うけど公式から修正されたソース落としてこれるからそれを参考にしてくれ

今規制中で携帯からコード打つ気にならんｗ
408 名前：403 mailto:sage [2010/12/31(金) 20:39:19 .net]: >>404
秀和のサイトの修正済サンプルコードを参考にしたら、うまく動きました。
第一引数にNULLではなくコンテキストのプロパティを与えればいいみたいですね。

秀和の本で勉強してると言い当てられてビックリですｗ
この本わかりやすいですね。

大学の研究で何千枚の画像相関やってるんで、OpenCLで夢がひろがりんぐ。
409 名前：デフォルトの名無しさん mailto:sage [2011/01/01(土) 10:51:11 .net]: グラフィックスドゥライヴァのヴァージョンは？
410 名前：404 mailto:sage [2011/01/01(土) 16:41:42 .net]: developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_OpenCL_ImplementationNotes_3.0.txt
411 名前：デフォルトの名無しさん mailto:sage [2011/01/04(火) 05:00:19 .net]: openCLを使っています。
CL_DEVICE_TYPE_DEFAULTという値について質問があります。
この値はプラットフォームの標準デバイスを使うと書いてありました。
どのようにしたら、プラットフォームの標準デバイスがGPUなのか、CPU
なのかを知ることができるのでしょうか。
412 名前：デフォルトの名無しさん [2011/01/26(水) 11:02:46 .net]: Radeon5850と6970を二本さして、FFTの負荷分散させたいと思ってcontextにデバイス２つのせてキューも2本立てたんだけど、
データ転送も並列実行も同時並列的に実行されないで逐次的に実行されてるみたいなんですよ。
コードは1GPUの場合のものをキューだけ変えて単純に2つ並べただけなんですけれども。

OpenCL StramSDKでマルチGPU?実行されてる方いらっしゃいます？
413 名前：デフォルトの名無しさん mailto:sage [2011/01/26(水) 12:09:39 .net]: AMDからメール来た

AMD Accelerated Parallel Processing (APP) SDK | AMD Developer Central
developer.amd.com/gpu/AMDAPPSDK/Pages/default.aspx
OpenCL? H.264/AVC: MainConcept
www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
414 名前：409 mailto:sage [2011/01/28(金) 13:15:14 .net]: OpenMP使えばいいんですね．自己解決しましたｗ
415 名前：デフォルトの名無しさん mailto:sage [2011/01/28(金) 18:00:42 .net]: OpenCLはCUDAやTBBのラッパーという理解で宜しいか？
416 名前：デフォルトの名無しさん mailto:sage [2011/01/31(月) 10:23:07 .net]: OpenMPはCPUしか並列化できない
GPUも並列化したいならOpenMPじゃなくてOpenCL使わなきゃだめだろ
417 名前：デフォルトの名無しさん [2011/01/31(月) 21:48:44 .net]: >>413
レスあざす。
もともとOpenCLで組んでて、OpenCLだけでマルチデバイスで動作しないかなぁと思った悩んでいたもんで。一応ホストのスレッドを二本立てたら並列動作しました！
418 名前：デフォルトの名無しさん mailto:sage [2011/01/31(月) 23:26:33 .net]: AMDのH264のSDKってどうなの？
419 名前：デフォルトの名無しさん mailto:sage [2011/02/01(火) 20:28:57 .net]: >>415
んなもんあったっけ？？
420 名前：デフォルトの名無しさん mailto:sage [2011/02/02(水) 01:05:26 .net]: >>416
話解らない奴だな
OpenCL H.264/AVC Encoder SDK Beta

どうなんだって聞いてるんだから答えろやクソが
421 名前：デフォルトの名無しさん mailto:sage [2011/02/02(水) 15:44:26 .net]: >>417
それAMD製じゃないしAMD専用でも無いじゃん

www.mainconcept.com/products/sdks/gpu-acceleration/opencltm-h264avc.html
422 名前：デフォルトの名無しさん mailto:sage [2011/02/02(水) 21:39:51 .net]: >>417
ぷｗ
423 名前：デフォルトの名無しさん mailto:sage [2011/02/03(木) 00:23:39 .net]: >>414
OpenCLの関数ってほとんどノンブロッキングだから
OpenMP使わなくても並列に動作するんじゃないの？
試したことないからわからんけど
424 名前：デフォルトの名無しさん [2011/02/03(木) 00:34:19 .net]: >>420
と思ったんですよ。とりあえず同じコンテクストにデバイス２つ乗っけて、キューを二本立ててやってみると計算はされるんだけど、プロファイラーで動作みてみると見事に逐次実行されてて。コンテクスト2つ立ててもダメでした。

ヘテロジニアスなんて謳ってるわりに面倒ですよねぇ^^;
425 名前：デフォルトの名無しさん mailto:sage [2011/02/04(金) 03:56:08 .net]: >>421
OpenCLのコマンドキューはインオーダー実行がデフォだから
CL_QUEUE_OUT_OF_ORDER＿EXEC＿MODE_ENABLEやらないと必ず逐次実行されるよ
426 名前：デフォルトの名無しさん mailto:sage [2011/02/04(金) 20:08:07 .net]: >>422
違うんですねー
OpenCLドライバは何故か初期から、OutOfOrderを付けても逐次実行されるんだわ。。。
いつか対応されるだろうと、一年くらい経過したけどまだ対応されてないとは
427 名前：デフォルトの名無しさん mailto:sage [2011/02/09(水) 20:10:42 .net]
428 名前：="../test/read.cgi/tech/1228891105/421" target="_blank">>>421
プロファイラで実行すると逐次実行されるが、プロファイラ上でなければ並列実行される。
ジョブ投入や実行の時間を記録して表示させてみ。

また、同一コンテキストのメモリが二つのデバイスのどちらからでもアクセスできる裏技もあるよ。
最初のアクセスは遅いが、それ以降は早いので、CPU側に読み込んで書き戻すとかしなくてもダミーでメモリをアクセスするジョブを流せばデバイス間のデータ移動ができる。

1年ほど前にデバイス2本同時駆動の実験だけして本チャンの計算プログラムはまだつくってなかったな、そういや。 []: [ここ壊れてます]
429 名前：デフォルトの名無しさん mailto:sage [2011/03/08(火) 07:32:39.91 .net]: 昨日1日使ってボトルネックをOpenCLに移植したけど、
余計遅くなったわ。やれやれ
430 名前：デフォルトの名無しさん mailto:sage [2011/03/08(火) 08:28:07.93 .net]: ボトルネックを移植するんじゃなくてOpenCLに向いている部分を移植しろよ
または並列性を極大化したりif文などの分岐を全部排除するなどアルゴリズム最適化をしてみれば？
431 名前：デフォルトの名無しさん mailto:sage [2011/04/07(木) 03:06:36.77 .net]: VLIW5のtパイプ埋まらん
432 名前：デフォルトの名無しさん mailto:sage [2011/04/13(水) 04:08:44.89 .net]: 深く考えずに2^26スレッドenqueueしたらひどいことになった。
433 名前：デフォルトの名無しさん mailto:sage [2011/04/21(木) 23:37:32.85 .net]: なんでこれ有料なんだ？
ttp://web.me.com/cducommun/CLBuilder/Home.html
434 名前：デフォルトの名無しさん mailto:sage [2011/04/22(金) 00:28:47.04 .net]: Appleが提供しているツールならまだしも第三者が開発しているツールを無料にしろってのは横暴だろ
シェアウェアや市販ソフトを完全否定なお人ですか？
435 名前：デフォルトの名無しさん mailto:sage [2011/04/23(土) 23:18:19.02 .net]: AMD APPのOpenCLについてご存じの方がいたら教えて欲しいんですが、
wavefront=64 って事は、例えばwork_group = 128 の場合 work_itemが64ずつ完全に並列実行って認識で合ってるでしょうか？
（wavefront内のやりとりは同期が必要ないかどうかを知りたいです）
436 名前：デフォルトの名無しさん [2011/04/24(日) 03:56:08.00 .net]: >>431
何の保証もないけど、今のところ大丈夫な気がする。
437 名前：デフォルトの名無しさん mailto:sage [2011/04/24(日) 05:50:16.61 .net]: 最大3クロックのタイミング差があると思うんだけど。
438 名前：デフォルトの名無しさん mailto:sage [2011/05/26(木) 04:58:19.55 .net]: XOR_INT*4とMULADD*4が同じ時間食うって納得いかん…
439 名前：デフォルトの名無しさん mailto:sage [2011/06/14(火) 22:58:32.16 .net]: for(d=0;省略){
clSetKernelArg(省略&d);
clEnqueueNDRangekernel(省略);
clEnqueueReadBuffer(省略);
for(省略){読み出したメモリ合算}
}
で1024*dで実行して
読み出して合算して再度実行・・・の形にしてもアドレス違反が起きてしまう・・・
イベントリストもバリア同期も意味なし

GPU実行でアドレス違反は画面だけ真っ黒になってびっくりした
デバックはCPUデバイス使ったほうがいいよ
440 名前：デフォルトの名無しさん mailto:sage [2011/06/26(日) 01:59:15.81 .net]: 最近OpenCLに興味もったんですが皆さん楽しいですか？
441 名前：デフォルトの名無しさん mailto:sage [2011/06/26(日) 14:59:58.32 .net]: 楽しいとか楽しくないとか問題じゃねえよ
442 名前：デフォルトの名無しさん mailto:sage [2011/06/26(日) 15:03:37.91 .net]: でっかいうんこかどうかだな
443 名前：デフォルトの名無しさん mailto:sage [2011/07/04(月) 00:47:28.82 .net]: AMD gDEBugger
ttp://developer.amd.com/tools/gDEBugger/Pages/default.aspx
いろいろ便利かもな
444 名前：デフォルトの名無しさん mailto:sage [2011/07/04(月) 00:50:00.35 .net]: nsightもOpenCLデバッグ対応してなかったっけ？
445 名前：天使 ◆uL5esZLBSE mailto:sage [2011/07/04(月) 06:50:33.14 .net]: ２０１１年になっても未だにJAVA使い続けてる奴ってさ
仕事で仕方なくならわかるけど

家でもJAVAやってるなら本当にバカだよね。哀れ

ゴミだし
446 名前：デフォルトの名無しさん mailto:sage [2011/07/04(月) 07:59:16.86 .net]: 最近みかける天使うぜー死ねと思っていたが
松本龍の阿呆発言と比べると実害無いだけマシだと思った
447 名前：デフォルトの名無しさん mailto:sage [2011/07/05(火) 22:49:02.30 .net]: つまんねー書き込みしてないでとっととNG登録しろよ
448 名前：デフォルトの名無しさん mailto:sage [2011/07/05(火) 22:51:03.29 .net]: このコテハン「天使 ◆uL5esZLBSE」は天才チンパンジー「アイちゃん」が
言語訓練のために使用しているハンドルです。

アイと研究員とのやり取りに利用する書き込みなので、
関係者以外はレスしないで下さい。

　　　　　　　　　　　　　　　　　　京都大学霊長類研究所
449 名前：デフォルトの名無しさん mailto:sage [2011/07/06(水) 01:40:07.31 .net]: intelのopencl　SDKをlinuxにインスコったけどコンパイルのやり方わからん
gcc使ってどうにかならんの？
450 名前：デフォルトの名無しさん mailto:sage [2011/07/06(水) 09:49:42.54 .net]: OpenCLってもう１年もバージョン変わって無いけど、開発中止したの？
451 名前：デフォルトの名無しさん mailto:sage [2011/07/06(水) 11:06:10.67 .net]: バージョンUPしなくていいほど今の版が完成されたすばらしい出来だという事なんだよ

という事にしておきたい
452 名前：デフォルトの名無しさん mailto:sage [2011/07/06(水) 11:57:01.57 .net]: グラボはどんどん進化してるのに、ライブラリは完成されてるとかねーよ
453 名前：デフォルトの名無しさん mailto:sage [2011/07/06(水) 18:08:10.55 .net]: 進化しても演算部分のコンパイラが底まで進化する必要があるか？

MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。
GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
454 名前：デフォルトの名無しさん mailto:sage [2011/07/09(土) 07:08:13.67 .net]: >>439
それってGPU１枚だけでも使えるの？
requirementsにはハードウェアのことが書いてない
455 名前：1 [2011/07/26(火) 06:44:48.46 .net]: toki.2ch.net/test/read.cgi/dataroom/1309855042/
456 名前：デフォルトの名無しさん mailto:sage [2011/07/27(水) 23:22:22.79 .net]: HD4850が最新のドライバではOpenCL動かないし、古いドライバでは動くがゲロ遅
アムドはあかんな
457 名前：デフォルトの名無しさん mailto:sage [2011/07/28(木) 01:08:32.77 .net]: >>452
4870 + CCC 11.6 で OpenCL 動いてるけど、
もしかして 11.7 では動かなくなるのかな ?
458 名前：デフォルトの名無しさん mailto:sage [2011/07/28(木) 14:50:27.81 .net]: HD4850, APP 2.4, CCC 11.6で動かず（カーネルコンパイルエラー）。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
459 名前：デフォルトの名無しさん mailto:sage [2011/07/28(木) 15:07:33.48 .net]: アムドとか言ってるあたりでお察し・・・
460 名前：デフォルトの名無しさん mailto:sage [2011/07/28(木) 20:28:57.67 .net]: アムドいうただけでレッテル貼りとかどんだけ・・・
ヌビディアはOpenCL対応あかんね
1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る
でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反
なめとるで
461 名前：デフォルトの名無しさん mailto:sage [2011/07/29(金) 09:43:45.32 .net]: どっちも自社ライブラリ使えってことだよ
462 名前：デフォルトの名無しさん mailto:sage [2011/07/29(金) 12:23:00.19 .net]: data parallelで簡単な2重forならできるけどそれ使って複雑な計算するのが
できぬ・・・CUDAと違って1024が最大なのがネック
463 名前：452 mailto:sage [2011/07/30(土) 22:03:20.57 .net]: 職場のC1060に家パソのHD4850が10倍以上の大差で惨敗してムカついたのでHD6950買ってきた。
2倍以上でHD6950の勝利！
アムド最高やで
464 名前：デフォルトの名無しさん mailto:sage [2011/07/30(土) 22:25:54.10 .net]: 6970や6990じゃなくて6950なのか。てかC1060はもうどうでもよかろう。
465 名前：デフォルトの名無しさん mailto:sage [2011/07/30(土) 23:10:14.10 .net]: >>460
C1060はどうでもええことないよ。
だって、職場の計算機の貴重な戦力だし。
6950にしたのは家パソ用に高い板を買う気はないから。
466 名前：デフォルトの名無しさん mailto:sage [2011/08/01(月) 20:49:14.86 .net]: いつの間にか WebCL とか出来てて驚いた。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
467 名前：デフォルトの名無しさん mailto:sage [2011/08/01(月) 21:47:49.14 .net]: WebGLについてはこちらでお願いします
【O3D】HTML5用 3D API WebGL 【Canvas:3D】
hibari.2ch.net/test/read.cgi/tech/1308761577/
468 名前：デフォルトの名無しさん mailto:sage [2011/08/01(月) 22:13:20.26 .net]: WebGLの話なんてしてないが
469 名前：デフォルトの名無しさん mailto:sage [2011/08/01(月) 23:26:04.83 .net]: サイトを開くだけで分散コンピューティングに参加…胸熱。
470 名前：デフォルトの名無しさん mailto:sage [2011/08/02(火) 10:29:42.77 .net]: www.infoq.com/jp/news/2011/07/WebCL

これか
確かにブラウザ上で並列処理する必要性がよくわからんな
471 名前：デフォルトの名無しさん mailto:sage [2011/08/02(火) 14:03:26.64 .net]: 頻繁にメインメモリと同期するような計算にはJavaScriptが遅くて使い物にならないだろうし
重い処理を単発でやるだけならサーバーでやればいいだけな気がする
わざわざWebで激しく環境依存するようなことをやる意味が分からん
472 名前：デフォルトの名無しさん mailto:sage [2011/08/02(火) 15:29:27.41 .net]: 技術というのは、早い者勝ちでなぁ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ
あと名を残したい人が作ったりするんだ
役に立つとか使えるとか、そんなの関係無いんだ
473 名前：デフォルトの名無しさん mailto:sage [2011/08/02(火) 16:18:14.25 .net]: それはわかるんだが、特許を取るタイミングとかが難しいよな
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか

まー特許引き延ばしって裏技もあるけど
474 名前：デフォルトの名無しさん mailto:sage [2011/08/02(火) 19:41:55.79 .net]: まあ、あれや
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。
そら、試してみたくもなるわな。
しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。

んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
475 名前：デフォルトの名無しさん mailto:sage [2011/08/03(水) 01:09:07.14 .net]: ブラウザで超広大なライフゲーム
476 名前：デフォルトの名無しさん mailto:sage [2011/08/04(木) 04:52:42.94 .net]: APP SDK 2.5 で BFI_INT が使われるようになったけど、
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
477 名前：デフォルトの名無しさん mailto:sage [2011/08/04(木) 18:42:12.38 .net]: CAL ILコンパイラはもう誰もメンテできないんだろうな。BFI_INT を付け足すのがそんなに苦痛かね?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に
モノにできるんだろうか?
478 名前：デフォルトの名無しさん mailto:sage [2011/08/04(木) 23:21:28.44 .net]: OpenCLってCellみたいなプロセッサが普及しないと面白くないよね。
GPU型の抽象化だけじゃ。
479 名前：デフォルトの名無しさん mailto:sage [2011/08/05(金) 09:45:21.35 .net]: そのCellがコケたからなー
発想が速すぎた
今の技術で開発していれば、大人気だったかもしれないのに
480 名前：デフォルトの名無しさん mailto:sage [2011/08/06(土) 00:40:12.65 .net]: i7であえてOpenCL
481 名前：デフォルトの名無しさん mailto:sage [2011/08/06(土) 02:51:44.01 .net]: OpenCLのアプリを配布するときってAMDとnVidiaで別に実行ファイル作らなきゃいけないの？
482 名前：デフォルトの名無しさん mailto:sage [2011/08/06(土) 03:08:35.23 .net]: 何でんなこと思った。
483 名前：デフォルトの名無しさん mailto:sage [2011/08/06(土) 03:57:16.00 .net]: 今のところ、OpenCLなアプリケーションを"配布"するための良い方法は無い。(除 MacOS X)
484 名前：デフォルトの名無しさん mailto:sage [2011/08/06(土) 07:16:37.83 .net]: *.cl カーネルを露出させるのがそんなに恥ずかしいか!

難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
485 名前：デフォルトの名無しさん mailto:sage [2011/08/07(日) 08:06:38.42 .net]: nVidiaから最新ドライバでOpenCL1.1対応とかメールきたんだけど、
ドライバとりに行ったらLinux用はまだじゃねーか。
ざけんなー。
486 名前：デフォルトの名無しさん mailto:sage [2011/08/07(日) 08:08:49.28 .net]: >>480
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
487 名前：デフォルトの名無しさん mailto:sage [2011/08/08(月) 05:22:20.10 .net]: Windows用OpenCL1.1ドライバを試してみたが、
どうも上手く動かないのでもう一寸待った方が良いと思う
488 名前：デフォルトの名無しさん mailto:sage [2011/08/09(火) 01:37:46.04 .net]: >>428
門外不出のノウハウ＝世間一般には知られていない。
つまり各分野
489 名前：の研究者すら出し抜く大発見ってことだぞｗ []: [ここ壊れてます]
490 名前：デフォルトの名無しさん mailto:sage [2011/08/11(木) 20:59:03.48 .net]: >>484
ノウハウが全て開示されているとでも思っているのか？
491 名前：デフォルトの名無しさん mailto:sage [2011/08/11(木) 22:05:51.96 .net]: 世間一般に知られていなければ十分じゃん
492 名前：デフォルトの名無しさん mailto:sage [2011/08/12(金) 21:31:49.60 .net]: 世間一般に知られないようにするためにカーネルを晒したくないわけだろ
493 名前：デフォルトの名無しさん mailto:sage [2011/08/14(日) 01:34:57.52 .net]: >>473
CAL ILコンパイラ自体はいまだに新命令追加されているよ。
64bitINT除算とかはドキュメント化までされている。
ドキュメントにはなっていないけど、wave_idとかは
Appendix Bにはこっそり追加されて、実際テキストで
1OP命令として書けば使える。

でもBFI_INTは置いてけぼり
494 名前：デフォルトの名無しさん mailto:sage [2011/08/14(日) 09:57:57.76 .net]: マスクが定数なら、iand,iand,ior で BFI_INT になるとおもうけど、
そうじゃないときになー。
495 名前：デフォルトの名無しさん mailto:sage [2011/08/31(水) 17:10:54.28 .net]: 初心者です。
Cで書かれた演算プログラムを高速化させたいと思っています。
この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか？

また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか？

当方LINUXでのプログラミングをしております。
496 名前：デフォルトの名無しさん mailto:sage [2011/08/31(水) 21:06:58.51 .net]: 並列化はアルゴリズムをかなり選ぶよ。GPGPUなんて尚更。
まず普通にマルチスレッドで並列化してみたら?
497 名前：デフォルトの名無しさん mailto:sage [2011/09/15(木) 10:02:24.21 .net]: opencl用の自動並列化コンパイラってある？
498 名前：デフォルトの名無しさん mailto:sage [2011/09/16(金) 05:07:07.00 .net]: >>490
そのやりかたでいいさ。
2重ループを1重ループ2つにわけるとか。
あとはほとんどC言語と同じだから書き換えるところも少ないんじゃないか？
499 名前：デフォルトの名無しさん mailto:sage [2011/09/16(金) 18:41:47.81 .net]: 「Ivy Bridge」プロセッサ、「OpenCL 」をサポート
500 名前：デフォルトの名無しさん mailto:sage [2011/09/16(金) 23:43:18.97 .net]: OpenCLを使ったおぉっとなるアプリってありますか？
501 名前：デフォルトの名無しさん mailto:sage [2011/09/17(土) 08:21:50.52 .net]: うわぁってなるあぷりならある
502 名前：デフォルトの名無しさん mailto:sage [2011/09/17(土) 08:36:22.90 .net]: たとえば？
503 名前：デフォルトの名無しさん mailto:sage [2011/09/17(土) 18:08:09.83 .net]: まってて、ちょっと調べてくる
504 名前：デフォルトの名無しさん mailto:sage [2011/09/18(日) 07:57:32.03 .net]: つ「www.geeks3d.com/20110822/webcl-nokia-extension-for-firefox-6-and-kernel-toy/」
505 名前：デフォルトの名無しさん mailto:sage [2011/09/23(金) 23:20:48.33 .net]: なんでAMDのOpenCLってこんなにサポートが糞なの？
506 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 06:50:26.05 .net]: OpenCLに関しちゃAMDが一番マシじゃね。
507 名前：デフォルトの名無しさん mailto:sage [2011/09/24(土) 15:07:51.08 .net]: >>500
ヒトイネ
508 名前：デフォルトの名無しさん mailto:sage [2011/09/27(火) 22:25:38.34 .net]: >500
バグレポートしたら、ちゃんと対応してもらえたよ？
509 名前：デフォルトの名無しさん mailto:sage [2011/10/03(月) 02:47:52.78 .net]: もしかして関数呼び出しはOpenCL Cで記述出来ない．．．？
cudaでいう__device__のように記述出来るかと思ったらそんなことはないのかひどいぞこれは
510 名前：デフォルトの名無しさん mailto:sage [2011/10/03(月) 02:54:10.32 .net]: そんなことはなかったすみませんでした
511 名前：デフォルトの名無しさん mailto:sage [2011/10/03(月) 22:18:02.72 .net]: >>503
バグレポートなんか出来るの？
512 名前：デフォルトの名無しさん mailto:sage [2011/10/04(火) 00:03:56.22 .net]: コンパイル時に死ぬバグだけどコンパイラのサポート窓口は分からなかったので
KernelAnalyzerのAboutにあるメアドに「KernelAnalyzerが死ぬんだけど」
って送った。（嘘はついてないつもり）
コンパイラチームに転送してくれて11.10/2.6で直るって連絡来たよ。
実行時に死ぬのとか結果が変なのもForumに書けば結構みてくれるよ。
513 名前：デフォルトの名無しさん mailto:sage [2011/10/05(水) 23:41:21.79 .net]: >>507
Forumに書いても放置が多いみたいで困る。。
514 名前：デフォルトの名無しさん [2011/10/06(木) 05:23:23.41 .net]: 俺が今書いてるJavaプログラムの中で
２つのbyte配列に対する１００～５万回くらいの論理積（単にforループで２つの配列の論理積をとる）が頻繁に発生するんだけど
そういうとこでOpenCL使ったら高速化期待できる？
まとめて１００万回くらいならＧＰＵが速そうなんだけど
１００回で済むとかだとオーバーヘッドがでかいのかなと思って躊躇してる
515 名前：デフォルトの名無しさん mailto:sage [2011/10/06(木) 18:38:50.63 .net]: aparapiでも使ってみたら？
516 名前：デフォルトの名無しさん mailto:sage [2011/10/17(月) 07:38:26.26 .net]: C++のラッパーを最近使い始めたけどかなり使いやすいね。
とくにメモリ解放が楽になった。
517 名前：デフォルトの名無しさん mailto:sage [2011/11/02(水) 21:22:05.07 .net]: OpenCLは構造体のメモリオブジェクトを作成できますか？

CUDAだったら
typedef struct {
float *num;
} DATA;

DATA data;

cudaMalloc( &data.num, sizeof(float) * 1024 );

みたいにできるんですけど
518 名前：デフォルトの名無しさん mailto:sage [2011/11/02(水) 23:38:01.05 .net]: >>512
例が意味不明
それじゃGPU上に単なるfloat型の配列を確保して、
そのdeviceポインタをCPUの構造体メンバに代入しているだけ。

OpenCLでもGPU上にfloat型の配列をbufferとして確保して、
それをCPUの構造体メンバに代入することは出来る。
メンバ変数の型はfloat*では無く、cl_memだけどね。

でも、その配列自体をGPU側にコピーして、
間接アクセスしようとするとCUDAとOpenCLでは全く違う。

OpenCLではGPU上のポインタは1つのカーネル呼び出し内でしか
一貫性が保証されないから、ポインタを保存しておいて
次のカーネル呼び出しで使うという事が不可能
(cl_memはハンドルに過ぎず、OpenCLのランタイムは
GPU上のオブジェクトを再配置する可能性があるから)
まあ、やるとしたら大きなbufferをメモリプールとして生成して、offsetをポインタの代わりに保存
後でアクセスするときにはbufferを引数に渡して、それにoffset足した位置を触るという
形にするしかない。

まあ、CUDAでも実際にはこの方がCPUとGPUで同じデータを扱えるし、
性能面でも悪くないやり方なんだけど。
519 名前：デフォルトの名無しさん mailto:sage [2011/11/03(木) 01:23:08.95 .net]: ラデ外付けGPUに大量にデータを送りたいんだけど、1/4までって制限どうにかならないの？256MBまでしか送れん
520 名前：デフォルトの名無しさん mailto:sage [2011/11/03(木) 10:05:29.53 .net]: いや、1/4なのではなく 256MBまでという制限。
sizeof(float4) * 4096 * 4096.
521 名前：デフォルトの名無しさん mailto:sage [2011/11/03(木) 10:38:23.81 .net]: >>515
これって変えられないの？
522 名前：デフォルトの名無しさん mailto:sage [2011/11/04(金) 11:46:02.78 .net]: 馬鹿には無理
523 名前：デフォルトの名無しさん mailto:sage [2011/11/07(月) 02:56:58.68 .net]: 並列化させるのも結構苦労するよね。
簡単な演算ならいいけど、データ依存がちょっとでも複雑になると
動かすカーネルの順番とか数とか
気にしなきゃいけないことｲﾊﾟｰｲ
524 名前：デフォルトの名無しさん mailto:sage [2011/11/15(火) 23:57:17.03 .net]: OpenCL 1.2
www.khronos.org/news/press/releases/khronos-releases-opencl-1.2-specification
525 名前：デフォルトの名無しさん mailto:sage [2011/11/16(水) 00:44:39.04 .net]: NVIDIAのドライバがカオスになるな
ｇｄｇｄの果てに漸く1.0対応が落ち着いたと思ったら
28x世代の1.1対応でまたおかしくなってまだ終息してないのに
526 名前：デフォルトの名無しさん mailto:sage [2011/11/16(水) 01:54:02.46 .net]: 彼らにはCUDAがあるからなぁ。。
頑張る必要が無いのだろう。
527 名前：デフォルトの名無しさん mailto:sage [2011/11/19(土) 02:59:11.80 .net]: nVidiaはどこに向かっているんだ…

OpenACC : 新しい並列コンピューティングのためのプログラミング環境
www.shader.jp/?p=466
528 名前：デフォルトの名無しさん mailto:sage [2011/11/19(土) 19:26:18.05 .net]: それはOpenMPのGPU版みたいなものなので、CUDAやOpenCLとは衝突しない
529 名前：デフォルトの名無しさん mailto:sage [2011/11/19(土) 20:50:05.10 .net]: AlteraがFPGAでOpenCLを、とか言い出してて面白そうな感じ。
530 名前：デフォルトの名無しさん mailto:sage [2011/11/19(土) 21:07:31.87 .net]: C++AMPのNVIDIA版ぽいね
まぁC++AMPはNVIDIAでも動くけど

インライン記述の世代でどれが主導権を握れるかは気になるところ
531 名前：デフォルトの名無しさん mailto:sage [2011/11/19(土) 23:38:32.61 .net]: MSは最終的にC++AMPをオープンにすると言ってはいるが、結局オプソ系コミュニティがどう動くかだな
CPUの並列ライブラリはMSはOpenMPからPPL推し、オプソ系は主にTBBと別れてしまっているので、
GPUではどうにかして歩調を揃えてもらいたいところ

ただ、一応オープン化を標榜するC++ AMPに介入するわけでもなくかといってCUDAの様に自社GPU専用に囲い込むわけでもなく、
立ち位置の被るオープン規格を立ち上げたNVIDIAの意図が分からんといえば分からん
GPUに全てを賭けるメーカーとしては握れる手綱は全て握っておきたい、という事なのかな
532 名前：デフォルトの名無しさん mailto:sage [2011/11/20(日) 01:50:41.74 .net]: >>523
使う側は思いっきり衝突するだろ
533 名前：デフォルトの名無しさん mailto:sage [2011/11/20(日) 02:32:04.15 .net]: >>522
PGI Accelerator が元になっているのかな?
www.softek.co.jp/SPG/Pgi/Accel/index.html
534 名前：デフォルトの名無しさん mailto:sage [2011/11/22(火) 14:27:24.23 .net]: インタビューで簡単にOpenACCについてふれてる
insidehpc.com/2011/11/21/cuda-reaches-5th-birthday-openacc-ramps-up/
535 名前：デフォルトの名無しさん mailto:sage [2011/11/22(火) 23:50:42.88 .net]: カーネルの実行順位はイベントで指定できる
OpenCLのバイナリコンパイルと読み込みうまくできない・・・

バイナリなしだと環境自由になるけど
ソース丸出しになるから計算高速化くらいしか使い道ないね
536 名前：デフォルトの名無しさん mailto:sage [2011/11/25(金) 00:37:00.99 .net]: 1.2の新機能
www.streamcomputing.eu/blog/2011-11-19/difference-between-opencl-1-2-and-1-1/
537 名前：デフォルトの名無しさん mailto:sage [2011/11/25(金) 22:22:16.51 .net]: >>531
ダイナミックに追加が変更があったのって、DirectX関係だけだな。。。
538 名前：デフォルトの名無しさん mailto:sage [2011/11/28(月) 10:27:25.45 .net]: なんかもーGPUメーカーは独自に動いてるし、開発する気無いだろｗ
539 名前：デフォルトの名無しさん mailto:sage [2011/11/29(火) 19:35:56.69 .net]: intel CPU制限多すぎ・・・SSE4.1対応って書いておいてくれよ・・・
core2 quad全部対応してるかのようなのはやめてほしい・・・
XPで使えないのはちょっと困る・・・
540 名前：デフォルトの名無しさん mailto:sage [2011/11/29(火) 23:11:26.28 .net]: SSE見逃してたごめん
541 名前：デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:12:08.31 .net]: SSEぐらいOpenCL使わなくってもいいじゃん
542 名前：デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:50:42.75 .net]: >>536
OpenCLの機能実現するのに都合がいい命令がSSE4.1にあるからインテルの開発ツールはSSE4.1対応の世代以降でないと使えないんだよ
どうせ普及する頃には古い世代のCPUいなくなってるよねって方針なんだろ
543 名前：デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:58:02.95 .net]: GPUが使えない環境での互換性用と割り切って広くサポートしてくれたほうがまだ有用なのにな
544 名前：デフォルトの名無しさん mailto:sage [2011/12/05(月) 06:55:31.93 .net]: 構造体そのままカーネルに放り投げられない・・・
x.yに配列分けなくちゃだめか・・・
GPU正直CUDAのほうが楽だよね・・・
CPUとGPU同時並列に魅力感じてたけど
両方ともスレッドが少なすぎて・・・
545 名前：デフォルトの名無しさん mailto:sage [2011/12/05(月) 09:48:13.49 .net]: なにいってるんだ？
546 名前：デフォルトの名無しさん mailto:sage [2011/12/05(月) 11:51:31.75 .net]: 構造体 a
int x;
int y;
の配列をそのままメモリバッファにコピーしても
うまくいかなかったので・・・
AMDのカーネルアナライザーでエラーがでてたんです
if(a[id].x-a[id].y){}
結局配列分割してコピーしました・・・
547 名前：デフォルトの名無しさん mailto:sage [2011/12/05(月) 12:04:37.78 .net]: 組み込みのint2でいいじゃない。
548 名前：デフォルトの名無しさん mailto:sage [2011/12/05(月) 16:36:44.62 .net]: そうですね
それで組み込んでみます
549 名前：542 mailto:sage [2011/12/05(月) 21:49:58.78 .net]: >>543
まず無いだろうけど、別スレッドで
同じ添え字のxとyをバラバラに更新すると嵌るよ。
550 名前：543 mailto:sage [2011/12/06(火) 04:05:54.65 .net]: >>544
xを固定してyの値すべて計算して次のxへという
九九を生成するようなマニアックな使い方をしてるんです・・・
551 名前：542 mailto:sage [2011/12/06(火) 07:51:19.62 .net]: それなら分けた方がいいと思う。
552 名前：543 mailto:sage [2011/12/06(火) 09:23:20.52 .net]: そうしてみます！
553 名前：デフォルトの名無しさん mailto:sage [2011/12/07(水) 22:41:57.13 .net]: ふう・・・ついに完成しました
ちまちま25%使うよりフルロードはいいですね
ただ、オーバーヘッドがいくらあるからはわかりませんが・・・
554 名前：デフォルトの名無しさん mailto:sage [2011/12/08(木) 07:31:00.39 .net]: 256MBの制限に引っかかって処理が止まるorz
これの上限増やせないのか?
555 名前：デフォルトの名無しさん mailto:sage [2011/12/08(木) 10:09:58.25 .net]: >>549
グローバルメモリが足りない・・・のかな？
ttp://www.ozone3d.net/gpu_caps_viewer/
これで確認してみて

それかワークスレッドの設定が悪いのかも
556 名前：デフォルトの名無しさん mailto:sage [2011/12/08(木) 11:03:39.84 .net]: >>550
なんでダメか分かった、ありがとう
ローカルメモリ32kbしかないのに2mb使おうとしてたwww
557 名前：デフォルトの名無しさん mailto:sage [2011/12/08(木) 14:28:54.91 .net]: >>551
使い捨てる変数の宣言くらいがちょうどいいよ
NVIDIAはローカルメモリ使わないと倍ぐらい遅くなるけど
他はそうでもないから(OpenCL入門に比較があったよ)
グローバルで問題ないと思うよ
558 名前：デフォルトの名無しさん mailto:sage [2011/12/15(木) 20:39:38.90 .net]: www.4gamer.net/games/076/G007660/20111214033/

おまいらこれからもOpenCLにしがみついて行くの？
559 名前：デフォルトの名無しさん mailto:sage [2011/12/15(木) 20:44:38.54 .net]: CUDAはGPUしかできないけど一度により多くの処理ができる
OpenCLはCPUとGPUを同時並列処理ができるのが魅力
どっちにも特化した特性があるからプログラムしだいだよ
560 名前：デフォルトの名無しさん mailto:sage [2011/12/15(木) 22:16:31.17 .net]: GPUには留まらない図が載ってるよ、ヌフォの所に
561 名前：デフォルトの名無しさん mailto:sage [2011/12/15(木) 22:40:09.72 .net]: もうGPU固有じゃなくなってきたのね・・・
カーネル丸出しのCLは論文すら少ない・・・
562 名前：デフォルトの名無しさん mailto:sage [2011/12/26(月) 03:28:48.61 .net]: 引数の渡し方が面倒なんだよなー
思わぬところでバグが出たりする
563 名前：デフォルトの名無しさん mailto:sage [2012/01/18(水) 10:01:49.46 .net]: openclを実用的に使うにはどんな環境がおすすめでしょうか
564 名前：デフォルトの名無しさん mailto:sage [2012/01/18(水) 10:11:34.51 .net]: いつでもCUDAに逃げられる環境
565 名前：デフォルトの名無しさん mailto:sage [2012/01/18(水) 22:05:36.88 .net]: nVidiaってこと？
566 名前：デフォルトの名無しさん mailto:sage [2012/01/19(木) 09:51:18.68 .net]: グラフィックボードは倍精度不動小数点数（cl_amd_fp64）が利用可能な
Radeon HD 7900、6900、5900/5800 シリーズがおすすめ

blog.tommy6.net/archives/74
567 名前：デフォルトの名無しさん mailto:sage [2012/01/19(木) 16:52:31.76 .net]: 宗教戦争が始まりそうだな
568 名前：デフォルトの名無しさん mailto:sage [2012/01/19(木) 17:05:38.23 .net]: >>561
紹介thx
569 名前：デフォルトの名無しさん mailto:sage [2012/01/19(木) 18:25:09.26 .net]: どうせおまえらめんどくさい組み込み関数なんか使わないだろってことか？
570 名前：デフォルトの名無しさん mailto:sage [2012/01/23(月) 19:34:34.31 .net]: GCNでアセンブリが変わったのか、動かなくなってしまった・・・
571 名前：デフォルトの名無しさん mailto:sage [2012/01/25(水) 02:58:13.00 .net]: 変わる以前にGCN対応ドライバ＆ランタイムまだ出てないでしょ
CCC12.1Previewが出回ってるからそれ付属のSDKランタイムなら動くんじゃないの
572 名前：デフォルトの名無しさん mailto:sage [2012/01/25(水) 03:08:02.37 .net]: Kernel AnalyzerもTahiti対応版出てないしな
573 名前：デフォルトの名無しさん [2012/02/01(水) 22:06:59.00 .net]: RADEONとGeforce、ガチンコ対決ではごっちが速いの？
574 名前：デフォルトの名無しさん mailto:sage [2012/02/01(水) 22:33:40.43 .net]: ごっちかな
575 名前：デフォルトの名無しさん mailto:sage [2012/02/01(水) 23:52:53.73 .net]: そもそもガチンコな応用でOpenCLってまともに実績あるの?
576 名前：デフォルトの名無しさん mailto:sage [2012/02/02(木) 00:02:24.64 .net]: 無ければなんだっての？
577 名前：デフォルトの名無しさん mailto:sage [2012/02/02(木) 15:35:32.54 .net]: いや別に問題ない
578 名前：デフォルトの名無しさん [2012/02/10(金) 23:47:32.03 .net]: とりあえず齧る分には公式のプログラミングガイド買っとけばおｋ？
579 名前：デフォルトの名無しさん mailto:sage [2012/02/13(月) 02:50:23.08 .net]: OK
C言語と同じ
580 名前：デフォルトの名無しさん mailto:sage [2012/02/22(水) 23:40:42.01 .net]: サブルーチンみたいにカーネルに直接引数渡して処理できればなぁ
アドレスを渡す時とかすげえ面倒。
581 名前：デフォルトの名無しさん mailto:sage [2012/02/23(木) 01:38:17.77 .net]: そんな気軽にあちこちで使うようなもんじゃないっしょ
582 名前：デフォルトの名無しさん mailto:sage [2012/03/08(木) 16:45:33.65 .net]: カーネルソース丸出しか
特定デバイス用にコンパイルしておかないと
いけないのがなあ
583 名前：デフォルトの名無しさん mailto:sage [2012/03/08(木) 16:57:57.20 .net]: 大したことないやつほど隠したがる銭湯の法則
584 名前：デフォルトの名無しさん mailto:sage [2012/03/08(木) 22:38:56.05 .net]: BOINC的なもので使うと不正対策必要で、既知の答えも一緒に計算させたりして対策するんだけどエコじゃないて悩ましいよ
585 名前：デフォルトの名無しさん mailto:sage [2012/03/11(日) 01:23:31.48 .net]: それなら同じWU他のやつに配って結果一致したやつだけ採用、
合わなかったら更に配布して一致した方採用でいいんでないかね
どのみち普通にやったって計算エラーになるのもいるし
586 名前：デフォルトの名無しさん mailto:sage [2012/03/11(日) 02:45:56.59 .net]: つーかカーネルがソースコードだから
改竄される恐れがなんて懸念するような
プログラムなら、どんな形態で配るにせよ
ディスアセンブルされりゃ同じだって。
587 名前：デフォルトの名無しさん mailto:sage [2012/03/17(土) 16:17:03.96 .net]: 個人PCでスパコンの1/1000の計算速度（10テラFLOPS）だってよ。スゲーな。

dualsocketworld.blog134.fc2.com/blog-date-201202.html
588 名前：デフォルトの名無しさん mailto:sage [2012/03/18(日) 17:23:23.96 .net]: 10TFLOPSっていうと10年前のスパコンの性能と同じくらいだな
589 名前：デフォルトの名無しさん mailto:sage [2012/03/18(日) 20:53:01.85 .net]: 10年後に京の性能がご家庭に来るかというと、さすがにそうでもない感。
590 名前：デフォルトの名無しさん mailto:sage [2012/03/18(日) 21:28:00.64 .net]: 物理的限界が近づいてきたからこれまでとは事情が違うよね。
無知な人は技術でなんとかなるって言っちゃうだろうけどw
591 名前：デフォルトの名無しさん mailto:sage [2012/03/18(日) 23:15:06.83 .net]: 一般家庭にベクトル演算ってそんなに必要ない気が。。。
592 名前：デフォルトの名無しさん mailto:sage [2012/03/19(月) 10:47:53.21 .net]: O(n^2)の直接法のN体とか本当にベンチマーク以上の意味はないんだがな
実用コードはツリー法やFMM法を使う
593 名前：デフォルトの名無しさん mailto:sage [2012/03/19(月) 17:14:11.16 .net]: O(n^2)がツリー法だとO(n logn)に、FMMだとO(n)になるそうだ

www.kurims.kyoto-u.ac.jp/~kyodo/kokyuroku/contents/pdf/1084-12.pdf
594 名前：デフォルトの名無しさん mailto:sage [2012/04/13(金) 00:11:16.74 .net]: AdobeのCS6でOpenCLが使われているという噂を聞いたんだが、カーネルのソースコードとかどうやってるんだろうか
595 名前：デフォルトの名無しさん mailto:sage [2012/04/13(金) 03:29:06.78 .net]: >>589
Adobeのライセンス認証部分のコードだって、一緒にディスクに入ってるわけですよ。
どうにでもなる。
596 名前：デフォルトの名無しさん [2012/04/29(日) 15:57:09.88 .net]: Intel OpenCL SDKを使って開発をしようとしているのですが、CPUとGPUを非同期で
走らせる方法が分かりません。
サンプルなどないでしょうか?
597 名前：デフォルトの名無しさん mailto:sage [2012/04/29(日) 20:57:55.38 .net]: >>587
必ずしもそうでもない。もちろん限られたケースだが、空間ごとに時間刻みを変えたい場合とか、ツリー方とかだと複雑になりすぎてまだまだ難しい場合も多い。
そもそも、ツリーやFMMでも近傍場の計算は直接法だし、サンプルコードとして無意味ではない。
598 名前：デフォルトの名無しさん [2012/05/02(水) 10:33:58.88 .net]: >>591
CPU側を並列化してGPUを扱うスレッド/プロセスとCPU側の計算をするものに分ける
並列化、同期はお好みの方法で
599 名前：デフォルトの名無しさん mailto:sage [2012/06/27(水) 01:05:42.85 .net]: 質問なんだけど今はAMD/nVidia/IntelどのSDKでビルドしても
AMD/nVidiaのドライバが入っている環境ならGPUが利用できるって理解でok？
600 名前：デフォルトの名無しさん mailto:sage [2012/06/27(水) 21:29:31.15 .net]: >>594
違うというか、根本的に違う
601 名前：デフォルトの名無しさん mailto:sage [2012/06/30(土) 22:46:38.04 .net]: >>594
理論上は合っているよ。
まあ、微妙に非互換だったり、ランタイムの
インストール方法など気を使わざるを得ないのが現実だが。
602 名前：デフォルトの名無しさん mailto:sage [2012/07/01(日) 01:24:59.44 .net]: >>595
603 名前：デフォルトの名無しさん mailto:sage [2012/07/01(日) 12:56:18.02 .net]: >>595
604 名前：デフォルトの名無しさん mailto:sage [2012/07/05(木) 01:16:06.38 .net]: GT440でclinfoしたら
Max compute units: 2
と出たんだけど、この２とGT440のCUDAコア96とはどういう関係にあるの？
605 名前：デフォルトの名無しさん mailto:sage [2012/07/05(木) 12:03:19.25 .net]: NVIDIAの場合
Max Compute unit = Streaming Multiprocessor(SM) = Streaming Multiprocessor eXtreme(SMX)
606 名前：デフォルトの名無しさん mailto:sage [2012/07/27(金) 10:28:17.75 .net]: CPUデバイスのランタイムを有効にするにはAMDかインテルのSDKをインストールしてもらうしかないの？
ランタイムだけのパッケージってある？
607 名前：デフォルトの名無しさん mailto:sage [2012/07/27(金) 11:10:16.02 .net]: >>601
Intel の Windows 用ならあるね。
AMD は知らん。
608 名前：デフォルトの名無しさん mailto:sage [2012/07/28(土) 14:23:52.35 .net]: software.intel.com/en-us/articles/vcsource-tools-opencl-sdk/
のダウンロードリストボックスのOpenCL CPU only runtime(Windows* OS)ってやつか。
見落としてた。ありがとう。
609 名前：デフォルトの名無しさん mailto:sage [2012/07/30(月) 20:27:19.07 .net]: CPUでCLやっても遅いだけで意味無いなぁ
610 名前：デフォルトの名無しさん mailto:sage [2012/07/30(月) 22:03:29.12 .net]: >>604
どんなプログラムなのかしらないけど、ボクが試したのは充分速かったけどなぁ。
いやまあ、GPUと絶対値を比べればもちろん遅いけど。ｗ
611 名前：デフォルトの名無しさん mailto:sage [2012/07/30(月) 22:41:12.50 .net]: CPUでOpenCL使うとお手軽にSIMD+マルチコア使えるな。
612 名前：デフォルトの名無しさん mailto:sage [2012/07/30(月) 22:48:37.20 .net]: ベンチも取らずに知ったか
613 名前：デフォルトの名無しさん mailto:sage [2012/07/31(火) 00:12:55.35 .net]: ベンチと言えば Intel と AMD で比べてみたら、Intel のほうがかなり速かった。
いやまあ、その PC の CPU は Intel だったんだけど。ｗ
AMD な CPU だと逆転したりするのかなぁ。
614 名前：デフォルトの名無しさん mailto:sage [2012/07/31(火) 07:48:58.72 .net]: >>606
お手軽じゃねーっつの。
CPUでSIMDとマルチコアを使いたいためだけにOpenCLを使つかうならアホだわ。
615 名前：デフォルトの名無しさん mailto:sage [2012/07/31(火) 10:50:46.32 .net]: phoronixのベンチ見る限りだとAMDのSDKの方が速そうだったけど
616 名前：デフォルトの名無しさん mailto:sage [2012/07/31(火) 18:30:47.41 .net]: 少なくともカーネル部分はお手軽だよ。

素のCで使うと準備が面倒だが
C++のラッパーなら大した事は無い。
617 名前：デフォルトの名無しさん mailto:sage [2012/07/31(火) 22:46:48.26 .net]: OpenCL以外でSIMDに自動で対応してくれるのってなにかあるの？
618 名前：デフォルトの名無しさん mailto:sage [2012/08/01(水) 06:14:34.83 .net]: インテルコンパイラ使っとけ。
それかFortranだな。
619 名前：デフォルトの名無しさん mailto:sage [2012/08/01(水) 13:12:30.64 .net]: simdと言っているのがSSEのパックドなインストラクションのことでいいならgccでもOK。
620 名前：デフォルトの名無しさん mailto:sage [2012/08/01(水) 22:34:10.47 .net]: gccじゃ自動ベクトル化は皆無に等しいだろ。
621 名前：デフォルトの名無しさん mailto:sage [2012/08/01(水) 22:54:07.37 .net]: ちょっと前までSSEｗとか思ってたけど
これだけ並列プログラミングが普及してきてAVX2とかみると考え変わる
622 名前：デフォルトの名無しさん mailto:sage [2012/08/01(水) 23:22:54.44 .net]: >>611
んなアホな
CL用のメモリとのやり取りが発生するだけ無駄だよ
正直、マルチコアを使いたいならMPIが一番速い。
通信含めても。
OpenMPもなんだかんだであまり速くないな。

>>612
PGI　　　はあまりコードの品質よくなかったな
623 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 00:32:11.20 .net]: >>617
なんか解釈に誤解があるようだが。
マルチコアのどんなプログラムでもOpenCLで書けという話ではない。

OpenCLのカーネルとして記述できるような問題に
適用すれば、なんも考えずにSIMDもマルチコアも
使えるようになるし、そういう用途に限れば
OpenMPやMPIもしくはPOSIX threadとかで
真面目に書くよりお手軽だし、余程の玄人が
書くのでない限り素早く、速いコードが書ける。

CL用のメモリ云々言っておきながら、速度面で
マルチスレッドなOpenMPでなくマルチプロセスになる
MPIをすすめるあたり根本的に理解に問題があるような。
まあ、通信部分はintel MPIとかなら共有メモリ使うから
極端に不利にはならないけど、少なくともこれが最速とは行かない。
624 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 00:45:08.79 .net]: てかさ、CL 用のメモリとのやりとりなんかしないよね？
いや、しないようにつくるよね？？？？

>CPUでSIMDとマルチコアを使いたいためだけにOpenCLを使つかうならアホだわ。
うわ、アホって言われちゃった。てへ。
625 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 01:31:56.84 .net]: OpenCLとMPIの並列化は全く別もんだし、
OpenCLとOpenMPの並列化もちょっと違う。
正直OpenCLのカーネルを書くくらいなら、
OpenMPを使った並列化の方が圧倒的に楽だわ。
OpenCLを使うメリットは複数のプラットフォームで動かすためだけだろ。
626 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 06:37:43.98 .net]: 無脳をさらすスレですか？
627 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 07:45:55.61 .net]: >>619
CLデバイスとCPUは論理的に別物なんだからメモリ転送はいるだろ。

>>620
GPUがなければOpenMPなりMPIなりで並列動作しているというプログラムを作ればよい。
CPUの並列も面倒くさいのでCLでってのは手抜き杉
628 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 08:05:46.59 .net]: >>622
CLで書くほうが手間がかかると思うが。。。
CPU用のコードとNVIDIA用のコード、ATI用のコードを用意するのはかなり大変だし。だからOpenCLが生まれたわけで。
629 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 08:07:44.71 .net]: >>623
GPUがあればそっちをつかいたいのならCLを書くこと自体が手間とか言ってる場合じゃないだろ。
それ一本で済まそうというのが手抜きだっての。
CPUでCLつかっても無駄なオーバーヘッドが出るだけだし
630 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 08:13:47.37 .net]: 論理的に別なのはわかるけど
対象がCPUの時にはメモリコピーしないような実装になっててもおかしくないような気もする
631 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 08:14:10.39 .net]: まあ、小さい規模のコードしか書いてない奴には分からんかもしれんが、
複数のハードウェアプラットフォームをそれぞれメンテしないといけなのは、
かなりの工数がかかるからな。
多少のパフォーマンスを犠牲にしても良いことなんて沢山あるんだよ。
632 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 09:23:17.69 .net]: えぇ～・・・・・・。
キミタチは実際につかったことないんだね？

ttp://software.intel.com/sites/landingpage/opencl/optimization-guide/index.htm
の Sharing Resources Efficiently とか読んでごらんよ。
633 名前：デフォルトの名無しさん mailto:sage [2012/08/02(木) 23:04:54.27 .net]: これは恥ずかしいｗ
634 名前：デフォルトの名無しさん mailto:sage [2012/08/03(金) 00:10:12.73 .net]: どれにレスしてんだか分からんレスがおおいな。
635 名前：デフォルトの名無しさん mailto:sage [2012/08/03(金) 00:34:42.14 .net]: このスレ、９９割が誤爆レスだからな。
636 名前：デフォルトの名無しさん mailto:sage [2012/08/03(金) 19:43:05.27 .net]: >>630
> 、９９割
0.99 割？ 990% ？

どのスレに書こうとしてたの？
637 名前：デフォルトの名無しさん mailto:sage [2012/08/04(土) 01:06:20.28 .net]: だ　ー　か　ー　ら　ー　ぁ　誤　爆　で　し　ょ
638 名前：デフォルトの名無しさん mailto:sage [2012/08/08(水) 17:52:37.24 .net]: なんでこのスレこの板にあるんだ?
639 名前：デフォルトの名無しさん mailto:sage [2012/08/09(木) 01:30:40.64 .net]: OpenCLハードル高いなぁ
どの機材構成でどのプラットフォームでどう書けば速くなるか
検証すべき項目が多すぎる
640 名前：デフォルトの名無しさん mailto:sage [2012/08/09(木) 02:10:21.89 .net]: 逆に考えるんだ
速さをあきらめればすべて解決する
641 名前：デフォルトの名無しさん mailto:sage [2012/08/09(木) 02:22:49.56 .net]: あちらを立てればこちらが立たずですなぁ
642 名前：デフォルトの名無しさん mailto:sage [2012/08/10(金) 17:37:54.94 .net]: 週あすｗでAPUの記事載ってて、OpenCLで何でも高速に出来るように書いてたなぁｗ
643 名前：デフォルトの名無しさん mailto:sage [2012/08/10(金) 23:05:10.52 .net]: write once, tune everywhere
644 名前：デフォルトの名無しさん mailto:sage [2012/08/10(金) 23:06:13.71 .net]: anywhereだったか
645 名前：デフォルトの名無しさん mailto:sage [2012/08/16(木) 08:59:47.91 .net]: OpenCL1.2ではデバイス分割ができるみたいだけど
それまでってどうやって並列化してたの？
コマンドキューをCompute Unit分生成してたの？
それともclEnqueueNDRangeKernelがいい感じに並列化してくれてたの？
646 名前：デフォルトの名無しさん mailto:sage [2012/08/17(金) 04:01:39.09 .net]: でっかく突っ込んだら普通にデスクトップがフリーズしてた。
647 名前：デフォルトの名無しさん mailto:sage [2012/08/21(火) 22:38:27.42 .net]: OpenCLで最速の構成教えて
648 名前：デフォルトの名無しさん mailto:sage [2012/08/22(水) 00:38:21.46 .net]: 素晴らしいプログラマ

これに尽きるｗ
649 名前：デフォルトの名無しさん mailto:sage [2012/08/22(水) 09:45:30.14 .net]: >>642
Radeon の一番高いヤツをさせるだけさす。ｗ
650 名前：デフォルトの名無しさん mailto:sage [2012/08/31(金) 15:37:24.77 .net]: APUより速いん？
651 名前：デフォルトの名無しさん mailto:sage [2012/09/06(木) 03:18:56.29 .net]: だれかOpenCLでOpenGL実装してくれ
652 名前：デフォルトの名無しさん [2012/09/08(土) 00:09:32.81 .net]: むしろOpenManko実装してくれ
653 名前：デフォルトの名無しさん mailto:sage [2012/09/08(土) 01:20:37.10 .net]: プロプライエタリですので
654 名前：デフォルトの名無しさん [2012/09/08(土) 18:07:21.58 .net]: OpenMankoはよ
655 名前：デフォルトの名無しさん mailto:sage [2012/09/08(土) 22:36:50.84 .net]: 互換フリー0実装のKuperで我慢しとけ。
656 名前：デフォルトの名無しさん mailto:sage [2012/09/09(日) 23:25:50.57 .net]: Mankoは商用製品で我慢しろよ
657 名前：デフォルトの名無しさん mailto:sage [2012/09/20(木) 15:05:43.24 .net]: 昔の日本はOpenだろ
658 名前：デフォルトの名無しさん [2012/09/27(木) 04:12:39.50 .net]: AMD Releases CodeXL Public Beta | SemiAccurate
semiaccurate.com/2012/09/25/amd-releases-codexl-public-beta/
659 名前：デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:09:53.66 .net]: pc.watch.impress.co.jp/img/pcw/docs/563/431/g02.png
660 名前：デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:15:43.73 .net]: engawa.2ch.net/test/read.cgi/poverty/1349151623/
661 名前：デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:16:52.94 .net]: prohardver.hu/dl/cnt/2012-10/90356/results/handbrake.png
662 名前：デフォルトの名無しさん mailto:sage [2012/10/28(日) 20:13:53.12 .net]: 意外と
663 名前：デフォルトの名無しさん [2012/11/30(金) 23:33:09.24 .net]: Khronos Releases Significant OpenCL 1.2 Specification Update | techPowerUp
www.techpowerup.com/176413/Khronos-Releases-Significant-OpenCL-1.2-Specification-Update.html
664 名前：デフォルトの名無しさん mailto:sage [2012/12/07(金) 11:27:13.90 .net]: OpenCLでパスワード解析
securityledger.com/new-
665 名前：25-gpu-monster-devours-passwords-in-seconds/ []: [ここ壊れてます]
666 名前：デフォルトの名無しさん mailto:sage [2012/12/20(木) 01:25:19.05 .net]: >>615
vetor extension記法でゴリゴリかく。
若しくは、-O3 -ftree-vectorize
但し、後者はまだまだ未熟なのは確かだね。
667 名前：デフォルトの名無しさん mailto:sage [2012/12/21(金) 09:03:58.99 .net]: 最近OpenCLを本格的に始めたんだが、
OpenCLのいいところは、コンパイラを選ばない、
カーネル以外はC++で書けるといところかな。

CUDAだと同じことができるけど、ホスト側でNVCC以外使おうとするとちょっと面倒だ。
ただ、カーネルの最適化がコンパイラでもできるから、
パフォーマンスは出やすいな。

LLVMで最適化レベルって設定ができるのかな？
668 名前：デフォルトの名無しさん mailto:sage [2012/12/22(土) 01:07:39.90 .net]: >>661
アーキテクチャが何にでも対応できるが、
アーキテクチャによって最適なWARP(に相当するもの）の数が違ったり、
コアレセンスアクセスできる条件が違ったり、キャッシュの有無だったりで
結局はアーキテクチャ依存の最適化をしないと速くならないよ。
669 名前：デフォルトの名無しさん mailto:sage [2012/12/22(土) 02:28:20.85 .net]: 場合によってはコンパイラのバージョン依存も。
670 名前：デフォルトの名無しさん mailto:sage [2012/12/24(月) 05:32:34.90 .net]: やっとCL使うネタが準備できた
楽しみだー
671 名前：デフォルトの名無しさん mailto:sage [2013/01/13(日) 19:49:11.31 .net]: Trinity APUで使ったらCPU使用率が50%（2コアなので1コアがフル稼働状態）になったが、こんなもんなの？
GPUで計算してるはずなんだが。
672 名前：デフォルトの名無しさん mailto:sage [2013/01/14(月) 05:46:41.04 .net]: ジョブの内容と数によるんでは。
673 名前：デフォルトの名無しさん mailto:sage [2013/01/14(月) 21:42:22.31 .net]: CUDA見たいに結果出るまでぽーりんぐしてんじゃないの？
674 名前：デフォルトの名無しさん mailto:sage [2013/01/14(月) 22:02:09.36 .net]: 自分のマシンのFLOPS計るのはどのベンチがお勧め？
675 名前：デフォルトの名無しさん mailto:sage [2013/01/15(火) 00:36:48.35 .net]: クロックとシェーダの数を掛ければ。
676 名前：デフォルトの名無しさん mailto:sage [2013/01/15(火) 12:44:28.36 .net]: ちゃんとGPUで計算されてないだけじゃね
afterburnerかなんかでGPU側の使用率も見てる？
677 名前：665 mailto:sage [2013/01/20(日) 11:45:47.76 .net]: Catalystのバージョン上げたらCPU使用率下がりました
678 名前：デフォルトの名無しさん mailto:sage [2013/01/21(月) 06:12:45.45 .net]: AMDのOpenCL SDKはCPU（SSE）デバイスもサポートしてるから
そっちで動いてたってことかな
679 名前：デフォルトの名無しさん mailto:sage [2013/01/22(火) 00:13:17.77 .net]: デバイス取得時にGPUを指定すればそんな目に合うはずね～が
680 名前：デフォルトの名無しさん mailto:sage [2013/01/22(火) 23:13:25.92 .net]: デバイスにCPU使ってたらCPU使用率100%になるんじゃないの
681 名前：デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:21:18.43 .net]: >>674
特に設定しないとシングルコアだからならない
682 名前：デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:32:16.04 .net]: CPU版はdevice fissionしないと使えるコア全部使わなかったっけ？
683 名前：デフォルトの名無しさん mailto:sage [2013/01/26(土) 18:02:42.38 .net]: いくつか本読んで基礎的なことは
わかったんだけど、openclでmpegのエンコーダー
作ってみたいから何か参考になる情報ないかな
684 名前：デフォルトの名無しさん mailto:sage [2013/01/26(土) 21:16:57.04 .net]: CUDAでこれだからOpenCLはチューニング大変だな
pc.watch.impress.co.jp/img/pcw/docs/584/977/html/7b_prometech_32.jpg.html
685 名前：デフォルトの名無しさん mailto:sage [2013/01/26(土) 22:38:20.74 .net]: >>677
MPEGってどれよ？
MPEG4（H.264）のことならx264がSSE、AVXアセンブリ含むソースコードが読めるからオススメ
686 名前：デフォルトの名無しさん mailto:sage [2013/01/30(水) 22:41:00.14 .net]: 試しに↓使ってみたんだがローカルメモリ使ったら速度が3割落ちた。
www.aocplan.com/gpgpu/gpgpu-benchmark
687 名前：デフォルトの名無しさん mailto:sage [2013/02/05(火) 22:18:38.26 .net]: OpenCLってHyper-Qみたいな機能ってあるでしょうか？
688 名前：デフォルトの名無しさん mailto:sage [2013/02/05(火) 22:28:21.47 .net]: >>678
アーキ毎にカーネルを書きなおさないと性能でないよ。
689 名前：デフォルトの名無しさん mailto:sage [2013/02/06(水) 21:46:06.32 .net]: 各アーキテクチャごとの最適化資料ってある？
690 名前：デフォルトの名無しさん mailto:sage [2013/02/07(木) 05:31:00.88 .net]: AMDだとこれが詳しい。NVIDIAのだったらCUDAのマニュアルを読めばいい。
developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf
691 名前：デフォルトの名無しさん mailto:sage [2013/02/11(月) 23:11:22.51 .net]: 標準のC++に替わり今後はOpenCLが標準に確定したな
OpenCLでパフォーマンスが激向上するから当然か
692 名前：デフォルトの名無しさん mailto:sage [2013/02/12(火) 06:11:15.51 .net]: 寝言は寝て言え
693 名前：デフォルトの名無しさん mailto:sage [2013/02/17(日) 21:21:57.05 .net]: >>684
ありがとう。VLIW4だとスレッド数1/4にして、1スレッドで4つずつ処理するようにしたら倍速になった。
694 名前：デフォルトの名無しさん mailto:sage [2013/02/18(月) 04:23:25.11 .net]: R600のISA解説したpdfもどっかにあって、あれ読むとKernel Analyzerの右側の命令が読めるようになって捗るぞ。
695 名前：デフォルトの名無しさん [2013/05/09(木) 04:25:55.54 .net]: Intel Releases SDK with OpenCL 1.2 Support for Intel Xeon Phi Coprocessors | techPowerUp
www.techpowerup.com/183718/intel-releases-sdk-with-opencl-1-2-support-for-intel-xeon-phi-coprocessors.html
696 名前：デフォルトの名無しさん mailto:sage [2013/05/10(金) 23:28:13.87 .net]: CUDAが動かない古いNvidiaのビデオカードでも
OpenCLなら動いたりするものなのでしょうか？
697 名前：デフォルトの名無しさん mailto:sage [2013/05/11(土) 17:38:28.19 .net]: 確かnvidiaがOpenCLサポートしているのは、
チップがGeforce8以降かつ、ドライバの対応も必要だったと思う。
でもgeforce8以降はほとんどCUDA(とPhysXが）乗ってたはず。
それ以前はサポートされていないから動かないんじゃないかな（機材とドライバがないから検証できん）
698 名前：デフォルトの名無しさん mailto:sage [2013/05/11(土) 23:50:31.95 .net]: CUDAにせよ、OpenCLにせよ古いマシンでやろうとする奴はなんなんだ？
古いGPUじゃ大して効果がないし、アーキテクチャがどんどん変わって
いるから使えないものが多いのに。
最新のアーキテクチャでも1万円も出せばそれなりのものが買えるのになあ。
699 名前：デフォルトの名無しさん mailto:sage [2013/05/12(日) 10:11:53.81 .net]: 研究目的なら最新ので良いけど、実用だと4年前に導入した
数百台の計算機で高速化したい、とかもあるからな。
700 名前：デフォルトの名無しさん mailto:sage [2013/05/13(月) 17:15:31.08 .net]: GeForce8以前って、どんだけ古いカード使っているんだよw
いろんな意味で、無理無理。
701 名前：デフォルトの名無しさん mailto:sage [2013/05/15(水) 13:05:11.17 .net]: とりあえずGPGPU普及させたいならGPU各社ともミドルレンジ以下でFP64対応切るのやめてくんないかな
性能出るかどうかより使えたり使えなかったりってのが一番困る
702 名前：デフォルトの名無しさん [2013/06/05(水) 08:17:39.89 .net]: OpenCLのチューニングって、まずどのあたりから手を付ければいいかな？
ワークグループ分割数で結構変わるという話は聞くけど、やっぱり
おまかせより明示的に指定した方がいいんだろうか？
703 名前：デフォルトの名無しさん mailto:sage [2013/06/05(水) 09:35:33.06 .net]: おまかせとかやる気無さすぎだろう…
色々変えてみて速さを測れ。
704 名前：デフォルトの名無しさん mailto:sage [2013/06/05(水) 20:55:53.52 .net]: ハードに合わせて適当な値を選んでくれると思ってたんで自分で下手な値を設定するより
いいかと思ってたんだけど、たしかに明示的に指定した方がよくなるケースが多いですね。
目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか？
それ以外、これは押さえておけ、というようなチューニングポイントってありますか？
705 名前：デフォルトの名無しさん [2013/06/06(木) 22:37:43.71 .net]: アドレスモードが便利そうなのでイメージオブジェクトを使ってみようと思ったんだけど、
これって4ch固定なんですかね？できれば1chで使いたいんだけど。
706 名前：デフォルトの名無しさん [2013/06/17(月) 09:44:11.96 !.net]: >>698
> 目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか？

これだとスピードでないよ。
Radeonだったら>>684の最適化マニュアルを、NVIDIAだったらCUDAの
説明書を読め。
707 名前：デフォルトの名無しさん mailto:sage [2013/06/18(火) 23:31:21.64 .net]: つか、勉強目的でエミュレータみたいなのが欲しい
遅くていいから
708 名前：デフォルトの名無しさん mailto:sage [2013/06/24(月) 22:41:41.16 .net]: 最近のハードなら何でも出来るだろ。
新しいの買えよ。それぐらい自己投資だ。
709 名前：デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]: ついに 2.0 で Dynamic Parallelism きちゃったじゃねぇか！
710 名前：デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]: nVidiaがいまだに1.1なのはどうにかならんのかな。
711 名前：デフォルトの名無しさん mailto:sage [2013/07/24(水) NY:AN:NY.AN .net]: CUDAがあるから、あまり積極的にやりたくないんじゃね？
712 名前：デフォルトの名無しさん mailto:sage [2013/08/01(木) NY:AN:NY.AN .net]: 今AMDの環境で開発しているんだけど、NVIDIAの環境でもビルドできるよう
1.1の機能に限定することってできないんですかね？
CL_USE_DEPRECATED_OPENCL_1_1_APISみたいな。
713 名前：デフォルトの名無しさん [2013/08/18(日) NY:AN:NY.AN .net]: OpenGLとの連携やっている人いますか？
OpenGLのHGLRCからcl_device_idを得るのにclGetGLContextInfoKHRというのが
ありますが、これを呼ぶ際、properties引数にCL_CONTEXT_PLATFORMを含めないと
エラー(CL_INVALID_PLATFORM)になります。
Platformを決め打ちで入れてやれば成功はしますが、cl_device_idを得る前にそれが
含まれるcl_platform_idを本来どうやって求めるのでしょうか？
714 名前：デフォルトの名無しさん mailto:sage [2013/08/18(日) NY:AN:NY.AN .net]
715 名前：>>707 clCreateContext に渡した properties と同じもので GL context を1つに特定できるものを渡せって書いてあるだろうに clGetGLContextInfoKHR で指定せずにエラーになるなら clCreateContext ではデフォルト値以外の cl_platform_id を指定したんだろう gl_sharing が有効な CL context は作成済みなのになんで cl_platform_id だけ行方不明なんだよ 余所のライブラリが作った CL context に問い合わせたいなら clGetContextInfo で CL_CONTEXT_PROPERTIES []: [ここ壊れてます]
716 名前：デフォルトの名無しさん mailto:sage [2013/08/18(日) NY:AN:NY.AN .net]: 回答ありがとうございます。
ただ、clCreateContextはclGetGLContextInfoKHRでデバイスを得た後に呼ぶことに
なると思うのですが？
手順は以下で間違ってますかね？

GLコンテキスト(HGLRC)作成
→clGetGLContextInfoKHRで関連付けられているCLデバイスを取得
→clCreateContextでCLコンテキストを作成

いずれにしても、どのデバイスを使っているかがわからないとプラットフォームも
決まらないと思うのですが。
717 名前：デフォルトの名無しさん mailto:sage [2013/10/24(木) 01:02:02.86 .net]: vloadn ってあるけど、直接ポインタを p[i] するのと速度違ったりするのか？
718 名前：デフォルトの名無しさん mailto:sage [2013/10/24(木) 21:28:52.21 .net]: vloadはアラインメントの制約がゆるい。要素でそろってればOK。
速度は実装によるだろうけど同じか制約がゆるいvloadのほうが少し遅い。
719 名前：デフォルトの名無しさん mailto:sage [2013/10/24(木) 22:48:45.60 .net]: なるほど。

アラインメントの制約のせいで、ちょっと冗長になってたあのコードとかを小さく綺麗に書き直せるかも。
これは良いことを知った。サンクス。
720 名前：デフォルトの名無しさん mailto:sage [2013/11/22(金) 19:43:38.99 .net]: Khronos Groupが「OpenCL 2.0」を完成、コンピュータビジョン向け「OpenVX 1.0」の暫定仕様も発表
sourceforge.jp/magazine/13/11/22/095200
https://www.khronos.org/news/press/khronos-releases-opencl-2.0
721 名前：デフォルトの名無しさん mailto:sage [2013/11/22(金) 19:46:35.85 .net]: タラタラ完成してんじゃねーよ
722 名前：デフォルトの名無しさん [2013/11/22(金) 20:47:48.41 .net]: OpenVXってのが気になる
723 名前：デフォルトの名無しさん mailto:sage [2013/11/25(月) 08:28:25.60 .net]: JOCLも、早く OpenCL 2.0 に対応しろよ
724 名前：デフォルトの名無しさん mailto:sage [2013/11/30(土) 20:57:20.27 .net]: OpenCLって初期化とかやたら面倒なんですが、
OpenGL に対する glfw や GLUT みたいなライブラリはないんですか？

勉強してみたい（というか、勉強しかけた）のですが、
計算処理を楽しむ前に挫折しそうです。
725 名前：デフォルトの名無しさん mailto:sage [2013/11/30(土) 21:26:47.63 .net]: あるけどない
独自API、英語のみのマニュアル…

初期化なんて一度書けば使い回しだからとりあえずやってみるべき
726 名前：デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:18:44.90 .net]: マニュアルが英語なのは全く問題ないので紹介していただけないでしょうか。

それでも枝葉末節の部分が面倒であれば、今はそういうものだと諦め、
コピペで使い回してかんばります。

ただ、私はたとえば OpenGL 入門者に対して、同じ理由
つまり「初期化なんて一度書けば使い回しだから」という理由で
ウィンドウ作らせたり、レンダリングコンテキストを作らせたりはしたくないです。
使い回し
幸い OpenGL にはユーティリティライブラリがあり、入門者にはありがたいです。
なので OpenCL にも入門者用にきっと何かあるだろうと思っていました。
727 名前：デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:34:05.19 .net]: OpenGL ほど広く使われていたらあっただろうね。
728 名前：デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:53:53.35 .net]: NVIDIAやAMDのサンプルコードには簡単なユーティリティが入っているよ。
OpenGLみたいに糞面倒なわけじゃないから、わざわざGLUTみたいなものを
作ろうと思った人はいなかったんだろう。
729 名前：デフォルトの名無しさん mailto:sage [2013/12/01(日) 02:54:53.01 .net]: そんなに面倒か？
必要十分しかないと思うんだが
730 名前：デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:12:45.40 .net]: CUDAの簡単さと比較すると面倒
731 名前：デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:18:23.16 .net]: あほか
732 名前：デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:47:08.42 .net]: c++binding使えば簡単じゃないか。
まあ、プラットフォーム選択する時点で
cudaには必要ない工程だが
733 名前：デフォルトの名無しさん mailto:sage [2013/12/01(日) 07:35:28.28 .net]: >>719
intelが最近OpenCLライブラリやGPU向けライブラリのプレビュー版を発表してる
ttp://software.intel.com/en-us/intel-ipp-preview
IPPはこれまで最適化済みCPUライブラリだったけど、それをGPUにも拡張しようとしてる模様
734 名前：デフォルトの名無しさん mailto:sage [2013/12/03(火) 07:13:40.30 .net]: >>726
ありがとうございます。

調べてみます。
735 名前：デフォルトの名無しさん mailto:sage [2013/12/03(火) 13:47:40.89 .net]: amd apu+linuxでaparapi経由で使ってみたんですが面白そうですね。
はるか昔に、javaで配列関係はどうしようかjniにでもしようかと悩んでたんですがこれでやっと悩みは解決できました。
java9.stream.parallelがopenclに対応してaparapiも不要になる（jvmと結合する)ようなので、openclを使えばjavaのままで配列のソリューションが得られるようです。
まだ触って4日ぐらいですが勉強がてらに、行列などの配列依存のライブラリを書き直してみようと思います。
736 名前：デフォルトの名無しさん mailto:sage [2013/12/30(月) 11:40:26.21 .net]: kaveriが販売される模様
737 名前：デフォルトの名無しさん mailto:sage [2014/01/11(土) 01:38:48.46 .net]: >>717
software.intel.com/en-us/vcsource/tools/opencl-sdk/clu-api
CLUとか
github.com/Computing-Language-Utility/CLU/blob/master/simple/simple.c
このぐらいに書ける。
使ったことはないので便利かどうかは知らない。
738 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 15:19:36.59 .net]: Core iとグラボつんでグラボで画面表示しててもIntelHDでOpenCLの計算をさせることはできるのでしょうか
739 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 16:36:29.14 .net]: 遅くはなろうが計算は出来るでしょう
740 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 17:04:11.19 .net]: あれ？遅くなる要因あるのでしょうか
使ってないIntelHDも使いたいというイメージだったのですが
741 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:04:09.93 .net]: CPUでやったほうが速いってだけ
742 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:14:29.38 .net]: CPUスレッドとは排他でしか使えないと言うことですか？
743 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:17:43.70 .net]: 732だけど、単純にIntelHDをグラボと取り違えただけだよ
744 名前：デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:34:07.15 .net]: 了解です
745 名前：デフォルトの名無しさん mailto:sage [2014/03/23(日) 07:57:03.89 ID:2/mKAdk3.net]: Ubuntu用のSDKはDebian GNU/Linuxで使えますか？
746 名前：デフォルトの名無しさん mailto:sage [2014/03/24(月) 20:46:02.33 ID:+qxUA/lQ.net]: >>733
俺も今日勉強始めたばっかだから実態よく分からんが、
規格ミニマムだとGPUで実行するバイナリを、
プログラム実行時に動的にコンパイルしてマウントする場合があるらしく、
それだとコンパイルのオーバーヘッドで遅くなりそう。

実行時にコンパイルせず事前にコンパイルしたバイナリを使うこともできるそうで
NVidia, AMDあたりはLLVMで動いてるからまず大丈夫だろうけど、HD Graphicsはどうなるんだろうか？
747 名前：デフォルトの名無しさん mailto:sage [2014/04/04(金) 10:41:37.63 ID:YtPgho8U.net]: CentOSにAMDのドライバを入れることに成功したけど、Debianには入らなかった。
748 名前：デフォルトの名無しさん mailto:sage [2014/04/23(水) 21:53:33.92 ID:e3QPM/2Y.net]: GPU持ってるCPUを使っているとか？
749 名前：741 mailto:sage [2014/04/23(水) 22:38:07.40 ID:Xxk46iNW.net]: はい、haswell(i7-4771)を使っています。
その他のグラフィックボードは積んでいません
750 名前：デフォルトの名無しさん mailto:sage [2014/04/23(水) 23:16:57.80 ID:RpkkzUGi.net]: Platformの数とデバイスの数はイコールじゃない。
デバイスはCPUとGPUの2個見つかるはず。ちなみに内蔵かどうかは関係ない。
気になるならclGetPlatformIDs/clGetPlatformInfoで見てみりゃいい。
751 名前：741 mailto:sage [2014/04/23(水) 23:39:22.71 ID:Xxk46iNW.net]: はしょって書くと以下のように２回出力、Platform IDが一緒でプログラムなどでcl::Platform::getをすると
２個で返ってきます。(DeviceはALLで情報をとってもGPUしか返ってきません。CPUでDeviceをとろうとするとエラーが出ます)

Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0

Platform Name: Experiment Intel Gen OCL Driver
Platform ID: 0x7f6ee0ba1a40
Name: Intel(R) HD Graphics Haswell M
Vendor: Intel
Device OpenCL C version: OpenCL C 1.1 beignet 0.8.0
Driver version: 0.8.0
Profile: FULL_PROFILE
Version: OpenCL 1.1 beignet 0.8.0
752 名前：デフォルトの名無しさん mailto:sage [2014/04/23(水) 23:55:44.68 ID:TUgA9FPl.net]: Platform数はドライバの数
汎用のドライバとIntelチューンのドライバの2つが入っていたら２つのプラットフォームが出てくる
少なくともWindowsだとそんな感じ

あと745の結果でPlatformIDが同じなのはおかしい
多分745のプログラムはバグってる
753 名前：741 mailto:sage [2014/04/24(木) 00:06:20.94 ID:T0adDPXi.net]: ドライバの数ですか・・・Debianのパッケージを入れる時にたしかに
汎用ローダとか言うのとintelドライバを入れた記憶があります
それで２つ出ているのか、入れたのは以下のパッケージだったような

opencl-headers - OpenCL (Open Computing Language) header files
beignet - Intel OpenCL library
beignet-dev - Intel OpenCL library
ocl-icd-dev - Development files to build a ICD Loader
ocl-icd-libopencl1 - Generic OpenCL ICD Loader
clinfo - Query OpenCL system information
754 名前：デフォルトの名無しさん mailto:sage [2014/06/26(木) 07:45:11.00 ID:DsGyZECt.net]: >>717
cl.hpp使えばそんな難しくないだろ

qa.atmarkit.co.jp/q/2899
755 名前：デフォルトの名無しさん mailto:sage [2014/06/26(木) 08:39:51.72 ID:rajeiAxv.net]: デフォルトのコンテキストやキューが追加されたのはOpenCL1.2からだから
NVIDIAじゃ使えないことに注意な。
756 名前：デフォルトの名無しさん mailto:sage [2014/06/26(木) 12:05:53.66 ID:u/fLSVr/.net]: >>747
// OpenCL側に結果を書き込む領域を作成する
const size_t
length = 0x10;
cl::Buffer
array( CL_MEM_READ_ONLY, length * sizeof( float ) );

（　´,_ゝ`）
757 名前：デフォルトの名無しさん mailto:sage [2014/06/26(木) 22:35:19.78 ID:BVAAIzQv.net]: >>749
答えといてやれよ。
758 名前：デフォルトの名無しさん mailto:sage [2014/08/29(金) 13:36:44.60 ID:P9znXDYB.net]: AMDとMS，GPU演算用途向けのコンパイラ「C＋＋ AMP v1.2」を発表
www.4gamer.net/games/032/G003263/20140828031/
C＋＋ AMP v1.2は、C＋＋開発者が広範なハードウェア構成および
ソフトウェア構成でアプリケーションを高速化できるよう、
以下の3つのアウトプットをサポートしています。

・Khronos GroupのOpenCL：AMD CPU/APU/GPU、Intel CPU/APU、NVIDIA GPU、Apple Mac OS X、その他のOpenCLに準拠したプラットフォームをサポート
・Khronos GroupのSPIR：AMD CPU/APU/GPU、Intel CPU/APU、将来的なSPIRに準拠したプラットフォームをサポート
：HSA FoundationのHSAIL：AMD APU、将来的なヘテロジニアス・システム・アーキテクチャー（HSA）に準拠したプラットフォームをサポート
759 名前：デフォルトの名無しさん [2014/08/30(土) 20:21:59.78 ID:rOGhcjm5.net]: ム板はしょっちゅう落ちるな。
760 名前：デフォルトの名無しさん mailto:sage [2014/08/30(土) 20:24:50.83 ID:nZ1XDijW.net]: よく落ちるな‥
761 名前：デフォルトの名無しさん mailto:sage [2014/09/19(金) 08:34:07.91 ID:KzrQAxPc.net]: OpenCL 1.2が現在のstableになるのかな？
1.1だとOpenCVは動かないですね
762 名前：デフォルトの名無しさん mailto:sage [2014/09/19(金) 23:42:34.05 ID:dfKMMaQo.net]: NVIDIAが1.2に対応しないからうちは1.1縛りだな。
OpenCVみたいにCUDAと両方やるならいいんだろうけど。
763 名前：デフォルトの名無しさん mailto:sage [2014/10/15(水) 00:45:43.10 ID:bIoSVMWH.net]: VBAで使いたいのですが、ラッパーDLL何か
ご存知ないでしょうか？
C#用のは幾つか見つかるのですが…
764 名前：デフォルトの名無しさん [2014/10/15(水) 01:04:21.97 ID:bIoSVMWH.net]: 質問あげ m(_ _)m
765 名前：デフォルトの名無しさん mailto:sage [2014/10/15(水) 10:11:05.56 ID:3rwOGNYw.net]: >>756
C#でVBAとOpenCLの仲介DLLでも作ればいいんでないの?
Windows知らんけど。
766 名前：デフォルトの名無しさん [2014/10/15(水) 10:36:01.03 ID:bIoSVMWH.net]: >>758
そうなんですけど、既にあるならそれ使いたいなと。

いま、ClooというC#用のラッパー使ったりソース見てるのですが、
ジェネリクスは使えないからどうするんだ？とか
DLL作ったことないのでチョット途方に暮れてます…
（シンプルなDLL作成サンプルは理解できますが、
openclを全てラップするのは無理…）
767 名前：デフォルトの名無しさん mailto:sage [2014/10/15(水) 19:03:22.75 ID:oTkKZ4Eq.net]: 既にあるもので使い方覚えるより
自分で造った方が早い場合も多い
768 名前：デフォルトの名無しさん mailto:sage [2014/10/15(水) 22:49:10.60 ID:y41AVgB1.net]: 口だけ番長
769 名前：757 [2014/10/16(木) 00:06:46.03 ID:1e+5gfAa.net]: >>760
プラットフォームを返すところから少し作り始めてみましたが、
VBAのcollectionとして値を返すなら、
C#では何なの？ディクショナリ？ってとこで
早速つまづいてしまいました(;_;)

なので、VBAでラッパー作ろうかと迷走中…
770 名前：デフォルトの名無しさん mailto:sage [2014/10/16(木) 00:45:29.59 ID:925HRnD9.net]: 別に何しようと勝手だけど
VBAでOpenCL使う必要性って何？

非同期処理が苦手なVBAは「待ち」が生じるような複雑な計算は向かないし
計算速くするだけならDLLなりに入力投げて結果だけもらえばいいし
Officeとの連携ならVBA使う必要ないし
規定されたソフトウェア以外使用禁止だったらそもそもOpenCL使えそうにないし
771 名前：デフォルトの名無しさん mailto:sage [2014/10/16(木) 15:24:45.15 ID:7O3aHiya.net]: そもそもVBAに固執してる時点で視野狭窄。
772 名前：757 [2014/10/16(木) 17:11:21.81 ID:8j84DcHT.net]: 固執？( ´��×��` ) ﾌﾟｯ
773 名前：757 [2014/10/16(木) 17:12:09.70 ID:8j84DcHT.net]: ありゃw
774 名前：デフォルトの名無しさん mailto:sage [2014/10/17(金) 13:05:53.28 ID:npcZf8Up.net]: あらあら可哀想なひとでしたか。
775 名前：デフォルトの名無しさん mailto:sage [2014/10/17(金) 16:09:50.28 ID:aw+RiOqr.net]: こんなところにもシナが湧くようになったか
776 名前：デフォルトの名無しさん mailto:sage [2014/10/18(土) 01:23:16.18 ID:sx5ESDLm.net]: そもそもそんな方法よりこうした方が・・とか
上流にまで遡って正そうとする奴がいるけど
余計なお世話なんじゃない？
VBAでOpenCLを使う方法を聞かれているんだから
答えがあるならそれに出せばいい。
無いならわからないと答えればいい。
見当違いのに話を捻じ曲げて、してやったりと
悦にはいるのか？
777 名前：デフォルトの名無しさん mailto:sage [2014/10/18(土) 13:19:15.72 ID:Z3gRebWt.net]: 余計なお世話だと感じたらスルーすればいいだけ
スルーも出来ないお子ちゃまが馬鹿にされるだけ
778 名前：デフォルトの名無しさん mailto:sage [2014/10/18(土) 15:49:20.82 ID:mzkaImX0.net]: >>769
あんた公務員やな
779 名前：デフォルトの名無しさん mailto:sage [2014/10/18(土) 19:40:45.23 ID:P/Strs7V.net]: 余計な世話しなきゃいい
780 名前：デフォルトの名無しさん mailto:sage [2014/10/19(日) 02:01:55.89 ID:CeuU+CpH.net]: まあ、余計なお世話なやつは
わかってない（解決策はわからない）
ってことだから

解決策以外はただの雑談
スルーするかしないかなんて、
どうでもいいこと
781 名前：デフォルトの名無しさん [2015/01/12(月) 09:09:09.30 ID:BHqm0X8b.net]: OpenCLとCUDAの相互運用について情報を探していたらCUDAカーネルを
OpenCLランタイムから実行できると書いてある記事を見つけたんだが、
本当にそんなんできるんだっけ？
www.4gamer.net/games/032/G003263/20091104040/
782 名前：デフォルトの名無しさん mailto:sage [2015/02/04(水) 08:37:05.19 ID:PgjHlyod.net]: いままでコンスタントに500[ms]程度でkernel処理が終わってたのが、
１分以上kernel処理が終了しない異常が、
処理２回目とあと不定期に発生するようになりました。
処理の内部のループカウントを数えたら正常なときと大差なく、
重い処理をしてはいないようです。やはりハードの不具合でしょうか？
783 名前：デフォルトの名無しさん [2015/02/04(水) 11:47:15.88 ID:kErMECZ6.net]: windows update
784 名前：デフォルトの名無しさん mailto:sage [2015/02/08(日) 04:16:42.58 ID:4RF7kRSx.net]: モバイルだと、GPU性能とCPU性能あんま大差ないからな。CPUだと4コアでNEON使えば最大性能で60GFLOPSぐらい？最新のTegraX1とかだと300GFLOPSオーバーするかもしれんが
現行のAdreno330ぐらいだと150GFLOPSくらい？
785 名前：デフォルトの名無しさん mailto:sage [2015/02/08(日) 04:19:43.86 ID:4RF7kRSx.net]: だからNEONのコードをわざわざ書き直す必要まだないかな？メモリアクセスのほうがボトルネックになってるっぽいのもあるし。まぁ、CPUとGPU実行じゃ消費電力ちがうかもしれんが。
786 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 00:22:26.32 ID:rqZ8R7KU.net]: 個人的にはこの言語産廃な気がするけどどうなんだろう
手続きの多さはさすがにちょっと…

CUDA←AMDも似たもの作るorライセンス料払ってでも統一しろ（最良）
C++AMPとOpenACC←そのレベルの抽象言語ぐらい統一しろ（次善）
OpenCL←やめて
787 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 10:01:14.87 ID:MuMGrz7U.net]: OpenCLはハード非依存のGPGPUプラットフォームとして用意され、
その上にライブラリを構築してユーザーはそれを使うのが本来意図してたこと。
残念ながらそういうライブラリがあまり出てきていないのが現実かな。
788 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 12:56:46.74 ID:TTUR8i8s.net]: OpenCLはDSPとかFPGAとかGPU以外もターゲットに入っているから
下手に統合しない方がいいと思う
789 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 20:42:11.90 ID:aU4fh9i9.net]: とか言いながら、触ればわかるが単なるCUDAの焼き直しなんだよな、これ
790 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 21:52:13.56 ID:DwKzmQqr.net]: nvidiaのquadro K620Mか
インテルグラフィックHD5500にしようと思うんだけど
openclとか数値計算の初歩の練習としてはどっちがいいよ
791 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 22:09:31.75 ID:SQuQNCw8.net]: >>783
IntelのOpenCLドライバって糞だって印象しかない。
AMDやNVIDIAで動いてたコードが通らなかったりするし。
792 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 22:20:29.24 ID:DwKzmQqr.net]: >>784
ありがとうございます
793 名前：デフォルトの名無しさん mailto:sage [2015/02/15(日) 22:26:41.71 ID:SSlwb3yD.net]: 実は正しくないコードが他の環境ではたまたま通っていただけ、てのはよくある。
たしかにIntelのコンパイラは厳しいから、普段の開発は他のGPUでやっていても
IntelのKernel Builderでカーネルのチェックしたりするな。
794 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 00:42:06.13 ID:bUgXoWHZ.net]: >>786
コードそのものに問題はなかったよ。
カーネルが複雑になりすぎるとIntelのコンパイラは落ちるから論外。
795 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 00:55:29.94 ID:0cGz3jVB.net]: IntelはGlobalWorkingGroupとLocalWGのサイズがN倍じゃないと動かないんだけどAMDは変な比率でも動く
原因調べるのの時間かかったよ
796 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 02:05:22.57 ID:bUgXoWHZ.net]: >>788
そりゃ動くほうが不思議だｗ自分の場合はカーネルを小さくしたら
普通に通ったからそういう問題はなかったはず。
797 名前：デフォルトの名無しさん [2015/02/16(月) 07:56:11.60 ID:F7oc1qZ/.net]: >>784
同意
798 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 13:24:15.63 ID:LR9r89r7.net]: AMDのコンパイラも最適化オンにしたらコンパイル終わらなかった事あったので、結構怪しい。(2011年ぐらいの話だけど)
799 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 13:44:20.54 ID:bUgXoWHZ.net]: >>791
確かにAMDのコンパイラの最適化は完全に地雷だったｗ
800 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 21:40:57.33 ID:HyfDl27x.net]: >>783
初心者がこれからOpenCLを始めるのにどの環境を選ぶか、という話なら
NVIDIAは避けるのが無難だな。デバッガやオフラインコンパイラなんかの
ツールが皆無に等しい。
CUDAもやりたいとかいうなら別だが。
801 名前：デフォルトの名無しさん mailto:sage [2015/02/16(月) 22:38:07.54 ID:QHeQ+cdL.net]: >>793
多くの奴はGPGPUするぞ、じゃメジャーなCUDAで良いやだからな
OpenCL使ってIntel,Nv,AMD(あとFPGAとか?)でちゃんと動くものを作らなければいけないってあんまりないだろからな
802 名前：デフォルトの名無しさん mailto:sage [2015/02/17(火) 02:24:50.68 ID:xvdMpEI6.net]: OpenCL使ったところで、同じコードでどんなCPU/GPUでも効率よく動くとかレアケースだしなぁ。
803 名前：デフォルトの名無しさん mailto:sage [2015/02/17(火) 08:22:15.68 ID:fCIGE3+K.net]: 最高のパフォーマンスを引き出すチューニングというなら別だが、どれかGPUを想定した
コードならそこそこの速度で動くだろ。たいてい、従来のCPUより速けりゃ十分だろうし。
FPGAだけは別格で、GPUと同じコードじゃぜんぜん速度が出ないだろうが。
804 名前：デフォルトの名無しさん mailto:sage [2015/02/18(水) 10:38:35.72 ID:CGhwPhC5.net]: SSEレジスタに乗ること期待して書いたchar16とかGPUに食わせたら憤死するで。
805 名前：デフォルトの名無しさん mailto:sage [2015/02/18(水) 16:12:46.20 ID:pennC58Z.net]: アーキテクチャ毎に最適化しないと、
OpenCLで性能なんか出せないよ。
806 名前：デフォルトの名無しさん mailto:sage [2015/02/18(水) 22:51:48.89 ID:Z2YWe05s.net]: >>797
ベクタ型は想定するターゲットで効果が見込まれる場合に使うべきで、そういう意味では
どっちかというとチューニングの範疇だろう。
そもそも、インテルのコンパイラならベクタ型使わずに普通に書いてSSE/AVXを
使ってくれるんだが。CL_DEVICE_PREFERRED_VECTOR_WIDTH_CHAR=1だしな。
下手に最適化しようとして却って駄目にしているように思える。
807 名前：デフォルトの名無しさん mailto:sage [2015/02/19(木) 01:05:51.96 ID:f67JHinc.net]: かたやGPUになるとパイプラインのスカスカ具合見ながら
int2とかint4とか使って依存関係のない演算で埋めていかないとお話にならんしなぁ。
808 名前：デフォルトの名無しさん mailto:sage [2015/02/19(木) 02:14:32.89 ID:KUEe9MYM.net]: アーキテクチャごとの最適化は、まだコンパイラとかの成長中の部分もあるだろうしなぁ

そのうち改善はしてくれるような気がするけど
809 名前：デフォルトの名無しさん mailto:sage [2015/02/19(木) 22:30:01.89 ID:t/UF4QVL.net]: そうは言っても今のアーキが向かってる方向ってコンパイラ実装の難易度上がってるから
コンパイラの苦手な部分を補填してやらにゃ速くならないってのは改善される事はないと思う

むしろそこまで賢いコンパイラとか使いたくない
810 名前：デフォルトの名無しさん mailto:sage [2015/02/19(木) 23:19:07.50 ID:1LBnym+M.net]: 技術的側面もあるが
それ以上にIA64がコケたことが
コンパイラを賢くしてプロセッサを脳筋にする道を
決定的に閉ざした

コンパイラの賢さに関して言えば
足並みがそろってない事の方が問題だと思う
811 名前：デフォルトの名無しさん mailto:sage [2015/02/26(木) 07:17:19.04 ID:BKvgQceT.net]: クロノスってなんかのアニメであったような
812 名前：デフォルトの名無しさん mailto:sage [2015/02/26(木) 14:44:53.01 ID:ZlyxtZ3O.net]: クロノスはゼウスのお父さん
813 名前：デフォルトの名無しさん mailto:sage [2015/02/26(木) 20:31:41.27 ID:yDVFOiWq.net]: マッシーンロボッ！
お前には、敵はない！
814 名前：デフォルトの名無しさん mailto:sage [2015/03/08(日) 09:21:28.42 ID:rJrv12ko.net]: OpenCL2.1は発表されたが相変わらずNVIDIAはやる気なさそうだなぁ、コメントくれないし。
おかげでいまだに開発は1.1ベースだよ。
815 名前：デフォルトの名無しさん mailto:sage [2015/04/12(日) 20:37:22.82 ID:4fkLnYAO.net]: OpenCLでHEVCをGPUに部分的にデコードさせる実験やってるな
まあ新製品はハードウェアでHEVCに対応してるから不要になっちゃうんだけど
816 名前：デフォルトの名無しさん mailto:sage [2015/04/12(日) 20:37:43.88 ID:4fkLnYAO.net]: ×やってるな
○やってたな去年の夏ごろ
817 名前：デフォルトの名無しさん mailto:sage [2015/04/12(日) 21:03:58.32 ID:b726GPIq.net]: 結局使えるのは、いつくらいになるのか…
818 名前：デフォルトの名無しさん mailto:sage [2015/04/25(土) 14:51:39.69 ID:zIE5htjK.net]: vexcl使えばopenclもcudaも関係なくGPUが使えるっぽいけど
819 名前：デフォルトの名無しさん mailto:sage [2015/04/25(土) 16:55:17.48 ID:DlB5+dQK.net]: NVIDIAでやっと1.2が使えるようになったと思ったらバグってんじゃねーか。
本当にやる気無いのな。
820 名前：デフォルトの名無しさん mailto:sage [2015/04/26(日) 16:04:03.54 ID:ljYoE8AT.net]: そらやる気ないやろ。
cudaなら囲い込みできるのに、
cudaの焼き直しのOpenCLなんて協力するだけ損だし。
821 名前：デフォルトの名無しさん mailto:sage [2015/04/27(月) 10:52:17.46 ID:1JZfjbGY.net]: pocl.sourceforge.net/
822 名前：デフォルトの名無しさん mailto:sage [2015/06/06(土) 14:22:49.99 ID:xHuAhJj5.net]: Core i7 3990とGeForce使ってるんだけど、IntelHDが認識されてなくてデバイスマネージャに表示されない
OpenCLの性能評価を試したいんだけど、IntelHDのドライバをインストールすれば認識されますかね？
823 名前：デフォルトの名無しさん mailto:sage [2015/06/07(日) 15:10:46.44 ID:OFY6KtcL.net]: >>815
モニタはiGPUとゲフォどっちにつないでる？
それと自作PCか？
824 名前：デフォルトの名無しさん mailto:sage [2015/06/07(日) 15:14:39.85 ID:OFY6KtcL.net]: あ、それとintel Opencl driver　インストールうまくできるか試してみて結果おしえて
825 名前：デフォルトの名無しさん mailto:sage [2015/06/07(日) 20:39:44.84 ID:NnypvtRT.net]: >>816
モニタはGeForceに接続。ドライバインストール試してみる。
826 名前：デフォルトの名無しさん mailto:sage [2015/06/08(月) 05:35:15.96 ID:ewd9hwV4.net]: Intelのにモニターをつなげないと
いけなかったはず。
827 名前：デフォルトの名無しさん mailto:sage [2015/06/08(月) 13:13:32.81 ID:rnRcmo2O.net]: i7 3990は検索してもろくにヒットしないけど、Sandy Bridge-Eなら無理なのでは。
828 名前：デフォルトの名無しさん mailto:sage [2015/06/09(火) 01:36:37.47 ID:c7FHKlcw.net]: そだね、そのくらい確認してるかと思って聞かなかったけど、
iGPUがついてないならそもそも無理だわな。
829 名前：デフォルトの名無しさん mailto:sage [2015/06/10(水) 12:18:07.90 ID:VIG2W0Y+.net]: うまくいけばCPUの方はOpenCLで動かせるかもしれない
やる意味ないけどね
830 名前：デフォルトの名無しさん mailto:sage [2015/06/19(金) 09:06:28.51 ID:giF1KE9b.net]: GPUのないノートのCPUでデバックしてから
GPUで実行できるなら俺はうれしい
831 名前：デフォルトの名無しさん mailto:sage [2015/06/19(金) 21:38:40.35 ID:s6jV56Gc.net]: 別途ドライバをインストールしなきゃならんってのが難点なんだよな。
SSE/AVXをお手軽に使えて、コア数に応じてマルチスレッドで実行してくれるから
使いではあると思うんだが。
832 名前：デフォルトの名無しさん mailto:sage [2015/06/19(金) 23:20:08.11 ID:KZJPVbVq.net]: デバッグなんかよりチューニングが大事だからターゲットハード以外でコーディングしてもなぁ
833 名前：デフォルトの名無しさん [2015/06/20(土) 00:21:14.39 ID:46SUOvEb.net]: なにがなんでも最高性能出さなきゃならん用途ばかりじゃあるまい。
一般的な並列化のみで大多数のハードでそこそこ速くなりゃ十分、という応用もある。
834 名前：デフォルトの名無しさん mailto:sage [2015/06/22(月) 00:09:27.57 ID:e4hiyCLD.net]: CLはチューニングなしだとCPUに惨敗もありえるのでな。
835 名前：デフォルトの名無しさん mailto:sage [2015/06/22(月) 01:11:03.05 ID:rREKDKy5.net]: メモリ転送とenqueueしてからの計算開始に時間かかるのがなぁ
836 名前：デフォルトの名無しさん mailto:sage [2015/06/22(月) 07:39:26.22 ID:FYteK6ai.net]: CPUに惨敗してた処理がチューニングでどうかなるもんか？
単に並列化できてなかっただけじゃね？
837 名前：デフォルトの名無しさん mailto:sage [2015/06/22(月) 21:40:24.04 ID:e4hiyCLD.net]: >>829
レジスタ数とか共有メモリサイズとかでブロックサイズだっけnVIDIAでいうところのwarp数とか
調整しないとてんでダメだよ。
838 名前：デフォルトの名無しさん mailto:sage [2015/06/22(月) 21:41:31.55 ID:e4hiyCLD.net]: >>828
そのコストを払っても高速かどうかは実機でテストするしかないしな。
機種ごとにCLを使うか通常ルーチン使うか選別するくらいしないと効果なし
839 名前：デフォルトの名無しさん mailto:sage [2015/06/23(火) 02:38:28.65 ID:22fvktD/.net]: チューニングは難しい
何となくやってみたら、処理時間が5倍遅くなったときの衝撃は大きかったな
840 名前：デフォルトの名無しさん mailto:sage [2015/06/23(火) 08:25:00.27 ID:drLPVFNo.net]: ターゲットのハードに特化したチューニングをしないと使い物にならんようなことを
言っている人がいるが、そんなこといったらユーザー環境を特定せずに広く配布する
アプリなんて作れんな。
うちじゃ一般的なGPU向けチューニングしかしてないが、NV/AMD安いのから高いのまで
テストしてみてローエンドでもCPUの数倍くらいで動くから十分、速く動かしたいなら
高いGPU使え、ってなノリだな。
841 名前：デフォルトの名無しさん mailto:sage [2015/06/23(火) 08:50:44.48 ID:LQs/3Np0.net]: 一番遅いハードに合わせて作っとけば問題ないよ
842 名前：デフォルトの名無しさん mailto:sage [2015/06/23(火) 22:58:24.67 ID:VwORpFDM.net]: >>833
AMDのHSAのAPUとAMDのOpenCl2のdGPUがHPCを除いたいまのデファクト
それ以外は無視で良い。Nvは一般用でGPGPUやる気ないし
HPC用ならターゲットのハードに特化したチューニングは当然だし
843 名前：デフォルトの名無しさん mailto:sage [2015/06/24(水) 01:34:16.84 ID:35TMs94C.net]: madとかそういう複合命令(?)を使ってチューニングする程度で抑えたいところ
844 名前：デフォルトの名無しさん mailto:sage [2015/08/31(月) 07:10:09.59 ID:kH1QDWTh.net]: Vexclの開発が止まってる
誰か引き継ぐ人はいないのか？
845 名前：デフォルトの名無しさん mailto:sage [2015/09/02(水) 06:58:53.31 ID:VNDyXTKC.net]: 早く2.0を使えるようにしてくれ
846 名前：デフォルトの名無しさん mailto:sage [2015/09/03(木) 00:02:12.18 ID:iQnjIkb4.net]: NVIDIA無視すりゃ幸せになれるぞ
847 名前：デフォルトの名無しさん mailto:sage [2015/09/03(木) 01:44:07.69 ID:cb/ef9ik.net]: >>839
こんなに対応が遅いと思わなかったんだよ
次からはAMDを信じるよ、あればだけど
848 名前：デフォルトの名無しさん [2015/12/19(土) 10:21:19.84 ID:7/8YsZOJ.net]: プログラマはMacを使ってるってマジ？
hayabusa3.2ch.net/test/read.cgi/news/1450395043/
849 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 10:23:37.79 ID:qfRCvKdP.net]: 単なる世間知らずが踊らされてそう言ってるだけ
850 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 12:49:21.08 ID:BBUxwf4S.net]: マルチコピペだぞそれ
851 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 15:25:38.18 ID:iG82T79N.net]: 100スレ以上にレスしてNGにならないのは運営が公認してるマルチってことか
852 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 16:25:03.85 ID:2xl0Mjgh.net]: GeForceはOpenCL2.xに対応した？
CUDAに同様の機能が在るから技術的に無理という事はないだろうけど
853 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 18:13:33.83 ID:LGhGH2LK.net]: 358でやっと1.2正式サポートしたところ。
854 名前：デフォルトの名無しさん mailto:sage [2015/12/19(土) 19:06:17.07 ID:2xl0Mjgh.net]: サンクス。IntelですらOpenCL2.0に対応しているのに業界最大手のnVIDIAがやらないのはなぁ
CUDAを使えという事なんだろうけど、それではnVIDIA専用になってしまうからそれは避けたい。
かといってnVIDIAを無視する訳にもいかないというジレンマ
そろそろOpenCL2.xをメインにしていきたいのだが
855 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 00:20:21.34 ID:ujiFhYYe.net]: VGAはいまAMDがすごく伸びてきているんだろ
来年の後半にはVGAの販売数シェアではAMDがNvidiaを上回るんじゃないのか
再来年には一般グラフィックではIntel、AMDが2強ってなるんじゃないか
856 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 00:47:13.59 ID:14eB8c4R.net]: NVIDIAのOpenCL対応はちょうどAppleが採用やめたあたりから停滞したな。
結局のところNVIDIAにとって、そういうOpenCLを望む大口の顧客でもいない限り
OpenCLに力を入れる理由はないんだろうな。
857 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 01:02:38.32 ID:XNwlDZDb.net]: nvidiaはopenAMP+だっけ？あっちに力いれてんじゃないのかね？
858 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 04:40:12.37 ID:oUoqwn36.net]: AMDもCUDAに対応するみたいなニュースをみたけど、どうなったんだろう？
GPGPUの技術も速く落ち着いて欲しい
859 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 07:41:04.82 ID:MpbNAZoy.net]: CUDAが各社GPU共通のならいいけどそうじゃないからなぁ
Intel iGPUでも使えないと困る
860 名前：デフォルトの名無しさん mailto:sage [2015/12/20(日) 07:47:22.55 ID:14eB8c4R.net]: AMDのあれは、HSAをターゲットにしたHalideやvexclのような並列計算APIで、
それがNVIDIA向けにもコンパイルできるって話だな。既存のCUDAコードからも
コンバートできるというのは目新しいが。
861 名前：デフォルトの名無しさん [2016/03/29(火) 10:04:21.74 ID:/c8bAcK4.net]: サッカーブッシュ日本代表日程ぷあたん（しゅっちょうまいくろ教育長交代）春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービ
862 名前：ス不足 サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題 春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残 コスメ２４チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題 マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン（販売報道陣過激派組織向携帯最新情報提供終了 校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント 高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費おじや50代資産ガリバズフィード40代エリート []: [ここ壊れてます]
863 名前：デフォルトの名無しさん mailto:sage [2016/05/30(月) 13:15:08.40 ID:27ORFIrk.net]: CUDA8.0RCでも1.2どまり
864 名前：デフォルトの名無しさん mailto:sage [2016/05/31(火) 02:00:22.72 ID:tLbBjsj4.net]: CUDAが強すぎて、なかなか広がらないイメージ
865 名前：デフォルトの名無しさん mailto:sage [2016/05/31(火) 15:24:04.45 ID:o40hgVi5.net]: あまり最適化されてない(できない、ifがそれなりに多い)プログラムをCPUとGPUで動かしてみて、
早い方を採用するには都合がいい。
866 名前：デフォルトの名無しさん mailto:sage [2016/08/08(月) 11:44:01.40 ID:OeTPyxgg.net]: CUDAは強い強い言われてるけど結局一社独占の技術だから過渡期の産物で終わってメインストリームにはなれんよ
nvidia自体x86やARM関係なくCPUを締め出しにかかって古い仕様を拡張する気がなさそうだし
867 名前：デフォルトの名無しさん mailto:sage [2016/08/08(月) 23:41:36.48 ID:FOEjBVJr.net]: しかしOpenCLも最近失速気味だしなぁ。規格は2.2まで出てるのにいまだに2.1のまともな実装すら出てないし。
AMDが体力続かなくて手を引いたりしたらOpenVXみたいにフェードアウトするんじゃないか？
868 名前：デフォルトの名無しさん mailto:sage [2016/08/13(土) 04:34:37.27 ID:C6tpw ]: [ここ壊れてます]
869 名前：DrS.net mailto: 物理レンダリングが出たばっかりなのに失速とは []: [ここ壊れてます]
870 名前：デフォルトの名無しさん mailto:sage [2016/10/29(土) 09:17:30.79 ID:W9gQheBG.net]: AppleがGeForce採用すりゃNVIDIAもOpenCLをアップデートすると期待してたが、今回も採用なしか。
それとも逆に、いつまでもOpenCL 2.0対応しないから採用しないのかな。
871 名前：デフォルトの名無しさん mailto:sage [2016/10/29(土) 12:19:11.69 ID:YsxFht0u.net]: OpenCLはオワコン
872 名前：デフォルトの名無しさん mailto:sage [2016/10/29(土) 15:09:52.99 ID:0Cs4HSkt.net]: HIPだっけ？
あれでCUDAを汎用的に使えるようになるんじゃないの？
873 名前：デフォルトの名無しさん mailto:sage [2016/10/29(土) 18:46:14.19 ID:vjtn6SxB.net]: >>862
C/C++使いはOpenCLも使えないと駄目ってなりつつあるんじゃないのか？
874 名前：デフォルトの名無しさん mailto:sage [2016/10/30(日) 01:49:24.70 ID:IKgBO44W.net]: それはOpenMPでは
875 名前：デフォルトの名無しさん mailto:sage [2017/01/08(日) 01:47:50.25 ID:qDa6npPv.net]: Vexcl難しい
サンプルコード少なすぎる
876 名前：デフォルトの名無しさん mailto:sage [2017/02/12(日) 09:50:54.30 ID:fljd0HzI.net]: vexclは挫折してviennacl使ってる
使えるスキルある人ならvexcl良いと思うけど
自分には無理だった
877 名前：デフォルトの名無しさん mailto:sage [2017/02/12(日) 14:41:00.16 ID:VBfSC62c.net]: boost.computeなら、どうだろうか？
878 名前：デフォルトの名無しさん mailto:sage [2017/02/16(木) 11:11:01.71 ID:sX4bqSJb.net]: Boost.computeはcudaに対応してない
879 名前：デフォルトの名無しさん mailto:sage [2017/02/17(金) 01:28:52.49 ID:LtwBLUnB.net]: OpenCLの話題だし、CUDA対応とかより、いかにOpenCLのコードが書きやすいかのほうが大切だと思うんだ
880 名前：デフォルトの名無しさん mailto:sage [2017/02/28(火) 20:15:03.56 ID:514SeM49.net]: ここ1年くらい停滞気味で話題が少なかったけど、これはめでたい。

NVIDIA 378.66 drivers for Windows offer OpenCL 2.0 evaluation support
https://www.khronos.org/news/permalink/nvidia-378.66-drivers-for-windows-offer-opencl-2.0-evaluation-support

一方で、前にいろいろぶち上げたAMDは何してるんだ？Ryzenで忙しいってか？
881 名前：デフォルトの名無しさん mailto:sage [2017/03/17(金) 02:02:00.80 ID:YSidBwLT.net]: Vexclで行列計算したいけど行列掛け算のexampleしかない
qr分解とかライブラリ使って出来ないの？
Vienaclにはqr分解とか例が沢山あるのに
882 名前：デフォルトの名無しさん [2017/03/17(金) 11:56:23.09 ID:ol/nseXL.net]: できる
883 名前：デフォルトの名無しさん mailto:sage [2017/03/30(木) 08:07:31.22 ID:sSr9ORWQ.net]: 過疎ってるところ恐縮ですが、質問です。

通常のCプログラムの中で、コプロ的な使い方でOpenCLをインラインアセンブラのように使うような使い方は可能なのでしょうか？
もしくは、その様な使い方を実現する方法はないでしょうか。
884 名前：デフォルトの名無しさん mailto:sage [2017/04/04(火) 23:25:23.65 ID:d4Y6801f.net]: Openmpでgpuの並列計算も出来るようになってから
Viennaclは更新も止まって、もう実質一年ぐらい更新ない

Openmpがgpu計算の標準になるのかな
885 名前：デフォルトの名無しさん mailto:sage [2017/10/25(水) 09:29:08.47 ID:h/b8kKiY.net]: 開発環境自体もOpenCL 2.0で止まっている感じはするな
鈍足になった感じはする
886 名前：デフォルトの名無しさん [2018/04/03(火) 04:40:48.84 ID:mPevnajZ.net]: cudaだと毎回計算結果違うとかビットエラーで整数計算も間違うことあるらしい
OpenCLをamdで動かすとどうなの？
887 名前：デフォルトの名無しさん [2018/04/03(火) 11:25:01.62 ID:R6gDm2yr.net]: えっ
888 名前：デフォルトの名無しさん [2018/04/03(火) 23:11:05.85 ID:RICRRaNn.net]: マイニング終了でRädeonの中古が格安で大量に売られてるので
何か使えないか
Openclってひょっとして再帰できない？
889 名前：デフォルトの名無しさん [2018/04/06(金) 09:28:13.93 ID:Z8wP2fEV.net]: >>877
科学計算用のやつだと、ちゃんとエラー補正してくれるよ
890 名前：デフォルトの名無しさん mailto:sage [2018/05/18(金) 19:25:23.10 ID:RN2l/52Z.net]: 再帰できないってことはないだろ。
確認まではしてないけど、小さいの書けばすぐわかるからよろしくです
891 名前：デフォルトの名無しさん mailto:sage [2018/05/18(金) 23:22:29.85 ID:z36hYsyi.net]: たしか昔はcudaも再帰できなかったと思う
ある時期までの規格なら再帰できないとかもありえる
あるいは製品依存とか？
892 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 10:52:19.90 ID:iBGlap+k.net]: 再帰って、例えば階乗（n!）を関数内で1引いて乗算して、また自身を呼び出すみたいなことでしょ？
できないわけないよな……と脳内で思ってます。

色々な階乗をパラでやっても大丈夫だと思うし、一つの階乗をパラでやっても排他きちんとやれば大丈夫だと…

もしかして全く勘違いなこと言ってるのかな…
（最近CL書いてない、というか、並列プログラム自体ネタがなくて書いてないorz）
893 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 12:28:46.68 ID:BjCA6AhS.net]: 再帰するにはスタックが必須になるから
そんな暗黙の領域管理をGPUにやらせるのかってことでしょ
再帰がなければ関数ごとに固定領域を決めればいいので楽できる
894 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 13:45:59.07 ID:iBGlap+k.net]: 普通に関数呼んでreturnで帰って来るんだから、スタックなんて意識しなくていいんじゃない？
（関数の戻り先は、勝手にスタックに積んでreturnで勝手に取り出してくる）

スタック容量が少ないから別途管理しないといけないってこと？
895 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 14:22:31.54 ID:7qbCVCh9.net]: ふつう、関数はインライン展開される。

再帰だと原則それができない。
896 名前：デフォルトの名無しさん [2018/05/19(土) 15:09:02.73 ID:GMayPujS.net]: 888
897 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 16:23:46.57 ID:KZiehyBT.net]: マイニング負け組はこちらへどうぞ
intel Oprencl2.1が今はお勧め
書籍もいっぱいあるぞ！
構わないからデペロッパーになろう
898 名前：デフォルトの名無しさん mailto:sage [2018/05/19(土) 19:18:17.82 ID:fx9VLx2G.net]: >>886
マジっすか。勉強になりました。
m(_ _)m
899 名前： mailto:sage [2018/05/20(日) 14:06:31.19 ID:JyKbNFIa.net]: >>886
Yコンビネータを見よ
インライン展開された、いいかえると無名関数であっても、再帰は可能である
900 名前：デフォルトの名無しさん mailto:sage [2018/05/20(日) 14:35:44.13 ID:KmZcyykh.net]: 的外れすぎるw
Yコンビネータは無名関数で再帰ができるようになる程度の意味しかないだろ。
(末尾呼び出し最適化がない限り)関数呼び出し深さが不定であるのには変わりない。

もちろんOpenCLには末尾呼び出し最適化も第一級オブジェクトとしての関数もないし、
それどころか関数ポインタすらない。
901 名前：デフォルトの名無しさん [2018/05/20(日) 16:22:27.06 ID:V9eOsuAz.net]: うむ
902 名前：デフォルトの名無しさん [2018/05/23(水) 19:10:21.35 ID:Au5e7VGg.net]: 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

H1I8V
903 名前：デフォルトの名無しさん mailto:sage [2018/05/24(木) 10:34:27.52 ID:cPlRxlDn.net]: H1I8V
904 名前：デフォルトの名無しさん [2018/07/04(水) 18:21:25.84 ID:bZ79e0V+.net]: これ人気らしいぞhttps://goo.gl/ZosWhA
905 名前：デフォルトの名無しさん [2018/07/04(水) 21:44:26.88 ID:gFgZc5FG.net]: QOJ
906 名前：デフォルトの名無しさん mailto:sage [2018/07/05(木) 16:14:25.67 ID:AeL6VB/V.net]: H1I8V
907 名前：デフォルトの名無しさん [2019/06/19(水) 04:56:27.83 ID:tVNS+22r.net]: 【出資】松本卓朗人工知能詐欺【注意】
https://rio2016.5ch.net/test/read.cgi/rikei/1560859403/
908 名前：デフォルトの名無しさん mailto:sage [2019/06/19(水) 08:10:22.42 ID:qaAgAiWI.net]: 久しぶりに何か書かれたと思ったら orz
909 名前：過去ログ ★ [[過去ログ]]: ■ このスレッドは過去ログ倉庫に格納されています

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef