- 1 名前:a36 ◆K0BqlCB3.k [2008/12/10(水) 15:38:25 .net]
- さてついにOpenCLの仕様が公開されました。
www.khronos.org/opencl/ 公式ページにはAPIのヘッダファイルが公開されており、 まだ実際に動かす事はできないもののプログラミングすることは可能となっています。 ということで、公開に先んじてプログラミングを始めてしまいましょう。
- 449 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 01:40:07.31 .net]
- intelのopencl SDKをlinuxにインスコったけどコンパイルのやり方わからん
gcc使ってどうにかならんの?
- 450 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 09:49:42.54 .net]
- OpenCLってもう1年もバージョン変わって無いけど、開発中止したの?
- 451 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 11:06:10.67 .net]
- バージョンUPしなくていいほど今の版が完成されたすばらしい出来だという事なんだよ
という事にしておきたい
- 452 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 11:57:01.57 .net]
- グラボはどんどん進化してるのに、ライブラリは完成されてるとかねーよ
- 453 名前:デフォルトの名無しさん mailto:sage [2011/07/06(水) 18:08:10.55 .net]
- 進化しても演算部分のコンパイラが底まで進化する必要があるか?
MSのCPUコンパイラさえ基本的には10年以上前のCPUでも動くような最適化レベルで止まっているしな。 GPUとして使うならまだしもGPGPUとして処理するならコンパイラは基本部分だけで、あとはドライバの進化で十分かと
- 454 名前:デフォルトの名無しさん mailto:sage [2011/07/09(土) 07:08:13.67 .net]
- >>439
それってGPU1枚だけでも使えるの? requirementsにはハードウェアのことが書いてない
- 455 名前:1 [2011/07/26(火) 06:44:48.46 .net]
- toki.2ch.net/test/read.cgi/dataroom/1309855042/
- 456 名前:デフォルトの名無しさん mailto:sage [2011/07/27(水) 23:22:22.79 .net]
- HD4850が最新のドライバではOpenCL動かないし、古いドライバでは動くがゲロ遅
アムドはあかんな
- 457 名前:デフォルトの名無しさん mailto:sage [2011/07/28(木) 01:08:32.77 .net]
- >>452
4870 + CCC 11.6 で OpenCL 動いてるけど、 もしかして 11.7 では動かなくなるのかな ?
- 458 名前:デフォルトの名無しさん mailto:sage [2011/07/28(木) 14:50:27.81 .net]
- HD4850, APP 2.4, CCC 11.6で動かず(カーネルコンパイルエラー)。
ググったら4xxxは11.6じゃ動かないから11.5にしろと言うことで11.5にしたら動いた。
- 459 名前:デフォルトの名無しさん mailto:sage [2011/07/28(木) 15:07:33.48 .net]
- アムドとか言ってるあたりでお察し・・・
- 460 名前:デフォルトの名無しさん mailto:sage [2011/07/28(木) 20:28:57.67 .net]
- アムドいうただけでレッテル貼りとかどんだけ・・・
ヌビディアはOpenCL対応あかんね 1.0のくせに1.1用の関数を使ってもコンパイル・リンクが通る でも、clEnqueueWriteBufferRectとか実行したらセグメンテーション違反 なめとるで
- 461 名前:デフォルトの名無しさん mailto:sage [2011/07/29(金) 09:43:45.32 .net]
- どっちも自社ライブラリ使えってことだよ
- 462 名前:デフォルトの名無しさん mailto:sage [2011/07/29(金) 12:23:00.19 .net]
- data parallelで簡単な2重forならできるけどそれ使って複雑な計算するのが
できぬ・・・CUDAと違って1024が最大なのがネック
- 463 名前:452 mailto:sage [2011/07/30(土) 22:03:20.57 .net]
- 職場のC1060に家パソのHD4850が10倍以上の大差で惨敗してムカついたのでHD6950買ってきた。
2倍以上でHD6950の勝利! アムド最高やで
- 464 名前:デフォルトの名無しさん mailto:sage [2011/07/30(土) 22:25:54.10 .net]
- 6970や6990じゃなくて6950なのか。てかC1060はもうどうでもよかろう。
- 465 名前:デフォルトの名無しさん mailto:sage [2011/07/30(土) 23:10:14.10 .net]
- >>460
C1060はどうでもええことないよ。 だって、職場の計算機の貴重な戦力だし。 6950にしたのは家パソ用に高い板を買う気はないから。
- 466 名前:デフォルトの名無しさん mailto:sage [2011/08/01(月) 20:49:14.86 .net]
- いつの間にか WebCL とか出来てて驚いた。
WebGL は色々使い道あるけど、WebCL は需要が分からん。
- 467 名前:デフォルトの名無しさん mailto:sage [2011/08/01(月) 21:47:49.14 .net]
- WebGLについてはこちらでお願いします
【O3D】HTML5用 3D API WebGL 【Canvas:3D】 hibari.2ch.net/test/read.cgi/tech/1308761577/
- 468 名前:デフォルトの名無しさん mailto:sage [2011/08/01(月) 22:13:20.26 .net]
- WebGLの話なんてしてないが
- 469 名前:デフォルトの名無しさん mailto:sage [2011/08/01(月) 23:26:04.83 .net]
- サイトを開くだけで分散コンピューティングに参加…胸熱。
- 470 名前:デフォルトの名無しさん mailto:sage [2011/08/02(火) 10:29:42.77 .net]
- www.infoq.com/jp/news/2011/07/WebCL
これか 確かにブラウザ上で並列処理する必要性がよくわからんな
- 471 名前:デフォルトの名無しさん mailto:sage [2011/08/02(火) 14:03:26.64 .net]
- 頻繁にメインメモリと同期するような計算にはJavaScriptが遅くて使い物にならないだろうし
重い処理を単発でやるだけならサーバーでやればいいだけな気がする わざわざWebで激しく環境依存するようなことをやる意味が分からん
- 472 名前:デフォルトの名無しさん mailto:sage [2011/08/02(火) 15:29:27.41 .net]
- 技術というのは、早い者勝ちでなぁ
仕様などをはやめに決めておかないと、特許やらパクリと言われたりとかなんやらで面倒な事になってしまうんだ あと名を残したい人が作ったりするんだ 役に立つとか使えるとか、そんなの関係無いんだ
- 473 名前:デフォルトの名無しさん mailto:sage [2011/08/02(火) 16:18:14.25 .net]
- それはわかるんだが、特許を取るタイミングとかが難しいよな
取得にも維持費もかかるし、早すぎると普及した一番儲かる時期に特許権が切れて利益にならないとか まー特許引き延ばしって裏技もあるけど
- 474 名前:デフォルトの名無しさん mailto:sage [2011/08/02(火) 19:41:55.79 .net]
- まあ、あれや
OpenCL CはJITやから、LL言語からでもグルーライブラリを組めば簡単に使える。 そら、試してみたくもなるわな。 しかし、実際はOpenCL Cを使いこなさなあかんわけで、それほどハードルが低いわけやないと。 んで、環境依存しまくりいうけど、マルチコアプロセッサ用のOpenCLライブラリもIntel, AMDから出てるわけで、もはや大概の環境でOpenCLは使えまっせ。
- 475 名前:デフォルトの名無しさん mailto:sage [2011/08/03(水) 01:09:07.14 .net]
- ブラウザで超広大なライフゲーム
- 476 名前:デフォルトの名無しさん mailto:sage [2011/08/04(木) 04:52:42.94 .net]
- APP SDK 2.5 で BFI_INT が使われるようになったけど、
bitselect() 使うとだめで、 (x & 0xf0f0f0f0) | (y & 0x0f0f0f0f) の型だと OK みたい。
- 477 名前:デフォルトの名無しさん mailto:sage [2011/08/04(木) 18:42:12.38 .net]
- CAL ILコンパイラはもう誰もメンテできないんだろうな。BFI_INT を付け足すのがそんなに苦痛かね?
AMDはLLVMのラデバックエンドに挑戦しているようだけど、果たして新アーキに切り替わる前に モノにできるんだろうか?
- 478 名前:デフォルトの名無しさん mailto:sage [2011/08/04(木) 23:21:28.44 .net]
- OpenCLってCellみたいなプロセッサが普及しないと面白くないよね。
GPU型の抽象化だけじゃ。
- 479 名前:デフォルトの名無しさん mailto:sage [2011/08/05(金) 09:45:21.35 .net]
- そのCellがコケたからなー
発想が速すぎた 今の技術で開発していれば、大人気だったかもしれないのに
- 480 名前:デフォルトの名無しさん mailto:sage [2011/08/06(土) 00:40:12.65 .net]
- i7であえてOpenCL
- 481 名前:デフォルトの名無しさん mailto:sage [2011/08/06(土) 02:51:44.01 .net]
- OpenCLのアプリを配布するときってAMDとnVidiaで別に実行ファイル作らなきゃいけないの?
- 482 名前:デフォルトの名無しさん mailto:sage [2011/08/06(土) 03:08:35.23 .net]
- 何でんなこと思った。
- 483 名前:デフォルトの名無しさん mailto:sage [2011/08/06(土) 03:57:16.00 .net]
- 今のところ、OpenCLなアプリケーションを"配布"するための良い方法は無い。(除 MacOS X)
- 484 名前:デフォルトの名無しさん mailto:sage [2011/08/06(土) 07:16:37.83 .net]
- *.cl カーネルを露出させるのがそんなに恥ずかしいか!
難読化するだけだったら gzip してバイナリに埋め込んどくのが楽かもね。
- 485 名前:デフォルトの名無しさん mailto:sage [2011/08/07(日) 08:06:38.42 .net]
- nVidiaから最新ドライバでOpenCL1.1対応とかメールきたんだけど、
ドライバとりに行ったらLinux用はまだじゃねーか。 ざけんなー。
- 486 名前:デフォルトの名無しさん mailto:sage [2011/08/07(日) 08:08:49.28 .net]
- >>480
恥ずかしいというよりノウハウの塊だから出したくない人はいるだろう。
- 487 名前:デフォルトの名無しさん mailto:sage [2011/08/08(月) 05:22:20.10 .net]
- Windows用OpenCL1.1ドライバを試してみたが、
どうも上手く動かないのでもう一寸待った方が良いと思う
- 488 名前:デフォルトの名無しさん mailto:sage [2011/08/09(火) 01:37:46.04 .net]
- >>428
門外不出のノウハウ=世間一般には知られていない。 つまり各分野
- 489 名前:の研究者すら出し抜く大発見ってことだぞw []
- [ここ壊れてます]
- 490 名前:デフォルトの名無しさん mailto:sage [2011/08/11(木) 20:59:03.48 .net]
- >>484
ノウハウが全て開示されているとでも思っているのか?
- 491 名前:デフォルトの名無しさん mailto:sage [2011/08/11(木) 22:05:51.96 .net]
- 世間一般に知られていなければ十分じゃん
- 492 名前:デフォルトの名無しさん mailto:sage [2011/08/12(金) 21:31:49.60 .net]
- 世間一般に知られないようにするためにカーネルを晒したくないわけだろ
- 493 名前:デフォルトの名無しさん mailto:sage [2011/08/14(日) 01:34:57.52 .net]
- >>473
CAL ILコンパイラ自体はいまだに新命令追加されているよ。 64bitINT除算とかはドキュメント化までされている。 ドキュメントにはなっていないけど、wave_idとかは Appendix Bにはこっそり追加されて、実際テキストで 1OP命令として書けば使える。 でもBFI_INTは置いてけぼり
- 494 名前:デフォルトの名無しさん mailto:sage [2011/08/14(日) 09:57:57.76 .net]
- マスクが定数なら、iand,iand,ior で BFI_INT になるとおもうけど、
そうじゃないときになー。
- 495 名前:デフォルトの名無しさん mailto:sage [2011/08/31(水) 17:10:54.28 .net]
- 初心者です。
Cで書かれた演算プログラムを高速化させたいと思っています。 この元のプログラムをホストプログラムとして、OpenCL用に書き換えて、高速化させたい演算部分を引っこ抜いてカーネルプログラムとして書き換えるというやり方でいいのでしょうか? また、このようなCのプログラムをOpenCL用に書き換える作業を解説しているサイトや書籍はあるのでしょうか? 当方LINUXでのプログラミングをしております。
- 496 名前:デフォルトの名無しさん mailto:sage [2011/08/31(水) 21:06:58.51 .net]
- 並列化はアルゴリズムをかなり選ぶよ。GPGPUなんて尚更。
まず普通にマルチスレッドで並列化してみたら?
- 497 名前:デフォルトの名無しさん mailto:sage [2011/09/15(木) 10:02:24.21 .net]
- opencl用の自動並列化コンパイラってある?
- 498 名前:デフォルトの名無しさん mailto:sage [2011/09/16(金) 05:07:07.00 .net]
- >>490
そのやりかたでいいさ。 2重ループを1重ループ2つにわけるとか。 あとはほとんどC言語と同じだから書き換えるところも少ないんじゃないか?
- 499 名前:デフォルトの名無しさん mailto:sage [2011/09/16(金) 18:41:47.81 .net]
- 「Ivy Bridge」プロセッサ、「OpenCL 」をサポート
- 500 名前:デフォルトの名無しさん mailto:sage [2011/09/16(金) 23:43:18.97 .net]
- OpenCLを使ったおぉっとなるアプリってありますか?
- 501 名前:デフォルトの名無しさん mailto:sage [2011/09/17(土) 08:21:50.52 .net]
- うわぁってなるあぷりならある
- 502 名前:デフォルトの名無しさん mailto:sage [2011/09/17(土) 08:36:22.90 .net]
- たとえば?
- 503 名前:デフォルトの名無しさん mailto:sage [2011/09/17(土) 18:08:09.83 .net]
- まってて、ちょっと調べてくる
- 504 名前:デフォルトの名無しさん mailto:sage [2011/09/18(日) 07:57:32.03 .net]
- つ「www.geeks3d.com/20110822/webcl-nokia-extension-for-firefox-6-and-kernel-toy/」
- 505 名前:デフォルトの名無しさん mailto:sage [2011/09/23(金) 23:20:48.33 .net]
- なんでAMDのOpenCLってこんなにサポートが糞なの?
- 506 名前:デフォルトの名無しさん mailto:sage [2011/09/24(土) 06:50:26.05 .net]
- OpenCLに関しちゃAMDが一番マシじゃね。
- 507 名前:デフォルトの名無しさん mailto:sage [2011/09/24(土) 15:07:51.08 .net]
- >>500
ヒトイネ
- 508 名前:デフォルトの名無しさん mailto:sage [2011/09/27(火) 22:25:38.34 .net]
- >500
バグレポートしたら、ちゃんと対応してもらえたよ?
- 509 名前:デフォルトの名無しさん mailto:sage [2011/10/03(月) 02:47:52.78 .net]
- もしかして関数呼び出しはOpenCL Cで記述出来ない...?
cudaでいう__device__のように記述出来るかと思ったらそんなことはないのかひどいぞこれは
- 510 名前:デフォルトの名無しさん mailto:sage [2011/10/03(月) 02:54:10.32 .net]
- そんなことはなかったすみませんでした
- 511 名前:デフォルトの名無しさん mailto:sage [2011/10/03(月) 22:18:02.72 .net]
- >>503
バグレポートなんか出来るの?
- 512 名前:デフォルトの名無しさん mailto:sage [2011/10/04(火) 00:03:56.22 .net]
- コンパイル時に死ぬバグだけどコンパイラのサポート窓口は分からなかったので
KernelAnalyzerのAboutにあるメアドに「KernelAnalyzerが死ぬんだけど」 って送った。(嘘はついてないつもり) コンパイラチームに転送してくれて11.10/2.6で直るって連絡来たよ。 実行時に死ぬのとか結果が変なのもForumに書けば結構みてくれるよ。
- 513 名前:デフォルトの名無しさん mailto:sage [2011/10/05(水) 23:41:21.79 .net]
- >>507
Forumに書いても放置が多いみたいで困る。。
- 514 名前:デフォルトの名無しさん [2011/10/06(木) 05:23:23.41 .net]
- 俺が今書いてるJavaプログラムの中で
2つのbyte配列に対する100〜5万回くらいの論理積(単にforループで2つの配列の論理積をとる)が頻繁に発生するんだけど そういうとこでOpenCL使ったら高速化期待できる? まとめて100万回くらいならGPUが速そうなんだけど 100回で済むとかだとオーバーヘッドがでかいのかなと思って躊躇してる
- 515 名前:デフォルトの名無しさん mailto:sage [2011/10/06(木) 18:38:50.63 .net]
- aparapiでも使ってみたら?
- 516 名前:デフォルトの名無しさん mailto:sage [2011/10/17(月) 07:38:26.26 .net]
- C++のラッパーを最近使い始めたけどかなり使いやすいね。
とくにメモリ解放が楽になった。
- 517 名前:デフォルトの名無しさん mailto:sage [2011/11/02(水) 21:22:05.07 .net]
- OpenCLは構造体のメモリオブジェクトを作成できますか?
CUDAだったら typedef struct { float *num; } DATA; DATA data; cudaMalloc( &data.num, sizeof(float) * 1024 ); みたいにできるんですけど
- 518 名前:デフォルトの名無しさん mailto:sage [2011/11/02(水) 23:38:01.05 .net]
- >>512
例が意味不明 それじゃGPU上に単なるfloat型の配列を確保して、 そのdeviceポインタをCPUの構造体メンバに代入しているだけ。 OpenCLでもGPU上にfloat型の配列をbufferとして確保して、 それをCPUの構造体メンバに代入することは出来る。 メンバ変数の型はfloat*では無く、cl_memだけどね。 でも、その配列自体をGPU側にコピーして、 間接アクセスしようとするとCUDAとOpenCLでは全く違う。 OpenCLではGPU上のポインタは1つのカーネル呼び出し内でしか 一貫性が保証されないから、ポインタを保存しておいて 次のカーネル呼び出しで使うという事が不可能 (cl_memはハンドルに過ぎず、OpenCLのランタイムは GPU上のオブジェクトを再配置する可能性があるから) まあ、やるとしたら大きなbufferをメモリプールとして生成して、offsetをポインタの代わりに保存 後でアクセスするときにはbufferを引数に渡して、それにoffset足した位置を触るという 形にするしかない。 まあ、CUDAでも実際にはこの方がCPUとGPUで同じデータを扱えるし、 性能面でも悪くないやり方なんだけど。
- 519 名前:デフォルトの名無しさん mailto:sage [2011/11/03(木) 01:23:08.95 .net]
- ラデ外付けGPUに大量にデータを送りたいんだけど、1/4までって制限どうにかならないの?256MBまでしか送れん
- 520 名前:デフォルトの名無しさん mailto:sage [2011/11/03(木) 10:05:29.53 .net]
- いや、1/4なのではなく 256MBまでという制限。
sizeof(float4) * 4096 * 4096.
- 521 名前:デフォルトの名無しさん mailto:sage [2011/11/03(木) 10:38:23.81 .net]
- >>515
これって変えられないの?
- 522 名前:デフォルトの名無しさん mailto:sage [2011/11/04(金) 11:46:02.78 .net]
- 馬鹿には無理
- 523 名前:デフォルトの名無しさん mailto:sage [2011/11/07(月) 02:56:58.68 .net]
- 並列化させるのも結構苦労するよね。
簡単な演算ならいいけど、データ依存がちょっとでも複雑になると 動かすカーネルの順番とか数とか 気にしなきゃいけないことイパーイ
- 524 名前:デフォルトの名無しさん mailto:sage [2011/11/15(火) 23:57:17.03 .net]
- OpenCL 1.2
www.khronos.org/news/press/releases/khronos-releases-opencl-1.2-specification
- 525 名前:デフォルトの名無しさん mailto:sage [2011/11/16(水) 00:44:39.04 .net]
- NVIDIAのドライバがカオスになるな
gdgdの果てに漸く1.0対応が落ち着いたと思ったら 28x世代の1.1対応でまたおかしくなってまだ終息してないのに
- 526 名前:デフォルトの名無しさん mailto:sage [2011/11/16(水) 01:54:02.46 .net]
- 彼らにはCUDAがあるからなぁ。。
頑張る必要が無いのだろう。
- 527 名前:デフォルトの名無しさん mailto:sage [2011/11/19(土) 02:59:11.80 .net]
- nVidiaはどこに向かっているんだ…
OpenACC : 新しい並列コンピューティングのためのプログラミング環境 www.shader.jp/?p=466
- 528 名前:デフォルトの名無しさん mailto:sage [2011/11/19(土) 19:26:18.05 .net]
- それはOpenMPのGPU版みたいなものなので、CUDAやOpenCLとは衝突しない
- 529 名前:デフォルトの名無しさん mailto:sage [2011/11/19(土) 20:50:05.10 .net]
- AlteraがFPGAでOpenCLを、とか言い出してて面白そうな感じ。
- 530 名前:デフォルトの名無しさん mailto:sage [2011/11/19(土) 21:07:31.87 .net]
- C++AMPのNVIDIA版ぽいね
まぁC++AMPはNVIDIAでも動くけど インライン記述の世代でどれが主導権を握れるかは気になるところ
- 531 名前:デフォルトの名無しさん mailto:sage [2011/11/19(土) 23:38:32.61 .net]
- MSは最終的にC++AMPをオープンにすると言ってはいるが、結局オプソ系コミュニティがどう動くかだな
CPUの並列ライブラリはMSはOpenMPからPPL推し、オプソ系は主にTBBと別れてしまっているので、 GPUではどうにかして歩調を揃えてもらいたいところ ただ、一応オープン化を標榜するC++ AMPに介入するわけでもなくかといってCUDAの様に自社GPU専用に囲い込むわけでもなく、 立ち位置の被るオープン規格を立ち上げたNVIDIAの意図が分からんといえば分からん GPUに全てを賭けるメーカーとしては握れる手綱は全て握っておきたい、という事なのかな
- 532 名前:デフォルトの名無しさん mailto:sage [2011/11/20(日) 01:50:41.74 .net]
- >>523
使う側は思いっきり衝突するだろ
- 533 名前:デフォルトの名無しさん mailto:sage [2011/11/20(日) 02:32:04.15 .net]
- >>522
PGI Accelerator が元になっているのかな? www.softek.co.jp/SPG/Pgi/Accel/index.html
- 534 名前:デフォルトの名無しさん mailto:sage [2011/11/22(火) 14:27:24.23 .net]
- インタビューで簡単にOpenACCについてふれてる
insidehpc.com/2011/11/21/cuda-reaches-5th-birthday-openacc-ramps-up/
- 535 名前:デフォルトの名無しさん mailto:sage [2011/11/22(火) 23:50:42.88 .net]
- カーネルの実行順位はイベントで指定できる
OpenCLのバイナリコンパイルと読み込みうまくできない・・・ バイナリなしだと環境自由になるけど ソース丸出しになるから計算高速化くらいしか使い道ないね
- 536 名前:デフォルトの名無しさん mailto:sage [2011/11/25(金) 00:37:00.99 .net]
- 1.2の新機能
www.streamcomputing.eu/blog/2011-11-19/difference-between-opencl-1-2-and-1-1/
- 537 名前:デフォルトの名無しさん mailto:sage [2011/11/25(金) 22:22:16.51 .net]
- >>531
ダイナミックに追加が変更があったのって、DirectX関係だけだな。。。
- 538 名前:デフォルトの名無しさん mailto:sage [2011/11/28(月) 10:27:25.45 .net]
- なんかもーGPUメーカーは独自に動いてるし、開発する気無いだろw
- 539 名前:デフォルトの名無しさん mailto:sage [2011/11/29(火) 19:35:56.69 .net]
- intel CPU制限多すぎ・・・SSE4.1対応って書いておいてくれよ・・・
core2 quad全部対応してるかのようなのはやめてほしい・・・ XPで使えないのはちょっと困る・・・
- 540 名前:デフォルトの名無しさん mailto:sage [2011/11/29(火) 23:11:26.28 .net]
- SSE見逃してたごめん
- 541 名前:デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:12:08.31 .net]
- SSEぐらいOpenCL使わなくってもいいじゃん
- 542 名前:デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:50:42.75 .net]
- >>536
OpenCLの機能実現するのに都合がいい命令がSSE4.1にあるからインテルの開発ツールはSSE4.1対応の世代以降でないと使えないんだよ どうせ普及する頃には古い世代のCPUいなくなってるよねって方針なんだろ
- 543 名前:デフォルトの名無しさん mailto:sage [2011/11/30(水) 00:58:02.95 .net]
- GPUが使えない環境での互換性用と割り切って広くサポートしてくれたほうがまだ有用なのにな
- 544 名前:デフォルトの名無しさん mailto:sage [2011/12/05(月) 06:55:31.93 .net]
- 構造体そのままカーネルに放り投げられない・・・
x.yに配列分けなくちゃだめか・・・ GPU正直CUDAのほうが楽だよね・・・ CPUとGPU同時並列に魅力感じてたけど 両方ともスレッドが少なすぎて・・・
- 545 名前:デフォルトの名無しさん mailto:sage [2011/12/05(月) 09:48:13.49 .net]
- なにいってるんだ?
- 546 名前:デフォルトの名無しさん mailto:sage [2011/12/05(月) 11:51:31.75 .net]
- 構造体 a
int x; int y; の配列をそのままメモリバッファにコピーしても うまくいかなかったので・・・ AMDのカーネルアナライザーでエラーがでてたんです if(a[id].x-a[id].y){} 結局配列分割してコピーしました・・・
- 547 名前:デフォルトの名無しさん mailto:sage [2011/12/05(月) 12:04:37.78 .net]
- 組み込みのint2でいいじゃない。
- 548 名前:デフォルトの名無しさん mailto:sage [2011/12/05(月) 16:36:44.62 .net]
- そうですね
それで組み込んでみます
- 549 名前:542 mailto:sage [2011/12/05(月) 21:49:58.78 .net]
- >>543
まず無いだろうけど、別スレッドで 同じ添え字のxとyをバラバラに更新すると嵌るよ。
|

|