- 1 名前:a36 ◆K0BqlCB3.k [2008/12/10(水) 15:38:25 .net]
- さてついにOpenCLの仕様が公開されました。
www.khronos.org/opencl/ 公式ページにはAPIのヘッダファイルが公開されており、 まだ実際に動かす事はできないもののプログラミングすることは可能となっています。 ということで、公開に先んじてプログラミングを始めてしまいましょう。
- 646 名前:デフォルトの名無しさん mailto:sage [2012/08/17(金) 04:01:39.09 .net]
- でっかく突っ込んだら普通にデスクトップがフリーズしてた。
- 647 名前:デフォルトの名無しさん mailto:sage [2012/08/21(火) 22:38:27.42 .net]
- OpenCLで最速の構成教えて
- 648 名前:デフォルトの名無しさん mailto:sage [2012/08/22(水) 00:38:21.46 .net]
- 素晴らしいプログラマ
これに尽きるw
- 649 名前:デフォルトの名無しさん mailto:sage [2012/08/22(水) 09:45:30.14 .net]
- >>642
Radeon の一番高いヤツをさせるだけさす。w
- 650 名前:デフォルトの名無しさん mailto:sage [2012/08/31(金) 15:37:24.77 .net]
- APUより速いん?
- 651 名前:デフォルトの名無しさん mailto:sage [2012/09/06(木) 03:18:56.29 .net]
- だれかOpenCLでOpenGL実装してくれ
- 652 名前:デフォルトの名無しさん [2012/09/08(土) 00:09:32.81 .net]
- むしろOpenManko実装してくれ
- 653 名前:デフォルトの名無しさん mailto:sage [2012/09/08(土) 01:20:37.10 .net]
- プロプライエタリですので
- 654 名前:デフォルトの名無しさん [2012/09/08(土) 18:07:21.58 .net]
- OpenMankoはよ
- 655 名前:デフォルトの名無しさん mailto:sage [2012/09/08(土) 22:36:50.84 .net]
- 互換フリー0実装のKuperで我慢しとけ。
- 656 名前:デフォルトの名無しさん mailto:sage [2012/09/09(日) 23:25:50.57 .net]
- Mankoは商用製品で我慢しろよ
- 657 名前:デフォルトの名無しさん mailto:sage [2012/09/20(木) 15:05:43.24 .net]
- 昔の日本はOpenだろ
- 658 名前:デフォルトの名無しさん [2012/09/27(木) 04:12:39.50 .net]
- AMD Releases CodeXL Public Beta | SemiAccurate
semiaccurate.com/2012/09/25/amd-releases-codexl-public-beta/
- 659 名前:デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:09:53.66 .net]
- pc.watch.impress.co.jp/img/pcw/docs/563/431/g02.png
- 660 名前:デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:15:43.73 .net]
- engawa.2ch.net/test/read.cgi/poverty/1349151623/
- 661 名前:デフォルトの名無しさん mailto:sage [2012/10/05(金) 01:16:52.94 .net]
- prohardver.hu/dl/cnt/2012-10/90356/results/handbrake.png
- 662 名前:デフォルトの名無しさん mailto:sage [2012/10/28(日) 20:13:53.12 .net]
- 意外と
- 663 名前:デフォルトの名無しさん [2012/11/30(金) 23:33:09.24 .net]
- Khronos Releases Significant OpenCL 1.2 Specification Update | techPowerUp
www.techpowerup.com/176413/Khronos-Releases-Significant-OpenCL-1.2-Specification-Update.html
- 664 名前:デフォルトの名無しさん mailto:sage [2012/12/07(金) 11:27:13.90 .net]
- OpenCLでパスワード解析
securityledger.com/new-
- 665 名前:25-gpu-monster-devours-passwords-in-seconds/ []
- [ここ壊れてます]
- 666 名前:デフォルトの名無しさん mailto:sage [2012/12/20(木) 01:25:19.05 .net]
- >>615
vetor extension記法でゴリゴリかく。 若しくは、-O3 -ftree-vectorize 但し、後者はまだまだ未熟なのは確かだね。
- 667 名前:デフォルトの名無しさん mailto:sage [2012/12/21(金) 09:03:58.99 .net]
- 最近OpenCLを本格的に始めたんだが、
OpenCLのいいところは、コンパイラを選ばない、 カーネル以外はC++で書けるといところかな。 CUDAだと同じことができるけど、ホスト側でNVCC以外使おうとするとちょっと面倒だ。 ただ、カーネルの最適化がコンパイラでもできるから、 パフォーマンスは出やすいな。 LLVMで最適化レベルって設定ができるのかな?
- 668 名前:デフォルトの名無しさん mailto:sage [2012/12/22(土) 01:07:39.90 .net]
- >>661
アーキテクチャが何にでも対応できるが、 アーキテクチャによって最適なWARP(に相当するもの)の数が違ったり、 コアレセンスアクセスできる条件が違ったり、キャッシュの有無だったりで 結局はアーキテクチャ依存の最適化をしないと速くならないよ。
- 669 名前:デフォルトの名無しさん mailto:sage [2012/12/22(土) 02:28:20.85 .net]
- 場合によってはコンパイラのバージョン依存も。
- 670 名前:デフォルトの名無しさん mailto:sage [2012/12/24(月) 05:32:34.90 .net]
- やっとCL使うネタが準備できた
楽しみだー
- 671 名前:デフォルトの名無しさん mailto:sage [2013/01/13(日) 19:49:11.31 .net]
- Trinity APUで使ったらCPU使用率が50%(2コアなので1コアがフル稼働状態)になったが、こんなもんなの?
GPUで計算してるはずなんだが。
- 672 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 05:46:41.04 .net]
- ジョブの内容と数によるんでは。
- 673 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 21:42:22.31 .net]
- CUDA見たいに結果出るまでぽーりんぐしてんじゃないの?
- 674 名前:デフォルトの名無しさん mailto:sage [2013/01/14(月) 22:02:09.36 .net]
- 自分のマシンのFLOPS計るのはどのベンチがお勧め?
- 675 名前:デフォルトの名無しさん mailto:sage [2013/01/15(火) 00:36:48.35 .net]
- クロックとシェーダの数を掛ければ。
- 676 名前:デフォルトの名無しさん mailto:sage [2013/01/15(火) 12:44:28.36 .net]
- ちゃんとGPUで計算されてないだけじゃね
afterburnerかなんかでGPU側の使用率も見てる?
- 677 名前:665 mailto:sage [2013/01/20(日) 11:45:47.76 .net]
- Catalystのバージョン上げたらCPU使用率下がりました
- 678 名前:デフォルトの名無しさん mailto:sage [2013/01/21(月) 06:12:45.45 .net]
- AMDのOpenCL SDKはCPU(SSE)デバイスもサポートしてるから
そっちで動いてたってことかな
- 679 名前:デフォルトの名無しさん mailto:sage [2013/01/22(火) 00:13:17.77 .net]
- デバイス取得時にGPUを指定すればそんな目に合うはずね〜が
- 680 名前:デフォルトの名無しさん mailto:sage [2013/01/22(火) 23:13:25.92 .net]
- デバイスにCPU使ってたらCPU使用率100%になるんじゃないの
- 681 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 00:21:18.43 .net]
- >>674
特に設定しないとシングルコアだからならない
- 682 名前:デフォルトの名無しさん mailto:sage [2013/01/23(水) 01:32:16.04 .net]
- CPU版はdevice fissionしないと使えるコア全部使わなかったっけ?
- 683 名前:デフォルトの名無しさん mailto:sage [2013/01/26(土) 18:02:42.38 .net]
- いくつか本読んで基礎的なことは
わかったんだけど、openclでmpegのエンコーダー 作ってみたいから何か参考になる情報ないかな
- 684 名前:デフォルトの名無しさん mailto:sage [2013/01/26(土) 21:16:57.04 .net]
- CUDAでこれだからOpenCLはチューニング大変だな
pc.watch.impress.co.jp/img/pcw/docs/584/977/html/7b_prometech_32.jpg.html
- 685 名前:デフォルトの名無しさん mailto:sage [2013/01/26(土) 22:38:20.74 .net]
- >>677
MPEGってどれよ? MPEG4(H.264)のことならx264がSSE、AVXアセンブリ含むソースコードが読めるからオススメ
- 686 名前:デフォルトの名無しさん mailto:sage [2013/01/30(水) 22:41:00.14 .net]
- 試しに↓使ってみたんだがローカルメモリ使ったら速度が3割落ちた。
www.aocplan.com/gpgpu/gpgpu-benchmark
- 687 名前:デフォルトの名無しさん mailto:sage [2013/02/05(火) 22:18:38.26 .net]
- OpenCLってHyper-Qみたいな機能ってあるでしょうか?
- 688 名前:デフォルトの名無しさん mailto:sage [2013/02/05(火) 22:28:21.47 .net]
- >>678
アーキ毎にカーネルを書きなおさないと性能でないよ。
- 689 名前:デフォルトの名無しさん mailto:sage [2013/02/06(水) 21:46:06.32 .net]
- 各アーキテクチャごとの最適化資料ってある?
- 690 名前:デフォルトの名無しさん mailto:sage [2013/02/07(木) 05:31:00.88 .net]
- AMDだとこれが詳しい。NVIDIAのだったらCUDAのマニュアルを読めばいい。
developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf
- 691 名前:デフォルトの名無しさん mailto:sage [2013/02/11(月) 23:11:22.51 .net]
- 標準のC++に替わり今後はOpenCLが標準に確定したな
OpenCLでパフォーマンスが激向上するから当然か
- 692 名前:デフォルトの名無しさん mailto:sage [2013/02/12(火) 06:11:15.51 .net]
- 寝言は寝て言え
- 693 名前:デフォルトの名無しさん mailto:sage [2013/02/17(日) 21:21:57.05 .net]
- >>684
ありがとう。VLIW4だとスレッド数1/4にして、1スレッドで4つずつ処理するようにしたら倍速になった。
- 694 名前:デフォルトの名無しさん mailto:sage [2013/02/18(月) 04:23:25.11 .net]
- R600のISA解説したpdfもどっかにあって、あれ読むとKernel Analyzerの右側の命令が読めるようになって捗るぞ。
- 695 名前:デフォルトの名無しさん [2013/05/09(木) 04:25:55.54 .net]
- Intel Releases SDK with OpenCL 1.2 Support for Intel Xeon Phi Coprocessors | techPowerUp
www.techpowerup.com/183718/intel-releases-sdk-with-opencl-1-2-support-for-intel-xeon-phi-coprocessors.html
- 696 名前:デフォルトの名無しさん mailto:sage [2013/05/10(金) 23:28:13.87 .net]
- CUDAが動かない古いNvidiaのビデオカードでも
OpenCLなら動いたりするものなのでしょうか?
- 697 名前:デフォルトの名無しさん mailto:sage [2013/05/11(土) 17:38:28.19 .net]
- 確かnvidiaがOpenCLサポートしているのは、
チップがGeforce8以降かつ、ドライバの対応も必要だったと思う。 でもgeforce8以降はほとんどCUDA(とPhysXが)乗ってたはず。 それ以前はサポートされていないから動かないんじゃないかな(機材とドライバがないから検証できん)
- 698 名前:デフォルトの名無しさん mailto:sage [2013/05/11(土) 23:50:31.95 .net]
- CUDAにせよ、OpenCLにせよ古いマシンでやろうとする奴はなんなんだ?
古いGPUじゃ大して効果がないし、アーキテクチャがどんどん変わって いるから使えないものが多いのに。 最新のアーキテクチャでも1万円も出せばそれなりのものが買えるのになあ。
- 699 名前:デフォルトの名無しさん mailto:sage [2013/05/12(日) 10:11:53.81 .net]
- 研究目的なら最新ので良いけど、実用だと4年前に導入した
数百台の計算機で高速化したい、とかもあるからな。
- 700 名前:デフォルトの名無しさん mailto:sage [2013/05/13(月) 17:15:31.08 .net]
- GeForce8以前って、どんだけ古いカード使っているんだよw
いろんな意味で、無理無理。
- 701 名前:デフォルトの名無しさん mailto:sage [2013/05/15(水) 13:05:11.17 .net]
- とりあえずGPGPU普及させたいならGPU各社ともミドルレンジ以下でFP64対応切るのやめてくんないかな
性能出るかどうかより使えたり使えなかったりってのが一番困る
- 702 名前:デフォルトの名無しさん [2013/06/05(水) 08:17:39.89 .net]
- OpenCLのチューニングって、まずどのあたりから手を付ければいいかな?
ワークグループ分割数で結構変わるという話は聞くけど、やっぱり おまかせより明示的に指定した方がいいんだろうか?
- 703 名前:デフォルトの名無しさん mailto:sage [2013/06/05(水) 09:35:33.06 .net]
- おまかせとかやる気無さすぎだろう…
色々変えてみて速さを測れ。
- 704 名前:デフォルトの名無しさん mailto:sage [2013/06/05(水) 20:55:53.52 .net]
- ハードに合わせて適当な値を選んでくれると思ってたんで自分で下手な値を設定するより
いいかと思ってたんだけど、たしかに明示的に指定した方がよくなるケースが多いですね。 目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか? それ以外、これは押さえておけ、というようなチューニングポイントってありますか?
- 705 名前:デフォルトの名無しさん [2013/06/06(木) 22:37:43.71 .net]
- アドレスモードが便利そうなのでイメージオブジェクトを使ってみようと思ったんだけど、
これって4ch固定なんですかね?できれば1chで使いたいんだけど。
- 706 名前:デフォルトの名無しさん [2013/06/17(月) 09:44:11.96 !.net]
- >>698
> 目安としてはCL_DEVICE_MAX_WORK_GROUP_SIZEに合わせておけばいいんだろうか? これだとスピードでないよ。 Radeonだったら>>684の最適化マニュアルを、NVIDIAだったらCUDAの 説明書を読め。
- 707 名前:デフォルトの名無しさん mailto:sage [2013/06/18(火) 23:31:21.64 .net]
- つか、勉強目的でエミュレータみたいなのが欲しい
遅くていいから
- 708 名前:デフォルトの名無しさん mailto:sage [2013/06/24(月) 22:41:41.16 .net]
- 最近のハードなら何でも出来るだろ。
新しいの買えよ。それぐらい自己投資だ。
- 709 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
- ついに 2.0 で Dynamic Parallelism きちゃったじゃねぇか!
- 710 名前:デフォルトの名無しさん mailto:sage [2013/07/23(火) NY:AN:NY.AN .net]
- nVidiaがいまだに1.1なのはどうにかならんのかな。
- 711 名前:デフォルトの名無しさん mailto:sage [2013/07/24(水) NY:AN:NY.AN .net]
- CUDAがあるから、あまり積極的にやりたくないんじゃね?
- 712 名前:デフォルトの名無しさん mailto:sage [2013/08/01(木) NY:AN:NY.AN .net]
- 今AMDの環境で開発しているんだけど、NVIDIAの環境でもビルドできるよう
1.1の機能に限定することってできないんですかね? CL_USE_DEPRECATED_OPENCL_1_1_APISみたいな。
- 713 名前:デフォルトの名無しさん [2013/08/18(日) NY:AN:NY.AN .net]
- OpenGLとの連携やっている人いますか?
OpenGLのHGLRCからcl_device_idを得るのにclGetGLContextInfoKHRというのが ありますが、これを呼ぶ際、properties引数にCL_CONTEXT_PLATFORMを含めないと エラー(CL_INVALID_PLATFORM)になります。 Platformを決め打ちで入れてやれば成功はしますが、cl_device_idを得る前にそれが 含まれるcl_platform_idを本来どうやって求めるのでしょうか?
- 714 名前:デフォルトの名無しさん mailto:sage [2013/08/18(日) NY:AN:NY.AN .net]
-
- 715 名前:>>707
clCreateContext に渡した properties と同じもので GL context を1つに特定できるものを渡せって書いてあるだろうに clGetGLContextInfoKHR で指定せずにエラーになるなら clCreateContext ではデフォルト値以外の cl_platform_id を指定したんだろう gl_sharing が有効な CL context は作成済みなのになんで cl_platform_id だけ行方不明なんだよ 余所のライブラリが作った CL context に問い合わせたいなら clGetContextInfo で CL_CONTEXT_PROPERTIES [] - [ここ壊れてます]
- 716 名前:デフォルトの名無しさん mailto:sage [2013/08/18(日) NY:AN:NY.AN .net]
- 回答ありがとうございます。
ただ、clCreateContextはclGetGLContextInfoKHRでデバイスを得た後に呼ぶことに なると思うのですが? 手順は以下で間違ってますかね? GLコンテキスト(HGLRC)作成 →clGetGLContextInfoKHRで関連付けられているCLデバイスを取得 →clCreateContextでCLコンテキストを作成 いずれにしても、どのデバイスを使っているかがわからないとプラットフォームも 決まらないと思うのですが。
- 717 名前:デフォルトの名無しさん mailto:sage [2013/10/24(木) 01:02:02.86 .net]
- vloadn ってあるけど、直接ポインタを p[i] するのと速度違ったりするのか?
- 718 名前:デフォルトの名無しさん mailto:sage [2013/10/24(木) 21:28:52.21 .net]
- vloadはアラインメントの制約がゆるい。要素でそろってればOK。
速度は実装によるだろうけど同じか制約がゆるいvloadのほうが少し遅い。
- 719 名前:デフォルトの名無しさん mailto:sage [2013/10/24(木) 22:48:45.60 .net]
- なるほど。
アラインメントの制約のせいで、ちょっと冗長になってたあのコードとかを小さく綺麗に書き直せるかも。 これは良いことを知った。サンクス。
- 720 名前:デフォルトの名無しさん mailto:sage [2013/11/22(金) 19:43:38.99 .net]
- Khronos Groupが「OpenCL 2.0」を完成、コンピュータビジョン向け「OpenVX 1.0」の暫定仕様も発表
sourceforge.jp/magazine/13/11/22/095200 https://www.khronos.org/news/press/khronos-releases-opencl-2.0
- 721 名前:デフォルトの名無しさん mailto:sage [2013/11/22(金) 19:46:35.85 .net]
- タラタラ完成してんじゃねーよ
- 722 名前:デフォルトの名無しさん [2013/11/22(金) 20:47:48.41 .net]
- OpenVXってのが気になる
- 723 名前:デフォルトの名無しさん mailto:sage [2013/11/25(月) 08:28:25.60 .net]
- JOCLも、早く OpenCL 2.0 に対応しろよ
- 724 名前:デフォルトの名無しさん mailto:sage [2013/11/30(土) 20:57:20.27 .net]
- OpenCLって初期化とかやたら面倒なんですが、
OpenGL に対する glfw や GLUT みたいなライブラリはないんですか? 勉強してみたい(というか、勉強しかけた)のですが、 計算処理を楽しむ前に挫折しそうです。
- 725 名前:デフォルトの名無しさん mailto:sage [2013/11/30(土) 21:26:47.63 .net]
- あるけどない
独自API、英語のみのマニュアル… 初期化なんて一度書けば使い回しだからとりあえずやってみるべき
- 726 名前:デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:18:44.90 .net]
- マニュアルが英語なのは全く問題ないので紹介していただけないでしょうか。
それでも枝葉末節の部分が面倒であれば、今はそういうものだと諦め、 コピペで使い回してかんばります。 ただ、私はたとえば OpenGL 入門者に対して、同じ理由 つまり「初期化なんて一度書けば使い回しだから」という理由で ウィンドウ作らせたり、レンダリングコンテキストを作らせたりはしたくないです。 使い回し 幸い OpenGL にはユーティリティライブラリがあり、入門者にはありがたいです。 なので OpenCL にも入門者用にきっと何かあるだろうと思っていました。
- 727 名前:デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:34:05.19 .net]
- OpenGL ほど広く使われていたらあっただろうね。
- 728 名前:デフォルトの名無しさん mailto:sage [2013/11/30(土) 22:53:53.35 .net]
- NVIDIAやAMDのサンプルコードには簡単なユーティリティが入っているよ。
OpenGLみたいに糞面倒なわけじゃないから、わざわざGLUTみたいなものを 作ろうと思った人はいなかったんだろう。
- 729 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 02:54:53.01 .net]
- そんなに面倒か?
必要十分しかないと思うんだが
- 730 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:12:45.40 .net]
- CUDAの簡単さと比較すると面倒
- 731 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:18:23.16 .net]
- あほか
- 732 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 03:47:08.42 .net]
- c++binding使えば簡単じゃないか。
まあ、プラットフォーム選択する時点で cudaには必要ない工程だが
- 733 名前:デフォルトの名無しさん mailto:sage [2013/12/01(日) 07:35:28.28 .net]
- >>719
intelが最近OpenCLライブラリやGPU向けライブラリのプレビュー版を発表してる ttp://software.intel.com/en-us/intel-ipp-preview IPPはこれまで最適化済みCPUライブラリだったけど、それをGPUにも拡張しようとしてる模様
- 734 名前:デフォルトの名無しさん mailto:sage [2013/12/03(火) 07:13:40.30 .net]
- >>726
ありがとうございます。 調べてみます。
- 735 名前:デフォルトの名無しさん mailto:sage [2013/12/03(火) 13:47:40.89 .net]
- amd apu+linuxでaparapi経由で使ってみたんですが面白そうですね。
はるか昔に、javaで配列関係はどうしようかjniにでもしようかと悩んでたんですがこれでやっと悩みは解決できました。 java9.stream.parallelがopenclに対応してaparapiも不要になる(jvmと結合する)ようなので、openclを使えばjavaのままで配列のソリューションが得られるようです。 まだ触って4日ぐらいですが勉強がてらに、行列などの配列依存のライブラリを書き直してみようと思います。
- 736 名前:デフォルトの名無しさん mailto:sage [2013/12/30(月) 11:40:26.21 .net]
- kaveriが販売される模様
- 737 名前:デフォルトの名無しさん mailto:sage [2014/01/11(土) 01:38:48.46 .net]
- >>717
software.intel.com/en-us/vcsource/tools/opencl-sdk/clu-api CLUとか github.com/Computing-Language-Utility/CLU/blob/master/simple/simple.c このぐらいに書ける。 使ったことはないので便利かどうかは知らない。
- 738 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 15:19:36.59 .net]
- Core iとグラボつんでグラボで画面表示しててもIntelHDでOpenCLの計算をさせることはできるのでしょうか
- 739 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 16:36:29.14 .net]
- 遅くはなろうが計算は出来るでしょう
- 740 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 17:04:11.19 .net]
- あれ?遅くなる要因あるのでしょうか
使ってないIntelHDも使いたいというイメージだったのですが
- 741 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:04:09.93 .net]
- CPUでやったほうが速いってだけ
- 742 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:14:29.38 .net]
- CPUスレッドとは排他でしか使えないと言うことですか?
- 743 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:17:43.70 .net]
- 732だけど、単純にIntelHDをグラボと取り違えただけだよ
- 744 名前:デフォルトの名無しさん mailto:sage [2014/02/24(月) 18:34:07.15 .net]
- 了解です
- 745 名前:デフォルトの名無しさん mailto:sage [2014/03/23(日) 07:57:03.89 ID:2/mKAdk3.net]
- Ubuntu用のSDKはDebian GNU/Linuxで使えますか?
- 746 名前:デフォルトの名無しさん mailto:sage [2014/03/24(月) 20:46:02.33 ID:+qxUA/lQ.net]
- >>733
俺も今日勉強始めたばっかだから実態よく分からんが、 規格ミニマムだとGPUで実行するバイナリを、 プログラム実行時に動的にコンパイルしてマウントする場合があるらしく、 それだとコンパイルのオーバーヘッドで遅くなりそう。 実行時にコンパイルせず事前にコンパイルしたバイナリを使うこともできるそうで NVidia, AMDあたりはLLVMで動いてるからまず大丈夫だろうけど、HD Graphicsはどうなるんだろうか?
|

|