[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 2chのread.cgiへ]
Update time : 05/30 06:39 / Filesize : 210 KB / Number-of Response : 866
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【GPGPU】くだすれCUDAスレ part6【NVIDIA】



1 名前:デフォルトの名無しさん mailto:sage [2012/09/23(日) 23:17:47.58 ]
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
ttp://developer.nvidia.com/category/zone/cuda-zone

関連スレ
GPGPU#5
ttp://hibari.2ch.net/test/read.cgi/tech/1281876470/

前スレ
【GPGPU】くだすれCUDAスレ【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/
【GPGPU】くだすれCUDAスレ pert2【NVIDIA】
ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/
【GPGPU】くだすれCUDAスレ pert3【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/
【GPGPU】くだすれCUDAスレ pert4【NVIDIA】
ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/
【GPGPU】くだすれCUDAスレ part5【NVIDIA】
toro.2ch.net/test/read.cgi/tech/1314104886/


809 名前:デフォルトの名無しさん mailto:sage [2014/03/29(土) 16:39:32.17 ID:b7K/xNj3]
世の中には面白い事考えるもんがおるのう

www.otb-japan.co.jp/dmpr/GPU/gpgpu-xeonPhi-E5-Hybrid.html

810 名前:デフォルトの名無しさん mailto:sage [2014/03/29(土) 16:44:00.72 ID:4Sjmsqlf]
こりゃ面白いな。
試してみたいw

ってかOpenACCってもうリリースされてるの??

811 名前:デフォルトの名無しさん mailto:sage [2014/03/29(土) 23:56:49.50 ID:lTQLq19d]
>>809
やっべ、ちょっと欲しいなって思っちゃった
値段を見て熱は冷めた

812 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 00:00:27.97 ID:stl8pn1Y]
値段ワロタw

813 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 00:12:47.34 ID:tTPtoH97]
>>812
むしろこの構成で高く付かない方がおかしいw
大雑把にはXeonで13万、Xeon Phiで37万、Taslaで39万掛かる感じ
(更に8x 4GB DDR3 1600 ECC Reg.で10万掛かってるけどな!)

814 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 00:31:08.95 ID:stl8pn1Y]
ひゃぁ〜w

815 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 02:22:44.74 ID:QNfBIqKl]
>>813
eBayとかだと自作の方が安くなりそうだな。
といってもtesla K20だけで20万はCUDAらない。

816 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 09:37:11.81 ID:stl8pn1Y]
じつにCUDAらん。

817 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 11:50:35.47 ID:tTPtoH97]
>>815
まあ超ハイスペックだと自作のほうが安くつくしな
ただ、Xeon Phiは一般販売されてなかった気がするんだが……



818 名前:デフォルトの名無しさん mailto:反エジソン陣営sage [2014/03/30(日) 15:11:23.08 ID:CQoCQWvX]
そうだったのか。
まあ買って、単純に付けるだけでは動かんからな。
セッティングがめんどくさそう。
ttp://www.sekaimon.com/i221402553263

819 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 18:21:35.60 ID:c0GW3Y/e]
>>817
アメリカだと通販で売ってるよ。

820 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 19:47:56.88 ID:/wxEDZQQ]
>>819
アメリカの金持ちPC自作erはPhiを使ってPC自作するからか
へたれ日本ではそんなことする奴いないだろからな

821 名前:デフォルトの名無しさん mailto:反エジソン陣営sage [2014/03/30(日) 21:20:53.45 ID:wRKHa685]
それPCやない、WSかHPCや!!
TITANの3wayに比べれば敷居低いと思う。

822 名前:デフォルトの名無しさん mailto:sage [2014/03/30(日) 23:10:13.83 ID:MguGVXnW]
自作ショップで普通はおいてないだけで
注文だせは取り寄せできるんじゃない?
Teslaに比べてもニッチだろうから。

823 名前:デフォルトの名無しさん mailto:sage [2014/03/31(月) 00:35:49.63 ID:icX96Vv2]
インテルがばら売りを許していない少なくとも日本では

824 名前:デフォルトの名無しさん mailto:sage [2014/03/31(月) 01:26:50.30 ID:r13zbHe8]
へーそうだったのか。
まあコンパイラも追加で買わないといけないし、
そこそこの資金は要求されるから、そういうもんかもね。

825 名前:デフォルトの名無しさん mailto:sage [2014/03/31(月) 02:07:17.65 ID:oafVDW+W]
>>820
よりどりみどりだよ。
https://www.google.com/webhp#q=xeon+phi&tbm=shop

826 名前:デフォルトの名無しさん mailto:sage [2014/03/31(月) 02:42:33.40 ID:oafVDW+W]
>>825のリンク、勝手にwww.google.co.jpにリダイレクトされちゃうな。

827 名前:デフォルトの名無しさん mailto:sage [2014/03/31(月) 20:18:51.35 ID:6pmx6lUa]
気が向いたらXeon Phiも付けてみたいよね。
これって現行の普通のi7だと厳しいのかね。



828 名前:デフォルトの名無しさん [2014/04/16(水) 08:25:39.12 ID:gbx/TG/2]
ブラボ4枚差しを今週には購入予定だが、cuda並列はむずかしいのかね?
おススメのHPか本はあるのかね

829 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 08:31:11.50 ID:1cVHCjMz]
きみらって皆採掘が目的なの?10年やって元がとれるくらい?

830 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 09:10:52.39 ID:Im3wLyAK]
>>829
今から採掘に回るとかただの情弱じゃねーかw
単純にゲームとプログラミングのためだよ

831 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 11:53:39.91 ID:7M5hcjK/]
6の正式版が出た

832 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 16:32:35.94 ID:oaV0pcFq]
>>828
The CUDA Hanbook に書いてあったかも。
CUDA by Exampleにもちょっとだけ書いてあったかも。
gtc-ondemandにもなんかあったような。
曖昧で申し訳ない。

833 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 19:54:40.11 ID:GTugkpJK]
5000円以下ぐらいの適当な安いビデオカードって
CUDA使うぐらいならCPUで全部計算した方が速い感じなの?
例えば
AUS 210-SL-TC1GD3-L
とか

834 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 20:08:41.61 ID:3pKdyFk1]
多分誰も答えてくれないと思います。

835 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 20:22:53.52 ID:Wy9kGQMK]
まずGPGPUの基本から勉強しましょう。

836 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 20:38:13.05 ID:Im3wLyAK]
>>833
一応CUDAコアは付いているようだな……>AUS 210-SL-TC1GD3-L(GeForce 210)
www.nvidia.co.jp/object/product_geforce_210_jp.html
同じ「計算」でも、GPGPUが効く分野とそうじゃない分野があるけどな

837 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 21:36:19.29 ID:1cVHCjMz]
同じ値段のCPUとGPUを比較した場合
500並列くらいまではCPUの方が勝ってるが10000並列だとGPUの方が圧倒的になる感じ。



838 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 21:43:51.00 ID:NtFft60O]
IntelがきっちりCPU向けに並列化したコードならxeonも速いよ、GPUメーカーの圧倒的数字は幻想だよせいぜい2倍だよ、みたいな主張をphiの宣伝時にやってて首を傾げたな
その理屈ならxeon倍積みましょう、って宣伝すりゃええやろと

結局、極端なオーダーではやっぱりGPUやphiの方が有利なケースがあるんだろうなと理解したけど

839 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 22:00:14.31 ID:Im3wLyAK]
例の奴貼っておきますね。どうしても問題の性質や書き方やコンパイラに
依存する部分が大きいからな……
www.hpc.co.jp/benchmark20121113.html
www.hpc.co.jp/benchmark20130201.html
www.hpc.co.jp/benchmark20130329.html

840 名前:デフォルトの名無しさん mailto:sage [2014/04/16(水) 22:46:25.66 ID:3pKdyFk1]
やっぱこの人たちすごいな。
久々に見て回ったらK40の新機能のGPU Boostが他で使えるとか見つけてしまった。
水冷化してないけど試してみるか。

841 名前:デフォルトの名無しさん mailto:sage [2014/04/27(日) 14:27:08.90 ID:KCo2Uyz6]
cuda 6.0正式リリースきた
https://developer.nvidia.com/cuda-downloads

842 名前:デフォルトの名無しさん mailto:sage [2014/04/28(月) 03:07:08.53 ID:eSg57KtL]
もしかしなくても、
また面倒くさいことこの上ない初期設定をしないといけないのか。
インストールとVS2012で拡張子変えて保存するだけで動くようになって欲しいよ。
エラーがでると、どの設定がミスったのかバカには分からんのですよ。

843 名前:デフォルトの名無しさん mailto:sage [2014/04/28(月) 11:41:14.51 ID:eFT4bAhD]
>>842
自分が使ってるVSは2008 Pro SP1, 2010 Pro, 2012 Pro UP4 だけど、
CUDA Toolkit 入れた後、
新規プロジェクトなら「NVIDIA -> CUDA X.X」だけで、
既存のプロジェクトなら古いCUDA Tookkitと新しいのを両方入れて
プロジェクトを右クリックで「ビルドのカスタマイズ(B)...」すれば動くよ。
少なくとも CUDA Toolkit 4.x -> 5.0 -> 5.5 RC -> 5.5 -> 6.0RC -> 6.0 はこの方法でできた。

844 名前:デフォルトの名無しさん mailto:sage [2014/04/29(火) 07:51:06.18 ID:xH63q4tk]
>>843
VS ExpressだとNsight入らないんじゃない?

845 名前:デフォルトの名無しさん mailto:sage [2014/04/29(火) 21:03:18.01 ID:AVMxK0NV]
大して変わってないくせに開発環境変えるなよな

846 名前:デフォルトの名無しさん mailto:sage [2014/05/03(土) 04:22:53.23 ID:qVaKcd2l]
これまで開発したプログラムをmaxwellアーキテクチャーで動作させるには
5.5までのtoolkitでptxを吐かせるのか、6.0に移行するしかない模様。

847 名前:デフォルトの名無しさん mailto:sage [2014/05/04(日) 16:05:09.46 ID:/x2IsFFD]
>>846
3月末に、カーネルを15種類連続実行するプログラムを、
CUDA Toolkit 5.5でFermi(CC=2.0/2.1)用コンパイルした物、
Kepler(CC=3.0/3.5)用にコンパイルした物、
CUDA Tooklit 6.0でMaxwell(CC=5.0)用にコンパイルした物の3つで、
GeForce 750 + NSIGHT Visual Studio Editonで「All」でプロファイル採ってみた。
いずれの場合も、ほとんど速度が変わらなかったよ。

だから、無理にMaxwell(CC=5.0)用にする必要は無いかも。



848 名前:デフォルトの名無しさん mailto:sage [2014/05/06(火) 20:16:14.86 ID:OXY1qxhv]
>>847
これ
docs.nvidia.com/cuda/maxwell-compatibility-guide/#axzz30vrhsMg6
は釣りってこと? Σ(-д -;)

849 名前:デフォルトの名無しさん mailto:sage [2014/05/07(水) 05:55:14.20 ID:OEkku2Ok]
>>848
>>846 で合ってると思う。
Gxx→FermiやFermi→Keplerのときも、
新アーキテクチャ非対応な古いToolkitで作ったcubinは使えなかったはず。

850 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 00:08:49.78 ID:YhiaKf7O]
Jetson買った人いる?

851 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 01:02:28.38 ID:sYRhNUSv]
Jetsonってなんだと思ってぐるぐるしたら、NvidiaのRasPiか
RasPiより性能大分良いんだろうが、でも、2万超えは高いな

852 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 16:02:02.59 ID:p0Sddlo6]
自動車用じゃん。スレチだろ

853 名前:デフォルトの名無しさん mailto:sage [2014/05/10(土) 20:33:48.55 ID:/nRhPCsz]
べつに限定されてはいない

組み込み用といだけ

854 名前:デフォルトの名無しさん mailto:sage [2014/05/12(月) 23:57:23.84 ID:LAs79Y1U]
この手の奴にBTデフォでついてんのみたことない
今後の組み込みの方向性的に必須なのに

855 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 00:15:45.25 ID:CSl2SJJR]
CUDA Tooklit を6.0にしたらGPU稼働率が下がったんだけど気のせい?

856 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 00:29:27.71 ID:Iv7eBFJt]
>>855
Ver変えたら能率が大きく違ったりするのはよくあることだからなあ……

857 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 01:44:04.16 ID:CSl2SJJR]
CUDA Tooklit を5.0から6.0にしたら
数値計算プログラムの挙動がおかしくなったorz
おんなじような事になった人いますか?



858 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 04:13:33.08 ID:CSl2SJJR]
連投すんません。数値計算上の安定化を入れたら解決しました。
浮動少数演算の癖がこれまでと違うのかも・・・。

859 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 12:29:21.30 ID:pJVewP3A]
安定化って何したんですか?

860 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 12:54:09.60 ID:X1Xq41se]
ja.wikipedia.org/wiki/%E6%95%B0%E5%80%A4%E7%9A%84%E5%AE%89%E5%AE%9A%E6%80%A7

861 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 14:08:06.19 ID:CSl2SJJR]
>>859
非線形最小二乗法のプログラムで、
一回の反復で更新する解の量を少し減らしたら安定しました。
CPUプログラムよりもGPUプログラムの場合に、
初期値からとんでもなく離れていってしまう場合が多いように感じます。

862 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 14:15:03.11 ID:CSl2SJJR]
>>859
en.wikipedia.org/wiki/Nelder%E2%80%93Mead_method
4. Expansion
のパラメータγを通常2とするところ、
1.9-2.0の間で初期値に応じて変化させるようにしました。

863 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 15:22:39.27 ID:pJVewP3A]
>>860-862
サンクス
誤差の拡大を抑えるってことなんですね
でもCUDAバージョンの違いで問題が出るってなんだろ?
へんな最適化がされてしまってるのかなあ

864 名前:デフォルトの名無しさん mailto:sage [2014/05/13(火) 20:36:41.53 ID:ckwx0yCj]
演算の挙動が論理的に変わるような変更ってあったっけ?

865 名前:デフォルトの名無しさん mailto:sage [2014/05/17(土) 07:57:45.29 ID:jeRfV2R/]
developer.download.nvidia.com/compute/cuda/6_0/rel/docs/CUDA_6_Performance_Report.pdf

CUDA 6 Report






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<210KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef