【GPGPU】くだすれCUDAスレ pert2【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 02/21 05:22 / Filesize : 250 KB / Number-of Response : 931
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2009/10/08(木) 19:29:37 ]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
www.nvidia.com/cuda

関連スレ
GPUで汎用コンピューティングを行うスレ
pc11.2ch.net/test/read.cgi/tech/1167989627/
GPGPU#3
pc12.2ch.net/test/read.cgi/tech/1237630694/
821 名前：810 mailto:sage [2010/04/04(日) 14:18:33 ]: みなさん色々有難うございます。ググりながら考えてるんですが難しいですね。

>>816 >>817
GTX260だと電源交換、i7はM/B&DDR3全部揃えないと…先立つものが…。(ToT)
www.katch.ne.jp/~kakonacl/douga/mediacoder/v0.71_cuda.html の人
は　GeForce9600GT(VRAM 512MB)Vista HomePremium(SP2)で実行、CUDAエンコ
でQ6600使用率83％と書いてあるけど、GT240のほうが高速ですよね？
pc.watch.impress.co.jp/docs/column/tawada/20091117_329556.html によると
GeForce 9600 GTの1,800MHz/256bit メモリ帯域幅は57.6GB/sec、
GeForce GT 240のGDDR5/3,400MHz/128bit 54.4GB/sec、
GeForce GT 240のDDR3/2,000MHz/128bit 32GB/sec。
DDR2-667（5.3GB/s） DDR2-800（6.4GB/s）デュアルだと倍。
もしかしてDDR2がボトルネックになる？　
GT240 GDDR3とGDDR5でCUDAエンコの速さの違いどうなんでしょう？
そこらへんが一番気になります。
822 名前：810 mailto:sage [2010/04/04(日) 14:19:49 ]: >>819
最新ではBフレームが16まで、Average/Variable/CBR/2pass/3pass できるみたいだよ。
x264ではAverage/Variableは何故かコマ落ちする。

>>820
SP216&DDR3のGTX260とCUDAコア数96のGT240だと、エンコ速度二倍差が出ます？
PHARAOH 500W電源だとGTX260+Q6600はギリギリかなぁ。

(Q6600+GT240)複数台にするほうが経済的かな? G41とDDR2が1組余ってるし…
823 名前：デフォルトの名無しさん mailto:sage [2010/04/04(日) 15:38:15 ]: hothardware.com/articleimages/Item1477/san.png
doubleはfloatの1/2*9ってとこか。

Teslaでやって1/2とかだったら、ロックなんだろうな。
824 名前：デフォルトの名無しさん mailto:sage [2010/04/04(日) 17:43:24 ]: これは低すぎるのでOpenCLでDoubleがHWサポート
されてないのではないかと
825 名前：デフォルトの名無しさん mailto:sage [2010/04/05(月) 00:43:36 ]: >>821
GDDR3とGDDR5とでは、メモリ帯域が倍違うので、ストリーム系のアプリでは大きく変わります。
ていうか、このクラスのボードで2枚挿しとか意味がない。
826 名前：デフォルトの名無しさん mailto:sage [2010/04/05(月) 01:09:55 ]: >823－824
むしろ理論値で単精度の5分の1になるはずのRADEONの倍精度が半分程度で済んでる方が気になる

>822
GT240なんてゴミ買うぐらいならいっそ中古のQ9xxxのCPUでも買った方が良くね？
827 名前：デフォルトの名無しさん mailto:sage [2010/04/05(月) 03:39:12 ]: 安物買いの銭失いとはこのこと

CUDAに大きな期待を抱かないほうがいい
828 名前：デフォルトの名無しさん mailto:sage [2010/04/05(月) 19:17:53 ]: >>823で、GTX295が285よりもスコア低いのはなぜ？
829 名前：デフォルトの名無しさん mailto:sage [2010/04/06(火) 01:17:45 ]: >>828
単純にGPUを一個しか使っていないからだと思う。
単一GPUなら285の方が速いからね。
830 名前：デフォルトの名無しさん mailto:sage [2010/04/06(火) 08:54:53 ]: >>825
CUDAエンコはストリームと違ってGDDR3もGDDR5殆ど関係無いってさ。
SP数(CUDAコア数)でほとんど性能が決まる。

>>827
最新のMediaCoderでVBRでやってみたらどう？
831 名前：デフォルトの名無しさん mailto:sage [2010/04/06(火) 19:53:29 ]: MLB オバマ始球式
832 名前：デフォルトの名無しさん [2010/04/07(水) 09:15:06 ]: HPC向けGPGPU終わりつつあるな

102 ：Socket774 ：sage ：2010/04/06(火) 23:24:12 ID:n4owrnuu

>>98
> HPC向けはどうなるんだろう？

マキーノの話だとこんなのが。
grape.mtk.nao.ac.jp/~makino/journal/journal-2010-04.html#3
> 一枚5万とかで買うのでない限り GPU は価格性能比では CPU に勝てなくなってしまった

以前はGPUの方が同コストのCPU比で10倍↑とか軽く叩き出してたけど、
CPUはマルチコア化が進みまくり値段下がりまくり…
ハイエンドGPGPU買うよりCPUの方がコスパが良くなってしまった。
基本直線番長のGPGPUよりCPUの方が扱いやすいし、プログラミングも先行きわからない
CUDAやらなくても、今までやってきた事そのままで走るし…
833 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 09:26:05 ]: 確かに、OpenMPとかでそれなりに性能出るならそっちの方が超簡単だもんな。
834 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 12:13:09 ]: 精度を削って性能を出したマシンで有名になったのにこういう時は倍精度の話だけか
835 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 12:54:34 ]: >>832
マルチコア化が進みまくりって、↓か？当面CUDAエンコの半分にもならんだろう
akiba-pc.watch.impress.co.jp/hotline/20100403/ni_c6176se.html
akiba-pc.watch.impress.co.jp/hotline/20100327/ni_cw3680.html
836 名前：デフォルトの名無しさん [2010/04/07(水) 15:29:03 ]: >>835
CUDAエンコは実用性ゼロと言われているだろ
HPC以外の分野でCUDAを利用している人はいないだろ
837 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 15:31:47 ]: >>834
そこ大事だよな。CPUと違って、倍精度・単精度の使い分けで性能違うもんな。
て、マキーノは昔、計算パスの場所によって計算精度が違う計算機を作ってたもんな
838 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 15:33:36 ]: >>836
エンコの中の人が面倒くさがっているだけなんじゃないの
839 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 15:38:47 ]: >>838
環境を作るのがめんどくさい。
コードを書き換えるのがめんどくさい。
最適化するのがめんどくさい。
840 名前：デフォルトの名無しさん [2010/04/07(水) 15:45:24 ]: >>838
まともなエンコを利用できないという事実が重要
841 名前：デフォルトの名無しさん [2010/04/07(水) 18:57:43 ]: たしかにOpteron12コアX4がFermiと同じ値段ならGPU終わるな。
既存のコードがそのまま動くし。
CUDAでこれ以上の性能が出るアプリは限られている。
842 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 19:05:29 ]: fermiの場合ボッタクリなだけのような。
最終的にはfusionみたいな物に落ち着くだろうけど。
GPUのアーキテクチャとしては変に汎用に振るより
コンパクトな割に暗号解読みたいに得意なものが速い
と言う方が良いだろう。
843 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 20:15:16 ]: >>838

正直エンコにCUDAを適応出来る処理が少なすぎる
844 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 21:02:20 ]: x264の開発者が全員RADE愛好者だったとかいうオチなら面白い
845 名前：デフォルトの名無しさん mailto:sage [2010/04/07(水) 21:05:12 ]: >>839
ペガシスがKarmaPlusに導入したCUDAエンコをTXP4になかなか導入
しないのはそれが原因かｗ
846 名前：デフォルトの名無しさん [2010/04/08(木) 00:28:04 ]: >>841
メニーコア化が進展すればGPUは終わるよね
実際のところ、全然進んでないからNVは助かっているけど
847 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 00:33:02 ]: メニーコアのメニーの次元が、GPUとCPUじゃ、全然違うしな
848 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 00:52:10 ]: 新しいものが出てくるときはチャンスだと思うんだが、このスレではそんな気配かけらもないな。
やっぱり日本人てダメなのかね
849 名前：デフォルトの名無しさん [2010/04/08(木) 00:53:43 ]: だって、HPC向けはコストパフォーマンス悪いし
GeForceは機能削られまくりだし、いまいちなんだよね
850 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 00:56:38 ]: ATOM+IONチップセットで
エンコ爆速になったりしないか
851 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 01:25:40 ]: >>850
動画データの転送には最低でもPenDは必要。

>>848
バカンスの概念が無い日本人はここぞって時に余力が無い。

>>841
4万のマザーに32,480円の8コア載せるより
5千円のマザーに1.6万円の4コア載せて数万のビデオカード挿す方が数倍早い
んだろうし、どっちもムーアの法則どうり進化すればGPUは当分優勢では？
852 名前：デフォルトの名無しさん [2010/04/08(木) 06:07:48 ]: GPUで縁故するとなんであんなに汚いの?
853 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 06:24:22 ]: ソースみたいとわからん。
854 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 06:27:58 ]: SpursEngineでエンコして汚いのはハードのせい
CUDAでエンコして汚い場合はソフトが成熟してないから
855 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 07:03:51 ]: >>851
適材適所ってことだよなー
y=a*x+b を100万個×10万回　みたいな計算には巨大コアはいらない、
小さいコアがたくさんある方が速い　みたいな。
856 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 19:19:24 ]: >>851
なぜ今頃ムーアの法則？
成り立たなくなってかなり経つんだが
857 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 19:46:55 ]: え？
858 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 19:53:19 ]: >>856

え？
859 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 21:00:18 ]: >>856
　　　　　　　　 _......_
　　　 __　　／.::::::::::｀:.､
　　／, - ｒ, /::::i::::ﾊ:i:::::;::',
　 r-'ヽ./ｲ i::::|ｲ/'　'-ﾍl:::i
　｀ｰ､i　{ l::::l '"´　￣ l:::l　＜またまたｗご冗談を
　　　　l!　l l::::ﾄ､ r_っ ,ィ:::l
　　　 l　ﾄヽ::l弋ニ＜l::::l!
　　　　ゝ- イ`　　　ｲ^ｲ
　　　　　　　 | 　　　/-{′

wiredvision.jp/news/200709/2007092021.html
www.itmedia.co.jp/news/articles/0906/18/news006.html
860 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 21:01:30 ]: あと10年ぐらいはどうにかなりそうな気がするけど
861 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 22:27:03 ]: >>856はfreelunchは終わった発言と混同しているに1000ペソ
862 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 22:27:35 ]: >>860
どんだけ低クロックなんだよ、電算機系分野の１０年ってものすげぇ進歩するんだぞ
863 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 22:58:17 ]: クロック？
ムーアの法則って集積密度の話じゃなかったっけ
864 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 23:03:27 ]: ムーアの法則なんて、明らかに無理だと分かった時点で
定義の方を変えて無理やり存続させているだけだろ。
865 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 23:14:23 ]: IntelはAMDの様子見して出し惜しみ＆殿様商売
「半導体の集積密度は18～24ヶ月で倍増する」ゆえ
CPUの性能は2年で倍近くになる。1年だと√2倍弱
GPUも同様。
866 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 23:19:44 ]: 集積密度≠性能ということをきちんと理解しましょう
867 名前：デフォルトの名無しさん mailto:sage [2010/04/08(木) 23:53:15 ]: GPUで無理矢理あれこれするより、
計算専用のユニットを別途開発した方がいいんじゃないの？と思う
GPUより効率よくできる部分もあるだろうし
868 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 10:42:33 ]: 　　∩＿＿＿∩　　　　　　　　｜
　　 | ノ＼　　　　ヽ　　　　　　　|
　　/　　●゛　　● |　　　　　　　|
　 |　∪　　( _●_)　ミ　　　　　　j
　彡､　　　|∪|　　 |　　　　　　Ｊ>>867
/　　　　 ∩ノ ⊃　ヽ
(　＼　／＿ノ　|　 |
.＼　“　　／＿＿|　 |
　　＼／＿＿＿／
869 名前：デフォルトの名無しさん [2010/04/09(金) 12:48:00 ]: x264がCUDA対応してないことと、AVIUTLでCUDA使えないこと、
MediaCoderのcudaH264Enc.exeの画質をx264並みにするにはビットレートを
何割増しにすればいいのか不明なこと、
PowerDirectorは設定がゴミなこと、

が問題かな
870 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 15:40:20 ]: forums.nvidia.com/index.php?showtopic=165055

Double precision is 1/2 of single precision for Tesla 20-series, whereas double precision
is 1/8th of single precision for GeForce GTX 470/480
871 名前：デフォルトの名無しさん [2010/04/09(金) 17:18:50 ]: 倍精度だとteslaの1/4だけと、値段は1/5なんだよね
872 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 17:46:49 ]: ノードの数がGTX480は480でteslaは442なんだよね
873 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 18:47:55 ]: あれ、HD5870でよくね？
874 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 20:10:18 ]: pc.watch.impress.co.jp/docs/news/20100405_359261.html

AMDは単精度しかなかったみたいね
875 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 20:58:04 ]: IEEE754準拠ではない64bit double floatはR7xxの頃からあった。
俺は使ったことないからわからないけど。
少なくともドキュメントには、Radeon HD4xxx を除外するような文言はなかった。

R8xxはIEEE754準拠の命令が結構揃ってるよ。
876 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 21:12:53 ]: なんでラデはFFTのライブラリを出さないのか理由がわかりますか
877 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 21:15:33 ]: つくれば？
878 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 21:23:09 ]: ですよね
879 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 22:31:50 ]: ascii.jp/elem/000/000/513/513385/
秋葉に出たみたいです。どうしようかな。
880 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 22:38:50 ]: 熱的にやめとけ。
881 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 22:53:30 ]: 売り切れたそうです。GTX480、3枚買った方がいるとか。
882 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 23:04:45 ]: >>875
IEEE754準拠の精度になったのがRV770で
RV670のころからdoubleはサポートされているよ。
883 名前：デフォルトの名無しさん mailto:sage [2010/04/09(金) 23:45:38 ]: 3枚とかアホとしかww
884 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 00:08:11 ]: 470なら3台行けるかなー
885 名前：デフォルトの名無しさん [2010/04/10(土) 01:56:40 ]: オークションで売るんじゃないか
886 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 02:23:45 ]: PCI-EXｘ16　3つあるマザーでPCIと交互にあるマザーでCUDAエンコに
使うんだろう。
887 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 05:14:47 ]: 結局、倍精度は削られているのかね？
削られていなければ買いたいのだが。
888 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 06:32:49 ]: まだ実測した人はいないみたいですね。スレの人が手に入れるのをまちましょう。
889 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 07:09:42 ]: GTX480じゃ倍精度無効になっているだけで
sandraのベンチのやつはEMUですが
890 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 07:42:43 ]: 無効じゃなくて1/4ですよね
ベンチはOpenGLがそうなってるということで
891 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 07:47:12 ]: OpenGLのなにが？
892 名前：デフォルトの名無しさん [2010/04/10(土) 07:59:10 ]: sandraのあれはOpenCLだろ>倍精度無効
893 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 08:04:30 ]: sandraはOpenCLだろうがGLだろうがCUDAだろうがCSだろうがvideorenderingだろうが
ハードで使えなきゃエミュでだすよ
894 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 08:14:32 ]: pc11.2ch.net/test/read.cgi/jisaku/1269857880/740
購入者
895 名前：デフォルトの名無しさん [2010/04/10(土) 08:54:56 ]: >>894
ゲーム目的だったらHD5970を買ったほうがよかったのにね
896 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 10:53:48 ]: M/Bとか貧弱なんでゲーマでもないみたいでなんで２枚も買ったのか
897 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 11:38:52 ]: 480/470の倍精度演算削られたのか…
倍精度演算やる人はぼったくり価格のC2050/2070買えってか
898 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 11:45:47 ]: >>897
そのソースはどこ？
899 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 13:34:59 ]: >>897
まぁ、このスレ住人が実際にCUDAで試すのを待とうや。
900 名前：デフォルトの名無しさん mailto:sage [2010/04/10(土) 13:57:02 ]: 米アマゾンはまだ発売前になってるね
901 名前：デフォルトの名無しさん mailto:sage [2010/04/11(日) 10:27:23 ]: これだけ出回ってるのに倍精度はおろか単精度の演算を流す人もいないとは
902 名前：デフォルトの名無しさん mailto:sage [2010/04/11(日) 13:02:22 ]: 出来る人はこんな所に来ない、つまりここは無能の衆が集う所だから
903 名前：デフォルトの名無しさん mailto:sage [2010/04/11(日) 13:11:46 ]: みんな科研費で買うんじゃない？５月まで待たないと．
904 名前：デフォルトの名無しさん mailto:sage [2010/04/11(日) 13:37:56 ]: 無駄遣いはやめてもらうようにこのスレのことも仕分け人に伝えとかないといかんね
905 名前：デフォルトの名無しさん [2010/04/11(日) 13:48:15 ]: 科研費が無駄に物価を高騰させてるな
さっさと仕分けされろ
906 名前：デフォルトの名無しさん [2010/04/11(日) 18:10:27 ]: 無駄な科学者・技術者は農業や林業にまわって効率を上げてやってほしい。
907 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 06:21:08 ]: 470ポチった。ついでにCUDAの入門書もポチった。
両方到着は14日予定。おまえらよろしく

>>897
倍精度のテストプログラムか何かあれば提示してくれないか？
手元にGeForce系列VGAが一切ないので一切やったことがないんだ
908 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 07:42:29 ]: 14日、期待してますよ。
909 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 09:50:33 ]: 人柱になってくれるのに情報薄くて申し訳ないが
このスレの上の方にあるCUDA公式での行列かけ算コードを倍精度化したものを走らせるのが一番簡単かな？
手持ちがあれば提供したいが
910 名前：時々書いている人 mailto:sage [2010/04/12(月) 13:40:47 ]: 未だELSAからボードが来ない……
911 名前：デフォルトの名無しさん [2010/04/12(月) 14:48:20 ]: 480のCUDAのベンチマーク結果はどかでみられませんか？
ゲームのベンチだといくらでもみつかるのですが。
912 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 15:15:57 ]: 　　　　　　　　　　　　　_(こ＾)､_
　　　　　　　　　　　〃､__ﾉノ､__,ヽ
　　　　　　　　　 {.っ＞　＜っﾄ､
　　　　　　　 (⌒i　（千于`ｰ┴'─────┐
　　　　　　　　　（O人　 `ー|　　　　　　　　 |
　　　　　　　　　　　/⌒ヽ(＾う　見せられ.　　　 |
　　　　　　　　　　　`ｧー─イ　　　　ないよ！　 |
　　　　　　　　　　　/　　（0::|＿＿＿＿＿_＿_＿_|
　　　　　　　　 /＼＿＿＿_/
　　　　　　　　／　　　/　　⌒ヽ
　　　　　　___／　／￣￣｀)　　ﾉ
　　　　　(__r＿__ノ　　　　 (.＿＿つ
913 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 18:54:31 ]: www.anandtech.com/show/2977/nvidia-s-geforce-gtx-480-and-gtx-470-6-months-late-was-it-worth-the-wait-/6
914 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 19:10:50 ]: おｋ、14日・・・はWin7のセットアップなどもあるから無理として、15日か16日にはテストする
915 名前：デフォルトの名無しさん mailto:sage [2010/04/12(月) 19:23:43 ]: あいかわらず倍精度のベンチはないもののNVIDIAがコンフォームしたって書いてあるね
916 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 08:17:19 ]: マーケティングの理由から倍精度つぶすとかやってくれるぜ全く
くあどろも同じだったら本当に萎えるわ
917 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 08:20:01 ]: やっぱり倍精度は1/4になっているのか。
Teslaだと高いしな。
Nehalemが6コア、8コアになってきて、Opteronは12コアになってきてしまったので、
CUDAの優位性がかなり下がってしまったな。
918 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 08:27:05 ]: nvidiaは1世代分戦略を間違えた希ガス
社運をHPCに賭けるなら、Fermiは倍精度つぶさずにバーゲンするべきだった
CUDAがある程度スタンダードになったことを確認した上で、Fermiの次をぼったくり価格にすれば良かったはず
PCIExpress3.0対応にしてさ

いまならCUDA捨てるの間に合うしなあ　ユーザ側が

リネーム商法といい、nvidiaはほんと強気だ
919 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 10:20:40 ]: まじか。書いてあるな。萎えたな。
「NVIDIA has confirmed it - the GTX 400 series' FP64 performance is capped at
1/8th (12.5%) of its FP32 performance, as opposed to what the hardware
natively can do of 1/2 (50%) FP32. 」
920 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 10:21:59 ]: これまでの何倍速くなりました！というのがかなり限定されるのがわかって来たからね。メモリ帯域に関しても確かにCUDAが始まった頃は、CPUの10倍以上あって早かったけど、今はDual CPUだと大差無くなって来ているので、高価なTeslaを入れる意味も無いなあ。
前に誰かが書いていたけど、古いPCの延命のために使うのはありだと思うけど、ちょっと高いよなあ。
歩留まりが悪いのはわかるが。
921 名前：デフォルトの名無しさん mailto:sage [2010/04/13(火) 10:29:35 ]: 結局、Fermiのほどまりは何％くらいで、普通は何％くらいなんですか？

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef