【GPGPU】くだすれCUDAスレ pert2【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 02/21 05:22 / Filesize : 250 KB / Number-of Response : 931
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2009/10/08(木) 19:29:37 ]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
www.nvidia.com/cuda

関連スレ
GPUで汎用コンピューティングを行うスレ
pc11.2ch.net/test/read.cgi/tech/1167989627/
GPGPU#3
pc12.2ch.net/test/read.cgi/tech/1237630694/
713 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 03:02:10 ]: >>708
おいおい・・・まじかよ。
かなり酷いなあ。まだ騙すことは出来るかもしれないが、
これがばれてくると偉いことになるぞ。

そういえばNVIDIAのGPUカンファレンスでCPUの2000倍速くなりましたってのがあったが、
Tesrax4、Opteron 2.4GHz 1Coreのものだった。
かなりつっこまれていたよ。
で、GPUは最適化しましたけど、実はCPUは最適化してませんだった。

>>710
この手の計算はどちらかというとストリーミングに近いから、
キャッシュやプリフェッチは十分効くよ。
特にハードウェアプリフェッチはかなり効果的だよ。
ただ、SSEを使ってしまったりすると、計算時間を隠蔽できなくなって、
今度は転送時間を隠蔽する方法を考えなくてはならなくなる。

Nehalemの中でも2000MHzのメモリに対応したものであれば、
48GB/sにもなるよ。このあたりはオーバークロック気味になるので、
コンシューマレベルでしかないけどね。

GPUを使うのを否定はしないが、いい加減嘘に近い誇張は止めてもらいたいものだ。
数倍でもいいだろう。2倍でも2日かかったものが1日で終わるんだぜ。
あんまり速いと仕事が増えるじゃねぇか！
714 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 03:47:59 ]: 嘘は言ってないんだよな
比較対象が微妙すぎるだけで
CPUでも効率を出すのが難しい問題はあるから、両方ともきちんとチューニングした上で比較するのが理想ではある
まあXX倍という数字が一人歩きするのはよくないね
715 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 04:43:39 ]: >>712
そのプレスリリースってどこにあるの？

>>713
この手の計算って常に帯域を使い切っているわけじゃないの？
それならキャッシュの効果は限定的になりそうだけど、プリフェッチはかなり効果ありそう。

journal.mycom.co.jp/news/2010/03/24/055/index.html
> 単一のGPU(Tesla S1070)を用いた際の性能は
> 「単精度ではTSUBAMEに搭載されているOpteron比で最大で100倍を超すレベルを達成、
> 平均でも 44,3GFlopsを達成している。
> 性能が落ちる倍精度でも15GFlops程度を達成しており、
> CPU比では相当高い値を実現した」(青木教授)と説明する。

www.gsic.titech.ac.jp/contents/press_release0324.pdf
> スパコンTSUBAMEの単一GPUを使った計算で
> 44.3GFlops（CPUの1コアに対して約80倍）

これってやっぱり、Tesla S1070の4基を単一GPUと言って
Opteronの1コアと比較している同じパターン・・・？

あまりに酷い誇張はやめてもらわないと、有能な開発者がGPUの性能をそれなりに引き出しても
能力が低いとか言われたり、色々と深刻な事態になりかねない・・・
716 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 04:54:00 ]: 実際、某社でなりかけている。

私の現場では、寧ろ旧世代のCPUを積んだサーバ機をGPUで延命させるってシナリオだから
処理能力は1.5倍でも御の字さw まぁ、実際のところはXeon1core対比で5倍程度は出たから
サーバ機一台で換算してなんとか2倍(5+1*3 vs 4)の数字は出たけど。
717 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 05:08:13 ]: >>715
結局実装アルゴリズムによるけど、
プリフェッチはかなり効くよ。

最後の2行はすごく同意だな。
わかっていない人からすると、GPU使えば数10倍になるはずと思ったりするので、
有能な奴が5倍速い書いたコードを書いたとしても相対的に低いと評価されそうだ。

>>716
たぶんこういう使い方が一番いいのかもね。
718 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 07:21:48 ]: >>715
CPU比ではそうかもしれんが
AMD比ではかなりしょぼくないか？ｗ
719 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 09:10:23 ]: nttxstore.jp/_II_EA13119354
NVIDIA Tesla C2070　ETS2070-C6ER　475,545円（税込)　発売開始日 2010/9/30
720 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 12:09:51 ]: GTX 470欲しいな。でもどうせ瞬殺なんでしょ？
いいよな秋葉原に住んでるおまえらは
721 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 12:47:08 ]: >>716
GPUで延命→鯖予算獲得→新鯖にGPU移植
の流れが理想
722 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 13:51:52 ]: GPGPUでの性能評価の指針って明確に定められないのかね
CPU単一コア，レファレンスコードと比較して何倍速くなったと言っても，
そんな条件で計算すること自体なさそうなんで，意味無い気がするんだが

GPUでチューニングするなら，CPUでもチューニングするべきだろう
723 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 14:00:31 ]: AMDかintelかでめんどくさいからじゃない
724 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 14:34:25 ]: >>722 CPUまでチューニングする必要はないと思うけど、
気象コードがMPIで並列化されてないとも思えないし、1GPU内でも相当の並列化を行ってるんだから、
CPUの1コアのみと比較するのは、ちょっとやりすぎ。
で実際Xeon/X5570と倍精度で比較したら、単一コアで10倍程度、4コアで3倍程度のアドバンテージしかないんじゃない。
ノード単位だと逆に遅くなるとか。120GPUの3.2TFLOPSも単精度だし…、比較自体を都合のいいように、いいとこどりしすぎ。
ベンチマークだけでなく、せっかく実アプリをフルGPU化したのは十分意味があるのに、世間受けを狙いすぎた発表で逆に良識を疑ってしまう。
725 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 15:23:41 ]: 第三者（？）が書いた記事よりも
NVIDIAの発表のほうがまだ信頼できるな。
726 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 16:40:26 ]: 詐欺師の言葉のほうが信頼があるとはこれ如何に
727 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 16:46:56 ]: 詐欺師はお客様に信用されなければいけない。
だから最低限の嘘しかつかない。

大道芸人は嘘をつくたびに金をもらえる。
だからいくらでも嘘をつく。
728 名前：デフォルトの名無しさん [2010/03/27(土) 18:47:44 ]: モックアップＮＶＩＤＩＡとうそつきが多い野心的な学者連中の
たわ言なんて信用できないよな
729 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 19:13:00 ]: ま俺は数字しか信じない
ttp://www.anandtech.com/video/showdoc.aspx?i=3783&p=6
730 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 19:26:53 ]: 数字なんていくらでもいじれるんですよ！
信用のあるデータが欲しいなら自分で実測するしかない
731 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 19:36:26 ]: つまりそのデータを公開しても
誰も信じないってわけね
732 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 19:44:22 ]: その通り！
よく分かってるじゃん
論文だって他人の実験の結果なんて基本誰も信用しないよ
とりあえず自分で再現実験してみるのは常識
733 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 20:09:19 ]: そしてその論文も誰も信用しない
734 名前：デフォルトの名無しさん mailto:sage [2010/03/27(土) 21:06:02 ]: 利害を共にしない数十人の人が
方法の妥当性を検証し、追試し、同じ結果が出て初めて
ある程度の信用を得る
それでも「ある程度」なのが学問の厳しい所だ
735 名前：デフォルトの名無しさん [2010/03/27(土) 21:40:16 ]: GPUは1コアだと思いますよ。TESRA内でもGPU同士はPCI越しなんで
遅くなると思います。
3000x3000x50って1GPUにおさまるサイズと思うし
736 名前：デフォルトの名無しさん [2010/03/27(土) 21:41:34 ]: 誰も追試できないと思っているから舐めているんだろ。
今後は青木の言うことはハイハイワロスだな。
737 名前：デフォルトの名無しさん [2010/03/27(土) 21:43:30 ]: >>735
それだったら120GPUの意味がないだろ。
あと、Teslaな
738 名前：デフォルトの名無しさん [2010/03/27(土) 21:49:48 ]: いくつかの別な測定を同じ測定かもしれない感じで書くのはテクニックじゃないですか
１GPUで44.3GFLOPSなのに120GPUでなんで3.22TFLOPSなんでしょうか。
739 名前：デフォルトの名無しさん mailto:sage [2010/03/28(日) 09:52:45 ]: Zotac GeForce GTX 480
Amazon.comでPre Order　$499だったから
申し込んでしまったｗ　(米→日転送業者使用)
740 名前：デフォルトの名無しさん mailto:sage [2010/03/28(日) 13:50:46 ]: 結局512spじゃなかったねGTX480
741 名前：デフォルトの名無しさん mailto:sage [2010/03/28(日) 15:30:51 ]: Ultraがくる
742 名前：デフォルトの名無しさん mailto:sage [2010/03/29(月) 03:53:35 ]: >>740
最初から、576にしておけばよかったのにね。
32x18で。2ブロックダメでも512で出せるのに。
743 名前：デフォルトの名無しさん mailto:sage [2010/03/29(月) 08:15:18 ]: そんなことしたらますますイールドが悪くなるわけで。
744 名前：デフォルトの名無しさん [2010/03/29(月) 11:43:02 ]: 1CUDAコア破損しただけで３２個分が台無しになるFermi
512すべて無事なのはほとんどないんだろうな
745 名前：デフォルトの名無しさん mailto:sage [2010/03/29(月) 11:50:30 ]: PS3と同じ作戦でござる。

　　　　＿＿＿＿＿＿＿＿＿＿＿＿
　　　　ヾミ || || || || || || || ,l,,l,,l 川〃彡|
　　　　　V~~''-山┴''''""~ 　　ヾニﾆ彡|　　　　　　　512SPは存在する・・・・・・！
　　　　 /　二ー―''二　　　　　ヾﾆニ┤　　　　　　存在するが・・・
　　　 <'-.,　　￣￣　　 _,,,..-‐､　〉ニﾆ|　　　　　　　今回　まだ　全部有効にするとの
　　　/"''-ﾆ,‐l 　　l`__ニ-‐'''""` /ニ二|　　　　　　　指定まではしていない
　　　|　==＝､!　　`＝====､　　l =ｌべ=|
.　　　| `ーﾟ‐'/　　 `ー‐ﾟ―' 　　l.=lへ|~|　　　　　　　そのことを
　　　 |`ー‐/　　　　`ー――　　H<,〉|=|　　　　　　　どうか諸君らも
　　　 |　　/　　　､　　　　　　 l|__ノｰ|　　　　　　　思い出していただきたい
.　　　| ／`ー　~　′　　＼　　　.|ヾ.ニ|ヽ
　　　 |ｌ　下王l王l王l王lヲ｜　　|　ヾ_,|　＼　　　　　つまり・・・・
. 　　 |　　　　≡　　　　　　　　　|　　 `l　　＼__　　　我々がその気になれば
　　　　!、　　　　　　　　　　 _,,..-'′ ／l　　　 |　~'''　 FermiのSP数は
‐''"￣|　`iｰ-..,,,＿,,,,,....-‐'''"　　／　 |　　　 |　　　 320SP　384SP　ということも
　-―|　　|＼　　　　　　　　　／　　 |　　　　 |　　　可能だろう・・・・・・・・・・ということ・・・・！
　　 |　　 |　＼　　　　　　／　　　 |　　　　　 |
746 名前：デフォルトの名無しさん mailto:sage [2010/03/29(月) 14:07:53 ]: 　　　　　＿＿＿_
　　　　　　　|<三`'ヨ′
　　　　　　_/6|ｰ廿┤
　　　 /l￣　ＫL.三.｣￣h
.　　 /　|　　レ兮y′/ l
　　〈　く　　 ∨ l/　,ｲ　|
　　　＼_,.>、　　　 /,L..｣_
.　0ﾆﾆﾆ)而}ﾆﾆﾆﾆニ),ﾘﾘﾆﾆ)
.　　Ｌ| |＿＿＿__|＿＿__| |
　　 l | |.＿＿＿＿＿＿_| |　　,:
　,　　l ＼ヽ　l　　|　　 , '／　　;'
　:, ____l＿|_|_;_|＿|＿__|_|＿＿　　　;
　　|＼ﾞ;三三ﾞ';三三三,;ﾞ三三＼　;'
　　|＼＼三三ﾞ三ｼﾞｼﾞ三三,''三;'＼,;'　　;'
　　|、＼＼三ﾞ;三三ｼﾞｼﾞ･'三三三;＼　;
　　0ﾄ､＼＼＼;'三三;'三三三;''三三,;'＼
　　　　＼＼＼| 炎炎炎炎炎炎炎炎炎 |
　　　　　＼＼| 二I二二I二二I二二I二 |
　　　　　　　＼ＬI二二I二二I二二I二二｣
　　　　　　　　0｣　　　　　　　　　　　　0｣
747 名前：デフォルトの名無しさん [2010/03/30(火) 10:14:08 ]: NVDIAフォーラムでGTX480の倍精度性能はTeslaの1/4という発言が
ありますがどうなんでしょう
748 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 10:30:27 ]: >>747
おれ、人柱としてぽちったから待っててくれ。
749 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 11:15:36 ]: >>748
俺はお前を待っているぞ
+　　　+
　 ∧＿∧ 　+
　（0ﾟ・∀・）　　　ﾜｸﾜｸﾃｶﾃｶ
　（0ﾟ∪ ∪ +
　と＿_）__）　+
750 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 11:36:18 ]: Quadroと同じ戦略か。
妥当っちゃ妥当だな
751 名前：デフォルトの名無しさん [2010/03/30(火) 12:00:52 ]: EECだけでなく倍精度も性能を劣化させたのか
GPGPUの利点がどんどんなくなってるな
752 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:20:38 ]: >>749
あ、748なんだけど、さすがにTesla買う金は無いのよ。
なんか、GTX480で動かして「明らかに倍精度の性能落としてやがる！！！１１」と
分かるプログラムはどこかにあるかな。
753 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:21:31 ]: Teslaもないと比べようがなくね？

visual profilerの関数の実行時間を比較くらいしか厳密な計測はできなさそう。
754 名前：753 mailto:sage [2010/03/30(火) 12:22:12 ]: リーロードしてなかった、悪気はないんだｗ
755 名前：デフォルトの名無しさん [2010/03/30(火) 12:34:45 ]: NVIDIA_GPU_Computing_SDK/C/bin/linux/release$ ./matrixMul
Processing time: 0.120000 (ms)
Test PASSED

Press ENTER to exit...
あたりを倍精度化してもらえばいいかと
756 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:36:50 ]: >>753
かぶって申し訳ないｗｗ
おれ>>739なんだけど、失敗かな。日本で入手可能になるのを
待ったほうが早くて安かったかもしんないよなorz
757 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:41:40 ]: >>755
おけ、matrixMulでGTX280とGTX480の比較ならやってさしあげられる。
floatのままと、doubleに全部置換した版で。
758 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:50:39 ]: floatは内部で型変換してるからdoubleの方が早いって聞いた事あるんだけど…
759 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 12:59:07 ]: 倍精度のFMAをひたすら繰り返す感じのカーネルで計測するのがよいかと。
760 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 13:09:51 ]: >>758
どこかのCPUでintをdoubleに変換してたという話かと。
761 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 13:10:18 ]: しかし、480SPとか、AMDはリアル12コアだとか、
時代の進歩は速いものだな。
762 名前：デフォルトの名無しさん [2010/03/30(火) 14:06:01 ]: しかし、性能はGTX295から毛の生えた程度
ていうか、もし倍精度の性能がいまいちだったらGTX480/470より
GTX295を買ったほうが安くていいかもね
763 名前：デフォルトの名無しさん [2010/03/30(火) 14:14:19 ]: 長崎大のようなことをやられたらNVDIAが東工大から呼出をうけて
「２度目はないからな」とか言われても不思議じゃないよね
764 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 15:00:14 ]: >>762
GTX295、5万円くらいだからなぁ。倍精度の性能がGTX280の２倍程度ならば…
GTX295でヨシってことになると。>>757よろしく！
765 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 15:19:12 ]: matrixMulはメインメモリの転送が時間に含まれてるしサイズが小さめ
プログラムが書けるなら1000x1000あたりの性能をお願いします
766 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 15:43:23 ]: >>760
そうなのか？
普通のCPUの構造上浮動小数点演算は、
64bitでやるから型変換をしてると聞いたんだけど
767 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 15:48:57 ]: もしかしてGPUだと話は別なのかな…
768 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 18:34:02 ]: >>766
x86アーキテクチャでは、普通は変数型に関わらず浮動小数点演算は80bitの拡張倍精度で行う。
メモリロード/ストアの際に、変数がfloat型ならfloat型に変換されはするが、
別に大した処理でもないので速度にそんな影響は出なかったと思うが。
769 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 18:46:24 ]: R3000かなんかで64bitint乗算がなくてとかなかったっけ
770 名前：デフォルトの名無しさん mailto:sage [2010/03/30(火) 22:56:03 ]: >>767
GPU だとどころか、倍精度演算器が載ってない CPU だってあるから。
処理系によって話が別。
771 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 02:58:13 ]: device emulationってなくなっちゃうのね
772 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 05:57:59 ]: ちょっと整理。

・x86(fpu)
浮動小数点レジスタが80bitなので、floatを突っ込んでも80bitで演算する。
従って、floatとの変換処理が入るのでdoubleの方が速いことがしばしば。

・x86(sse)
MMXレジスタが汎用なので、floatはfloatのまま演算する。
従って、定数や標準関数でdoubleに汚染されないように気をつければfloatの方が多少速くなる。
また、MMXレジスタにfloatの方が2倍詰め込めるのでベクタ化した場合に2倍速くなる可能性もある。
更に、キャッシュ効率もよくなるのでより速くなるかもしれない。

・GPU(cuda)
単精度レジスタと倍精度レジスタが分かれているんだっけ? 倍精度についてよく知らんのでフォローお願い。
演算器の特性上、単精度の方がずっと高速に演算するし、転送量も当然半分にできる。
応用にも拠るけれど、CPUとのI/Fは単精度で内部だけ倍精度にできると最強かも。
773 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 07:48:43 ]: 64bit版gccだと、-m32オプションをつけない限りもはやx87のコードは吐かないなあ。

>CPUとのI/Fは単精度で内部だけ倍精度にできると最強かも。
これって何回丸めが発生するかによるけど、精度は単精度+αだね。
でもこういうことはよくやるなあ。
データ量を減らしたくて少し精度が欲しい場合は、最終的に欲しいデータはfloatで持っておいて、
計算するときにすべてdouble型のデータにコピーして最後に結果をfloat型に戻す。
この方法をとれば、丸め誤差の発生は一回で済む。
計算の中身が超越関数使ったり、複雑であったりすると結構有効だよ。
その分速度は犠牲になるけど、メモリ帯域が支配的であると余り影響がないな。
G200系だとまだ効果はないだろうけど、Fermiなら結構役に立つんでない？
774 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 11:35:13 ]: >・x86(fpu)
>浮動小数点レジスタが80bitなので、floatを突っ込んでも80bitで演算する。
>従って、floatとの変換処理が入るのでdoubleの方が速いことがしばしば。
doubleは64bitなんだから結局まるめが入るのは同じじゃないの？
775 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 13:02:05 ]: おいおいあれだけCPU側のコードが糞だといっておいて、CPUのこと知らなさすぎだろｗ

floatが遅くなるのは、MSVCが、floatのときは毎回メモリに書き戻すことで精度を32bitに落としてIEEE互換にするコードを出すから
レジスタ間ならfloat/double/long double関係なく80bit
776 名前：デフォルトの名無しさん [2010/03/31(水) 14:32:17 ]: GPUの種類を取得する関数か何かはありませんか？
777 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 14:42:10 ]: >>776
サンプルでついてくるdeviceQueryのソース読んでみれば
778 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 14:44:59 ]: >>776
CUDA APIガイドに書いてあるだろ
779 名前：デフォルトの名無しさん [2010/03/31(水) 15:12:11 ]: そうじゃなくて製品名です
780 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:20:59 ]: 製品名って、ASUSかEVGAか判別したいってこと？？
781 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:26:11 ]: メーカーの判別はどうがんばっても無理だろ
782 名前：デフォルトの名無しさん [2010/03/31(水) 15:32:47 ]: じゃあせめてWindowsかMacかInaxかぐらいわかりませんか？
783 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:33:23 ]: 製品名って言うくらいだから、ELSA GLADIAC 998 GTX Plus V2 512MBみたいなのじゃないのか。
784 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:34:04 ]: >>782
CUDA以前の問題。てか、そのレベルじゃ絶対無理だろ。
785 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:53:38 ]: #ifdef _WIN32
786 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 15:55:08 ]: まさかOpenCLの話か？
#ifdef _apple
とかやった覚えがある。
787 名前：デフォルトの名無しさん [2010/03/31(水) 16:15:17 ]: #ifdef _appleは豆知識だな
788 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 16:44:37 ]: Inax は釣りだろ。782 は偽者じゃないか？
TOTO 向けと別の最適化するのかなｗ
789 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 19:31:24 ]: 水流をGPUでシミュレーションして最適化するのか
790 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 21:04:19 ]: 流体シミュレーションはGPGPUのメインテーマだから、まさにうってつけだろう
791 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 21:06:11 ]: OpenCL使えよ馬鹿ども
792 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 21:08:09 ]: 日本の便器メーカーは水量削減に血道を上げているからな
いかに少ない水量で、効率良く、かつきっちり排泄物を流しきるか
793 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 21:11:31 ]: 便器開発での計算に使用するだけでなく、
便器自体にTeslaを搭載し、
排泄物を画像認識して最適な水流を計算する。

排熱も有効利用できそうだ
794 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 22:39:35 ]: >>793
画像認識のコード書くやつは大変だな
795 名前：デフォルトの名無しさん mailto:sage [2010/03/31(水) 22:42:09 ]: 確かに、今は節水ということで一般家庭向けの便器は
流れが悪いといくことを感じるな。

現場では流体演算とかして設計しているのだろうか？
796 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 01:09:36 ]: TOTO 節水シミュレーションでググってみた。
www.toto.co.jp/saiyo/new/techno/person/person_05_2.htm
797 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 01:17:06 ]: 流体どころか三相全てシミュレートしてるんだな
798 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 07:04:31 ]: GTX470が先に発売されるみたいですね。
購入される方いますか。
799 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 12:43:41 ]: どうしてcudaはosと密接なのか？
最新のubuntuをいれたくてもいれられへん
理由を教えてくれろ
800 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 14:28:01 ]: >>799
ドライバレベルで提供されているから。
801 名前：デフォルトの名無しさん [2010/04/01(木) 19:55:02 ]: >>797
固体ってのが生々しいな。シミュレーションするためにウンコの物性とか
測定したりしたんだろうな。
802 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 20:10:39 ]: 壊れ方とかがリアルな模型があるとか聞いたことがある。
でも物体の測定データのファイル名とかはなまなましいだろうなｗ

シミュレーションしているときのSSとかあればいいのに。
803 名前：デフォルトの名無しさん mailto:sage [2010/04/01(木) 21:27:09 ]: たしか法律で、流す水の量は決まってるんだよね。
804 名前：デフォルトの名無しさん mailto:sage [2010/04/02(金) 07:57:34 ]: >>799
たぶん、nvccがgccの進化について行けていないだけだと思う。
バイナリだけなら、最新のUbuntuでも動くよ。
805 名前：デフォルトの名無しさん [2010/04/02(金) 16:58:24 ]: 最近のディストリビューションって大抵1年かそこらでサポート終わりじゃん。
1つまえのバージョンにしか入れられないと、半年程度でいれかえなきゃいけないんだよね。
そこらへんを早く何とかしてくれよ。
CentOSとかつかえばいいのかもしれんけど
806 名前：デフォルトの名無しさん mailto:sage [2010/04/03(土) 03:06:19 ]: そこを何とかしてもらいたいね。
俺は古いバージョンのLinuxをVirtualBoxで新しいバージョンのLinux上で動かして、
クロスコンパイルライクなことをしているよ。コンパイルだけなら仮想化環境でも通るからな。
807 名前：デフォルトの名無しさん mailto:sage [2010/04/03(土) 12:32:49 ]: GTX480で倍精度削られたのは本当らしい…

Quadroではどうなるんだろう
808 名前：デフォルトの名無しさん mailto:sage [2010/04/03(土) 14:22:26 ]: 今すぐ計算して論文書かなきゃって人以外は↓ここ聞いてからにした方がいいんじゃないかと。
ttp://www.hardocp.com/article/2010/03/26/nvidia_fermi_gtx_470_480_sli_review/7

「当機はまもなく離陸しますw」
809 名前：デフォルトの名無しさん mailto:sage [2010/04/03(土) 14:24:49 ]: >>807
ドイツ語読めないけど、これ？
ttp://www2.hardware-infos.com/news.php?news=3497
810 名前：デフォルトの名無しさん mailto:sage [2010/04/03(土) 22:55:58 ]: Q1.同じGT-240を二枚挿せばCUDAも倍近く早く処理できるようになりますか？
Q2.GDDR5とGDDR3とDDR3でCUDA動画エンコードの処理スピードはどれくらい
違いますか？GDDR3を100として。
811 名前：デフォルトの名無しさん mailto:sage [2010/04/04(日) 00:22:50 ]: >>810
もう少し具体的に知りたいことを書いた方が答えやすい。

例えば動画エンコード用途に限ると「複数枚挿しはどうよ？」とか、「FermiとかATIとかの中でどれが一番速いか」とか。
812 名前：デフォルトの名無しさん mailto:sage [2010/04/04(日) 00:38:10 ]: 十分具体的だろ･･･。

ソフトウェアによって、複数挿に対応しているかどうかは変わるので、
使いたいソフトについて調べよう。

メモリの速さは重要だけど、GPGPUでは、メモリにアクセスするときの遅延のほうが問題となっている。
ハードウェアの構造的にもGT200系のほうがメモリアクセスが柔軟なので、GTX260あたりを検討してはどうだろう。
813 名前：デフォルトの名無しさん mailto:sage [2010/04/04(日) 01:19:30 ]: 具体的だろと言っておきながらソフトによって変わるとか意味不明

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef