【GPGPU】くだすれCUDAスレ【NVIDIA】

[表示 : 全て最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 05/09 17:28 / Filesize : 215 KB / Number-of Response : 912
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前：デフォルトの名無しさん mailto:sage [2008/03/22(土) 11:13:52 ]: このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。
CUDA使いが優しくコメントを返しますが、
お礼はCUDAの布教と初心者の救済をお願いします。

CUDA・HomePage
www.nvidia.com/cuda

関連スレ
【GPGPU】NVIDIA CUDA質問スレッド
pc11.2ch.net/test/read.cgi/tech/1190008468/
GPUで汎用コンピューティングを行うスレ
pc11.2ch.net/test/read.cgi/tech/1167989627/
GPGPU#2
pc11.2ch.net/test/read.cgi/tech/1188374938/
829 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 23:22:43 ]: 309 名前：◆cZfSunOs.U []： 2009/06/19(金) 11:46:10 ID:MLNb4KfK0 (17)
生キー指定以外の12桁以上「##～」形式も将来の拡張用にしておきましょう．
で，まとめ:

if (length $handle_pass >= 12)
{
my $mark = substr($handle_pass, 0, 1);
if ($mark eq '#' || $mark eq '$')
{
if ($handle_pass =~ m|^#([[:xdigit:]]{16})([./0-9A-Za-z]{0,2})$|)
{
$GB->{TRIPSTRING} = substr(crypt(pack('H*', $1), "$2.."), -10);
}
else
{
# 将来の拡張用
$GB->{TRIPSTRING} = '???';
}
}
else
{
use Digest::SHA1 qw(sha1_base64);
$GB->{TRIPSTRING} = substr(sha1_base64($handle_pass), 0, 12);
$GB->{TRIPSTRING} =~ tr/+/./;
}
}
else
{
# 従来形式
}
830 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 23:23:28 ]: インデント消えたorz
831 名前：デフォルトの名無しさん mailto:sage [2009/08/08(土) 23:25:49 ]: Kernel用のCRYPTを自前実装しないといけないのか・・
832 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/08/09(日) 00:05:13 ]: C++用のコード晒してみる。これは実際に某ツールで使ってる。

char* trip_sha1(const char* key) {
SHA1Context sha1;
SHA1Reset(&sha1);
SHA1Input(&sha1, reinterpret_cast<const uint8_t*>(key), std::strlen(key));
uint8_t digest[SHA1HashSize];
SHA1Result(&sha1, digest);

static char cryptresult[13]; /* encrypted result */
static const char base64mod[] = /* 0..63 => ascii-64 */
"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789./";
cryptresult[0] = base64mod[digest[0] >> 2];
cryptresult[1] = base64mod[(digest[0] << 4 | digest[1] >> 4) & 0x3F];
cryptresult[2] = base64mod[(digest[1] << 2 | digest[2] >> 6) & 0x3F];
cryptresult[3] = base64mod[digest[2] & 0x3F];
cryptresult[4] = base64mod[digest[3] >> 2];
cryptresult[5] = base64mod[(digest[3] << 4 | digest[4] >> 4) & 0x3F];
cryptresult[6] = base64mod[(digest[4] << 2 | digest[5] >> 6) & 0x3F];
cryptresult[7] = base64mod[digest[5] & 0x3F];
cryptresult[8] = base64mod[digest[6] >> 2];
cryptresult[9] = base64mod[(digest[6] << 4 | digest[7] >> 4) & 0x3F];
cryptresult[10] = base64mod[(digest[7] << 2 | digest[8] >> 6) & 0x3F];
cryptresult[11] = base64mod[digest[8] & 0x3F];
cryptresult[12] = 0;
return cryptresult;
}
833 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 00:36:34 ]: ｓｈ１のCUDA版くらいありそうだけど
834 名前：828 mailto:sage [2009/08/09(日) 00:38:07 ]: ご両人、コードさんくす～
実はC住人なんで（汗

蛇足だが関数内のstaticの使い方が気持ち悪いです（笑

さー昔しらべたSHA-1の資料でもひっぱってくるかー
835 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/08/09(日) 01:53:23 ]: オリジナルのcrypt(3)でもchar配列はstaticでとってるんだよな
たしかにキモイ

std::stringとか使ってみ？
CUDAに移植できへんで？
836 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 01:56:33 ]: 笑えるくらいきれいなワンツーｗ
837 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 01:57:37 ]: ごば
838 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 13:04:04 ]: CUDAでrandは使えない？
839 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 13:11:14 ]: >>838
使えないよ。自分で用意しないと。
840 名前：デフォルトの名無しさん mailto:sage [2009/08/09(日) 13:25:21 ]: CUDA上でのSHA1の実装というとこのあたりか？
forums.nvidia.com/index.php?showtopic=102349
841 名前：デフォルトの名無しさん mailto:sage [2009/08/10(月) 22:49:48 ]: r0,g0,b0,r1,g1,b1,r2,....

というようなグローバルメモリにあるchar型の配列に対して、GPU側からuchar4型変数で

{r0,g0,b0,r1} {r1,g1,b1,r2},....

というようにアクセスすることは可能でしょうか？
842 名前：デフォルトの名無しさん mailto:sage [2009/08/11(火) 01:04:40 ]: y*4+x
843 名前：841 mailto:sage [2009/08/11(火) 01:59:08 ]: あーこれじゃ駄目だった
ごめんなさい、忘れてください
844 名前：828 ◆TripEQ.VNLIV mailto:sage [2009/08/11(火) 21:13:55 ]: だめだー
SHA1と総当り攻撃じゃ現実的じゃない。。。
4桁適合ならまだ使える感じorz
845 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 13:47:21 ]: 誰かRADEON HD48xx向けのCUDAドライバ開発してないの？
846 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 14:23:41 ]: >>845
どちらかというと
AMD Accelerated Video Transcoding（AVT）

では？
847 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 16:05:07 ]: いや、CUDA互換機能つけて
CUDA対応ソフトを使えるようにならんかなーと。
848 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 17:49:44 ]: >>847
OpenCLじゃだめですか？
849 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 17:50:52 ]: ラッパー作ってくれるならいいけど・・・
既存のソフトでCUDAにしか対応してないやつとか
CUDA以外の開発環境が整わなさすぎて、見切り発車でCUDA使いたいなとか
あるんで。
850 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 18:44:14 ]: CUDAってOpenCL取り込んでたような……気のせい？
851 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/08/21(金) 20:13:56 ]: CUDAは環境。

OpenCLは言語・フレームワークで、CUDA向けのプログラムを記述出来る物のひとつ。
従来の「CUDA言語」は "C for CUDA" という扱いになった。
852 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 20:36:51 ]: x64でCUDAをしようと思ったんだけど，vitual studioでプロジェクトが作れない．
CUDA_VS_Wizard_W64.2.0を入れて，
CUDA64WinAppはテンプレートとして表示されるようになったが，
選択してもうまく生成されない．
CUDAWinApp(32bit)の方はうまく生成される．

64bitで開発してる方や，
症状の原因がわかりそうな方，ご教授願う．
853 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 21:00:40 ]: おっと，自己解決．
スレ汚しスマソ．
854 名前：デフォルトの名無しさん mailto:sage [2009/08/21(金) 23:07:09 ]: >>853
いや、教えてよ（笑）
855 名前：デフォルトの名無しさん mailto:sage [2009/08/23(日) 20:28:04 ]: 共有メモリのBank Conflictがいまいちわからないのですが、
同じ配列のアドレス(添え字)に複数のスレッドが同時にアクセスしなければいよいのでしょうか？
856 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 07:21:12 ]: 最近のマザボってPCIEx16が普通に2,3個あるよな
ところで違う世代のGeForce9800、GTX280とかを積んだ場合
CUDAはどちらのGPUも使ってくれるの？
857 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 09:24:02 ]: >>856
CUDAはGPUチップを一つだけしか使えない。
どれを使うかは、cudaSetDevice()で指定しないといけない。
サンプルの、MultiGPUを参照のこと。
858 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 18:32:52 ]: ということは，
最近のグラボ一枚にGPUが2つ積んであるヤツでも，
GPUを指定してやらないといけないのか．
859 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 18:39:49 ]: そそ、しかも1スレッド1GPUに拘束される。
860 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 19:17:17 ]: >>858
未確認だけど、SLIの場合はドライバで1つのGPUに見せかけるらしい。
2チップを積んでいるカードは内部でSLI接続されているらしいし、
1デバイスの場合と同じでもいいかもしれない。
861 名前：デフォルトの名無しさん mailto:sage [2009/08/26(水) 23:51:13 ]: SLIとCUDAは同時使用できないとかじゃないのか？
862 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 00:10:58 ]: forum.nvidia.co.jp/EokpControl?&tid=11178&event=HE0004
* SLIグループ内の各GPUは個別に列挙されるようになったため、
計算アプリケーションはSLIがグラフィックス向けに有効になっている
場合でも、マルチGPUの性能を活用することができます。

と、リリースノートにはあるね
863 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 00:25:41 ]: >>862
2.3からはSLIの場合でもCUDAからは個別に見えるように変更なのか。

SLIでゲームの中でPhysXとかCUDAを使う場合とかは特定のチップに負荷が集中して
そのせいで利用効率が落ちたりしないのかな？
864 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 01:23:53 ]: プログラマが生理整頓するか，
CUDAさんよろしくお願いしますするか，どっちがいいかってことか．
でも，一度の演算に対して，1コアにスレッドが重複しない限りは，
無駄に複数のGPUに処理を分配する必要性はないよな．
演算の命令ごとにGPUを切り替えるなら，効果はありか．
SLIの場合って，GPUのRAMは共有されるのか？

>>859
GPUはGPU内の大量のコアがそれぞれ1スレッドずつ受け取る仕組みじゃないのか？
1スレッド1GPUって並列演算ってレベルじゃねーぞ．
865 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 03:53:53 ]: >>864
「スレッドを受け取る」っていう意味がわからんのだが。
CPUの１スレッドがGPU１個使って、そのGPUが複数スレッドを実行する。
866 名前：デフォルトの名無しさん mailto:sage [2009/08/27(木) 04:59:54 ]: >>865
CPUのスレッドなのね．
スレッドのことをGPUのハードウェアスレッドかと勘違いしてた･･･orz
867 名前：デフォルトの名無しさん [2009/09/01(火) 18:44:53 ]: CUDAがでてきた2005年当時は、シングルコアの限界も見えてきて、それなら

有り余るグラフィックボードの性能を、3Ｄレンダリングや、フォトショップフィルタなど、ゲーム以外にも有効活用と歌ってたけど

あれよあれよという間に、インテルCPUがマルチコア化してきて、そっちの方が上記の用途に、大きな効果があり、メインになってきて、

結局グラフィックボードは、結局またGPUはゲーム以外に用なしになったなｗ
868 名前：デフォルトの名無しさん [2009/09/01(火) 19:21:06 ]: U-BASICってバージョンアップしないの？
869 名前：デフォルトの名無しさん mailto:sage [2009/09/01(火) 19:38:01 ]: >>867
コンシューマーはそうかもしれんけど、エンタープライズはまた少し違うんじゃない？じゃなきゃNVIDIAもTESLAなんて作らんよ。
870 名前：デフォルトの名無しさん mailto:sage [2009/09/01(火) 20:10:53 ]: ああシールの貼り替えで10倍の金を取るために始めたアレか
871 名前：デフォルトの名無しさん mailto:sage [2009/09/01(火) 23:00:56 ]: >>870
本気でそう思ってるなら偏狭すぎる。少しは頭使えよ
872 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 00:04:27 ]: >>869
むしろ、nVIDIAはTESLA以外作りようが無かったんでしょ。
だってCPU作れないんだもん。
873 名前：デフォルトの名無しさん [2009/09/02(水) 02:29:04 ]: NVIDIA は、2009年8月17日、業界標準の線形代数ライブラリ、LAPACK を、超並列処理の NVIDIA CUDA 対応 GPU に最適化した実装「CULA」のベータ版が EM Photonics 社からリリースされたと発表した。
LAPACK ルーチンは何百万人もの開発者が活用し、数値物理学、構造力学、電子設計オートメーションなどさまざまな問題の解決に役立てられている。
CULA により、ワークステーションやデータセンターで使われている NVIDIA Tesla GPU の力を活用し、クアッドコア CPU 1個の場合でパフォーマンスを最大10倍に引き上げることが可能になるとされる。
EM Photonics には、CULA Basic、CULA Premium、CULA Commercial からなる CULA tools という製品ファミリがある。CULA ライブラリとは、LAPACK ルーチンの実装の1つで、GPU の能力を活用して高速に処理が行えるようにしたもの。
LAPACK というのは線形代数でよく使われる関数の集合体で、科学分野や工学分野で活用されている。科学分野や工学分野の問題は線形モデルで近似できることが多いため、線形代数ルーチンで解が得られる。
CULA は、NVIDIA GPU が持つ超並列 CUDA アーキテクチャを活用し、LAPACK ルーチンの多くを高速で処理できる。
874 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 08:05:49 ]: >>872
それ以外作りようがなかったからって…事前事業でやってるんじゃないんだぞ？「しょうがなくTESLA作る」とかありえないんだよ。純粋に、戦略的なマーケティングの結果だろ。
875 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 08:10:12 ]: >>874
× 事前
◯ 慈善
876 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 09:31:55 ]: 戦略的なマーケティングの結果、マザボは作れてもCPUは作れないNVIDIAは仕方なしに、
TESLAをでっち上げたわけですね、判ります。
877 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 12:41:59 ]: CPUは作れないってどういう意味で言ってるんだろ
x86互換プロセッサなんて作れるところはいくらでもある
ただライセンスの問題なダケ
あとはマーケットな
878 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 12:46:20 ]: x86互換プロセッサぐらいなら大学の授業でFPGAに実装したことあるぞ
879 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 12:51:56 ]: 互換なんてダレでも作れるべ
性能はムリだが
880 名前：デフォルトの名無しさん mailto:age [2009/09/02(水) 12:58:32 ]: DXCSがくるからCUDAはもういらないかもー
881 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 12:59:56 ]: 作るだけならVIAにだってできる
882 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 13:07:09 ]: ↑↑お前出来ないだろｗ
883 名前：408 mailto:sage [2009/09/02(水) 14:49:32 ]: NVIDIAってCUDA捨てたん？
ここ1年ぐらい見る限りすげーやる気なさそうなんだけど。
884 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 15:18:52 ]: 捨ててないけどやることないだけだろ
885 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 17:51:42 ]: 今はOptiXに期待
886 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 18:43:14 ]: news.developer.nvidia.com/2009/08/nexus-visualstudio-based-gpu-development.html

おまいら，
9月30日以降に期待ですよ．
887 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 21:10:27 ]: CUDAで最適化したいプログラムに条件分岐満載で
実際の演算部分がほとんどなくてDate並列化できそうもないときって
あきらめるしかないのかな･･･。
888 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/02(水) 22:49:22 ]: www.atmarkit.co.jp/fcoding/articles/parallel/03/para03a.html

Fixstarsのエンジニアからの有り難い言葉
889 名前：デフォルトの名無しさん mailto:sage [2009/09/02(水) 23:43:18 ]: 条件分岐でシーケンスを発生させる事そのものが目的でなけりゃ、
何か手はあるんでないの？
何しようとしてるか知らんけど、今使ってるアルゴリズムに以外に
GPU向きの手がないか調べてみたらいいんでない？
890 名前：デフォルトの名無しさん mailto:sage [2009/09/03(木) 15:42:37 ]: やっぱりx86コアが100個も200個もあるほうがいいんじゃね？
891 名前：デフォルトの名無しさん mailto:sage [2009/09/03(木) 17:29:08 ]: >>889
なるほど
もっとソースを読んで見るよ。

あとCUDAについてのオススメの文献あるかな？
892 名前：デフォルトの名無しさん mailto:sage [2009/09/03(木) 21:47:44 ]: >>891
GPU Gems3。訳本はアホみたいに高いが、英語でよければネットで公開されてる。途中までだけど。
893 名前：デフォルトの名無しさん mailto:sage [2009/09/03(木) 21:52:19 ]: >>890
そりゃそうかもしれんが、コスト見合わんだろ。
894 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/03(木) 22:31:48 ]: x86のほうが性能マシな演算用途こそ、GPUが何百台あってもコスト的に見合わないんじゃないかと
895 名前：デフォルトの名無しさん mailto:sage [2009/09/03(木) 22:43:05 ]: >>892
thx
でかい書店いって立ち読みして検討するかな。

>>894
そうとも限らない。
32bit単精度浮動小数点を扱えるプロセッサが数百個あるわけで、
プログラムの仕方によっては高速化する。
まあ向き不向きがあるのは事実だし、どっちが良いとは決め付けられない。
896 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/03(木) 22:47:43 ]: 向き不向きでいえばGPUに向いてない（というか使うことすらできない）演算の方が圧倒的に多い。
897 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 01:37:54 ]: 円周率の計算とかに使えればいいじゃん。
898 名前：,,・´∀｀・,,）っ-○○○ mailto:sage [2009/09/04(金) 02:08:24 ]: なにそれ誰が得するの？
899 名前：デフォルトの名無しさん [2009/09/04(金) 02:10:35 ]: 円周率を100万桁まで暗記してる人が、あれ？次なんだったっけって言って調べられる
900 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 05:48:21 ]: GPUが今後発展するなら、GPUに向いたアルゴリズムが開発されてくるでしょう。
でも、普通のCPUが高速化してくるので、結局特定の分野しか使えないのかもね。まさにハードウェアアクセラレータ。
901 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 16:30:49 ]: 全く依存性がなく並列に計算できるものに向いてるんだっけ？
あんまり計算用途には向いてない気もするんだけど。
902 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 17:05:27 ]: 実際高速化されてるものもあるんだし、得している奴はいるだろ
903 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 17:31:22 ]: 粒子法では，GPUかなり美味しいです＾＾
904 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 17:34:46 ]: 画像や文字のパターンマッチングにもそれなりに使えるよ。
905 名前： ◆TripEQ.VNLIV mailto:sage [2009/09/04(金) 21:24:41 ]: 実は一般ユーザーが恩恵を受ける事はほとんどない事実。。。
906 名前：デフォルトの名無しさん mailto:sage [2009/09/04(金) 22:19:54 ]: ATI臭くなってきたぞ，このスレ
907 名前：デフォルトの名無しさん mailto:sage [2009/09/05(土) 01:41:57 ]: ATIのGPUでCUDAが使えるならともかく使えないのに、
なぜかCUDAスレでATIの話題がされる不思議。
908 名前：デフォルトの名無しさん mailto:sage [2009/09/05(土) 04:37:45 ]: ATOM３３０搭載PCでCUDAなグラボを付けたら幸せになりますか？
909 名前：デフォルトの名無しさん mailto:sage [2009/09/05(土) 05:32:50 ]: >>908
気持ち次第です。
910 名前：デフォルトの名無しさん mailto:sage [2009/09/05(土) 07:55:02 ]: NVIDIAへの財務次第です
911 名前：408 mailto:sage [2009/09/05(土) 09:50:44 ]: あきらかに落ち目でしょNVIDIA

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef