1 名前:デフォルトの名無しさん mailto:sage [2014/11/20(木) 23:14:46.66 ID:jr3oZn27.net] このスレッドは、他のスレッドでは書き込めない超低レベル、 もしくは質問者自身何が何だが分からない質問を勇気を持って書き込むスレッドです。 CUDA使いが優しくコメントを返しますが、 お礼はCUDAの布教と初心者の救済をお願いします。 CUDA・HomePage ttp://developer.nvidia.com/category/zone/cuda-zone 関連スレ GPGPU#5 ttp://peace.2ch.net/test/read.cgi/tech/1281876470/l50 前スレ 【GPGPU】くだすれCUDAスレ【NVIDIA】 ttp://pc12.2ch.net/test/read.cgi/tech/1206152032/ 【GPGPU】くだすれCUDAスレ pert2【NVIDIA】 ttp://pc12.2ch.net/test/read.cgi/tech/1254997777/ 【GPGPU】くだすれCUDAスレ pert3【NVIDIA】 ttp://hibari.2ch.net/test/read.cgi/tech/1271587710/ 【GPGPU】くだすれCUDAスレ pert4【NVIDIA】 ttp://hibari.2ch.net/test/read.cgi/tech/1291467433/ 【GPGPU】くだすれCUDAスレ part5【NVIDIA】 toro.2ch.net/test/read.cgi/tech/1314104886/ 【GPGPU】くだすれCUDAスレ part6【NVIDIA】 ttp://peace.2ch.net/test/read.cgi/tech/1348409867/
892 名前:デフォルトの名無しさん [2016/03/05(土) 16:43:06.41 ID:hF4tqJh9.net] こんにちは。 CUDA では、__device__ 修飾された関数は、GPU内部から呼び出せますが、 再帰コールが出来ないのはなぜですか? 以下はできますよね? __device__ int aaa(int x) { return x * 2; } __device__ int bbb(int y) { return aaa(y) + 3; } では、以下は駄目ですか? __device__ int kaijou(int y) { if ( y == 1 ) { return y; } else { return y * kaijou(y-1); } }
893 名前:デフォルトの名無しさん [2016/03/05(土) 17:05:18.01 ID:nqZZ4Fac.net] 団子は答えなくて結構
894 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 17:17:05.46 ID:oAjMaO0h.net] ハード的に絶対できないと言うことも無いのだろうが、スタックどれだけ使うか計算できないってのが大きいんじゃね。
895 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 19:01:23.69 ID:wCUhFShW.net] 最適化の邪魔になるから最初から再帰はやめてねーんってことかな。
896 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 20:36:21.36 ID:pXJbdtfw.net] >>870 おまえが正解答えてやれば あれずに済むだろ
897 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/05(土) 21:10:49.87 ID:18qofrJ5.net] >>873 俺ならその無駄レス書いてる暇で書けるぞ>>870 は無能だから理解できないだけで >>871 CUDAの自称コアが要素毎プレディケートつきのSIMDユニットを マルチコアって言い張ってるだけから本物の独立したコアでないから で終わりなんだけどね。 命令ポインタは「自称コア」ごとに独立してないんだ 「分岐」も本物の分岐ではなく、if-else節を全部一列のコードに展開してプレディケート しているだけ。プレディケートビットの全要素が0あるいは1になって初めて関数を 飛び越えることができる。 SIMDの要素(自称)ごとに命令ポインタと関数コールスタックを管理できて別々の 命令ステートを独立して持てるならそれは既にSIMDじゃない
898 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/05(土) 21:25:15.51 ID:18qofrJ5.net] ベクトルを隠蔽しない、1ワープを1つのスレッドとして処理できるプログラミングモデルが 提供されるなら再帰は理屈上可能 それはCPUのSIMDの在り方と同じってことだけど
899 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 21:53:08.36 ID:LlD1+gMh.net] 独立したコア
900 名前:ニいう前提だから、コア毎のレジスタで表現できる範囲の処理しか出来ないって事だと思ってたけど違うのか。 [] [ここ壊れてます]
901 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:00:09.02 ID:oAjMaO0h.net] 基本はSIMDプロセッサでの本当の分岐だよ。 簡単な処理ならpredicate実行で済ますけどこれはモダンなプロセッサではSIMT、SIMD、に限らず一般的な手法 状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていくから、どこかのdivergent pathで無限ループになるとwarp内の別threadには何時までたっても制御が帰ってこないけどね。
902 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/05(土) 22:00:10.11 ID:18qofrJ5.net] 再帰だけならCell SPUすら出来てるからね 命令ポインタの制約のある偽りのコアであること以上の理由はないでしょう 末尾再帰をループに展開するオプションすら用意してないのは処理系の実装の手抜きだろうと思うけど
903 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:04:28.99 ID:0d+Ags99.net] 可能な限り手を抜くのがハードにとってのGPGPUという物かも
904 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/05(土) 22:12:52.44 ID:18qofrJ5.net] 実害は具体的にはバックトラッキング型の探索アルゴリズムが使えない (実装方法に制限がある)とかかな
905 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 22:24:17.32 ID:oAjMaO0h.net] cudaは性能出すために最適化しだすと、結局SIMD構造を意識して記述することになる。 で結局、SIMTでプログラミングするメリットを感じなくなる。 scatter,gatherも便利なのだけど、それしかないから、性能出すためにアラインメント気にしながら連続アドレスにアクセスするように記述していると、普通のSIMDのようにアドレス1つ計算すればすむのに無駄だなぁと。 で、複数のアドレスを受け取ったハードウェアが同じキャッシュラインに乗っていることを検出してメモリアクセス回数を最小化するとか、バカじゃねと。 まあGCNはそこら辺の無駄に対応していて美しいのだが、いかんせんソフトやサポート体制がクソ過ぎて。
906 名前:デフォルトの名無しさん mailto:sage [2016/03/05(土) 23:05:45.56 ID:wCUhFShW.net] >>877 >状態保存のメモリを最小化するためにdivergent pathを深さ優先でスキャンしていく 横からですが参考になります。 再帰がまずいっていうより結果として条件分岐をたくさん通るのがまずいって感じですかね。
907 名前:デフォルトの名無しさん [2016/03/06(日) 08:40:29.75 ID:e28R5O2W.net] 最近は、5,000円くらいの低価格GPUでも、Keplerコアを使っていて、 Fermiコアの上位互換だから、再帰コールも出来るのですか? でも、関数のローカル変数は、C/C++と全く同じで、スレッド独立だが、 関数引数だけは、スレッド共通だと聞きましたが、これだと再帰コール できなさそうですが。
908 名前:デフォルトの名無しさん [2016/03/06(日) 11:18:07.40 ID:5MH1CF8G.net] あーあまた糞団子が答えちゃった このスレの事情を知らん奴が見ると余計に迷うぞ
909 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 11:35:37.89 ID:ejwavTIm.net] 答えられないクズは存在する価値ないでしょ とっとと失せろよゴミ
910 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 11:48:38.53 ID:ejwavTIm.net] つーか俺も含めてまだ正解出してないんだけどな んで正解はこれ、Kepler以降なら再帰に【一応は】対応 developer.download.nvidia.com/assets/cuda/files/CUDADownloads/TechBrief_Dynamic_Parallelism_in_CUDA.pdf 誰かツッコミ入れると思ったけど期待外れだったなあ まあ、俺の説明も何も間違ってないのだけど (>>874 も「出来ない」という説明をしてるのではなく制約を説明しているだけ)
911 名前:デフォルトの名無しさん mailto:sage [2016/03/06(日) 13:04:30.88 ID:ZW4nksfm.net] 確かにこの団子は鳥屋氏じゃないな。 鳥屋氏はこういう物言いはしない。
912 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 13:12:58
] [ここ壊れてます]
913 名前:.97 ID:ejwavTIm.net mailto: お前は、中村ちゃぷにちゃんが中身の団子が存在すると思ってるんだ そこから既に間違ってるよ [] [ここ壊れてます]
914 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 13:18:27.49 ID:ejwavTIm.net] ドァンゴが、13:18くらいを、お伝えします
915 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 13:20:55.68 ID:ejwavTIm.net] ちゃぷにさんはだんごやさんを嫌ってるはずなので彼がその顔文字を使う理由はないんだよ 自分でNGキーワードに入れてる宣言してたし
916 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 13:22:13.40 ID:ejwavTIm.net] 更に言うと彼は精神が壊れて自作PC板で機械翻訳コピペを貼るだけの人に成り下がってしまった
917 名前:デフォルトの名無しさん [2016/03/06(日) 13:49:39.00 ID:5MH1CF8G.net] 団子=鳥屋でも別にいいじゃねーか 糞撒き散らすだけならどっちもNGだ
918 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 13:52:02.23 ID:ejwavTIm.net] 中村ちゃぷに君と一緒にしないでくれる?
919 名前:デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:37:46.02 ID:ZW4nksfm.net] >>891 鳥屋氏に何かあったの? そっちが気になる。
920 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 14:39:09.93 ID:ejwavTIm.net] >>894 だから本人に直接聞いて来いよTwitterアカウントあるだろ
921 名前:デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:42:36.51 ID:ZW4nksfm.net] 別に本人と直接連絡とれるけどなんか聞きにくいじゃん。 おしえてよ。
922 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 14:43:25.75 ID:ejwavTIm.net] 俺なら聞けるのか?w デタラメ言っちゃうけど?
923 名前:デフォルトの名無しさん mailto:sage [2016/03/06(日) 14:47:00.65 ID:ZW4nksfm.net] 本人に根掘り葉掘り聞くよりいいよ。
924 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/06(日) 14:48:10.37 ID:ejwavTIm.net] ちなみに彼は10年以上前から初心者の質問板で「メンヘル屋」と呼ばれてたぞ
925 名前:デフォルトの名無しさん mailto:sage [2016/03/06(日) 23:01:58.93 ID:YHBwXFpN.net] 日曜日の真昼間に2ch張り付きかよ さすが糞団子だな
926 名前:デフォルトの名無しさん mailto:sage [2016/03/07(月) 07:46:57.77 ID:7lblB3Ic.net] 平日の日中ならいいのかw
927 名前:デフォルトの名無しさん [2016/03/07(月) 12:32:22.52 ID:+p3ICmyk.net] 頼むからNGの外に出てくるな>>901 =糞団子
928 名前:デフォルトの名無しさん [2016/03/07(月) 17:04:45.58 ID:GuUCesj8.net] マジで氏ねよ!ここ糞団子!! お前のせいでスレがめちゃくちゃ!
929 名前:デフォルトの名無しさん mailto:sage [2016/03/07(月) 19:13:33.67 ID:IaXW9rhX.net] >>901 なんでそう思ったの?
930 名前:デフォルトの名無しさん mailto:sage [2016/03/07(月) 21:28:52.80 ID:Xyilrqi/.net] 病気の人が召還してる
931 名前:デフォルトの名無しさん mailto:sage [2016/03/08(火) 00:17:54.26 ID:zUXR2K3c.net] 糞団子は>>900 が効いてる様だなw
932 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/08(火) 01:03:04.66 ID:4ClxYf7a.net] 普通ジャン
933 名前:デフォルトの名無しさん mailto:sage [2016/03/08(火) 06:06:38.08 ID:sCq0/cKi.net] 家でpcにかじり付いてる人なんだろ 病気の人は
934 名前:デフォルトの名無しさん mailto:sage [2016/03/08(火) 07:07:19.82 ID:zUXR2K3c.net] 日曜日に一日中2chが普通なんだ さすが糞団子
935 名前:デフォルトの名無しさん mailto:sage [2016/03/08(火) 22:50:34.72 ID:f+sFTvrc.net] 2chやっているおっさんなら起きてから寝るまで2chが普通だろ いまはスマホで仕事サボって2chしているおっさんが多いからな
936 名前:デフォルトの名無しさん [2016/03/08(火) 22:59:24.25 ID:8p7AV+as.net] >>910 今やちょっとゆる会社だと、トイレが満室になって10分待ちだからな。
937 名前:デフォルトの名無しさん mailto:sage [2016/03/08(火) 23:40:27.24 ID:SNBHGm11.net] そんなにトイレが好きならドアを接着剤で止めてやろうかと思った
938 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 00:03:43.04 ID:QI7bsFp8.net] 平日仕事サボって2chなら、まぁわからなくも無い 理解できないのは日曜日の朝から晩まで2ch張り付きの糞団子
939 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/09(水) 00:29:18.66 ID:EC2EcKU9.net] スマホゲーの体力ゲージ消化してるだけじゃね? 2chなんてとっくにブーム終わってるだろ
940 名前:デフォルトの名無しさん [2016/03/09(水) 12:01:37.54 ID:Bn2mru1A.net] >>913 話し相手が欲しいんだよ スレをウンコ臭くしておいて
941 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 17:46:55.52 ID:+SKBM1r7.net] へえ、お前、寂しがり屋なんだな
942 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 19:21:18.15 ID:QI7bsFp8.net] 糞団子が急に大人しくなって笑える かなり効いた様だなw
943 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 19:28:24.12 ID:n0++16X2.net] かまってちゃん 乙
944 名前:デフォルトの名無しさん [2016/03/09(水) 21:45:15.09 ID:Bn2mru1A.net] コテ団子をNGにして華麗にスルーしないとね 名無しで煽る時は怒るんじゃなくてファブリーズでも置いておきましょう
945 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:07:10.45 ID:F7KphU9Z.net] そんなにかまってほしいのか
946 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:13:39.55 ID:QI7bsFp8.net] それはお前だろ さっきからチョロチョロウザい
947 名前:デフォルトの名無しさん mailto:sage [2016/03/09(水) 22:45:09.81 ID:F7KphU9Z.net] おまえがそれを言うのか
948 名前:デフォルトの名無しさん mailto:sage [2016/03/10(木) 00:12:27.45 ID:lJwnXkdm.net] なんだ やっぱり、かまってちゃんか?
949 名前:デフォルトの名無しさん mailto:sage [2016/03/10(木) 05:26:45.85 ID:ElNFIbXj.net] っ鏡
950 名前:デフォルトの名無しさん mailto:sage [2016/03/10(木) 20:04:24.43 ID:lJwnXkdm.net] いや、朝の5時から鏡出されても…
951 名前:デフォルトの名無しさん mailto:sage [2016/03/10(木) 22:07:55.24 ID:Kwch6Nj+.net] ここはプ板のかまってちゃんが集うところです Nvidiaユーザーってへんなやつ多いよね。どう?
952 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/03/10(木) 23:24:17.96 ID:36+0Q/RN.net] ミラーマン! 植草教授!
953 名前:デフォルトの名無しさん mailto:sage [2016/03/11(金) 00:12:19.52 ID:0VtVfbcA.net] はい かまってちゃんの変な奴来ました
954 名前:デフォルトの名無しさん [2016/03/12(土) 13:14:03.96 ID:7MrNfl0C.net] 誰も居ない?
955 名前:デフォルトの名無しさん mailto:sage [2016/03/14(月) 00:27:24.09 ID:tMjTpPPM.net] 糞団子が荒らして過疎ったな ホントろくでもねぇ奴だったな
956 名前:デフォルトの名無しさん mailto:sage [2016/03/15(火) 19:07:06.06 ID:NepgFCLn.net] では素人が質問してもいいですか オプションのCUDA RuntimeをStatic CUDA runtime library (-cudart static)にしているのにもかかわらずcudart32_75.dllが生成されるんですけど不要ですよね? 消しても動くのでいらなさそうではあるんですけど一応残してます
957 名前:デフォルトの名無しさん mailto:sage [2016/04/06(水) 05:42:39.04 ID:b0ehB924.net] https://devblogs.nvidia.com/parallelforall/inside-pascal/ https://devblogs.nvidia.com/parallelforall/wp-content/uploads/2016/04/gp100_SM_diagram.png
958 名前:デフォルトの名無しさん mailto:sage [2016/04/06(水) 19:11:29.54 ID:7FwwXsE8U] NVIDIA DGX-1がダサいだー
959 名前:デフォルトの名無しさん mailto:sage [2016/04/08(金) 23:49:33.98 ID:Oe8UeTI2.net] >>874 この辺りからの流れはとても勉強になる
960 名前:デフォルトの名無しさん mailto:sage [2016/04/13(水) 00:20:39.50 ID:vTxSOF48.net] >>930 CUDAを使ったことがない連中がたくさん来場してたからな CUDAは映像・画像処理の一般プログラムではなく専門性が非常に高い分野(機械学習や車の自動運転とか)で使うって感じに なってきたからな。
961 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/04/13(水) 00:37:51.36 ID:uE1XEE4+.net] レジスタファイルがダイ全体で14Mもあるとかホント化け物ですね アクセスレイテンシはでかそう
962 名前:デフォルトの名無しさん mailto:sage [2016/04/13(水) 18:30:01.95 ID:P1TlabSM.net] 言っているそばからw
963 名前:デフォルトの名無しさん mailto:sage [2016/04/18(月) 20:53:52.86 ID:npM92plo.net] 以前エクサスケールへむけての改良点てやってたけど warpサイズが4になったりレジスタファイルの階層化とか やってるのかな
964 名前:デフォルトの名無しさん mailto:sage [2016/04/29(金) 07:41:21.25 ID:H9O34uIX.net] >>935 機械学習はマルチGPU
965 名前:デフォルトの名無しさん [2016/04/29(金) 19:49:33.11 ID:F6Ql+W8p.net] Pascalは忘れられてるけど、倍精度も強化されてるんだよね 単精度を徹底的に削った思い切った方針には目を見張った
966 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/04/29(金) 21:17:01.56 ID:RuK53SvA.net] 大型スパコン案件に特化して設計したものをGPUに流用してるだけで それが全部だと言い張られても困りますが
967 名前:デフォルトの名無しさん mailto:sage [2016/04/29(金) 22:49:34.54 ID:wZxrhoKH.net] なんでおまえが困るんだよw
968 名前:デフォルトの名無しさん mailto:sage [2016/04/30(土) 00:41:27.46 ID:oV2mml7H.net] GPGPUは深層学習のブレークで
969 名前:今後一気に需要が高まる? [] [ここ壊れてます]
970 名前:デフォルトの名無しさん [2016/04/30(土) 11:52:36.46 ID:xhIIf3AZ.net] 高まるだろうね 倍精度と半精度がちょうどいい具合 そうやってGPGPU市場を頑張ってもらって12.1の妨害行為は止めて欲しいわ
971 名前:デフォルトの名無しさん mailto:sage [2016/04/30(土) 22:20:59.01 ID:4IpkHcLg.net] その需要の大半はnVIDIAが発表したEyerissみたいな専用チップに喰われるのでは
972 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/04/30(土) 22:33:42.88 ID:wNNJHcCv.net] あれはCNNに特化したものでGPUほどのプログラマビリティはない ディープラーニングって一言で言っても1個のASICで賄えるほど狭い分野じゃない
973 名前:デフォルトの名無しさん mailto:sage [2016/04/30(土) 22:45:19.47 ID:tL+Fobdg.net] CNNに特化て具体的には行列演算てこと?
974 名前:,,・´∀`・,,)っ-○○○ mailto:sage [2016/04/30(土) 23:20:42.71 ID:wNNJHcCv.net] 疎行列に特化したマトリクス演算回路とそれなりの帯域のリングバスネットワークが主な構成要素 って覚えておけば大体間違いない 実はGPUの特性と正反対(GPUは密行列なら得意)
975 名前:デフォルトの名無しさん mailto:sage [2016/04/30(土) 23:25:48.76 ID:WnEgJTfp.net] fermi世代ってdouble⇒floatで倍速なはずだよね? ちっとも速くならないんだが。
976 名前:デフォルトの名無しさん mailto:sage [2016/05/01(日) 05:03:39.83 ID:IAB0IXGv.net] 大分前だけど構造体でデータを渡すとdouble扱いになったことはある 原因は不明
977 名前:デフォルトの名無しさん mailto:sage [2016/05/01(日) 10:04:45.15 ID:c2Ftkl1w.net] >>950 thx。 調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、 floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。 fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。 全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。
978 名前:デフォルトの名無しさん [2016/05/01(日) 10:24:43.67 ID:tKi6j9CT.net] 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、 BitTorrentがオープンソースで開発されています 言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか? Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします https://twitter.com/Lyrise_al ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw The Covenant Project 概要 Covenantは、純粋P2Pのファイル共有ソフトです 目的 インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します 特徴 Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW) 接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です DHTにはKademlia + コネクションプールを使用します UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります) 検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません h
979 名前:デフォルトの名無しさん mailto:sage [2016/05/01(日) 11:36:33.54 ID:4G1NPxxh.net] eyerissは大量のデーターが複数のフィルター処理されるのに向いてる
980 名前:デフォルトの名無しさん [2016/05/09(月) 19:46:40.50 ID:ZKk/r1uF.net] 質問があります 環境はwindows 10 | arch linux, cuda 7.5, gcc | visual c++ 2013です #include <stdio.h> __global__ void a(char *A){ } int main(){ a<<1, 1>>(); // (1) } (1)で「expression must have integral or enum type」とエラーが出て困っているのですが ホストコンパイラを呼び出す際に何か間違えているのでしょうか コンパイルに使用したコマンドは windows nvcc -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin" -c -DWIN32 -D_CONSOLE -D_MBCS -Xcompiler /EHsc,/W3,/nologo,/Wp64,/O2,/Zi,/MT test.cu linux (失念したが大体同じ) です
981 名前:デフォルトの名無しさん mailto:sage [2016/05/09(月) 23:47:16.41 ID:+C4ZnXlR.net] >>954 ≪≫のところじゃない? 二重カッコじゃなくて、三重カッコにすべきかな 二重カッコだと別の演算子になって、意味が変わってくる
982 名前:デフォルトの名無しさん [2016/05/09(月) 23:54:10.06 ID:ZKk/r1uF.net] ああ、3重括弧でしたか 間抜けなミスで騒いでしまって申し訳ないです ありがとうございます
983 名前:デフォルトの名無しさん mailto:sage [2016/05/20(金) 21:20:51.03 ID:OCEBmLiZ.net] グーグルがTensolFlow用のTPUとかいうの作ってたらしいがどうなの?
984 名前:sage [2016/05/23(月) 17:33:55.45 ID:w8cwn6FF.net] CUDA fortranで一つの配列に対して2GB以上のメモリを アロケートすることが出来ず、 PGIのサイト見たら「2GBの壁」とかって説明されているのですが、 これってどうにか克服出来ないですかね?
985 名前:デフォルトの名無しさん mailto:sage [2016/05/23(月) 18:16:51.67 ID:rInNNyjw.net] >>958 何gbくらい必要なの?
986 名前:デフォルトの名無しさん mailto:sage [2016/05/23(月) 18:47:01.54 ID:hrdyo10f.net] >>958 fortranなんか使っているからだよ。
987 名前:デフォルトの名無しさん mailto:sage [2016/05/23(月) 19:56:12.00 ID:Y87SDCLt.net] 32ビットの壁ってこと?
988 名前:デフォルトの名無しさん mailto:sage [2016/05/23(月) 22:17:34.30 ID:COcpIksW.net] CU_LIMIT_MALLOC_HEAP_SIZE か cudaLimitMallocHeapSize を拡げりゃいいんじゃないかな。
989 名前:デフォルトの名無しさん mailto:sage [2016/05/24(火) 12:32:54.07 ID:eVw6ZtsBc] >>959 6GB位ですかね
990 名前:デフォルトの名無しさん [2016/06/01(水) 19:25:08.39 ID:XXwwXNx4.net] ttps://developer.nvidia.com/cudnn >Supported on Windows, Linux and MacOS systems with Pascal, Kepler, Maxwell, Tegra K1 or Tegra X1 GPUs. のTegra K1の文字を見て、サポート復活を喜んでいたのですが、 Tegra K1は32bitでして、 必要なCUDA7.5は64bit必須 もしかして、cuDNNとCUDAは無関係で独立して使えたりしますか?
991 名前:デフォルトの名無しさん mailto:sage [2016/06/03(金) 02:14:25.16 ID:qw00fiPh.net] CUDA APIで1番始めに呼んだAPIは時間がかかるとのことですが、 時間計測に影響が出ないように事前にどんな関数を呼んでますか? 慣習だったり、よく使われる関数があれば教えてください。
992 名前:デフォルトの名無しさん mailto:sage [2016/06/04(土) 23:09:31.90 ID:EzTgQ+dX.net] 工学じゃなくて物理系でもcuda覚える価値ってある?