- 1 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:55:08 ]
- 前スレ
Cellプログラミングしちゃいなよ2 pc11.2ch.net/test/read.cgi/tech/1183091522/
- 321 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:58:41 ]
- このスレで期限前に最速コードを公開して、コンテストを無効化して、そして伝説へ…
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。 いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。
- 322 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:18:54 ]
- 58156364 / 4(SIMD) * 15(cycle) / 40(ticks) = 5452159.125 か。
だれか 15cycle の壁をやぶってくれw
- 323 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:22:23 ]
- temperingをテーブル参照で・・・
って、数十GBメモリが必要になりますよ
- 324 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:34:45 ]
- じゃぁ、それを計算で求めるようにしよう!!!
ってのはおいといて、おいらも>>312が視野に入ってきたかな。。。
- 325 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:40:19 ]
- 9%→90%→99%→99.9$→・・・
ですね。わかります
- 326 名前:202 mailto:sage [2009/01/11(日) 19:36:49 ]
- >>322
だんごさんが15を破れることバラしちゃったから俺もバラすけど、 15は数日前にもう破ってるよ。 コンパイラの吐くコードがよろしくなくて、調整の時間が取れてないだけ。 >>325 99.9$ ・・・ 9000円くらい?
- 327 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:43:14 ]
- 未だかつてこのスレでこんなにCellプログラミングが流行ったことがあっただろうか、いやない
- 328 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:51:07 ]
- きそう、この週末丁度暇になったのにPS3は会社のだから事務所に置きっぱなしだ……
尤も、半年以上放置しているから今更勘が戻らないけどね。
- 329 名前:202 mailto:sage [2009/01/11(日) 20:10:39 ]
- >>328
大丈夫、俺なんてCellプログラミングは初めてだ。 リモートの開発環境も用意してくれるよ。 ・・・べ、別に誘ってるわけじゃないんだからねっ! どっちかっていうとライバルが増えると困るんだからねっ!
- 330 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:06:20 ]
- >>326
切ったのは16(っていうか18)じゃなくて? どうせ4要素毎にspu_addして最後に合計を水平加算してるっしょ? 加算はEvenパイプだよ。
- 331 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 23:42:30 ]
- あんまり具体的な話をするのは、1〜2人で参加という趣旨に反すると
思うよ。
- 332 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:54:01 ]
- >>328
Cell SDKはx86のLinuxにも入れられるぞ シミュレータもある。
- 333 名前:322,324 mailto:sage [2009/01/12(月) 00:47:51 ]
- あー、呑んだ。酔っぱらった。酔ったまんま unroll にとりかかるぜw
>>325,326 おいら今 unroll してない状態で 16cycle だから、近いかなぁ、と。 >>330 18ってなに?ともあれ、なんとか even をあと一つ縮めたいよなぁ… >>331 どうせおいら申し込んでないしー。ってか名前&社名出せねぇw
- 334 名前:202 mailto:sage [2009/01/12(月) 00:50:14 ]
- >>330
あれ、だんごさんに言われると不安になってきた。 あとで数えなおし&理論限界の計算しなおししてみる。
- 335 名前:322,324 mailto:sage [2009/01/12(月) 01:05:26 ]
- >>334
ってか、even 15 切ってるのが居たら神な希ガス >>322 に書いたけど、だんごさんも 15 は切ってないよ。 どれだけ論理限界(15)に近づけるかの勝負でしょ。 それか誰かが 15 を切るかw
- 336 名前:322,324 mailto:sage [2009/01/12(月) 01:07:46 ]
- あ、>>301 の 5.47M は間違いだと思われ
- 337 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/12(月) 01:43:39 ]
- パイプラインの空き35位まで詰められたけど、理論性能の95%しか出てない。
>>312が99.6%出してる時点で勝てそうにないorz
- 338 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 01:47:40 ]
- >>312は2日前の成果。日増しに(わずかながらではあるが)性能は伸びてる
- 339 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 07:40:11 ]
- 理論スループット15になる方法思いついたときは俺SUGEEEEEEEEEEって思ったけど
そこまでは案外みんな気づくの早かったな。
- 340 名前:202 mailto:sage [2009/01/12(月) 09:00:51 ]
- >>335
even? odd じゃね? tempering 的に言って。 >>339 てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで そのスコアを超えたのか。すげーな。
- 341 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:40:14 ]
- おいおい逆だ
pc.watch.impress.co.jp/docs/2005/0212/kaigai03l.gif
- 342 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:41:24 ]
- >てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
それは秘密。 ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。
- 343 名前:202 mailto:sage [2009/01/12(月) 09:54:54 ]
- >>341
おおおおおおおお! 俺、v = mt[k] とかに //e って、 spu_and() とかに //o ってコメント付けてた! 恥ずかしー!
- 344 名前:デフォルトの名無しさん [2009/01/12(月) 12:33:46 ]
- ど素人ですけど、CELLに悪戦苦闘してる方々に質問。
CELLのメモリ構成の扱いにくさって、将来LSの容量が増えて 各SPUが特定の仕事に専心するようになったら、それほど 大きな足かせにならない気がするんですけど、どうでしょうか? 今はLSの容量が少なすぎて、頻繁に書き換えが必要だから超面倒だけど。 クタはそこまで考えて、LSにしたんじゃないんでしょうか?
- 345 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 13:52:21 ]
- なんか書き込みがゲハ臭いから回答すべきか「帰りな」と言うべきか迷うが。
クタだけに焦点を当てるなら、PS3を設計している最中に「LSが増えたら」が無いのは考えれば分かる話だよな?
- 346 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 14:19:49 ]
- ほんとゲハ臭いなw
>>344 ここで Hack the Cell やるような人は扱いにくいとか思ってないんじゃん? 扱いにくいってなるのは、プロジェクトが大きくなって C# あがりの へたれプログラマも使わなきゃいけなくなった時じゃないかな? Hack the Cell やるような職人にとっては LS の容量が少なくて超面倒って 事はなくて(ちょっと面倒くらいw)、へたれにとっては LS の容量が増えても、 ヘテロだったり cache じゃなかったりの時点で超面倒なんだと思われ。 今だったら Larrabee みたいな方がいいに決まってるっしょ。
- 347 名前:346 mailto:sage [2009/01/12(月) 14:23:56 ]
- 今だったら => 今から作るんだったら
- 348 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 16:55:22 ]
- LarrabeeってCell扱うのはマンドクセッと思ってる
ヘタレ(と言うよりPCのCPUのみ扱い慣れている) プログラマに取ってはいかにも扱いやすそうに見えるが キャッシュレベルで勝手に同期が取られる事を良い事に ついスレッドのあちこちで頻繁に同期を取るプログラムを 書いてしまってそれがキャッシュ用リング?バスの帯域を 圧迫してパフォーマンスが出ないと言う罠に陥りそうな希ガス。
- 349 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:12:05 ]
- いいからゲハに帰れよ
- 350 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:14:32 ]
- >>348
何言っているんだか。まるでx86だけがPCのCPUみたいな言い方しなさんな。 つーか、LarrabeeとCellを同列で語ること自体がどうかしている。
- 351 名前:348 mailto:sage [2009/01/12(月) 17:19:15 ]
- >349
俺は残念ながら>344じゃないしゲハから来たわけでも無いよ。
- 352 名前:デフォルトの名無しさん mailto:348 [2009/01/12(月) 17:30:51 ]
- >350
読解力無いね、アナタ。
- 353 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 19:15:57 ]
- しかし、今更ながら気づいたが現在、市場で売られている
PCのCPUはもはや、ほとんど全てx86なんだよな。 Apple(Macintosh)がIntel CPUの採用を始めてからは。 と言うかx86以外のPC用(と呼べる)CPUを思いつけない。
- 354 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 20:50:56 ]
- CBE
- 355 名前:250 mailto:sage [2009/01/13(火) 03:00:47 ]
- ふー、目標の 6M 突破。と思ったらすごい事になってんなw 5.47M ってwww
こっから先は spu-gcc43 の最適化特性との根比べっぽいなぁ… orz っていうか最適化馬鹿過ぎw 不要な処理し過ぎ!! フルアセで書かせろ!!!!w
- 356 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 08:21:08 ]
- >>355
いっそマシン語を配列に書いたら?www SPUは厳密な実行属性管理とかしないから自己書き換えとか簡単に動いたりするよ。 実際問題オーバーレイって自己書き換えと似たようなもんだし。 いや冗談ですwww
- 357 名前:202 mailto:sage [2009/01/13(火) 12:50:07 ]
- どうしても0.3命令くらいはオーバーヘッドが消えない。
15.3 * 100 /15 = 102 だから、2%がオーバーヘッドか。 コンパイラに99%以上の効率のコードを吐き出させるだんごさんは神。
- 358 名前:202 mailto:sage [2009/01/13(火) 13:17:14 ]
- >>355
ちょっと待ってろ、fixstarsにインラインアセンブラ使って良いかどうか訊いてくる。 だんごさんに勝つにはもうそれしかない希ガス。
- 359 名前:250 mailto:sage [2009/01/13(火) 13:34:00 ]
- >>358
おぉ!よろしく頼むっす!でもさすがにダメな気がするw おいら今 1.66% のオーバーヘッドまできた。5.54M でもなんか全然本質じゃない事ばっかでちょっと虚しい… orz
- 360 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 13:45:11 ]
- これからチュートリアル読み始めるんだけど、10倍くらいならいけるかな
- 361 名前:202 mailto:sage [2009/01/13(火) 16:11:14 ]
- 5M台何人いるのか判らなくなってきたな。
5.6M切ってるのがこのスレに4人くらい居るのかな?
- 362 名前:202 mailto:sage [2009/01/13(火) 17:30:57 ]
- >>322,324 さん、fixstars社員ですね、わかります。
- 363 名前:,,・´∀`・,,)っ-○◎○ mailto:sage [2009/01/13(火) 17:52:24 ]
- VISEO MDT243Wだったら2位も悪くないなと思ってるんだぜ。
ってか、42インチのテレビなんて使わねー PCモニタとしてつかうにはでかすぎるし。
- 364 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 21:17:18 ]
- 15命令切る方法思いついたかも知れない
- 365 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 21:27:21 ]
- うはwwww
みなぎってきたwwwwwwwwww とりあえず目標修正 5Mな!
- 366 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:28:57 ]
- と思いきや、それをやるには spu_and が必要だから減らないんだなー
- 367 名前:202 mailto:sage [2009/01/13(火) 21:29:45 ]
- wwwwwwwwww
びびらせやがって!
- 368 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:31:56 ]
- いや、>>366 は適当に書いただけだってばw
- 369 名前:202 mailto:sage [2009/01/13(火) 21:32:43 ]
- 試しにインラインアセンブラつかってみたんだけど、
asm("lqr $50, mt+16") みたいにすると、コンパイラに怒られる。 mt+ って書式は使えない?
- 370 名前:202 mailto:sage [2009/01/13(火) 21:33:45 ]
- ちょっwww
だんごさんに追い抜かれる!
- 371 名前:202 mailto:sage [2009/01/13(火) 21:35:12 ]
- インラインアセンブラ無しでどうやって5M超えようか
- 372 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:35:43 ]
- 202 さんは現段階で抜いてたの?
- 373 名前:202 mailto:sage [2009/01/13(火) 21:42:09 ]
- たぶんね。15cycle は少し前に突破してる。 >>326
だれも気づいてないっぽかったから、その後は 15cycle前提で会話してた。 gcc43に行く手を阻まれて、理論値に全然近づけてないけど、>>316 の時点で >>312 は抜いてた。
- 374 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:57:26 ]
- って事は、>>357 は本当は 14.3 ってこと?
- 375 名前:202 mailto:sage [2009/01/13(火) 22:00:39 ]
- >>374
それ、実は、アセンブラを自動生成する簡単なプログラム書いて、 その出力したコード(未テスト)のサイクル数の話。15はウソ。 本当のオーバーヘッドは0.3どころじゃない。もっとデカイ。 んで、アセンブラ禁止された。 ... 質問しなけりゃ良かったorz
- 376 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:15:21 ]
- というわけで俺だけ次のステップに逝く予感
- 377 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 22:15:31 ]
- アセンブラ禁止意味不明。最早 Hack The spu-gcc43 じゃん。
- 378 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:17:56 ]
- パイプラインを埋める方策考え直さないといけないな。
- 379 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:19:54 ]
- 方策は・・・あるんだなこれが。
- 380 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 22:25:49 ]
- >>377 うまいw まさしくそのとおりだとおも
- 381 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:25:50 ]
- これは15cycleを切れないコードの最高スコアだ。もちろんアセンブラなど使ってない。
spu-gcc43 -std=gnu99 -O3 -g -c -o mt_mine.o mt_mine.c spu-gcc43 -Wl,-Map,mt_kadai.map mt_kadai.o mt_mine.o mt19937ar.sep/mt19937ar.o -o mt_kadai ./mt_kadai ORIGNAL: sum=3c927c56, 294035297 ticks MINE: sum=3c927c56, 5466192 ticks ORIGNAL: sum=2e987a4d, 424162315 ticks MINE: sum=2e987a4d, 7885270 ticks ORIGNAL: sum=ef1b6aef, 312107681 ticks MINE: sum=ef1b6aef, 5802168 ticks ORIGNAL: sum=eedd2516, 290059639 ticks MINE: sum=eedd2516, 5392281 ticks ORIGNAL: sum=f7e967a8, 14367047 ticks MINE: sum=f7e967a8, 267131 ticks ORIGNAL: sum=1f37a7db, 214219571 ticks MINE: sum=1f37a7db, 3982409 ticks ORIGNAL: sum=c7d41f36, 294968868 ticks MINE: sum=c7d41f36, 5483545 ticks ORIGNAL: sum=aa9d2e9f, 259569157 ticks MINE: sum=aa9d2e9f, 4825469 ticks ORIGNAL: sum=8abd398a, 250848188 ticks MINE: sum=8abd398a, 4663339 ticks ORIGNAL: sum=a374bd58, 6110381 ticks MINE: sum=a374bd58, 113635 ticks
- 382 名前:202 mailto:sage [2009/01/13(火) 22:29:57 ]
- 多分、もう、次のステップはない。
Hack the spu-gcc 4.3 '09 優勝争いのステージに、いま、俺とだんごさんが立っている。 このステージを制するのは、俺か、だんごさんか、はたまた新たなる チャレンジャーか!!!
- 383 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:33:16 ]
- 我ながら恐ろしい。15clk/QWORDに対する実効効率99.74%の基地外スケジューリング
俺に勝てるかなククク
- 384 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:43:37 ]
- ヒント:最適化が糞なら、無効にすればいいじゃない
- 385 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 23:46:28 ]
- 今更?
- 386 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 23:58:15 ]
- この課題説明でインラインアセンブラ禁止なら、
pragma も使用禁止でしょうな。
- 387 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 00:03:42 ]
- それって、なんてコンパイラハッキングゲーム?w
- 388 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 00:41:47 ]
- わっちもようやく>>282のスタートラインに立てたので一応報告。
ちなみに、何故かコンパイラの最適化無効にしたらコードの質が良くなってるし、 コンパイラとの戦いの意味合いの方が強いような気がするなぁ…。
- 389 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:01:21 ]
- ハッキングなどしてない
spu-gcc43 -std=gnu99 -O3 -g -c -o mt_mine.o mt_mine.c spu-gcc43 -Wl,-Map,mt_kadai.map mt_kadai.o mt_mine.o mt19937ar.sep/mt19937ar.o -o mt_kadai ./mt_kadai ORIGNAL: sum=3c927c56, 295486875 ticks MINE: sum=3c927c56, 5093390 ticks ORIGNAL: sum=2e987a4d, 426256300 ticks MINE: sum=2e987a4d, 7347483 ticks ORIGNAL: sum=ef1b6aef, 313648483 ticks MINE: sum=ef1b6aef, 5406455 ticks ORIGNAL: sum=eedd2516, 291491590 ticks MINE: sum=eedd2516, 5024518 ticks ORIGNAL: sum=f7e967a8, 14437972 ticks MINE: sum=f7e967a8, 248913 ticks ORIGNAL: sum=1f37a7db, 215277119 ticks MINE: sum=1f37a7db, 3710802 ticks ORIGNAL: sum=c7d41f36, 296425055 ticks MINE: sum=c7d41f36, 5109559 ticks ORIGNAL: sum=aa9d2e9f, 260850588 ticks MINE: sum=aa9d2e9f, 4496367 ticks ORIGNAL: sum=8abd398a, 252086563 ticks MINE: sum=8abd398a, 4345293 ticks ORIGNAL: sum=a374bd58, 6140545 ticks MINE: sum=a374bd58, 105884 ticks
- 390 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:02:58 ]
- やべぇwww笑いがとまんねーwwwww
- 391 名前:202 mailto:sage [2009/01/14(水) 01:17:46 ]
- 抜かれた・・・完敗だorz
- 392 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:19:03 ]
- ん?まだもう一段階いけたよ
- 393 名前:202 mailto:sage [2009/01/14(水) 01:23:53 ]
- 5M切れそう?
- 394 名前:202 mailto:sage [2009/01/14(水) 01:25:36 ]
- ちがうか、5088682 が下限なんだな。
- 395 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 01:34:03 ]
- >>389
逆汗しないから、その実行ファイルうpして?
- 396 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:34:04 ]
- ニヤニヤ
- 397 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:35:32 ]
- >>395
優勝すれば公開されるんだからそのときに見ればいいじゃないか。 種も仕掛けもない
- 398 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 02:09:28 ]
- >>389
さっき98%超えたけどさすがにそれは神の領域だわ。
- 399 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 02:14:08 ]
- ttp://cell.fixstars.com/ps3linux/index.php/3.8%E3%80%80%E6%BC%94%E7%BF%92%E5%95%8F%E9%A1%8C_(3-3)_%E5%8C%BA%E5%88%86%E6%B1%82%E7%A9%8D%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0_(%E8%A7%A3%E7%AD%94)
- 400 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 02:17:55 ]
- 途中で投稿してもうた・・・
cell.fixstars.com/ps3linux/index.php/ ここにあるプログラミングチュートリアルの演習3−3の回答で、SPEの個数を変えたいんですが #define NUM_SPE * の*だけ変えてもだめですよね・・・ 性能がどんなもんかみたいんですが…どの点を変更すればよいのかご教授いただけませんでしょうか
- 401 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 02:20:52 ]
- 2のべき乗ならいいんじゃないの?
テキトーに言ってみるけど。
- 402 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 09:07:02 ]
- >>400
そこだけでいいと思うけど・・・ PS3なら個数は1~6までSPEが利用できる
- 403 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 12:06:10 ]
- >>389
SFMTより速いんじゃね?
- 404 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 12:42:54 ]
- >>401-402
ありがとうございます。 変更箇所はこちらであっているみたいですね タイム関数を利用して処理時間を測定しても、逆にSPEを利用したほうが時間が延びてしまいます。 理論上ではSPE1からSPE4にしたら1/4になるはずですよね? ppeのメイン関数にあるresultをかこって測定しているのですが適切ではないのかな すみません、出力に要した時間を測定するにはどこが適切なのでしょう cell.fixstars.com/pukiwiki/index.php?tips_timebase タイム関数はこれを使用しています
- 405 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 13:21:25 ]
- >>404
そもそもこの問題ってそんな大規模な数を計算してないから 下手にSPE増やすとデータ転送時間やらその他もろもろが増えて 逆に遅くなる可能性のほうが高いよ
- 406 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 14:42:22 ]
- そうですか…わかりました。測定するプログラム自体が間違いだったんですかw
性能を見るために適したプログラム・・・どっかありますかね? 探してみます。
- 407 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 16:03:39 ]
- 質問です。
CELLとLarrabee ってどの程度性能差があるんですか? 大して性能差がないとしたら、仮にPS4が出るとして、 ソニーがCELLに拘る意味って、もはや無いのでは? むしろPCの世界で主流になるであろう、Larrabeeに 切り替えた方がコスト的にも有利なのでは?
- 408 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 16:50:01 ]
- ゲハ板にお帰りください。
- 409 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:16:08 ]
- >>403
逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い (高くしないと性能の出ない)アーキテクチャに向いてるってのはある。 MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。 これはCUDAの実装についての説明。 ソースはCUDA SDKのサンプルにも入ってる。 developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。 要するに依存関係があって、128ビット性能が出ない。 各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。
- 410 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:18:53 ]
- × 要するに依存関係があって、128ビット性能が出ない。
× 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないとが出ない。
- 411 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 17:38:23 ]
- つっこみたいんだが
- 412 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:44:30 ]
- どうぞ
今回の課題のMTはSFMTと比べてレイテンシを埋めるためのテクニックが使いやすいのは事実だよ。 っていうか誰かCUDAにSFMT移植してごらん?4論理スレッドしか並列実行できない悲惨なことになる。
- 413 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 17:45:45 ]
- いや、どっちも×なところになんだがw
- 414 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:48:20 ]
- ○ 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないと性能が出ない。
タイピングしすぎで腱鞘炎になりそう
- 415 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 18:36:35 ]
- >407
Larrabeeはまだ世の中に出ていないので誰にも分かりません。 性能比較は用途によって変わるので今、Cellが使われている用途に そのままLarrabeeが使われたらどうなるかなんて仮定の話は Intelの中の人ですら分からないでしょう。 またPC用のCPUの世界でLarrabeeのような シンプルなコアをたくさん集積したメニーコアが すぐに流行る事も無いでしょう。 流行るとしてもだいぶ先の話(10年先か20年先か?)
- 416 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 20:19:04 ]
- >>409
速さもランダム性も優れているなんて虫が良すぎるんじゃないかとは思っていたんだ。 ふつーなら、どっちかのはずだもんな。元がひどくない限りは。
- 417 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 22:15:12 ]
- 99%超えたおー
- 418 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 10:44:32 ]
- cell.fixstars.com/challenge/faq.html#kadai4
> インラインアセンブラは使用してもよいですか? > インラインアセンブラは禁止としていましたが、使用していただいて構いません。(1/15 更新)
- 419 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 10:46:52 ]
- 中の人このスレ見てるな。
- 420 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 11:23:12 ]
- なんか、いきなり競争のルールが変わってしまったな。
- 421 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 11:33:29 ]
- いちいちルールなんて再確認しないだろうから、このスレ見てない人が可哀想だよな。
|

|