[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 23:35 / Filesize : 266 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

cellプログラミングしちゃいなよ3



1 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:55:08 ]
前スレ

Cellプログラミングしちゃいなよ2
pc11.2ch.net/test/read.cgi/tech/1183091522/

321 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:58:41 ]
このスレで期限前に最速コードを公開して、コンテストを無効化して、そして伝説へ…
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。

いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。

322 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:18:54 ]
58156364 / 4(SIMD) * 15(cycle) / 40(ticks) = 5452159.125 か。
だれか 15cycle の壁をやぶってくれw

323 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:22:23 ]
temperingをテーブル参照で・・・


って、数十GBメモリが必要になりますよ

324 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:34:45 ]
じゃぁ、それを計算で求めるようにしよう!!!

ってのはおいといて、おいらも>>312が視野に入ってきたかな。。。

325 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:40:19 ]
9%→90%→99%→99.9$→・・・

ですね。わかります

326 名前:202 mailto:sage [2009/01/11(日) 19:36:49 ]
>>322
だんごさんが15を破れることバラしちゃったから俺もバラすけど、
15は数日前にもう破ってるよ。
コンパイラの吐くコードがよろしくなくて、調整の時間が取れてないだけ。

>>325
99.9$ ・・・ 9000円くらい?

327 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:43:14 ]
未だかつてこのスレでこんなにCellプログラミングが流行ったことがあっただろうか、いやない

328 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:51:07 ]
きそう、この週末丁度暇になったのにPS3は会社のだから事務所に置きっぱなしだ……
尤も、半年以上放置しているから今更勘が戻らないけどね。

329 名前:202 mailto:sage [2009/01/11(日) 20:10:39 ]
>>328
大丈夫、俺なんてCellプログラミングは初めてだ。
リモートの開発環境も用意してくれるよ。

・・・べ、別に誘ってるわけじゃないんだからねっ!
どっちかっていうとライバルが増えると困るんだからねっ!



330 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:06:20 ]
>>326
切ったのは16(っていうか18)じゃなくて?

どうせ4要素毎にspu_addして最後に合計を水平加算してるっしょ?
加算はEvenパイプだよ。

331 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 23:42:30 ]
あんまり具体的な話をするのは、1〜2人で参加という趣旨に反すると
思うよ。

332 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:54:01 ]
>>328
Cell SDKはx86のLinuxにも入れられるぞ
シミュレータもある。

333 名前:322,324 mailto:sage [2009/01/12(月) 00:47:51 ]
あー、呑んだ。酔っぱらった。酔ったまんま unroll にとりかかるぜw
>>325,326
おいら今 unroll してない状態で 16cycle だから、近いかなぁ、と。
>>330
18ってなに?ともあれ、なんとか even をあと一つ縮めたいよなぁ…
>>331
どうせおいら申し込んでないしー。ってか名前&社名出せねぇw

334 名前:202 mailto:sage [2009/01/12(月) 00:50:14 ]
>>330
あれ、だんごさんに言われると不安になってきた。
あとで数えなおし&理論限界の計算しなおししてみる。

335 名前:322,324 mailto:sage [2009/01/12(月) 01:05:26 ]
>>334
ってか、even 15 切ってるのが居たら神な希ガス
>>322 に書いたけど、だんごさんも 15 は切ってないよ。
どれだけ論理限界(15)に近づけるかの勝負でしょ。
それか誰かが 15 を切るかw

336 名前:322,324 mailto:sage [2009/01/12(月) 01:07:46 ]
あ、>>301 の 5.47M は間違いだと思われ

337 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/12(月) 01:43:39 ]
パイプラインの空き35位まで詰められたけど、理論性能の95%しか出てない。
>>312が99.6%出してる時点で勝てそうにないorz


338 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 01:47:40 ]
>>312は2日前の成果。日増しに(わずかながらではあるが)性能は伸びてる

339 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 07:40:11 ]
理論スループット15になる方法思いついたときは俺SUGEEEEEEEEEEって思ったけど
そこまでは案外みんな気づくの早かったな。



340 名前:202 mailto:sage [2009/01/12(月) 09:00:51 ]
>>335
even? odd じゃね? tempering 的に言って。
>>339
てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
そのスコアを超えたのか。すげーな。

341 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:40:14 ]
おいおい逆だ
pc.watch.impress.co.jp/docs/2005/0212/kaigai03l.gif


342 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:41:24 ]
>てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
それは秘密。

ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。

343 名前:202 mailto:sage [2009/01/12(月) 09:54:54 ]
>>341
おおおおおおおお!
俺、v = mt[k] とかに //e って、 spu_and() とかに //o ってコメント付けてた!
恥ずかしー!

344 名前:デフォルトの名無しさん [2009/01/12(月) 12:33:46 ]
ど素人ですけど、CELLに悪戦苦闘してる方々に質問。
CELLのメモリ構成の扱いにくさって、将来LSの容量が増えて
各SPUが特定の仕事に専心するようになったら、それほど
大きな足かせにならない気がするんですけど、どうでしょうか?
今はLSの容量が少なすぎて、頻繁に書き換えが必要だから超面倒だけど。
クタはそこまで考えて、LSにしたんじゃないんでしょうか?

345 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 13:52:21 ]
なんか書き込みがゲハ臭いから回答すべきか「帰りな」と言うべきか迷うが。
クタだけに焦点を当てるなら、PS3を設計している最中に「LSが増えたら」が無いのは考えれば分かる話だよな?

346 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 14:19:49 ]
ほんとゲハ臭いなw
>>344
ここで Hack the Cell やるような人は扱いにくいとか思ってないんじゃん?
扱いにくいってなるのは、プロジェクトが大きくなって C# あがりの
へたれプログラマも使わなきゃいけなくなった時じゃないかな?
Hack the Cell やるような職人にとっては LS の容量が少なくて超面倒って
事はなくて(ちょっと面倒くらいw)、へたれにとっては LS の容量が増えても、
ヘテロだったり cache じゃなかったりの時点で超面倒なんだと思われ。
今だったら Larrabee みたいな方がいいに決まってるっしょ。

347 名前:346 mailto:sage [2009/01/12(月) 14:23:56 ]
今だったら => 今から作るんだったら

348 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 16:55:22 ]
LarrabeeってCell扱うのはマンドクセッと思ってる
ヘタレ(と言うよりPCのCPUのみ扱い慣れている)
プログラマに取ってはいかにも扱いやすそうに見えるが
キャッシュレベルで勝手に同期が取られる事を良い事に
ついスレッドのあちこちで頻繁に同期を取るプログラムを
書いてしまってそれがキャッシュ用リング?バスの帯域を
圧迫してパフォーマンスが出ないと言う罠に陥りそうな希ガス。

349 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:12:05 ]
いいからゲハに帰れよ



350 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:14:32 ]
>>348
何言っているんだか。まるでx86だけがPCのCPUみたいな言い方しなさんな。
つーか、LarrabeeとCellを同列で語ること自体がどうかしている。

351 名前:348 mailto:sage [2009/01/12(月) 17:19:15 ]
>349
俺は残念ながら>344じゃないしゲハから来たわけでも無いよ。

352 名前:デフォルトの名無しさん mailto:348 [2009/01/12(月) 17:30:51 ]
>350
読解力無いね、アナタ。

353 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 19:15:57 ]
しかし、今更ながら気づいたが現在、市場で売られている
PCのCPUはもはや、ほとんど全てx86なんだよな。

Apple(Macintosh)がIntel CPUの採用を始めてからは。

と言うかx86以外のPC用(と呼べる)CPUを思いつけない。

354 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 20:50:56 ]
CBE

355 名前:250 mailto:sage [2009/01/13(火) 03:00:47 ]
ふー、目標の 6M 突破。と思ったらすごい事になってんなw 5.47M ってwww
こっから先は spu-gcc43 の最適化特性との根比べっぽいなぁ… orz
っていうか最適化馬鹿過ぎw 不要な処理し過ぎ!! フルアセで書かせろ!!!!w

356 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 08:21:08 ]
>>355
いっそマシン語を配列に書いたら?www
SPUは厳密な実行属性管理とかしないから自己書き換えとか簡単に動いたりするよ。
実際問題オーバーレイって自己書き換えと似たようなもんだし。

いや冗談ですwww

357 名前:202 mailto:sage [2009/01/13(火) 12:50:07 ]
どうしても0.3命令くらいはオーバーヘッドが消えない。
15.3 * 100 /15 = 102 だから、2%がオーバーヘッドか。

コンパイラに99%以上の効率のコードを吐き出させるだんごさんは神。

358 名前:202 mailto:sage [2009/01/13(火) 13:17:14 ]
>>355
ちょっと待ってろ、fixstarsにインラインアセンブラ使って良いかどうか訊いてくる。
だんごさんに勝つにはもうそれしかない希ガス。

359 名前:250 mailto:sage [2009/01/13(火) 13:34:00 ]
>>358
おぉ!よろしく頼むっす!でもさすがにダメな気がするw
おいら今 1.66% のオーバーヘッドまできた。5.54M
でもなんか全然本質じゃない事ばっかでちょっと虚しい… orz



360 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 13:45:11 ]
これからチュートリアル読み始めるんだけど、10倍くらいならいけるかな

361 名前:202 mailto:sage [2009/01/13(火) 16:11:14 ]
5M台何人いるのか判らなくなってきたな。
5.6M切ってるのがこのスレに4人くらい居るのかな?

362 名前:202 mailto:sage [2009/01/13(火) 17:30:57 ]
>>322,324 さん、fixstars社員ですね、わかります。

363 名前:,,・´∀`・,,)っ-○◎○ mailto:sage [2009/01/13(火) 17:52:24 ]
VISEO MDT243Wだったら2位も悪くないなと思ってるんだぜ。
ってか、42インチのテレビなんて使わねー
PCモニタとしてつかうにはでかすぎるし。

364 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 21:17:18 ]
15命令切る方法思いついたかも知れない

365 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 21:27:21 ]
うはwwww
みなぎってきたwwwwwwwwww





とりあえず目標修正

                5Mな!

366 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:28:57 ]
と思いきや、それをやるには spu_and が必要だから減らないんだなー

367 名前:202 mailto:sage [2009/01/13(火) 21:29:45 ]
wwwwwwwwww

びびらせやがって!

368 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:31:56 ]
いや、>>366 は適当に書いただけだってばw

369 名前:202 mailto:sage [2009/01/13(火) 21:32:43 ]
試しにインラインアセンブラつかってみたんだけど、
asm("lqr $50, mt+16")
みたいにすると、コンパイラに怒られる。 mt+ って書式は使えない?



370 名前:202 mailto:sage [2009/01/13(火) 21:33:45 ]
ちょっwww
だんごさんに追い抜かれる!

371 名前:202 mailto:sage [2009/01/13(火) 21:35:12 ]
インラインアセンブラ無しでどうやって5M超えようか

372 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:35:43 ]
202 さんは現段階で抜いてたの?

373 名前:202 mailto:sage [2009/01/13(火) 21:42:09 ]
たぶんね。15cycle は少し前に突破してる。 >>326
だれも気づいてないっぽかったから、その後は 15cycle前提で会話してた。

gcc43に行く手を阻まれて、理論値に全然近づけてないけど、>>316 の時点で
>>312 は抜いてた。

374 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 21:57:26 ]
って事は、>>357 は本当は 14.3 ってこと?

375 名前:202 mailto:sage [2009/01/13(火) 22:00:39 ]
>>374
それ、実は、アセンブラを自動生成する簡単なプログラム書いて、
その出力したコード(未テスト)のサイクル数の話。15はウソ。

本当のオーバーヘッドは0.3どころじゃない。もっとデカイ。

んで、アセンブラ禁止された。
... 質問しなけりゃ良かったorz

376 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:15:21 ]
というわけで俺だけ次のステップに逝く予感

377 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 22:15:31 ]
アセンブラ禁止意味不明。最早 Hack The spu-gcc43 じゃん。

378 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:17:56 ]
パイプラインを埋める方策考え直さないといけないな。

379 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:19:54 ]
方策は・・・あるんだなこれが。



380 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 22:25:49 ]
>>377 うまいw まさしくそのとおりだとおも

381 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:25:50 ]
これは15cycleを切れないコードの最高スコアだ。もちろんアセンブラなど使ってない。

spu-gcc43 -std=gnu99 -O3 -g -c -o mt_mine.o mt_mine.c
spu-gcc43 -Wl,-Map,mt_kadai.map mt_kadai.o mt_mine.o mt19937ar.sep/mt19937ar.o -o mt_kadai
./mt_kadai
ORIGNAL: sum=3c927c56, 294035297 ticks
MINE: sum=3c927c56, 5466192 ticks
ORIGNAL: sum=2e987a4d, 424162315 ticks
MINE: sum=2e987a4d, 7885270 ticks
ORIGNAL: sum=ef1b6aef, 312107681 ticks
MINE: sum=ef1b6aef, 5802168 ticks
ORIGNAL: sum=eedd2516, 290059639 ticks
MINE: sum=eedd2516, 5392281 ticks
ORIGNAL: sum=f7e967a8, 14367047 ticks
MINE: sum=f7e967a8, 267131 ticks
ORIGNAL: sum=1f37a7db, 214219571 ticks
MINE: sum=1f37a7db, 3982409 ticks
ORIGNAL: sum=c7d41f36, 294968868 ticks
MINE: sum=c7d41f36, 5483545 ticks
ORIGNAL: sum=aa9d2e9f, 259569157 ticks
MINE: sum=aa9d2e9f, 4825469 ticks
ORIGNAL: sum=8abd398a, 250848188 ticks
MINE: sum=8abd398a, 4663339 ticks
ORIGNAL: sum=a374bd58, 6110381 ticks
MINE: sum=a374bd58, 113635 ticks

382 名前:202 mailto:sage [2009/01/13(火) 22:29:57 ]
多分、もう、次のステップはない。

Hack the spu-gcc 4.3 '09

優勝争いのステージに、いま、俺とだんごさんが立っている。
このステージを制するのは、俺か、だんごさんか、はたまた新たなる
チャレンジャーか!!!

383 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:33:16 ]
我ながら恐ろしい。15clk/QWORDに対する実効効率99.74%の基地外スケジューリング
俺に勝てるかなククク

384 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 22:43:37 ]
ヒント:最適化が糞なら、無効にすればいいじゃない

385 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 23:46:28 ]
今更?

386 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 23:58:15 ]
この課題説明でインラインアセンブラ禁止なら、
pragma も使用禁止でしょうな。

387 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 00:03:42 ]
それって、なんてコンパイラハッキングゲーム?w

388 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 00:41:47 ]
わっちもようやく>>282のスタートラインに立てたので一応報告。

ちなみに、何故かコンパイラの最適化無効にしたらコードの質が良くなってるし、
コンパイラとの戦いの意味合いの方が強いような気がするなぁ…。


389 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:01:21 ]
ハッキングなどしてない

spu-gcc43 -std=gnu99 -O3 -g -c -o mt_mine.o mt_mine.c
spu-gcc43 -Wl,-Map,mt_kadai.map mt_kadai.o mt_mine.o mt19937ar.sep/mt19937ar.o -o mt_kadai
./mt_kadai
ORIGNAL: sum=3c927c56, 295486875 ticks
MINE: sum=3c927c56, 5093390 ticks
ORIGNAL: sum=2e987a4d, 426256300 ticks
MINE: sum=2e987a4d, 7347483 ticks
ORIGNAL: sum=ef1b6aef, 313648483 ticks
MINE: sum=ef1b6aef, 5406455 ticks
ORIGNAL: sum=eedd2516, 291491590 ticks
MINE: sum=eedd2516, 5024518 ticks
ORIGNAL: sum=f7e967a8, 14437972 ticks
MINE: sum=f7e967a8, 248913 ticks
ORIGNAL: sum=1f37a7db, 215277119 ticks
MINE: sum=1f37a7db, 3710802 ticks
ORIGNAL: sum=c7d41f36, 296425055 ticks
MINE: sum=c7d41f36, 5109559 ticks
ORIGNAL: sum=aa9d2e9f, 260850588 ticks
MINE: sum=aa9d2e9f, 4496367 ticks
ORIGNAL: sum=8abd398a, 252086563 ticks
MINE: sum=8abd398a, 4345293 ticks
ORIGNAL: sum=a374bd58, 6140545 ticks
MINE: sum=a374bd58, 105884 ticks



390 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:02:58 ]
やべぇwww笑いがとまんねーwwwww

391 名前:202 mailto:sage [2009/01/14(水) 01:17:46 ]
抜かれた・・・完敗だorz

392 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:19:03 ]
ん?まだもう一段階いけたよ

393 名前:202 mailto:sage [2009/01/14(水) 01:23:53 ]
5M切れそう?

394 名前:202 mailto:sage [2009/01/14(水) 01:25:36 ]
ちがうか、5088682 が下限なんだな。

395 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 01:34:03 ]
>>389
逆汗しないから、その実行ファイルうpして?


396 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:34:04 ]
ニヤニヤ

397 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 01:35:32 ]
>>395
優勝すれば公開されるんだからそのときに見ればいいじゃないか。
種も仕掛けもない

398 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 02:09:28 ]
>>389
さっき98%超えたけどさすがにそれは神の領域だわ。


399 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 02:14:08 ]
ttp://cell.fixstars.com/ps3linux/index.php/3.8%E3%80%80%E6%BC%94%E7%BF%92%E5%95%8F%E9%A1%8C_(3-3)_%E5%8C%BA%E5%88%86%E6%B1%82%E7%A9%8D%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0_(%E8%A7%A3%E7%AD%94)



400 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 02:17:55 ]
途中で投稿してもうた・・・
cell.fixstars.com/ps3linux/index.php/
ここにあるプログラミングチュートリアルの演習3−3の回答で、SPEの個数を変えたいんですが
#define NUM_SPE * の*だけ変えてもだめですよね・・・
性能がどんなもんかみたいんですが…どの点を変更すればよいのかご教授いただけませんでしょうか

401 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 02:20:52 ]
2のべき乗ならいいんじゃないの?
テキトーに言ってみるけど。

402 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 09:07:02 ]
>>400
そこだけでいいと思うけど・・・
PS3なら個数は1~6までSPEが利用できる

403 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 12:06:10 ]
>>389
SFMTより速いんじゃね?

404 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 12:42:54 ]
>>401-402
ありがとうございます。
変更箇所はこちらであっているみたいですね
タイム関数を利用して処理時間を測定しても、逆にSPEを利用したほうが時間が延びてしまいます。
理論上ではSPE1からSPE4にしたら1/4になるはずですよね?
ppeのメイン関数にあるresultをかこって測定しているのですが適切ではないのかな
すみません、出力に要した時間を測定するにはどこが適切なのでしょう
cell.fixstars.com/pukiwiki/index.php?tips_timebase タイム関数はこれを使用しています

405 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 13:21:25 ]
>>404
そもそもこの問題ってそんな大規模な数を計算してないから
下手にSPE増やすとデータ転送時間やらその他もろもろが増えて
逆に遅くなる可能性のほうが高いよ

406 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 14:42:22 ]
そうですか…わかりました。測定するプログラム自体が間違いだったんですかw
性能を見るために適したプログラム・・・どっかありますかね?
探してみます。

407 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 16:03:39 ]
質問です。
CELLとLarrabee ってどの程度性能差があるんですか?
大して性能差がないとしたら、仮にPS4が出るとして、
ソニーがCELLに拘る意味って、もはや無いのでは?
むしろPCの世界で主流になるであろう、Larrabeeに
切り替えた方がコスト的にも有利なのでは?

408 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 16:50:01 ]
ゲハ板にお帰りください。

409 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:16:08 ]
>>403
逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い
(高くしないと性能の出ない)アーキテクチャに向いてるってのはある。

MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。
これはCUDAの実装についての説明。
ソースはCUDA SDKのサンプルにも入ってる。
developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf

それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。
要するに依存関係があって、128ビット性能が出ない。
各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。



410 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:18:53 ]
× 要するに依存関係があって、128ビット性能が出ない。
× 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないとが出ない。

411 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 17:38:23 ]
つっこみたいんだが

412 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:44:30 ]
どうぞ


今回の課題のMTはSFMTと比べてレイテンシを埋めるためのテクニックが使いやすいのは事実だよ。
っていうか誰かCUDAにSFMT移植してごらん?4論理スレッドしか並列実行できない悲惨なことになる。

413 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 17:45:45 ]
いや、どっちも×なところになんだがw

414 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/14(水) 17:48:20 ]
○ 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないと性能が出ない。

タイピングしすぎで腱鞘炎になりそう

415 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 18:36:35 ]
>407
Larrabeeはまだ世の中に出ていないので誰にも分かりません。
性能比較は用途によって変わるので今、Cellが使われている用途に
そのままLarrabeeが使われたらどうなるかなんて仮定の話は
Intelの中の人ですら分からないでしょう。

またPC用のCPUの世界でLarrabeeのような
シンプルなコアをたくさん集積したメニーコアが
すぐに流行る事も無いでしょう。

流行るとしてもだいぶ先の話(10年先か20年先か?)

416 名前:デフォルトの名無しさん mailto:sage [2009/01/14(水) 20:19:04 ]
>>409
速さもランダム性も優れているなんて虫が良すぎるんじゃないかとは思っていたんだ。
ふつーなら、どっちかのはずだもんな。元がひどくない限りは。

417 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/14(水) 22:15:12 ]
99%超えたおー


418 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 10:44:32 ]
cell.fixstars.com/challenge/faq.html#kadai4
> インラインアセンブラは使用してもよいですか?
> インラインアセンブラは禁止としていましたが、使用していただいて構いません。(1/15 更新)

419 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 10:46:52 ]
中の人このスレ見てるな。



420 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 11:23:12 ]
なんか、いきなり競争のルールが変わってしまったな。

421 名前:デフォルトの名無しさん mailto:sage [2009/01/15(木) 11:33:29 ]
いちいちルールなんて再確認しないだろうから、このスレ見てない人が可哀想だよな。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<266KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef