- 1 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:55:08 ]
- 前スレ
Cellプログラミングしちゃいなよ2 pc11.2ch.net/test/read.cgi/tech/1183091522/
- 243 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/08(木) 21:43:17 ]
- 俺の中の人も本質を求める人間だ
たとえばさ、学生部門の優勝者って奨学金を年60万円もらえるでしょ。 社会人枠でたかだか42インチのテレビっていうか15万円相当のギフト券優勝狙うよりは、 より額が大きい学生枠で聞き分けのいい後輩に入れ知恵したほうが得 ってのは極論。しかし、特に勝つことには拘ってない。 ちなみに優勝候補は5x倍の圧倒的な性能をたたき出した上で既に提出済みって情報ならあるよ。 ビット演算の論理式レベルで最適化したレポートをひっさげて、ね。 #だんごやさんのマイミクにガチのフィックスターズ社員さんがいます。今回の出題者かもね?
- 244 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/08(木) 21:54:38 ]
- >>238-239はたぶんCell Speed Challengeのほうだろ。あれは大学・企業対決の意味合いが強いから当然だ。
フィックスターズのほうは会社の名義を書く必要がないので自宅警備員ですら応募可能です。
- 245 名前:202 mailto:sage [2009/01/08(木) 21:59:51 ]
- なんか心理戦になってるw
圧倒的な性能って、、、だんごさんも 5x倍でしょーに。 だんごさんが優勝候補でないとすると、俺は準優勝すらムリポだが、 一応50倍逝ったので終了後ソース公開するよ。
- 246 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/08(木) 22:06:44 ]
- っていうかIPC上限考えれば論理式レベルで手を入れない限り限界突破は不可能
- 247 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/08(木) 23:16:35 ]
- ちなみに「団子厨」は優勝云々以前に参加登録すらしてませんので。
偽名はまずいらしいからね。 2人までのチーム参加OKなの知ってた? 今回はだんごやさんではない代表名義で、実質俺だけでやってます。 優勝か準優勝になったらPS3を彼にあげるってことで手を打った。
- 248 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/08(木) 23:57:17 ]
- っていうか、優秀者のコードはBSDライセンスで公開されることになってるから
終了後に公開ってのも無意味だと思うんだ。 アセンブリ出力と実行形式一式を暗号化ZIPでアップロードして コンテスト終了後にパスワード公開するってのはどうかな?
- 249 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 00:12:41 ]
- で、みんなで pikazip challenge ですね。わかります。
- 250 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 00:13:52 ]
- おいらまだ普通に並列化しただけで10倍の状態… orz
50倍はしんどそうだなぁ。あ、今 gcc 4.1 なんだけど、 4.3 にしたらどんくらい違うんだろ? 4.3 のオリジナルって 何 ticks くらい?
- 251 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/09(金) 00:16:43 ]
- 4.3でやれ。
- 252 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/09(金) 00:17:14 ]
- 一番上が29Mticksくらい
- 253 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/09(金) 00:17:58 ]
- 何とか6MTick突破。spu_timing 見る限りもっと詰められそうな気もする…。
これからドルアーガの中継見て寝る。 >>228 今は3Dプログラミングだけに集中したいと思っていたりもします。
- 254 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 00:21:06 ]
- spu_timing ってなんですか?とググらずに聞いてみるテスト。
- 255 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/09(金) 00:35:28 ]
- もっと画期的なモン使えよ
up2.viploader.net/pic3/src/vl2_092246.gif
- 256 名前:250 mailto:sage [2009/01/09(金) 02:25:25 ]
- >>252
ども。29M って事は、50 倍だとやっぱとりあえずの目標が 6M なのね。 いま、ちょっとやったら 10M@gcc4.1 にはなった。さっきは 20M。 さらに半減かぁ。だんだん最適化できる所が減ってきたなぁ。
- 257 名前:202 mailto:sage [2009/01/09(金) 10:38:25 ]
- アンローリングしまくったら遅くなって、アセンブラ見るとローカル変数をLSに読み書きしてる・・・
コンパイラがバカなのか、レジスタ128個じゃパイプライン詰められないのか、よく判らん。
- 258 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 11:02:56 ]
- 5.6M切ったよ
- 259 名前:202 mailto:sage [2009/01/09(金) 11:05:40 ]
- うぁー、5M台増えてきたな。
みんなすげー。
- 260 名前:202 mailto:sage [2009/01/09(金) 11:13:40 ]
- 現在確認されている5M台は、だんごさん、俺、>>227、>>258 と、リーク情報の提出者か。
提出者 = >>258 だったりしないのかな?
- 261 名前:202 mailto:sage [2009/01/09(金) 11:18:35 ]
- トリップ付けて、コードのコメントにトリップパスつけるという手もあるな。
- 262 名前:258 mailto:sage [2009/01/09(金) 11:48:22 ]
- 団子先生(笑)と同じチームだったりします。
- 263 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 11:58:18 ]
- >>262
名前貸してPS3をゲットを狙ってる人か >>247の書き込みみると,学生部門じゃなく社会人部門で参加してるのね ところでCellチャレやってる人はいないのかな ここ学生少ないんかね?
- 264 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 13:47:18 ]
- トリップで mt_mine.c の sha1sum 書き込んどきゃいいじゃん
- 265 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/09(金) 17:17:15 ]
- 証明する気など更々ないんだが
中の人は中の人名義で別の活動やってるからこっちの名前で技術的名声得ても何のメリットもないし。 だんごやさんとは所詮「記号」だ。tanasinnなみに退廃的な概念だ。 なによりでしゃばりすぎだ、だんごやさんは
- 266 名前:202 mailto:sage [2009/01/09(金) 22:38:08 ]
- >>264
一度トリップ付けたら、その後ソース改変できなくなるじゃん。
- 267 名前:264 mailto:sage [2009/01/09(金) 22:44:14 ]
- ん??改変したらまた新しいの書き込めばいんじゃん?
- 268 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 01:09:01 ]
- >212
「45nmで32コア+PPE2コアのCell」がどこかで発表されたの? 論理設計してみただけとか言う話じゃなく、試作チップくらい作られた? 検索したけど見つからなかったので差し支えなければソースを教えてくれ。
- 269 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 03:45:46 ]
- >>268
www-06.ibm.com/jp/solutions/deepcomputing/events/pdf/ibm.pdf
- 270 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/10(土) 03:46:09 ]
- 勘違いだった。投入は来年(2010年)ごろらしいよ。
- 271 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/10(土) 04:50:14 ]
- 今日と月曜休日出勤命令が出たと言うのに、こんな時間まで現実逃避して
しまって良いのだろうか…。 >>255 何この芸術的な画面。こっちは一画面分片側無しとか有るんですがw >>258 ようやく追いつけた、けど次にやるべき事が見えてこない罠。
- 272 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/10(土) 07:05:00 ]
- 一番綺麗なところ見せてるに決まってるじゃんか。
Odd側でレイテンシ1なのはlnopかhbrだと思っていいよ。
- 273 名前:202 mailto:sage [2009/01/10(土) 10:42:06 ]
- 5.6M切ったところに壁があるのかな?
- 274 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 13:16:46 ]
- なんで速くなったのかわかんねーが理論限界にまた一歩近づいた
- 275 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 17:56:53 ]
- >>273
1%上げるのすら絶対無理な境地に達した。
- 276 名前:202 mailto:sage [2009/01/10(土) 18:13:37 ]
- >>275
mjd!? 優勝候補ブチ抜けるんじゃない? 俺も準優勝以上目指して頑張ろう。 プライベートがゴタゴタしまくってて、せっかくの休みなのに殆ど弄れねー。
- 277 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 18:32:08 ]
- っていうかね
コアループの内側の片方パイプ側が全部隙間無く埋まっちゃって これ以上どうしようもないんだよね 外側をどうにかするとかいうレベルでのチューンしかできない。 とはいってもTick数が10とか20変わるレベルなんだけど
- 278 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 20:29:05 ]
- 優勝候補ってのはオレのチームに決まってるだろ
- 279 名前:202 mailto:sage [2009/01/10(土) 22:05:00 ]
- >>278
ちょw、>>243の優勝候補って団子さん自身だったのかよwww 他人のスコアをリークするfixstars社員がいるのかと思ったよ。
- 280 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 22:18:04 ]
- っていうか>>271見て焦った
だが、普通無理だろっていう境地に達した 敢えて言う spu-gcc43の特性見切った
- 281 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 22:24:15 ]
- >>280
のちの団子氏によると、ここが真のスタートラインだったという。
- 282 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 22:48:46 ]
- スタートラインに立ってる人間いくらいるんだろうな?
ループ内で片方のパイプ全部埋まってる状態なんだが。 埋めるのしんどかった。アセンブラ使わずにだからな。
- 283 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:00:01 ]
- というコメントを書き込み、団子氏はふと気付いた。
「アセンブラを使ったら…」
- 284 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 23:05:56 ]
- じゃあ質問してきてよ。
アセンブラ使っていいかどうか っていうか変数おっかけるのめんどくせぇ
- 285 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:16:34 ]
- というコメントを残しており、
動機は未だに不明。 では、次のニュースです。
- 286 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:17:57 ]
- まさか、そこまで普通しないだろう。
そう、普通はしない。 しかし、Cellをいじる様な人種に常識は通用しないのだ。
- 287 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:22:24 ]
- 今までなんとなく、心にぼんやりとあった、疑問が脳裏をよぎる。
"なぜ、MTの限られた最適化で、LSの容量も制限するという、こんなにもきつい制限の課題なのか。" そう。実は要求レベルは、その領域にあったのだ。
- 288 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:30:06 ]
- スタート地点に立てた人間は、そうは多くない。しかし、そこまで行きついたものは確実に、"次"に気づいた。
だが、それらの人間とは別に、ごく一部、初めからその道を進んでいたものもいた。 そして、その先には、さらなる波乱が待っていた。
- 289 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:48:48 ]
- ってかさぁ、1 tick って何 cycle くらいなの?
そっから逆算すると、5.6 M の時って平均何 cycle / 32bit 生成くらい?
- 290 名前:268 mailto:sage [2009/01/11(日) 01:37:26 ]
- >270
納得した。
- 291 名前:202 mailto:sage [2009/01/11(日) 01:58:42 ]
- >>289
知ってるが、教えたくない情報の一つだなw ヒント: cpuinfo
- 292 名前:202 mailto:sage [2009/01/11(日) 02:06:51 ]
- ちなみに、壁を超える方法も思いついたぞ。
1.先に実行されたはずのORIGINALの結果をレジスタから探してくる 2. チャネルに書き込めないなら、関数呼び出し前に保存したデクリメンタの値を 書き換える。 だれかネタでやってくれないかなw
- 293 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 02:36:26 ]
- >>289, 291
40cycle/1tickだろ。5.6Mだと3.85cycle/32bitくらいか。 最低限SIMD化したとして15.4cycle/128bit。 unroll効いてるとして16〜7cycle/128bitくらいか。 ホントにそんなんで出来るんか???
- 294 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/11(日) 02:45:23 ]
- >>282
少ない方が100ぐらい空いてるので、全部詰められれば0.25MTickか…。 コンパイラが糞なら asm volatile を使って手動スケジューリングでも しようかと考え中です。 >>292 while( spu_read_decrementer() < ~16384 ) rand();
- 295 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 04:57:09 ]
- SPU_Decrementerは内部的にチャンネル使ってます。
- 296 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 05:07:17 ]
- 配列にマシン語記述ってのどうかな?
ありがちな方法だな。 いけないプログラマ丸出し
- 297 名前:202 [2009/01/11(日) 07:55:31 ]
- >>293
unrollするとってくだりからアレだが、そこまでの推測は正しいと思うよ。 15.4という数値がでてきたとすると、15cycle+0.4cycleで0.4がオーバーヘッドになる。 オーバーヘッドは1%くらいに抑えたいから、目標は5.51Mticksを切ること。 トップクラスはそのあたりにある壁にどこまで近づけるかというチキンレース中。 というところまで推測できちゃうから、みんなticks数は有効数字一桁しか出さなかったんだけど、 だんごさんが有効数字二桁の情報を出してきたのは、「cycle数で並ばれても壁までの近さなら 負けない」という意思表示かな。カッコイイ。
- 298 名前:202 mailto:sage [2009/01/11(日) 07:56:41 ]
- 普段使ってるのと違うPCで書き込みしたらsage忘れた。スマソ。
- 299 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:15:21 ]
- >unroll効いてるとして16〜7cycle/128bitくらいか。
これが意味不明なんだけどね。 アンロールしようが何しようが演算ユニットが増えるわけじゃない。 演算ユニットの稼働率をいくらまで詰めるかって課題なわけで。
- 300 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:29:36 ]
- っていうか
「15サイクル」って具体的な数字が出てきたけど、本当にそれでいいのか、そこから考えないといけない。
- 301 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:42:54 ]
- 128bitあたり、15サイクルのスループットで済むと仮定して、オーバーヘッド抜きのスループットは5.47M切るくらい?でいいのかな?
えーと、絶望させちゃっていいかな? 【とっくに切ってるよ】 逆にどこに限界があるのかわからなくなってきたよ。
- 302 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 10:45:57 ]
- だんごに勝つにはtemperingの命令数減らすことを本気で考えたほうが良い。
そこから道が開けると思う。 アンロールしてタイミング詰めるのはそれからでも遅くない。
- 303 名前:202 mailto:sage [2009/01/11(日) 10:55:24 ]
- >>301
底知れねーな。でも大丈夫、その程度で絶望しないよ。 5.5Mを切る戦いに参戦する敵を増やしたくなかったから、>>297では>>293の数値をもとに話してた。 まだgccの吐くコードに翻弄されてるけど、5.5の壁の先の世界があることは理解している。 ・・・でも、俺より先に>>227がだんごさんに追いつきそうなんだよな・・・ 昨日一日物件探しまくって、良い物件見つけたと思ったら今朝「もう申し込まれてました」と連絡がorz 早く休日を丸一日使ってだんごさんと同じ世界に行きたい。
- 304 名前:202 mailto:sage [2009/01/11(日) 11:06:10 ]
- >>302
敵増やしたくないから具体的な話はしたく無いんだけどさ。 俺もだんごさんも>>227さんも、とっくにそのレベルで出来る事はやってる。 その程度では勝てないよ。
- 305 名前:,,・´∀`・,,)っ-○○◎ mailto:sage [2009/01/11(日) 12:34:59 ]
- で、一位がこのスレからでるのは確定状態か
- 306 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:00:56 ]
- 団子3兄弟
- 307 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:01:52 ]
- スレで情報をホイホイ書き込むような人がトップとれるんだろうか…
- 308 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:12:48 ]
- 具体的な方法論は誰も公開してないんだぜ。
5M台叩き出してる人はアルゴリズムレベルでは殆ど同じコードになってると思う。必然的に。 あとは0.1パーセント単位のチューンってことになるわけだが 最後まで粘ったもん勝ちになりそうだな。
- 309 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 16:46:40 ]
- ってかさぁ、15cycle とかホントに出来んの?
ってか、みんなマジでこんなとこに書いてんの?w
- 310 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:22:25 ]
- とりあえず、良くも悪くもこのスレに書き込まれたことで、ここら辺の性能が
スタンダードになってしまったな。 まだ2か月近くあるしね。
- 311 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:24:06 ]
- こうならないと面白くないだろ?
- 312 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:33:15 ]
- ORIGNAL: sum=3c927c56, 294426736 ticks
MINE: sum=3c927c56, 5470853 ticks ORIGNAL: sum=2e987a4d, 424726988 ticks MINE: sum=2e987a4d, 7891991 ticks ORIGNAL: sum=ef1b6aef, 312523179 ticks MINE: sum=ef1b6aef, 5807115 ticks ORIGNAL: sum=eedd2516, 290445788 ticks MINE: sum=eedd2516, 5396877 ticks ORIGNAL: sum=f7e967a8, 14386174 ticks MINE: sum=f7e967a8, 267359 ticks ORIGNAL: sum=1f37a7db, 214504754 ticks MINE: sum=1f37a7db, 3985803 ticks ORIGNAL: sum=c7d41f36, 295361550 ticks MINE: sum=c7d41f36, 5488220 ticks ORIGNAL: sum=aa9d2e9f, 259914712 ticks MINE: sum=aa9d2e9f, 4829583 ticks ORIGNAL: sum=8abd398a, 251182134 ticks MINE: sum=8abd398a, 4667315 ticks ORIGNAL: sum=a374bd58, 6118517 ticks MINE: sum=a374bd58, 113731 ticks このスコアをここに晒せるって意味を理解してくれ。
- 313 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:39:55 ]
- ちょっとそのソース晒してくれる?
嘘くさいから。
- 314 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:43:14 ]
- 晒せるかボケ
- 315 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/11(日) 17:43:29 ]
- あれからパイプラインの空きを半分くらいまで詰められたけど、
コンパイラが糞でどうにもならない状態。 .L9: ; メインループの先頭 lqr $81,mt+X lqr $84,mt+X lqr $53,mt+X lqr $41,mt+X lqr $47,mt+X lqr $48,mt+X lqr $59,mt+X lqr $68,mt+X lqr $24,mt+X lqr $71,mt+X lqr $113,mt+X lqr $42,mt+X lqr $43,mt+X lqr $45,mt+X lqr $46,mt+X lqr $58,mt+X lqr $55,mt+X lqr $93,mt+X lqr $104,mt+X shufb $106,$73,$81,$127 >>312 数日前のスコアですか?
- 316 名前:202 mailto:sage [2009/01/11(日) 17:43:33 ]
- >>313
ちょwwwそれはやりすぎだろw >>312がスタンダードになってしまうw >>312 なら追いつける自信があるけど、そっから先どこまで行ったんだろうね。。。
- 317 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:46:08 ]
- >>316
自信あるのかよ! ハッキリ言ってなんでこれで性能上がるのか理解不能っていう(デ?)チューンをしてる
- 318 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:47:55 ]
- 15clkが本当なら>>312は99%突破してるわけだが
- 319 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:51:59 ]
- 虚虚実実ですなw
- 320 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:53:24 ]
- 再提出上等
スコア更新する度にフィックスターズに送りつけてやるぜヘヘヘ
- 321 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:58:41 ]
- このスレで期限前に最速コードを公開して、コンテストを無効化して、そして伝説へ…
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。 いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。
- 322 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:18:54 ]
- 58156364 / 4(SIMD) * 15(cycle) / 40(ticks) = 5452159.125 か。
だれか 15cycle の壁をやぶってくれw
- 323 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:22:23 ]
- temperingをテーブル参照で・・・
って、数十GBメモリが必要になりますよ
- 324 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:34:45 ]
- じゃぁ、それを計算で求めるようにしよう!!!
ってのはおいといて、おいらも>>312が視野に入ってきたかな。。。
- 325 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:40:19 ]
- 9%→90%→99%→99.9$→・・・
ですね。わかります
- 326 名前:202 mailto:sage [2009/01/11(日) 19:36:49 ]
- >>322
だんごさんが15を破れることバラしちゃったから俺もバラすけど、 15は数日前にもう破ってるよ。 コンパイラの吐くコードがよろしくなくて、調整の時間が取れてないだけ。 >>325 99.9$ ・・・ 9000円くらい?
- 327 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:43:14 ]
- 未だかつてこのスレでこんなにCellプログラミングが流行ったことがあっただろうか、いやない
- 328 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:51:07 ]
- きそう、この週末丁度暇になったのにPS3は会社のだから事務所に置きっぱなしだ……
尤も、半年以上放置しているから今更勘が戻らないけどね。
- 329 名前:202 mailto:sage [2009/01/11(日) 20:10:39 ]
- >>328
大丈夫、俺なんてCellプログラミングは初めてだ。 リモートの開発環境も用意してくれるよ。 ・・・べ、別に誘ってるわけじゃないんだからねっ! どっちかっていうとライバルが増えると困るんだからねっ!
- 330 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:06:20 ]
- >>326
切ったのは16(っていうか18)じゃなくて? どうせ4要素毎にspu_addして最後に合計を水平加算してるっしょ? 加算はEvenパイプだよ。
- 331 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 23:42:30 ]
- あんまり具体的な話をするのは、1〜2人で参加という趣旨に反すると
思うよ。
- 332 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:54:01 ]
- >>328
Cell SDKはx86のLinuxにも入れられるぞ シミュレータもある。
- 333 名前:322,324 mailto:sage [2009/01/12(月) 00:47:51 ]
- あー、呑んだ。酔っぱらった。酔ったまんま unroll にとりかかるぜw
>>325,326 おいら今 unroll してない状態で 16cycle だから、近いかなぁ、と。 >>330 18ってなに?ともあれ、なんとか even をあと一つ縮めたいよなぁ… >>331 どうせおいら申し込んでないしー。ってか名前&社名出せねぇw
- 334 名前:202 mailto:sage [2009/01/12(月) 00:50:14 ]
- >>330
あれ、だんごさんに言われると不安になってきた。 あとで数えなおし&理論限界の計算しなおししてみる。
- 335 名前:322,324 mailto:sage [2009/01/12(月) 01:05:26 ]
- >>334
ってか、even 15 切ってるのが居たら神な希ガス >>322 に書いたけど、だんごさんも 15 は切ってないよ。 どれだけ論理限界(15)に近づけるかの勝負でしょ。 それか誰かが 15 を切るかw
- 336 名前:322,324 mailto:sage [2009/01/12(月) 01:07:46 ]
- あ、>>301 の 5.47M は間違いだと思われ
- 337 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/12(月) 01:43:39 ]
- パイプラインの空き35位まで詰められたけど、理論性能の95%しか出てない。
>>312が99.6%出してる時点で勝てそうにないorz
- 338 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 01:47:40 ]
- >>312は2日前の成果。日増しに(わずかながらではあるが)性能は伸びてる
- 339 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 07:40:11 ]
- 理論スループット15になる方法思いついたときは俺SUGEEEEEEEEEEって思ったけど
そこまでは案外みんな気づくの早かったな。
- 340 名前:202 mailto:sage [2009/01/12(月) 09:00:51 ]
- >>335
even? odd じゃね? tempering 的に言って。 >>339 てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで そのスコアを超えたのか。すげーな。
- 341 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:40:14 ]
- おいおい逆だ
pc.watch.impress.co.jp/docs/2005/0212/kaigai03l.gif
- 342 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:41:24 ]
- >てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
それは秘密。 ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。
- 343 名前:202 mailto:sage [2009/01/12(月) 09:54:54 ]
- >>341
おおおおおおおお! 俺、v = mt[k] とかに //e って、 spu_and() とかに //o ってコメント付けてた! 恥ずかしー!
|

|