[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 23:35 / Filesize : 266 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

cellプログラミングしちゃいなよ3



1 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:55:08 ]
前スレ

Cellプログラミングしちゃいなよ2
pc11.2ch.net/test/read.cgi/tech/1183091522/

262 名前:258 mailto:sage [2009/01/09(金) 11:48:22 ]
団子先生(笑)と同じチームだったりします。

263 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 11:58:18 ]
>>262
名前貸してPS3をゲットを狙ってる人か
>>247の書き込みみると,学生部門じゃなく社会人部門で参加してるのね


ところでCellチャレやってる人はいないのかな
ここ学生少ないんかね?

264 名前:デフォルトの名無しさん mailto:sage [2009/01/09(金) 13:47:18 ]
トリップで mt_mine.c の sha1sum 書き込んどきゃいいじゃん

265 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/09(金) 17:17:15 ]
証明する気など更々ないんだが

中の人は中の人名義で別の活動やってるからこっちの名前で技術的名声得ても何のメリットもないし。
だんごやさんとは所詮「記号」だ。tanasinnなみに退廃的な概念だ。
なによりでしゃばりすぎだ、だんごやさんは

266 名前:202 mailto:sage [2009/01/09(金) 22:38:08 ]
>>264
一度トリップ付けたら、その後ソース改変できなくなるじゃん。

267 名前:264 mailto:sage [2009/01/09(金) 22:44:14 ]
ん??改変したらまた新しいの書き込めばいんじゃん?

268 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 01:09:01 ]
>212
「45nmで32コア+PPE2コアのCell」がどこかで発表されたの?
論理設計してみただけとか言う話じゃなく、試作チップくらい作られた?

検索したけど見つからなかったので差し支えなければソースを教えてくれ。

269 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 03:45:46 ]
>>268
www-06.ibm.com/jp/solutions/deepcomputing/events/pdf/ibm.pdf

270 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/10(土) 03:46:09 ]
勘違いだった。投入は来年(2010年)ごろらしいよ。



271 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/10(土) 04:50:14 ]
今日と月曜休日出勤命令が出たと言うのに、こんな時間まで現実逃避して
しまって良いのだろうか…。

>>255
何この芸術的な画面。こっちは一画面分片側無しとか有るんですがw

>>258
ようやく追いつけた、けど次にやるべき事が見えてこない罠。


272 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/10(土) 07:05:00 ]
一番綺麗なところ見せてるに決まってるじゃんか。

Odd側でレイテンシ1なのはlnopかhbrだと思っていいよ。

273 名前:202 mailto:sage [2009/01/10(土) 10:42:06 ]
5.6M切ったところに壁があるのかな?

274 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 13:16:46 ]
なんで速くなったのかわかんねーが理論限界にまた一歩近づいた

275 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 17:56:53 ]
>>273
1%上げるのすら絶対無理な境地に達した。

276 名前:202 mailto:sage [2009/01/10(土) 18:13:37 ]
>>275
mjd!? 優勝候補ブチ抜けるんじゃない?
俺も準優勝以上目指して頑張ろう。

プライベートがゴタゴタしまくってて、せっかくの休みなのに殆ど弄れねー。

277 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 18:32:08 ]
っていうかね

コアループの内側の片方パイプ側が全部隙間無く埋まっちゃって
これ以上どうしようもないんだよね

外側をどうにかするとかいうレベルでのチューンしかできない。

とはいってもTick数が10とか20変わるレベルなんだけど

278 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 20:29:05 ]
優勝候補ってのはオレのチームに決まってるだろ

279 名前:202 mailto:sage [2009/01/10(土) 22:05:00 ]
>>278
ちょw、>>243の優勝候補って団子さん自身だったのかよwww

他人のスコアをリークするfixstars社員がいるのかと思ったよ。

280 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 22:18:04 ]
っていうか>>271見て焦った
だが、普通無理だろっていう境地に達した

敢えて言う
spu-gcc43の特性見切った



281 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 22:24:15 ]
>>280
のちの団子氏によると、ここが真のスタートラインだったという。

282 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 22:48:46 ]
スタートラインに立ってる人間いくらいるんだろうな?
ループ内で片方のパイプ全部埋まってる状態なんだが。
埋めるのしんどかった。アセンブラ使わずにだからな。

283 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:00:01 ]
というコメントを書き込み、団子氏はふと気付いた。
「アセンブラを使ったら…」

284 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/10(土) 23:05:56 ]
じゃあ質問してきてよ。
アセンブラ使っていいかどうか

っていうか変数おっかけるのめんどくせぇ

285 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:16:34 ]
というコメントを残しており、
動機は未だに不明。
では、次のニュースです。

286 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:17:57 ]
まさか、そこまで普通しないだろう。
そう、普通はしない。
しかし、Cellをいじる様な人種に常識は通用しないのだ。

287 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:22:24 ]
今までなんとなく、心にぼんやりとあった、疑問が脳裏をよぎる。

"なぜ、MTの限られた最適化で、LSの容量も制限するという、こんなにもきつい制限の課題なのか。"

そう。実は要求レベルは、その領域にあったのだ。

288 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:30:06 ]
スタート地点に立てた人間は、そうは多くない。しかし、そこまで行きついたものは確実に、"次"に気づいた。
だが、それらの人間とは別に、ごく一部、初めからその道を進んでいたものもいた。

そして、その先には、さらなる波乱が待っていた。

289 名前:デフォルトの名無しさん mailto:sage [2009/01/10(土) 23:48:48 ]
ってかさぁ、1 tick って何 cycle くらいなの?
そっから逆算すると、5.6 M の時って平均何 cycle / 32bit 生成くらい?

290 名前:268 mailto:sage [2009/01/11(日) 01:37:26 ]
>270
納得した。



291 名前:202 mailto:sage [2009/01/11(日) 01:58:42 ]
>>289
知ってるが、教えたくない情報の一つだなw

ヒント: cpuinfo

292 名前:202 mailto:sage [2009/01/11(日) 02:06:51 ]
ちなみに、壁を超える方法も思いついたぞ。

1.先に実行されたはずのORIGINALの結果をレジスタから探してくる
2. チャネルに書き込めないなら、関数呼び出し前に保存したデクリメンタの値を
  書き換える。

だれかネタでやってくれないかなw

293 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 02:36:26 ]
>>289, 291
40cycle/1tickだろ。5.6Mだと3.85cycle/32bitくらいか。
最低限SIMD化したとして15.4cycle/128bit。
unroll効いてるとして16〜7cycle/128bitくらいか。
ホントにそんなんで出来るんか???

294 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/11(日) 02:45:23 ]
>>282
少ない方が100ぐらい空いてるので、全部詰められれば0.25MTickか…。
コンパイラが糞なら asm volatile を使って手動スケジューリングでも
しようかと考え中です。

>>292
while( spu_read_decrementer() < ~16384 ) rand();


295 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 04:57:09 ]
SPU_Decrementerは内部的にチャンネル使ってます。

296 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 05:07:17 ]
配列にマシン語記述ってのどうかな?

ありがちな方法だな。
いけないプログラマ丸出し

297 名前:202 [2009/01/11(日) 07:55:31 ]
>>293
unrollするとってくだりからアレだが、そこまでの推測は正しいと思うよ。

15.4という数値がでてきたとすると、15cycle+0.4cycleで0.4がオーバーヘッドになる。
オーバーヘッドは1%くらいに抑えたいから、目標は5.51Mticksを切ること。
トップクラスはそのあたりにある壁にどこまで近づけるかというチキンレース中。

というところまで推測できちゃうから、みんなticks数は有効数字一桁しか出さなかったんだけど、
だんごさんが有効数字二桁の情報を出してきたのは、「cycle数で並ばれても壁までの近さなら
負けない」という意思表示かな。カッコイイ。

298 名前:202 mailto:sage [2009/01/11(日) 07:56:41 ]
普段使ってるのと違うPCで書き込みしたらsage忘れた。スマソ。

299 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:15:21 ]
>unroll効いてるとして16〜7cycle/128bitくらいか。
これが意味不明なんだけどね。

アンロールしようが何しようが演算ユニットが増えるわけじゃない。
演算ユニットの稼働率をいくらまで詰めるかって課題なわけで。

300 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:29:36 ]
っていうか
「15サイクル」って具体的な数字が出てきたけど、本当にそれでいいのか、そこから考えないといけない。



301 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/01/11(日) 08:42:54 ]
128bitあたり、15サイクルのスループットで済むと仮定して、オーバーヘッド抜きのスループットは5.47M切るくらい?でいいのかな?


えーと、絶望させちゃっていいかな?

【とっくに切ってるよ】
逆にどこに限界があるのかわからなくなってきたよ。

302 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 10:45:57 ]
だんごに勝つにはtemperingの命令数減らすことを本気で考えたほうが良い。
そこから道が開けると思う。
アンロールしてタイミング詰めるのはそれからでも遅くない。

303 名前:202 mailto:sage [2009/01/11(日) 10:55:24 ]
>>301
底知れねーな。でも大丈夫、その程度で絶望しないよ。
5.5Mを切る戦いに参戦する敵を増やしたくなかったから、>>297では>>293の数値をもとに話してた。
まだgccの吐くコードに翻弄されてるけど、5.5の壁の先の世界があることは理解している。

・・・でも、俺より先に>>227がだんごさんに追いつきそうなんだよな・・・
昨日一日物件探しまくって、良い物件見つけたと思ったら今朝「もう申し込まれてました」と連絡がorz
早く休日を丸一日使ってだんごさんと同じ世界に行きたい。

304 名前:202 mailto:sage [2009/01/11(日) 11:06:10 ]
>>302
敵増やしたくないから具体的な話はしたく無いんだけどさ。
俺もだんごさんも>>227さんも、とっくにそのレベルで出来る事はやってる。
その程度では勝てないよ。

305 名前:,,・´∀`・,,)っ-○○◎ mailto:sage [2009/01/11(日) 12:34:59 ]
で、一位がこのスレからでるのは確定状態か

306 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:00:56 ]
団子3兄弟

307 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:01:52 ]
スレで情報をホイホイ書き込むような人がトップとれるんだろうか…

308 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 13:12:48 ]
具体的な方法論は誰も公開してないんだぜ。
5M台叩き出してる人はアルゴリズムレベルでは殆ど同じコードになってると思う。必然的に。

あとは0.1パーセント単位のチューンってことになるわけだが
最後まで粘ったもん勝ちになりそうだな。

309 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 16:46:40 ]
ってかさぁ、15cycle とかホントに出来んの?
ってか、みんなマジでこんなとこに書いてんの?w

310 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:22:25 ]
とりあえず、良くも悪くもこのスレに書き込まれたことで、ここら辺の性能が
スタンダードになってしまったな。

まだ2か月近くあるしね。



311 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:24:06 ]
こうならないと面白くないだろ?

312 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:33:15 ]
ORIGNAL: sum=3c927c56, 294426736 ticks
MINE: sum=3c927c56, 5470853 ticks
ORIGNAL: sum=2e987a4d, 424726988 ticks
MINE: sum=2e987a4d, 7891991 ticks
ORIGNAL: sum=ef1b6aef, 312523179 ticks
MINE: sum=ef1b6aef, 5807115 ticks
ORIGNAL: sum=eedd2516, 290445788 ticks
MINE: sum=eedd2516, 5396877 ticks
ORIGNAL: sum=f7e967a8, 14386174 ticks
MINE: sum=f7e967a8, 267359 ticks
ORIGNAL: sum=1f37a7db, 214504754 ticks
MINE: sum=1f37a7db, 3985803 ticks
ORIGNAL: sum=c7d41f36, 295361550 ticks
MINE: sum=c7d41f36, 5488220 ticks
ORIGNAL: sum=aa9d2e9f, 259914712 ticks
MINE: sum=aa9d2e9f, 4829583 ticks
ORIGNAL: sum=8abd398a, 251182134 ticks
MINE: sum=8abd398a, 4667315 ticks
ORIGNAL: sum=a374bd58, 6118517 ticks
MINE: sum=a374bd58, 113731 ticks

このスコアをここに晒せるって意味を理解してくれ。

313 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:39:55 ]
ちょっとそのソース晒してくれる?
嘘くさいから。

314 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:43:14 ]
晒せるかボケ

315 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/11(日) 17:43:29 ]
あれからパイプラインの空きを半分くらいまで詰められたけど、
コンパイラが糞でどうにもならない状態。

.L9: ; メインループの先頭
lqr $81,mt+X
lqr $84,mt+X
lqr $53,mt+X
lqr $41,mt+X
lqr $47,mt+X
lqr $48,mt+X
lqr $59,mt+X
lqr $68,mt+X
lqr $24,mt+X
lqr $71,mt+X
lqr $113,mt+X
lqr $42,mt+X
lqr $43,mt+X
lqr $45,mt+X
lqr $46,mt+X
lqr $58,mt+X
lqr $55,mt+X
lqr $93,mt+X
lqr $104,mt+X
shufb $106,$73,$81,$127

>>312
数日前のスコアですか?


316 名前:202 mailto:sage [2009/01/11(日) 17:43:33 ]
>>313
ちょwwwそれはやりすぎだろw
>>312がスタンダードになってしまうw

>>312 なら追いつける自信があるけど、そっから先どこまで行ったんだろうね。。。

317 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:46:08 ]
>>316
自信あるのかよ!
ハッキリ言ってなんでこれで性能上がるのか理解不能っていう(デ?)チューンをしてる

318 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:47:55 ]
15clkが本当なら>>312は99%突破してるわけだが

319 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:51:59 ]
虚虚実実ですなw

320 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 17:53:24 ]
再提出上等
スコア更新する度にフィックスターズに送りつけてやるぜヘヘヘ



321 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 17:58:41 ]
このスレで期限前に最速コードを公開して、コンテストを無効化して、そして伝説へ…
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。

いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。

322 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:18:54 ]
58156364 / 4(SIMD) * 15(cycle) / 40(ticks) = 5452159.125 か。
だれか 15cycle の壁をやぶってくれw

323 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:22:23 ]
temperingをテーブル参照で・・・


って、数十GBメモリが必要になりますよ

324 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 18:34:45 ]
じゃぁ、それを計算で求めるようにしよう!!!

ってのはおいといて、おいらも>>312が視野に入ってきたかな。。。

325 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 18:40:19 ]
9%→90%→99%→99.9$→・・・

ですね。わかります

326 名前:202 mailto:sage [2009/01/11(日) 19:36:49 ]
>>322
だんごさんが15を破れることバラしちゃったから俺もバラすけど、
15は数日前にもう破ってるよ。
コンパイラの吐くコードがよろしくなくて、調整の時間が取れてないだけ。

>>325
99.9$ ・・・ 9000円くらい?

327 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:43:14 ]
未だかつてこのスレでこんなにCellプログラミングが流行ったことがあっただろうか、いやない

328 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 19:51:07 ]
きそう、この週末丁度暇になったのにPS3は会社のだから事務所に置きっぱなしだ……
尤も、半年以上放置しているから今更勘が戻らないけどね。

329 名前:202 mailto:sage [2009/01/11(日) 20:10:39 ]
>>328
大丈夫、俺なんてCellプログラミングは初めてだ。
リモートの開発環境も用意してくれるよ。

・・・べ、別に誘ってるわけじゃないんだからねっ!
どっちかっていうとライバルが増えると困るんだからねっ!

330 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:06:20 ]
>>326
切ったのは16(っていうか18)じゃなくて?

どうせ4要素毎にspu_addして最後に合計を水平加算してるっしょ?
加算はEvenパイプだよ。



331 名前:デフォルトの名無しさん mailto:sage [2009/01/11(日) 23:42:30 ]
あんまり具体的な話をするのは、1〜2人で参加という趣旨に反すると
思うよ。

332 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/11(日) 23:54:01 ]
>>328
Cell SDKはx86のLinuxにも入れられるぞ
シミュレータもある。

333 名前:322,324 mailto:sage [2009/01/12(月) 00:47:51 ]
あー、呑んだ。酔っぱらった。酔ったまんま unroll にとりかかるぜw
>>325,326
おいら今 unroll してない状態で 16cycle だから、近いかなぁ、と。
>>330
18ってなに?ともあれ、なんとか even をあと一つ縮めたいよなぁ…
>>331
どうせおいら申し込んでないしー。ってか名前&社名出せねぇw

334 名前:202 mailto:sage [2009/01/12(月) 00:50:14 ]
>>330
あれ、だんごさんに言われると不安になってきた。
あとで数えなおし&理論限界の計算しなおししてみる。

335 名前:322,324 mailto:sage [2009/01/12(月) 01:05:26 ]
>>334
ってか、even 15 切ってるのが居たら神な希ガス
>>322 に書いたけど、だんごさんも 15 は切ってないよ。
どれだけ論理限界(15)に近づけるかの勝負でしょ。
それか誰かが 15 を切るかw

336 名前:322,324 mailto:sage [2009/01/12(月) 01:07:46 ]
あ、>>301 の 5.47M は間違いだと思われ

337 名前:227 ◆eZQcaIaFJs mailto:sage [2009/01/12(月) 01:43:39 ]
パイプラインの空き35位まで詰められたけど、理論性能の95%しか出てない。
>>312が99.6%出してる時点で勝てそうにないorz


338 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 01:47:40 ]
>>312は2日前の成果。日増しに(わずかながらではあるが)性能は伸びてる

339 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 07:40:11 ]
理論スループット15になる方法思いついたときは俺SUGEEEEEEEEEEって思ったけど
そこまでは案外みんな気づくの早かったな。

340 名前:202 mailto:sage [2009/01/12(月) 09:00:51 ]
>>335
even? odd じゃね? tempering 的に言って。
>>339
てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
そのスコアを超えたのか。すげーな。



341 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:40:14 ]
おいおい逆だ
pc.watch.impress.co.jp/docs/2005/0212/kaigai03l.gif


342 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/12(月) 09:41:24 ]
>てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
それは秘密。

ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。

343 名前:202 mailto:sage [2009/01/12(月) 09:54:54 ]
>>341
おおおおおおおお!
俺、v = mt[k] とかに //e って、 spu_and() とかに //o ってコメント付けてた!
恥ずかしー!

344 名前:デフォルトの名無しさん [2009/01/12(月) 12:33:46 ]
ど素人ですけど、CELLに悪戦苦闘してる方々に質問。
CELLのメモリ構成の扱いにくさって、将来LSの容量が増えて
各SPUが特定の仕事に専心するようになったら、それほど
大きな足かせにならない気がするんですけど、どうでしょうか?
今はLSの容量が少なすぎて、頻繁に書き換えが必要だから超面倒だけど。
クタはそこまで考えて、LSにしたんじゃないんでしょうか?

345 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 13:52:21 ]
なんか書き込みがゲハ臭いから回答すべきか「帰りな」と言うべきか迷うが。
クタだけに焦点を当てるなら、PS3を設計している最中に「LSが増えたら」が無いのは考えれば分かる話だよな?

346 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 14:19:49 ]
ほんとゲハ臭いなw
>>344
ここで Hack the Cell やるような人は扱いにくいとか思ってないんじゃん?
扱いにくいってなるのは、プロジェクトが大きくなって C# あがりの
へたれプログラマも使わなきゃいけなくなった時じゃないかな?
Hack the Cell やるような職人にとっては LS の容量が少なくて超面倒って
事はなくて(ちょっと面倒くらいw)、へたれにとっては LS の容量が増えても、
ヘテロだったり cache じゃなかったりの時点で超面倒なんだと思われ。
今だったら Larrabee みたいな方がいいに決まってるっしょ。

347 名前:346 mailto:sage [2009/01/12(月) 14:23:56 ]
今だったら => 今から作るんだったら

348 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 16:55:22 ]
LarrabeeってCell扱うのはマンドクセッと思ってる
ヘタレ(と言うよりPCのCPUのみ扱い慣れている)
プログラマに取ってはいかにも扱いやすそうに見えるが
キャッシュレベルで勝手に同期が取られる事を良い事に
ついスレッドのあちこちで頻繁に同期を取るプログラムを
書いてしまってそれがキャッシュ用リング?バスの帯域を
圧迫してパフォーマンスが出ないと言う罠に陥りそうな希ガス。

349 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:12:05 ]
いいからゲハに帰れよ

350 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 17:14:32 ]
>>348
何言っているんだか。まるでx86だけがPCのCPUみたいな言い方しなさんな。
つーか、LarrabeeとCellを同列で語ること自体がどうかしている。



351 名前:348 mailto:sage [2009/01/12(月) 17:19:15 ]
>349
俺は残念ながら>344じゃないしゲハから来たわけでも無いよ。

352 名前:デフォルトの名無しさん mailto:348 [2009/01/12(月) 17:30:51 ]
>350
読解力無いね、アナタ。

353 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 19:15:57 ]
しかし、今更ながら気づいたが現在、市場で売られている
PCのCPUはもはや、ほとんど全てx86なんだよな。

Apple(Macintosh)がIntel CPUの採用を始めてからは。

と言うかx86以外のPC用(と呼べる)CPUを思いつけない。

354 名前:デフォルトの名無しさん mailto:sage [2009/01/12(月) 20:50:56 ]
CBE

355 名前:250 mailto:sage [2009/01/13(火) 03:00:47 ]
ふー、目標の 6M 突破。と思ったらすごい事になってんなw 5.47M ってwww
こっから先は spu-gcc43 の最適化特性との根比べっぽいなぁ… orz
っていうか最適化馬鹿過ぎw 不要な処理し過ぎ!! フルアセで書かせろ!!!!w

356 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/01/13(火) 08:21:08 ]
>>355
いっそマシン語を配列に書いたら?www
SPUは厳密な実行属性管理とかしないから自己書き換えとか簡単に動いたりするよ。
実際問題オーバーレイって自己書き換えと似たようなもんだし。

いや冗談ですwww

357 名前:202 mailto:sage [2009/01/13(火) 12:50:07 ]
どうしても0.3命令くらいはオーバーヘッドが消えない。
15.3 * 100 /15 = 102 だから、2%がオーバーヘッドか。

コンパイラに99%以上の効率のコードを吐き出させるだんごさんは神。

358 名前:202 mailto:sage [2009/01/13(火) 13:17:14 ]
>>355
ちょっと待ってろ、fixstarsにインラインアセンブラ使って良いかどうか訊いてくる。
だんごさんに勝つにはもうそれしかない希ガス。

359 名前:250 mailto:sage [2009/01/13(火) 13:34:00 ]
>>358
おぉ!よろしく頼むっす!でもさすがにダメな気がするw
おいら今 1.66% のオーバーヘッドまできた。5.54M
でもなんか全然本質じゃない事ばっかでちょっと虚しい… orz

360 名前:デフォルトの名無しさん mailto:sage [2009/01/13(火) 13:45:11 ]
これからチュートリアル読み始めるんだけど、10倍くらいならいけるかな



361 名前:202 mailto:sage [2009/01/13(火) 16:11:14 ]
5M台何人いるのか判らなくなってきたな。
5.6M切ってるのがこのスレに4人くらい居るのかな?

362 名前:202 mailto:sage [2009/01/13(火) 17:30:57 ]
>>322,324 さん、fixstars社員ですね、わかります。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<266KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef