1 名前:デフォルトの名無しさん [2009/01/25(日) 02:16:01 ] 前スレ cellプログラミングしちゃいなよ3 pc11.2ch.net/test/read.cgi/tech/1215388508/l50
367 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:13:16 ] 今日でひとつの祭りが終わるなぁ。勉強になったし楽しめたよ。満足満足
368 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:37:56 ] 残念なこともあるにはあるけどなかなか楽しめたな しばらくしたらコード公開されるのかな それとも20までお預けかな
369 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 01:56:36 ] へるみさんは80倍ちょっとか。
370 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/07(土) 02:35:40 ] ビット入れ替え思いつかずに、12cycleの壁超えられなかったもします。 フィックスターズ賞狙いですが、99%越えの接戦に勝てるか不安…。
371 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 10:32:23 ] トランザムってどうやって加算したの? spu_cntbとかをうまく使うの? 締め切りすぎたけど、結果発表までは内緒なのかな…
372 名前:202 mailto:sage [2009/03/07(土) 11:05:43 ] 俺なんか12.3cycle/qwordだ。ランク外orz
373 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 11:48:08 ] で、トランザムって何なの? 俺が・・・が出自ってことは分かったけれど
374 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 11:50:25 ] >>371 spu_cntbは最初に思いついたね たとえば、 cntb(a) << 24 | cntb(b) << 16 | cntb(c) << cntb(d) を8組作って、左シフト+加算で畳み上げるってのはどう? 8ビット単位のシフト+論理和ならspu_shuffleでできるからOddパイプ側で処理を割り振ることもできるし このへんはいろいろやりようは有ると思う。 どっちかというとmt[]の更新のほうがめんどいんだ。 どういうレイアウトを組むかによってOddパイプの演算量が全然変わってくる。
375 名前:371 [2009/03/07(土) 11:51:50 ] >373 たぶんbitを90度回転したんじゃないかと。 01234... 01234... を 0000 1111 ... な感じに。
376 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 11:59:16 ] ( cntb(a) << 24 ) | ( cntb(b) << 16 ) | ( cntb(c) << 8 ) | cntb(d) に訂正しときます >>373 俺が最初に言い出しました。transpose + sumだからトランザム(笑) あと速いし。さすがにmt[]の更新のほうがネックで3倍にはならないようだけどね。 なんのことはない、1bit×128並列のSIMD演算ですよ。 暗号のクラックなんかでよく使う方法です。
377 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 12:41:24 ] >>376 やっぱり1bitx128並列の事だったか。 その方法ならshift無くせるしxorとかの回数も減らせることは気が付いてたけど めんどくさいからやらなかった。 やった場合には1要素平均何cycleまでいくものなんだろう?
378 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 12:48:45 ] >>377 ブログなんかで「大台」って言ってる人がいるけど、これは100倍のことだと思うよ。 だから2クロック切るくらいかな。
379 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 12:57:04 ] 鬼すぎるw
380 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/07(土) 12:57:45 ] The Art of Multiprocessor Programming 届いた。普通に神本っぽい。 ところで、KLabの中の人ってこのスレの住人だったりするのだろうか…。 >>372 12.3は何とか超えたけど、その少し先で詰まっていたりもします。 >>376 普通に translate + sum だと思ってましたo r z
381 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 13:21:59 ] ちょうどビット配列の転置アルゴリズムを「ハッカーのたのしみ」なんかが扱ってる www.hackersdelight.org/HDcode/transpose32.c
382 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 13:45:25 ] temperingはそれこそすげー速くなるんだけどMT[i+1]とMT[i+M]のロードがなかなか難しいよね いろいろやったけど命令数的に90倍速程度が理論限界で諦めた コンパイラはレジスタ足りないってわめくし 結局普通の方法で11.75/cycleの68倍速で提出したよ こっちのコードの方が最適化自体に手間掛けたから気に入ってるんだ
383 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 13:46:47 ] 11.75cycle/QWORDだた
384 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:08:23 ] ところでオレ以外に学生部門の人はいないの? 学生参加は手を上げて!!
385 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 15:14:07 ] >>382 mt[i+1]のほうは奇数・偶数みたいな分け方をすればpermuteの回数を「減らす」 くらいは出来るという結論に達した。 幸いなことに先頭から226個まではは並列実行できるし。 ただ、128ビット全部使うことは諦めないといけない。 1レジスタにビットを限界までの6分割とか8分割とかにしないといけない。 参加者が少なかったせいか10倍すら超えなくても参加賞は貰えることになったらしいので ウケを狙うのもアリだったな。
386 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 15:15:37 ] ○1レジスタにビットを限界まで詰めることを諦めて104ビットずつ6分割とか78ビットずつ8分割とかにしないといけない。
387 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:35:29 ] >>385 全員参加賞もらえるなんてどっか出てたか? フィクスタの社長ブログとかには参加者159人とか載ってるし、参加者少なすぎとかは無いんじゃないか?
388 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 15:38:20 ] cell.fixstars.com/challenge/entry.html 参加者特典 課題提出者全員に参加賞をプレゼントいたします。 ボールペンかなんかの予感
389 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:41:17 ] >>388 ほんとだ。疑ってすまんかった。 いつの間にか変わっていたんだな。
390 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 17:39:43 ] 「トランザム」 = 「とらん、sum」かとおもてたよ Tempering後のchecksumをとらないのかと。どやってやるんだそんなのと
391 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 17:46:47 ] kikxさんとこのが良く分からない 乱数生成の順番は入れ替わりそうだけど転置ではなさそうだ
392 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 17:52:46 ] > z = si_lqx(spu_slqw(spu_gather(y), 4), mag_lut); > r = spu_xor(spu_rlmaskqw(y,-1), z); 懐かしい 左4ビットシフトもspu_shuffleでできるよね? このへんはみんな気づいたかなと思うけど。
393 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:23:39 ] シャッフル1回でってこと? 想像もつかない
394 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/07(土) 18:26:58 ] 何となく11.75になる方法分かったorz
395 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:32:16 ] >391 mt[]の中の順番が入れ替わるだけ、かな? >392 団子さんは結局何倍までいけました?
396 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 18:35:33 ] spu_gatherやるとさ、プリファードスロットの下位4ビットにLSBが集約されるじゃん。 で、他は0になるじゃんじゃん。 spu_shuffleの第一引数に { 0x00, 0x10, 0x20, 0x30, 0x40 ,,, 0xF0 } ってベクトルブッ込むわけだ。 spu_shuffle( pattern, pattern, (vec_uchar16)spu_gather(y) ) これで spu_slqw(spu_gather(y), 4) とまったく同じ結果になる筈。
397 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 18:36:06 ] >>395 ノーコメント
398 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 18:40:04 ] shinhさんが俺をオフ会に誘ってるようですなwww
399 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:42:31 ] >>396 なるほど そういえば最初のうちは似たような使い方することで shuffleの定数生成機能を利用して1bitシフトしようとかしてたなぁ
400 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:45:48 ] でも、フィックスターズで会合セッティングするって、 社長blogに書いてあったよね。
401 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:49:47 ] 団子の自演か。
402 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 18:49:50 ] 入賞者以外も招待されるとしても気遅れしてしまって行けそうにない
403 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 18:59:24 ] そもそも人材スカウト前提のプログラミングコンテストじゃねーの? shinh氏はGoogleだから興味はなさそうだなー
404 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:22:19 ] >>403 おたくは誘われたら行くの? それとももっと良いとこに勤めてたりすんの?
405 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 19:25:38 ] そもそもFixstarsっていいところなのかね? Cellに将来性を感じない
406 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:26:29 ] なんという正直な意見
407 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:34:30 ] 現状じゃCellにいいことないよね LarrabeeとかGPUとかにも浮気するのかCell自身の発展があるのかどちらかじゃないと それに >経験、能力を考慮の上、当社規定により決定 は怖すぎる
408 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 19:38:01 ] 団子の自慢か。
409 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:01:06 ] shuffleでシフトって意味あるの? 命令数も使用パイプラインも変わらない気がするんだけど…
410 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 20:03:46 ] 要素単位のシフトはevenでshuffleはodd
411 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:11:52 ] すると>>396 はこういうこともできるってだけで 別に意味はないのか
412 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 20:15:06 ] ところで貴様らソースコードの先頭ってコレ入れた? /* * Copyright 2008-2009 ***********. All Rights Reserved. * * Redistribution and use in source and binary forms, with or without * modification, are permitted provided that the following conditions * are met: (中略) */ いや、BSDLで公開するなら常識だよな?
413 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 20:16:36 ] >>411 あるよ。普通の方法でやるとevenが余る。 evenでもoddでも等価な演算が出来る場合は、パイプラインの充填率をみて微調整ができるだろ。
414 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:27:23 ] そしたらslとslqwの使い分けでいいような
415 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 20:35:43 ] それもそうだな ケースを選ぶけどvec_uchar16に対応するシフト・ローテート命令としても使えるんだよ
416 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:39:16 ] これって優勝と準優勝しかないんだろ? せめて参加部門中で自分が何位くらいだったか知りたい
417 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 20:40:13 ] それでもFixstarsならブービー賞を用意してくれるッ!
418 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:43:15 ] >>417 あるかもなそれも。あったとして賞品はなんだろう? てか俺は賞はいらんから純粋に自分がどのくらいの実力なのか 相対的な位置を尻たいのさ
419 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 20:44:12 ] >>415 ああ、確かにslqwでできなくてshuffleでできる演算はあるな 参考になった、ありがとう
420 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/07(土) 21:27:20 ] んなところでオリジナルのGNドライブ(違)です tripper.kousaku.in/20090307.html
421 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 21:40:27 ] トランザムはともかくアルゴリズムについてはもともと分かってた人間もいると思うぞ
422 名前: ◆imos.WO182 mailto:sage [2009/03/07(土) 22:00:11 ] cntbだけじゃなくsumbのことも忘れないでやってくださいです…
423 名前: ◆imos.WO182 mailto:sage [2009/03/07(土) 22:41:49 ] ってよく見たら本文に書いてあったね,すませ. しかしできればコード本体も書き直したのを載せておいた方が後の人のためにも.
424 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 22:43:09 ] 書き直したやつ上げといた
425 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 22:44:47 ] shinh氏のはsumb使うときにオール0のレジスタ指定とかやったらしいが 実はそれが敗因だったんじゃねーのか? いや、mt[]のほうが大変なんだけどね
426 名前: ◆imos.WO182 mailto:sage [2009/03/07(土) 23:35:18 ] すばやい対応乙です しかし実はこのスレに圧倒されてHack the CellからCell Challengeに逃げ(ry とまぁそれはさておきここのsumbの引数の活用は意外と大きいかも? 単純計算0.5cycle/qwordは変わるし
427 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 23:55:47 ] あれ、cntb はレイテンシ4じゃねの。そしてsumbはevenじゃねの。
428 名前: ◆imos.WO182 mailto:sage [2009/03/08(日) 05:04:38 ] スループットのみを考えての計算だったのだけど 128個に対して16命令余分→4個に対して0.5命令余分みたいな もしevenが余ってたらあまり増えない可能性も十分にあると思うが
429 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/08(日) 05:46:51 ] コメントはかなりいい加減です。
430 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/08(日) 05:49:02 ] >>428 mt[i+1]なんかの算出の平均コストはそんなもんじゃすまない。
431 名前: ◆imos.WO182 mailto:sage [2009/03/08(日) 14:51:27 ] >>430 というかトランザムって言ってるなら+1なんてローテートの長さが変わるだけなんじゃ? 自分の書いた古いメモには128個の生成に1行あたり LD,LD,ROT(16),ROT(16),SEL,XOR,XOR*.5(mag01),(*tempering),ROT*2(29=256-227),SEL,ST (*tempering)=XOR*2.5,CNTB,SUMB,ADD みたいなことが書いてある 実装してないので抜けや間違いがあると思うが
432 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/08(日) 14:59:28 ] 静かになるな 当分はこんなところか ・Cell Speed Challenge参加組 ・shinh氏主催のオフ会ネタ ・Cell@ム板スレのみんなで何か作ろうぜ
433 名前:デフォルトの名無しさん mailto:sage [2009/03/08(日) 15:46:51 ] 作ろうぜってw 実質 PS3 環境で価値のあるものって何かあるか?
434 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/08(日) 15:54:41 ] PS3持ってる人でなおかつLinux入れてる変態専用だからなぁ その意味じゃGeForceさえ刺さってれば直ぐ試せるCUDAは敷居が低い にしても NVIDIA CUDA質問スレッドとくだすれCUDAスレが同時進行してる様は気味が悪かった。
435 名前:デフォルトの名無しさん mailto:sage [2009/03/08(日) 18:49:50 ] kikxさんとこのが想像以上に頭良すぎてわろたw これは勝てないわ
436 名前:デフォルトの名無しさん mailto:sage [2009/03/08(日) 23:27:43 ] fixstarsのチュートリアルがつながらんのお
437 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/09(月) 00:55:20 ] > 松本先生の書いたドキュメントを読んでると、状態空間は624ワードじゃなくて623ワード+1ビットであることが分かります。 > これをワード単位に切り上げた実装が624ワードになってるだけです。 32 * 623 + 1 = 19937
438 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 18:31:43 ] >>376 前スレ1000に "let's transpose!" って書いてある件w
439 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/09(月) 19:18:10 ] >>438 いやそれ以前に俺はbitsliceって単語出してるけどなwww
440 名前:デフォルトの名無しさん mailto:sage [2009/03/09(月) 21:56:53 ] っていうか、団子がずっと bitslice に気付いてなかったっぽいのが・・・ 自分であんだけ色々弄ってるんだからとっとと気付くだろー、ふつーw
441 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 01:25:49 ] ひょえー、120倍でも勝てないのかよw
442 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 02:22:18 ] cell challengeのほうは予選の時点でおそらく220倍ぐらい いかないと勝てない件
443 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 04:22:07 ] 120倍で勝てないってHack the Cellの話?
444 名前:デフォルトの名無しさん mailto:sage [2009/03/11(水) 13:01:02 ] ttp://longlong.way-nifty.com/blog/2009/03/post-7872.html これじゃね?
445 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/11(水) 19:22:12 ] 懇親会の連絡来たお
446 名前:202 mailto:sage [2009/03/12(木) 15:35:12 ] fixstarsとshin_hさんの、両方参加する。
447 名前:デフォルトの名無しさん mailto:sage [2009/03/12(木) 15:49:45 ] これみんな参加するの?正直気が引けるというか・・・
448 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/12(木) 22:38:10 ] フィックスターズさんへ 首都圏限定の懇親会楽しいですか? 次のコンテストから応募要件に「首都圏在住であること」って 入れておけばいいよwww
449 名前:デフォルトの名無しさん mailto:sage [2009/03/12(木) 23:10:53 ] 地理的にも精神的にもイナカモンなんだな
450 名前:デフォルトの名無しさん mailto:sage [2009/03/12(木) 23:22:59 ] 優勝して交通費請求すれば出すんじゃね?
451 名前:デフォルトの名無しさん mailto:sage [2009/03/12(木) 23:53:45 ] 都民にあらずんば人に非ず。 というか、普通に考えたら首都圏在住の人間が一番多くなるんだから当然でしょ。 他にふさわしい所があるってんなら言ってみ?
452 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 00:54:42 ] 沖縄
453 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 01:03:30 ] >>450 舐めんな。平日じゃなきゃ、のぞみでも使って自腹で逝ってやんよ そうだ!関西にLarrabeeトータルソリューションカンパニーの設立を!
454 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 01:08:19 ] 梅田の空中庭園あたりでなんかやるっていったら集まる奴おるか?
455 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:12:27 ] 交通費出してくれたら行ってやるよ
456 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 01:18:57 ] つまり団子が自費で全国から招集のオフ会でも開くのか?
457 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 01:26:28 ] こことかどう? www.gardenfields.jp/isolabella.htm
458 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/13(金) 02:02:59 ] ええわ。誰も来るな。 一人でCUDAまいてやる
459 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 02:23:06 ] 誰が上手い事言えと
460 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 09:59:43 ] CELLを使った電子会議システムでバーチャル懇親会をやればいい。
461 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 14:51:50 ] >>448 団子の精神年齢は相当低いなぁ…
462 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 15:52:12 ] 団子の起業フラグだな
463 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 17:59:29 ] 本当に行きたかったらどんなに遠くても行くだろう まぁ行く気が起きない遠さなのも確かだが
464 名前:,, ・´ ∀ `・ ,,)っ-○◎● mailto:sage [2009/03/13(金) 18:06:56 ] >>463 >>453
465 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 18:44:50 ] かおでかいよ てか人集めたいなら休日にやればいいのに
466 名前:デフォルトの名無しさん mailto:sage [2009/03/13(金) 19:25:04 ] 平日だと何ででれないんだ? どうせ暇だろ?
467 名前:,, ・´ ∀ `・ ,,)っ-○◎● mailto:sage [2009/03/13(金) 19:33:35 ] 暇など無い