- 1 名前:デフォルトの名無しさん [2009/01/25(日) 02:16:01 ]
- 前スレ
cellプログラミングしちゃいなよ3 pc11.2ch.net/test/read.cgi/tech/1215388508/l50
- 284 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 18:19:24 ]
- あ、printf入れたらか。そっちもないけどさ。
そんなシビアな環境でやってないからかな。。。
- 285 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 18:40:01 ]
- 止まらなくなった。何が何やら分からない。きっと今日は風が強かったからCellBE様のご機嫌がちょっと
悪かったんだな、うん
- 286 名前:227 ◆eZQcaIaFJs mailto:sage [2009/02/15(日) 18:41:44 ]
- >>279
同じような事で悩んだりしたのでヒントっぽいものを。 ・align16 付けてますか?(SSE と違って実行時の例外は無し) ・アセンブラから書き換えるグローバル変数は volatile にしてますか? 今のところ spu-gcc-4.3 の致命的なバグに遭遇した事は無かったりもします。 >>282 割り込み属性を指定してる関数で破壊するレジスタを待避しないコンパイラや、 ABIを無視して呼び出し先関数で使用しているレジスタしか待避しないコンパイラなら 見たこと有りますよ。
- 287 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 18:42:14 ]
- と思ったけど止まったぜヒャッハァー
- 288 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 18:44:36 ]
- まぁ、アライメントだろうな。
- 289 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 19:08:21 ]
- >>283
デバッガ関係ないし。 シビアなマルチスレッドプログラミングしてたらよく起こる
- 290 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 19:12:04 ]
- printfでうまくいくケースはメモリ周りだろ
アロケーションしてないとこの参照とかあるとそうなる
- 291 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 19:31:26 ]
- みなさんどうデバッグしてます?経験?デバッガ?
- 292 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 19:37:38 ]
- >>291
ただの趣味グラマだけど、基本はVCのデバッガで引っ掛けて、引っかかったらカンと経験っぽいもので何とかしてる。 一応、ユニットテストっぽいこともやるにはやってるかな。
- 293 名前:デフォルトの名無しさん mailto:sage [2009/02/15(日) 19:39:09 ]
- 今回はprinf( )デバッグだけで済んだ。
というか、リモート・デバッガ動かなかったから prinf( )デバッグしただけなんだな。
- 294 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 02:58:04 ]
- コンテストも終盤だし、スレの勢いも落ち着いてきたね
- 295 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 10:13:53 ]
- コンテストの目的って何なの?
Cellでなければ不可能な最適化や高速化の技術があるはずだ、って事なの? SFMTとは違う事をやるの?
- 296 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 10:48:13 ]
- >>294
誰ももう手の内を明かしたくないってことだろう。 >>295 いわゆる惰性って奴じゃないか?
- 297 名前:202 mailto:sage [2009/02/17(火) 10:57:17 ]
- F1みたいに厳しい制限の中でトップを争うレースかと思ってたのに、
何でもあり or 曖昧な評価基準 のレースになってしまって、やる気が 無くなった。ここ2週間何もしてない。 一応提出できるレベルには持っていく積もりだけど、Fixstars賞すら狙えない レベルに落ちぶれてしまった。
- 298 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 14:20:34 ]
- 今はCell Challengeの方やってんぜ
提出締め切りがこっちの方が近いからな
- 299 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 15:32:43 ]
- >>298
俺もやってんだがこっちはツールキットの10倍すら厳しい・・・ しかもOpenCafe上でやるとたまにだが実行時間がめちゃめちゃ遅くなるし 今ホームページみたらQ&Aが更新されてた 遅くなる事象が報告されてるみたいだな
- 300 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 19:47:29 ]
- いったいどんな属性のやつが優勝するんだろう?
- 301 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 19:51:51 ]
- 暇人である事は確かだろう
- 302 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 20:20:34 ]
- おれは暇人に該当するがさすがに職場からリモートでするほどの勇気or気力はないな。
つか不景気だし。 カレーだいすき れんこんだいすき
- 303 名前:デフォルトの名無しさん mailto:sage [2009/02/17(火) 22:14:20 ]
- >>295
本来の目的は前者、つまり、あなたが言うような「Cellでなければ不可能な最適化や 高速化の技術があるはず」だと思うよ。そこら辺が曖昧になったから、 >また予想以上の盛り上がりに感謝し、「実用性に優れている」と弊社にて判断した >プログラムに対して「フィックスターズ賞」を追加することに決定しました。 > >「実用性に優れている」と判断する基準 >* MT 乱数 (tempering された乱数) を生成している >* オリジナルコードと同じ順序で乱数を出力している >* MT 乱数を簡単に取り出せること (関数の戻り値, 配列に格納, など) >* 高速である >※上記の基準をもとに総合的に判断します。 という具合に「フィックスターズ賞」を作ったのだと思う。 要は、即戦力になる人材に応募して欲しいんだろ。 .>「実用性に優れている」と弊社にて判断した ^^^^^^^^^^^^^^^^^^ という一文が重要なんだよ。
- 304 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 07:24:34 ]
- ノーベル賞も実用性、実効性が最初に問われるんだってよかったね。
- 305 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 15:14:05 ]
- プログラミングの質問なんですが、
DMA転送する際に構造体のメンバがポインタだとSPUで読み取れないんですか?
- 306 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 15:41:51 ]
- エスパーレスするが、
取得したポインタを用いてさらに別途DMA転送しろってことじゃないか?
- 307 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 19:49:40 ]
- おいお前ら
メモリ足りてる?
- 308 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 20:16:34 ]
- >>307
とりあえずループ展開終わっただけの段階だけど、足りてる。 ファイルサイズだと253.0k。チューニングすればもう少し減ると思うが コンパイラがどう最適化するか判らないから、増えるかも?
- 309 名前:デフォルトの名無しさん mailto:sage [2009/02/18(水) 23:05:16 ]
- 前スレの「ていうか頭足りてる?」を思い出した
- 310 名前:デフォルトの名無しさん mailto:sage [2009/02/19(木) 20:12:03 ]
- IBMのCell Broadband Engine Programming Handbookがリンク切れなのは何故。。
- 311 名前:デフォルトの名無しさん mailto:sage [2009/02/20(金) 02:34:19 ]
- 消したって事は必要無いからなんじゃないかね?
PowerXCell 8iを含むって書いてあるけど、こっちで用が足りるんじゃない? ttp://www.ibm.com/chips/techlib/techlib.nsf/techdocs/1741C509C5F64B3300257460006FD68D?Open&S_TACT=105AGX16&S_CMP=LP
- 312 名前:デフォルトの名無しさん mailto:sage [2009/02/20(金) 19:27:42 ]
- あと2週間、だっぞ。
159-1名の君たち、せいぜいがんばれや。
- 313 名前:デフォルトの名無しさん mailto:sage [2009/02/22(日) 00:33:27 ]
- 159って何?
そんなに参加してるの?
- 314 名前:デフォルトの名無しさん mailto:sage [2009/02/22(日) 22:23:47 ]
- 駄目だなぁ、どうしても3%を超える事すら出来ない。
命令順序を入れ替えても変化なしだ。
- 315 名前:デフォルトの名無しさん mailto:sage [2009/02/24(火) 21:22:11 ]
- フィックスターズ、Cell活用のH.264リアルタイムソフトウェアエンコーダ
journal.mycom.co.jp/articles/2009/02/24/fixstars_powerxcell8i/index.html
- 316 名前:デフォルトの名無しさん mailto:sage [2009/02/24(火) 21:33:44 ]
- ↑
ルイスvsホリフィールドを久々に見せてもらったよ
- 317 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/24(火) 21:39:05 ]
- 中の人が言ってたアレ完成したのか
- 318 名前:227 ◆eZQcaIaFJs mailto:sage [2009/02/25(水) 01:03:24 ]
- [チラシの裏]
プロファイラの結果見ながら片っ端からソース書き換える仕事も一段落して、 次はOpenMPのマルチスレッド地獄。楽だと思って甘く見てたら、今日だけで 落とし穴に2回も落ちてしもうたよorz 目標の100FPSまでもう少し。 >>297 気力出なくて放置してるのはわっちも同じです。トランザムさえ無ければ 5位以内に入れる自信は有ったのになぁ…。
- 319 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 01:27:14 ]
- お互いに牽制し過ぎて、勝てないと思ってみんな提出しなくてノーマルな方法で優勝可能というオチだったりw
- 320 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 01:38:04 ]
- 159名がどこから来た数字かやっと分かった。
これは見つかるのかw
- 321 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/25(水) 02:42:06 ]
- >>318
俺がガンダムだ
- 322 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 10:56:18 ]
- SIMD化すると遅くなるんですがなぜですか?
- 323 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 15:34:40 ]
- 依存チェンじゃね?
とcellを知らないオレが答えてみる
- 324 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 20:17:42 ]
- なぜですかって聞いちゃだめでしょう。ルール的に
- 325 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:23:39 ]
- トランザムって何?
禁じてなのか
- 326 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:27:28 ]
- >>325
俺も何か高等テクニックなのかと思って近くの奴に トランザムって知ってるか? と聞いたら最近のガンダムがどれぐらい面白いかの話をされた
- 327 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:34:32 ]
- > トランザムって
厨二病
- 328 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:39:49 ]
- トランザムシステム(TRANS-AM)
オリジナルのGNドライヴに予め組み込まれていたシステム。 機体内部に蓄積されていた高濃度圧縮粒子を全面開放することで機体が赤い光に包まれ、 スペックを3倍以上に上げることができる。しかし、このシステムは大量のGN粒子を消費し、 使用時間の制限と、時間終了後は粒子の再チャージまで機体性能が大幅に低下するなど、 諸刃の剣である。イオリアがヴェーダが何者かによって破壊、もしくは掌握されたときのために 温存していた最後の希望であった。
- 329 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 22:53:24 ]
- >>322
俺がいる
- 330 名前:デフォルトの名無しさん mailto:sage [2009/02/25(水) 23:38:51 ]
- コンテスト終了後はソース公開されるんでしょ?
それ見ながら、このスレでトランザムについて解説してもらったらおk
- 331 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 02:44:03 ]
- fixstarsが今度Cellプログラミング実践セミナーを開くそうだけど、行く人いる?
自分は考え中・・・
- 332 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 12:53:22 ]
- 俺はトランザムって、てっきり車(スポーツカー)の事だと思ってた。
まさか最近のアニメ(ガンダム00)の話だったとはw。
- 333 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 12:56:33 ]
- >>332
それは元々、TRANS AMericanでアメリカ横断と言う意味だな。
- 334 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 13:03:19 ]
- >321
「俺がガンダムだ」の意味が分かったよ。 そんなもん分かりたくもなかったがw。
- 335 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 16:29:26 ]
- speedchallengeはもうだめだ
「他のジョブが動作中です」的なエラーがでて何も出来ない
- 336 名前: ◆imos.WO182 mailto:sage [2009/02/26(木) 18:43:54 ]
- Cell Challengeだけどまだプログラムを書いてる途中で一度も動かしていない\(^o^)/オワタ
こんな長いコードのデバッグとか正直あと1日で無理だろ,常考…orz
- 337 名前:デフォルトの名無しさん mailto:sage [2009/02/26(木) 19:28:04 ]
- 俺はバグとり合戦開始した。コンパイラはエラーはかないけど、正しい結果が得られない
明日の夕方に間に合えばいいが
- 338 名前: ◆imos.WO182 mailto:sage [2009/02/26(木) 22:50:55 ]
- ぉぅ,こっちは今からやっとバグ取り合戦だぜ.
徹夜してがんばろう.しかしチューニングまでは到達しないかもしれn… Another jobが云々は他の人もがんばってるってことかな. がんばらないと…
- 339 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 01:57:17 ]
- >>335
ターミナルでcellunlockするといけるってどこかに書いてあった気がする
- 340 名前: ◆imos.WO182 mailto:sage [2009/02/27(金) 03:20:47 ]
- 90%ぐらいの確率で答えを正しくだすけどっていう状況になってしまた\(^o^)/
それも実行する度に正しかったり1違ったり…orz DMA転送の付近で順序がおかしくなってるんだろうなー…
- 341 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 03:24:40 ]
- 間に合わないだろう、さすがに。
- 342 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 05:23:23 ]
- あきらめってきもちいいです
- 343 名前: ◆imos.WO182 mailto:sage [2009/02/27(金) 05:58:03 ]
- 別のバグを見つけて解決したけどなぜ時々正解していたかは未だに謎
とりあえず命令順序を良いように変えてくれるコンパイラに感謝 ところで Cell challenge って短い文字列でも勝負やるのかね もしかしたらそもそもSPU起動しない方が速いとかありうるけど まぁあまり気にしないでおくべきか
- 344 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 17:07:12 ]
- PS3に比べてOpenCafeだと全く速度が出ない
サイズの小さい問題ほど顕著で 128x256:7.3% 5120x5120:11.6% 20480x20480:42.4% 73600x73600:90.1% の速度しかでない PS3で開発してたもんだから今提出してがっかりした 何が原因なんだ
- 345 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 17:27:16 ]
- 実はPS3とOpenCafeのPPE-SPE間,SPE-SPE間通信時間を比べると
OpenCafeのほうが1.5倍の時間がかかってるんだよな SPEプログラム呼び出しに至ってはOpenCafeのほうは絶望的に遅い
- 346 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 17:47:00 ]
- 少なくともSPEの起動・終了を使い回したりはしてないんだがなあ
SPE間通信とシグナル通知レジスタあたりが怪しい気がする
- 347 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 19:44:24 ]
- 単純にコンパイラの違いとか
- 348 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 20:05:34 ]
- 携帯電話に対抗するPSP2、CellとLarrabeeで揺れるPS4
pc.watch.impress.co.jp/docs/2009/0226/kaigai492.htm
- 349 名前:デフォルトの名無しさん mailto:sage [2009/02/27(金) 20:28:21 ]
- ゲハ厨?
- 350 名前:314 mailto:sage [2009/02/28(土) 23:08:14 ]
- うーん、相変わらず駄目だ。2月に入ってから作成始めて、
出来るだけ土日のいずれかは使ってるんだけど、オリジナルの 3%を超えられない。 ぎりぎりまで頑張ってみるけど、コンテストに出さないかも。 いい加減、土日はフルに休みたいし、めんどくせぇなw
- 351 名前:デフォルトの名無しさん mailto:sage [2009/03/01(日) 00:51:06 ]
- 135 の扱いが厄介だ。
- 352 名前:デフォルトの名無しさん mailto:sage [2009/03/03(火) 17:02:50 ]
- Cell Challenge予選の結果が発表された
(入力をまだみれてないのでおそらくだけど) 2^34の問題が0.2秒で解けてるチームが1位っぽい
- 353 名前:デフォルトの名無しさん mailto:sage [2009/03/03(火) 21:44:08 ]
- imosさんてチームimoか?はえーなあ
- 354 名前: ◆imos.WO182 mailto:sage [2009/03/04(水) 15:43:01 ]
- お察しの通りチームImoですー
2^34が1秒切ったと喜んでいたけども1位とは4倍の壁… evenの埋まってる率はおそらく7割以上なのでアルゴリズムの変更が必須で悩み中
- 355 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 00:22:49 ]
- 1位のチームの人Anthyの開発者?
- 356 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 00:51:29 ]
- 何気にハックざセルの提出期限近いな
優勝ラインはどれぐらいだろうな? 4.5Mぐらいだと予想しているんだが
- 357 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/05(木) 01:20:01 ]
- # OpenMP で並列化出来るところが少なすぎて発狂しそう…。
>>354 今週の土曜日になれば Hack the Cell のネタバレ解禁だと思うので、 パイプライン両方埋めるテクニックが盗めるかもしれませんよ。 >>356 数字書いちゃうとアレな気もしますが、一月末の時点で3.5M突破 している方もいますよ。
- 358 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 01:39:03 ]
- それはすごいな。
でも、まだフィクスタ賞のチャンスは俺には残ってるはず。
- 359 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/03/05(木) 03:57:11 ]
- ああ、ふぃく☆すた賞狙ってる人は、コンパイラを飼い慣らすテクニックのほうを重視したほうがいいかもです。
- 360 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 08:54:15 ]
- コンパイラを飼い慣らすって
そんなに差がでるのですか
- 361 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 11:46:33 ]
- え、gccに限らずVCだろうがiccだろうがコンパイラとの格闘だぜ?
- 362 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 12:29:30 ]
- 自分はオプションにアンロールとO3つけてstripぐらいしかしてないです。
さすがに-pgとかつけたままにしたりましませんが・・・ けどその位を殺っておけばいいだろうという認識です。 そんなに激しく差がでるのかー
- 363 名前:デフォルトの名無しさん mailto:sage [2009/03/05(木) 23:56:56 ]
- コンパイルオプションはいじったらだめなんじゃ…
- 364 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 02:44:34 ]
- 自分はcell challengeなので。
- 365 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 11:43:09 ]
- 無意味なラベルを入れておくとかそういうおまじないレベルの事はやらなくて大丈夫なんだよね?
- 366 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 14:47:21 ]
- O3だと動かない\(^o^)/
- 367 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:13:16 ]
- 今日でひとつの祭りが終わるなぁ。勉強になったし楽しめたよ。満足満足
- 368 名前:デフォルトの名無しさん mailto:sage [2009/03/06(金) 22:37:56 ]
- 残念なこともあるにはあるけどなかなか楽しめたな
しばらくしたらコード公開されるのかな それとも20までお預けかな
- 369 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 01:56:36 ]
- へるみさんは80倍ちょっとか。
- 370 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/07(土) 02:35:40 ]
- ビット入れ替え思いつかずに、12cycleの壁超えられなかったもします。
フィックスターズ賞狙いですが、99%越えの接戦に勝てるか不安…。
- 371 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 10:32:23 ]
- トランザムってどうやって加算したの?
spu_cntbとかをうまく使うの? 締め切りすぎたけど、結果発表までは内緒なのかな…
- 372 名前:202 mailto:sage [2009/03/07(土) 11:05:43 ]
- 俺なんか12.3cycle/qwordだ。ランク外orz
- 373 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 11:48:08 ]
- で、トランザムって何なの?
俺が・・・が出自ってことは分かったけれど
- 374 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 11:50:25 ]
- >>371
spu_cntbは最初に思いついたね たとえば、 cntb(a) << 24 | cntb(b) << 16 | cntb(c) << cntb(d) を8組作って、左シフト+加算で畳み上げるってのはどう? 8ビット単位のシフト+論理和ならspu_shuffleでできるからOddパイプ側で処理を割り振ることもできるし このへんはいろいろやりようは有ると思う。 どっちかというとmt[]の更新のほうがめんどいんだ。 どういうレイアウトを組むかによってOddパイプの演算量が全然変わってくる。
- 375 名前:371 [2009/03/07(土) 11:51:50 ]
- >373
たぶんbitを90度回転したんじゃないかと。 01234... 01234... を 0000 1111 ... な感じに。
- 376 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 11:59:16 ]
- ( cntb(a) << 24 ) | ( cntb(b) << 16 ) | ( cntb(c) << 8 ) | cntb(d)
に訂正しときます >>373 俺が最初に言い出しました。transpose + sumだからトランザム(笑) あと速いし。さすがにmt[]の更新のほうがネックで3倍にはならないようだけどね。 なんのことはない、1bit×128並列のSIMD演算ですよ。 暗号のクラックなんかでよく使う方法です。
- 377 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 12:41:24 ]
- >>376
やっぱり1bitx128並列の事だったか。 その方法ならshift無くせるしxorとかの回数も減らせることは気が付いてたけど めんどくさいからやらなかった。 やった場合には1要素平均何cycleまでいくものなんだろう?
- 378 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 12:48:45 ]
- >>377
ブログなんかで「大台」って言ってる人がいるけど、これは100倍のことだと思うよ。 だから2クロック切るくらいかな。
- 379 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 12:57:04 ]
- 鬼すぎるw
- 380 名前:227 ◆eZQcaIaFJs mailto:sage [2009/03/07(土) 12:57:45 ]
- The Art of Multiprocessor Programming 届いた。普通に神本っぽい。
ところで、KLabの中の人ってこのスレの住人だったりするのだろうか…。 >>372 12.3は何とか超えたけど、その少し先で詰まっていたりもします。 >>376 普通に translate + sum だと思ってましたo r z
- 381 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/03/07(土) 13:21:59 ]
- ちょうどビット配列の転置アルゴリズムを「ハッカーのたのしみ」なんかが扱ってる
www.hackersdelight.org/HDcode/transpose32.c
- 382 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 13:45:25 ]
- temperingはそれこそすげー速くなるんだけどMT[i+1]とMT[i+M]のロードがなかなか難しいよね
いろいろやったけど命令数的に90倍速程度が理論限界で諦めた コンパイラはレジスタ足りないってわめくし 結局普通の方法で11.75/cycleの68倍速で提出したよ こっちのコードの方が最適化自体に手間掛けたから気に入ってるんだ
- 383 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 13:46:47 ]
- 11.75cycle/QWORDだた
- 384 名前:デフォルトの名無しさん mailto:sage [2009/03/07(土) 15:08:23 ]
- ところでオレ以外に学生部門の人はいないの?
学生参加は手を上げて!!
|

|