1 名前:デフォルトの名無しさん mailto:sage [2007/04/29(日) 09:54:14 ] コンパイラ性能、コンパイルオプション、コードの最適化などについて語りましょう。 主に速度面の最適化を中心としますが、サイズなどの最適化もどうぞ。 なお、OS、CPU、コンパイラなどは限定しません 前スレ C、C++の最適化について語るスレ pc11.2ch.net/test/read.cgi/tech/1084676298/
610 名前:デフォルトの名無しさん mailto:sage [2008/03/30(日) 10:57:30 ] あぼ〜ん推奨ワード:ダンゴ、だんご、団子
611 名前:デフォルトの名無しさん mailto:sage [2008/03/30(日) 11:22:37 ] 610 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん
612 名前:デフォルトの名無しさん mailto:sage [2008/03/30(日) 17:47:20 ] >>610-611 w
613 名前:デフォルトの名無しさん mailto:sage [2008/03/31(月) 02:51:59 ] w ってどういう意味?
614 名前:デフォルトの名無しさん mailto:sage [2008/03/31(月) 03:08:41 ] 藁w
615 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 00:18:25 ] >>614 には失望した
616 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 01:05:43 ] なら俺は干草
617 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 10:00:38 ] >>600 コンパイラによるがされにくい。 PGIでは、vectorのまま[]でアクセスしたループはベクトル化してくれないが、 一旦ポインタに変換してループを書くとベクトル化する。
618 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 10:52:06 ] vector使うなら、operator[]を使わずにiteratorを使うだろ。常考
619 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 15:40:33 ] iteratorなんかつかったら余計に最適化されねーっての。
620 名前:デフォルトの名無しさん mailto:sage [2008/04/01(火) 16:37:25 ] されますが何か。
621 名前:デフォルトの名無しさん mailto:sage [2008/04/02(水) 15:05:29 ] その手があったか。 vectorに限って言えばiteratorはまず間違いなくポインタだろ。 ということは最適化される。
622 名前:619 mailto:sage [2008/04/02(水) 16:20:53 ] すんません。 vector<double>::iterator p = v.begin(); を使って、 p[i] でアクセスしたらポインタと同等の最適化されました。 ただ、for文の終了条件を p != v.end() なんてことしたら ループの回数が不明ということで最適化除外されました。
623 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/02(水) 17:00:57 ] std::vector<F32vec4> から派生の方向で アクセッサ?ほぼ再実装だね
624 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/02(水) 17:02:21 ] >>622 コンパイラは?
625 名前:デフォルトの名無しさん mailto:sage [2008/04/02(水) 23:37:03 ] ダンゴさんはVCの最適化については一言言いたいところがあるようだな
626 名前:デフォルトの名無しさん mailto:sage [2008/04/02(水) 23:48:28 ] >>624 PGI
627 名前:デフォルトの名無しさん [2008/04/03(木) 00:23:08 ] 623 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん
628 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 13:17:37 ] >p != v.end() 毎回インスタンス変数見るのか。 for(int i=0,sz=v.size(); i<sz; i++){...} for(iterator i=0,end=v.end(); i!=end; i++){...} のどちらかだろ常考。
629 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 14:51:29 ] 本来その程度の事は自動でやってくれるべきだけどね。 高級アセンブラだから細かいところに気を使うんだよな。
630 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 15:13:25 ] それを自動でやったらvolatileを勝手に外すくらいの暴挙じゃね? 正当にやれるのは、v自体がローカル変数で、 ポインタを取られてないことを解析出来る場合だけど、 その前提を維持するより一時ローカル変数に移した方が簡単だと思う。
631 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 16:33:26 ] ああそうか。あー!面倒くさい! もうローカルでポインタを取得してないメンバ変数やグローバル変数が 外から変更される可能性がある場合は全部volatile付けるって事でいいよw なんてやってるとvolatileだらけでどっちが面倒くさいんだか分からなくなってくるな。
632 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 18:15:58 ] パソコンだとマルチスレッドなんてあるから、 volatileが付いていてもいなくても 付いているのと同じように扱われている気がする(ローカルな自動変数以外)。
633 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 19:18:06 ] volatileは厳密にメモリのアクセス回数を決めるための物だから 同じってことは無いだろうけどね。
634 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 19:31:48 ] >>633 釣りかネタだよね?
635 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 20:56:39 ] バカの可能性もあるな。(w
636 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 21:06:50 ] 流れ見てないんだが… ここは「volatile 宣言最強!!!」って言わなくちゃいけないところですか? はずしてたらごめんなさい
637 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 21:08:45 ] volatile は毎回メモリにアクセスするようにするものだとか マジレスしたらいけない流れなんだろうな。
638 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 21:32:10 ] お前らボラれてるぞ
639 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/03(木) 21:33:36 ] volatileは最適化抑制です。
640 名前:636 mailto:sage [2008/04/03(木) 21:36:48 ] >>637 > volatile は毎回メモリにアクセスするようにするもの なのは, いいんだけど >>634 な, ものがあったから ちょっと言ってみたかった
641 名前:636 mailto:sage [2008/04/03(木) 21:43:32 ] >>639 そんなもん分かってて遊んでるんだからほっとけや
642 名前:デフォルトの名無しさん mailto:sage [2008/04/03(木) 21:49:31 ] volatile is a hint to the implementation to avoid aggressive optimization involving the object because the value of the object might be changed by means undetectable by an implementation.
643 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 01:29:39 ] ダンゴさんのレスがピシッと決まったな。
644 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 02:20:00 ] 643 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん
645 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 04:20:10 ] さすがダンゴさん
646 名前:デフォルトの名無しさん [2008/04/04(金) 11:12:12 ] 644 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん
647 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 11:15:58 ] >名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん これもあぼ〜んしとくわ
648 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 21:51:09 ] >volatileは最適化抑制 厳密には違うけどまぁ別にいいや
649 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 21:56:37 ] volatile は処理系には検知できない手段によってオブジェクトの値が変更をうける可能性がある場合に オブジェクトへの積極的な最適化を抑制するための処理系へのヒントである。
650 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 22:19:36 ] 1: int i; 2: i = 1; 3: i = 2; 4: i = 3; こうしたとき2行目3行目の代入された数値は使われないので、最適化されて消される。 しかしデバイス制御などでiがデバイスのアドレスの場合、消されては困る場合がある。 こういう時、宣言の前にvolatileを付けたら最適化されないので意図した動きを得られる。
651 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 22:22:27 ] マルチスレッドかメモリマップド I/O で使うのが定番だな。
652 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 22:56:39 ] > マルチスレッド マルチスレッドでのvolatileについてはダンゴさんが一言ありそうだ
653 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 23:02:50 ] クリティカルセクション自身も volatile にするだろ?
654 名前:デフォルトの名無しさん mailto:sage [2008/04/04(金) 23:04:19 ] フラグ程度なら害はない。
655 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 00:15:04 ] volatileで万全!
656 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 00:16:34 ] double-checked locking とか泥くせえよなあ
657 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 06:42:33 ] メモリオーダリングはしょうがない。volatileは悪くない。
658 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 09:05:07 ] もう -O0 でいいじゃん。
659 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 09:41:28 ] -O0 で毎回メモリ読みに行くことは保証されてるのか?
660 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 09:52:28 ] それ以前に volatile では保証されてんのか? > 処理系へのヒントである。 とか書いてあるとちょっと不安なんだが。
661 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 10:01:27 ] 規格上はメモリアクセスは保証されない ターゲットにメモリが存在するとも限らないし
662 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 10:29:51 ] Java だと昔 volatile がちゃんと実装されてないとか聞いた事あったけど、 C/C++ でそういう処理系は聞いた事ないな。 inline や register みたいにヒント扱いだから 規格上はそのあたりの挙動は処理系依存なのかもしんないけど、 先ず心配しないでいいとは思う。
663 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 17:18:06 ] A8.2 型指定子によると | volatileオブジェクトについては、処理系独立な意味付けは行われていない。 とあるから安心していいのでは。
664 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 20:40:18 ] register を無視するコンパイラがあるように volatile を無視するコンパイラ程度はあってもいい気はする。
665 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 21:02:06 ] >>664 volatileを無視するコンパイラは最適化禁止だな。
666 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 21:10:12 ] 特に最適化しなければ volatile だから 全て volatile なコンパイラはあっても volatile 無視するコンパイラは少なそうか?
667 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/05(土) 21:18:00 ] 元の意味が「揮発性」だっけ。 規格準拠をうたうコンパイラで、そういうのは聞いたことはない。 まあ、そういう処理系を作ろうと思えば作れるんじゃないの?
668 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 21:30:53 ] こうですか? #define volatile
669 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/05(土) 21:35:44 ] __declspec(align(32)) みたいなのを規格化してほしーな
670 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 21:37:09 ] アラインメント関連は C++0x にもう入ってるだろ?
671 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/05(土) 21:44:14 ] どっちかというとCに入れて欲しいんだが
672 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 21:45:40 ] それは確かにw
673 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 22:05:57 ] ダンゴさんの書き込みへのレスのすばやさは宇宙一とおもわれるほどだな
674 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/05(土) 22:11:24 ] 673 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん
675 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 22:14:57 ] メモリバリアはcpuか評価環境で変わってくるんじゃないの? ほとんどosにそれを通知するような機構があると思うんだけど。 javaのvolatileはそれを保証するものになるらしいが。
676 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 23:14:20 ] 本当に意味のある最適化が仕様的に禁止されてる言語に対して何期待してるんだ? 実質的に高級アセンブラじゃん, 言語仕様が…
677 名前:デフォルトの名無しさん mailto:sage [2008/04/05(土) 23:58:13 ] なんか、また変なのが涌いてきたぞ...
678 名前:デフォルトの名無しさん mailto:sage [2008/04/06(日) 22:59:17 ] まぁマテ、じっくり話を聞いたらなんてこたぁない普通の話かもしれん。 聞きたかないが。
679 名前:デフォルトの名無しさん mailto:sage [2008/04/07(月) 07:19:16 ] ポインタがあるせいで禁止される最適化の話じゃないのかな?
680 名前:デフォルトの名無しさん mailto:sage [2008/04/08(火) 00:27:34 ] >>666 gccに-fvolatileと-fvolatile-globalってオプションがあったらしい。 前者はポインタからの間接参照、後者はグローバル変数の参照を 全てvolatile扱いするというもの。 見付けたドキュメントは古そうなのだったから、 最近のgccにもあるかどうかは知らないけど。
681 名前:デフォルトの名無しさん mailto:sage [2008/04/20(日) 16:08:47 ] スレが静まり返ったな
682 名前:デフォルトの名無しさん mailto:sage [2008/04/20(日) 20:27:33 ] 組み込み行きたい、.net開発とかいやだよもう
683 名前:デフォルトの名無しさん mailto:sage [2008/04/20(日) 20:39:41 ] >>682 私と一緒に働きましょう! 就職フェアでお待ちしてます。
684 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 01:48:52 ] 後置インクリメント/デクリメントなんて消えればいいのに
685 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 01:51:04 ] 消えてるし
686 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 01:59:31 ] 後置インクリメントを使ってるソースは消えればいい 特にパラメータ化された型のインスタンスに対して使ってるやつ
687 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 11:15:41 ] 一時オブジェクトが必要になるしな。
688 名前:後置インクリメント mailto:sage [2008/04/21(月) 12:57:17 ] わたしのこと、そんなに嫌い・・・?
689 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 17:35:02 ] むしろ後置の動作が前置になって前置がなくなればいいと思う
690 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 19:52:26 ] それもそうだな。
691 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 20:20:52 ] >>683 もう働いてるんだって、前は自動車のOSとかやってた
692 名前:デフォルトの名無しさん mailto:sage [2008/04/21(月) 21:06:12 ] >>691 最近だとトヨタさんががんばってるみたいだけどあれどうよ?
693 名前:683 mailto:sage [2008/04/22(火) 00:09:19 ] あー、うちの課の私の隣のチームがトヨタさんのシステムやってますね。 # 私は非組み込み。
694 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 20:25:12 ] 実際他社のそれってあんま知らない というか正直1年もいないで他のチームいったからな あの数ヶ月は楽しかった Javaを経てそっちいって今は標準化()わらいチームだ
695 名前:デフォルトの名無しさん mailto:sage [2008/04/22(火) 21:36:24 ] むしろ標準化の方がよっぽどいきたくないな、いい会社ならやりがいありそうではあるが・・
696 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 12:07:43 ] 自分のソースを貼ったら最適化してくれるスレってある?
697 名前:デフォルトの名無しさん [2008/04/27(日) 12:18:53 ] 張ってみ
698 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 14:07:48 ] 貼るなら普通にSourceForgeとかに置いて、 その辺のスレで添削のお願いとかした方がいいんじゃね? 運が良ければバグとか直してくれる暇人とか来るだろうし。
699 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 14:11:20 ] >>696 数学板とかいくとアルゴリズムレベルで最適化してくれるが # 早い話、俺はどこまでアフォなのかを教えてくれる
700 名前:デフォルトの名無しさん mailto:sage [2008/04/27(日) 14:52:19 ] 2次元拡散方程式の最強のコードを教えてください
701 名前:デフォルトの名無しさん mailto:sage [2008/04/29(火) 04:53:20 ] >>700 貴方がこれから知ったことをすべて教えてくれるのなら...
702 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 18:04:29 ] >>700 ちょっと調べて見たけど、隣り合うところとしか計算しないから 並列化することで計算速度はあがりそうに思える。 しかし単純にスレッド化しても、パフォーマンスがあがるわけではない。 なぜならCPUのキャッシュにヒットするかどうかが鍵になるので キャッシュ漏れが発生するような並列化をしてしまうと ペナルティが発生してしまうためである。 またL2キャッシュ漏れが発生して当然というぐらい大量の要素数について 計算するのであれば、並列化することで高速化は図れると思うが やってみないとわからないし、環境に依存する。 よって最強を求めるならば 要素数や初期条件で最適化は変わるのは当然なので 何がやりたいかちゃんとかかないとだめ。
703 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 18:30:26 ] 最強 == 汎用 汎用 != 最強
704 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 18:52:26 ] キャッシュ漏れってなんだ?
705 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 18:59:10 ] キャッシュミスのことかな?
706 名前:ヽ・´∀`・,,)っ━━━━━━┓ mailto:sage [2008/04/30(水) 19:54:07 ]
707 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 22:42:56 ] >>702 「ラムダ持ち上げとかやって本当にグローバルに取らなきゃいけない変数は まとめて局所的に集約した形でヒープに、そうでない変数はスタックに取る」 とか 「計算方法と使用可能なリソースを分析して配列自体の要素のならびを スパースに取る(CPU n 個いれば, キャッシュラインサイズ * n で集めら れるように配列を配置しておいて, N スレッドに自動配分する」 ってのが、賢いコンパイラ 高級アセンブラの C とか C++ とかは上記のような最適化を許されない言語 仕様が結構あると思うんだが… # 結構がんばってるんだけどな, 大規模並列用の C コンパイラ # だけど fortran とか, チューニングされた lisp 系言語には負けてるよな
708 名前:デフォルトの名無しさん mailto:sage [2008/04/30(水) 22:53:26 ] 下手に最適化しすぎるとgccに対するLinusみたいにボロクソ言われるしな。 言語仕様として低レベルと高レベルを同じ次元で扱ってるのが問題。
709 名前:デフォルトの名無しさん mailto:sage [2008/05/01(木) 00:28:06 ] スピルアウト?
710 名前:デフォルトの名無しさん mailto:sage [2008/05/01(木) 00:29:48 ] 誤爆