[表示 : 全て 最新50 1-99 101- 201- 301- 2chのread.cgiへ]
Update time : 05/09 17:17 / Filesize : 84 KB / Number-of Response : 360
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

インテルC++コンパイラ9.0発表!



1 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 00:54:56 ]
結構前からインテルのFTPサイトからダウソ出来たがようやく正式に出荷だ。
8.0と8.1は糞だったが9.0は実行速度もアプし、コンパイル時間も短くなった。
インテラーな人は来いノシ

2 名前:デフォルトの名無しさん [2005/06/16(木) 01:15:32 ]
そんなエサで俺様がクマー(ry

3 名前:デフォルトの名無しさん [2005/06/16(木) 01:20:23 ]
あどきぼん

4 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 01:29:26 ]
AMD C++ コンパイラ1.0発表
www.amd.com/us-en/Processors/Develop/compiler/download.html

5 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 06:05:50 ]
>>4
Not Foundだが

6 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 10:17:03 ]
>>4
Not Foundだが!!

7 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 12:30:30 ]
安藤はコンパイラは作らないよ

8 名前:デフォルトの名無しさん [2005/06/16(木) 12:35:45 ]
pc.watch.impress.co.jp/docs/2005/0615/intel.htm

9 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 12:45:58 ]
AMD Core Math Library (ACML)
ttp://developer.amd.com/acml.aspx

10 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 12:56:17 ]
7.0購入組みだが、9.0も無料でアップグレードできるとは。
メール着てびっくり。



11 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 16:23:16 ]
効果あった人いる?
速くなったとか小さくなったとか

ためしたところ速度は8とほとんど変わらない。
吐き出すexeは相変わらずでかいし、その割りに速度はVCシリーズ
とトントンかチト負けてる。

もうちょっと頑張って欲しいんだが、使い方が悪いのかな…?



12 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 16:48:31 ]
VC6だとオバカなので IntelCの方が断然早いけど、VC7は賢いのでそんなにかわらない。
でも DualCore に対応したのが大きいと思う。。

13 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 17:10:06 ]
VC8とどっちが賢い?

14 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 18:20:02 ]
VC8のほうが賢いと思う(こっちはまだバグがあるけど)

>でも DualCore に対応したのが大きいと思う
これはどんなアプリで速くなる?(今までのHT対応の
うたい文句とは別のことをするの?)



15 名前:デフォルトの名無しさん mailto:sage [2005/06/16(木) 23:29:18 ]
AMDプロセッサにも対応しましたね。
というかIntelチェックをはずしただけか。

16 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 09:12:23 ]
それは評価できるな

17 名前:デフォルトの名無しさん mailto:age [2005/06/18(土) 14:44:51 ]
だれかインテルコンパイラのすばらしさを語ってくれ。


18 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 17:38:40 ]
MSCってSSEのパック命令を吐いてくれる?
IntelC++は使ってくれるけど。

19 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 17:58:01 ]
>>18
よく知らないけどVC(MSC?)ではSSE関係のビルトインは使ったことは無い。
そもそも無いのかもしれない。

VCでSIMD使いたかったら_asmで直に記述だけど、
ICのSSEビルトイン命令は_asmよりもいいことある?


20 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 18:25:38 ]
>>19
iclはSSEを意識してプログラミングしなくても、必要とあれば勝手に
SSE命令を使ってくれるんじゃなかたっけ?



21 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 18:38:03 ]
>>20
それはVC7,8にもスイッチある。/arch:sse だったっけ?
体感できるほど実感はなかったけど…。

ICの/Qxオプションで体感するほど性能アップを感じた人いますか?



22 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 18:41:23 ]
VC++7.0(.NET 2002)には無いぽ
/Qxオプションよりも/Qaxオプションの方が良いぽ


23 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 18:55:50 ]
>>21
自作プログラムはほとんど速度を要求しないものばかりで
体感云々は感じないけど、姫野ベンチとかはある程度効果があったよ。

icl 9.0 EM64T(-QxW -Qipo -O3)とcl 8.0 x64(-O2 -favor:AMD64)で
10%強くらいの違い。

24 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 18:57:10 ]
よくわかってないんだけど、IntelC++コンパイラって
Linuxでしか使わなくていいよね?Winなら現行と次のVCあれば問題ないよね?

25 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 19:01:27 ]
TK2003のVC7には/arch:sse,sse2オプションあるよ。

>/Qxオプションよりも/Qaxオプションの方が良いぽ
/Qx /Qax どっちも性能アップを体感できなかった… Qaxは動作する
CPUを選ばなくなる代わりに、事前判別のオーバーヘッド&EXEがでかく
なるデメリットあるよね? まあ、どっちにしろ早くならないわけだが。

いままでSIMD系を自動で利用する機能で効果あったためしが無いんだわ。
VC,ICともに。

そもそも_asmで直にSIMD書いても、相当がんばって命令順序の最適化を
やらないと大抵はCのSIMD無しのコードに負けちゃう。(それだけ
通常のコンパイル結果が優れているんだろう)

まあだからこそ手作業で、コンパイル結果より高性能なSIMDのコードを
書き上げることは価値があるんだけどね。

SSE,SSE2を自動で使って幸せになった香具師、語ってくれ!



26 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 19:15:40 ]
>>23
32bit版キボンヌ

27 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 19:21:17 ]
>>24
ICはVCほど高くないし(余計なもの付いてないし)、性能出るなら
導入したいと思ってるんだが、あんなにでかい&VC比で大して速く
ないじゃあしょうがない…

インテルのサイトにIC導入で幸せになった企業の成功談義が載ってる
の見たことあるけど、ほんとかよって感じ





28 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 19:45:35 ]
>>26
WinXP x64、Opteron246、姫野ベンチの配列サイズはMiddle。

MSC Version 14.00.50215.44 for 80x86

 /O2        687.5[MFLOPS]
 /O2 /arch:SSE /arch:SSE2 407.5[MFLOPS]

ICC Version 9.0 Build 20050430Z Package ID: W_CC_P_9.0.019

 /Qipo /O3     877.6[MFLOPS]
 /Qipo /QxW /O3  1021.6[MFLOPS]

icl9.0、AMDに対応という割には/QxNが相変わらず使えないんだが。

29 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 20:12:50 ]
>>28
>/O2 /arch:SSE /arch:SSE2 407.5[MFLOPS]
VCだとSSE2使って性能落ちるんかい!

ICが優秀な場合もあるんだねえ〜。あ、でもICにipo(グローバル最適化?)
つけるんならVC8にも/GL,/LTGCつけてあげてよ。

さらにガイドオプティマイズ組み合わせればSSEはともかく結果ひっくり返るかもよ。


30 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 20:46:12 ]
>>29
MSC Version 14.00.50215.44 for 80x86

 /O2 /GL  689.7[MFLOPS] (/LTGCは無いみたい)

ちなみにVC6(Version 12.00.8804)
 
 /O2     880.5[MFLOPS]



31 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 20:56:51 ]
>>30
/GLはコンパイル時に、/LTGCはリンク時に付けます(両方必要)

ただ、IDEのプロパティからプログラム全体の最適化でリンク時のコード生成を
選んだのならどっちもついてると思う。

>VC8 /O2 /GL  689.7[MFLOPS]
>VC6 /O2     880.5[MFLOPS]

何かが間違ってる気もしますが、こちらの実感としても
VC6のサイズオプティマイズ(O1)が一番バランスいいという
ケースもあるので、プログラムの性質によってはそういう
結果になるのかも…うーむ。

EXEのサイズはやっぱりICの方がかなり大きい?


32 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 21:24:37 ]
> MSC Version 14.00.50215.44 for 80x86
これって何についてくるコンパイラ? VS2005?

33 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 21:36:20 ]
>>32
VS2005ベータ2


34 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 21:44:16 ]
ICCは実行ファイルでかい。かなりインライン展開とかループの
アンロールとか多いのではなかろうかと思っている。

ところでICC9.0ってANSI/ISO C++に完全準拠したの?以前は説明に例外事項
が出ていたけど9.0のマニュアルにはそうしたことは出てないんですが。

35 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 21:51:13 ]
とりあえずドライストーンをコンパイルして試そうぜ。
イソテルとマイクロンフトの結果も出てるから比較しやすいじゃんぐ。
ttp://pcweb.mycom.co.jp/special/2005/compiler/menu.html

36 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 22:19:58 ]
>ttp://pcweb.mycom.co.jp/special/2005/compiler/menu.html

この記事大丈夫か? ICCがVC必須とかデバッガがIDE上で動くとか
平気で書いてるが…

ベンチマークもいいけど、皆の作成している、現実的な状況での
有用性を知りたい。



37 名前:デフォルトの名無しさん mailto:sage [2005/06/18(土) 23:46:36 ]
Windows版は文字通りコンパイラだけでリンカが付属してないから少なくともVC++が必要だぞ。

38 名前:デフォルトの名無しさん mailto:sage [2005/06/19(日) 00:08:52 ]
>>37
xilink6.exeはリンカじゃなかったのか…?

Qipoの面倒だけ見て後はVCのリンカへ丸投げか。

まあ、今はMSからVCただでダウンロードできるからいいのか。



39 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 10:35:27 ]
>>34
アンロールはデフォルトでオフになっているようです。

40 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 13:05:28 ]
>>39
じゃあ何であんなにでっかいんでしょうねぇ?

下手するとVCのデバッグビルドにも匹敵するような
大きさのEXEを吐かないか?




41 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 13:58:56 ]
サイズは少々でかくても速ければいいんだが、
VC++に比べて今一つなんだよなぁ。

42 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 15:06:56 ]
でかさを相殺するほどは早くないんだよねえ。
VCに負ける場合もあるし(っていうかICが勝ってる実感ほとんどないんよ)

ならばHTやマルチプロセッサ環境(ICの得意分野?)で圧倒的に
役に立ってるよ!って香具師いたら、リポートキボンヌ


43 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 17:16:24 ]
>>40
でかいって、10倍や100倍になってしまうの?
倍くらいの大きさで速くなるのなら別にいいと思う。

44 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 18:11:23 ]
>>39
デフォルトでQunrollですよ、8.1/9,0は。

>>43
倍にもならないです。プログラムによってICCが出力するファイルがMSCより
小さくなることもあります。

45 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 18:15:09 ]
さすがに10倍にはならないけど、VC++で120KB程度ならICCでは
340-400KBくらいにはなる。3-4倍くらいかな。それで10秒かかる計算が
9秒で終わるようになっても嬉しくないわけで、投資する価値があるかと。
ただ、小数計算が多いと整数並みに速くはなるみたいだから
そういう処理が多い人は効果を実感できるんじゃないかな。


46 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 18:25:22 ]
>>43 >>44
各種最適化オプション(高速化のため)を組み合わせると
VCの2〜3倍、ものによっては4倍近くならない?

>倍にもならないです。プログラムによってICCが出力するファイルがMSCより
>小さくなることもあります。
小さくなる事例は見たこと無いなあ…どのぐらいの規模なの?

こちらのはVCで600〜800KB(Ox,GLなど)がICで2MB(Qipo,Qax)近くなる
(デバッグ情報は含んでない、念のため)




47 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 19:55:21 ]
>>46
Qaxつかったらファイルサイズが大きくなるのは当たり前では?
2種類のコードが含まれるわけでしょ。

MSCのオプションを/Ox /GL、ICCを/Qipo /O3(SSE使わない)でコンパイルして
速度とファイルサイズを比較した方がいいとおもうけど。


48 名前:44 mailto:sage [2005/06/20(月) 20:20:48 ]
>>46
www5e.biglobe.ne.jp/~liquor/raytrace/
ここのソースをコンパイルしたらICCがMSCよりファイルサイズが
小さくなったのであのように書きました。

>47にならって、
ICC9.0 Build 20050430Z(/Qipo /O3)がファイルサイズ61440byte、実行時間942[ms]
MSC14.・・・(/GL /Ox)が90112byte、実行時間953[ms]

49 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 21:30:25 ]
>>47
こっちとしてはコンパイラの得意技使ってでも高性能たたき出して
欲しいんいだわ。サイズ2倍3倍になってもコンスタントに2割3割
速くなればうれしい状況もあるし。

Qaxはずしてサイズ縮まったとしてもVCと比べて似たような結果になるだけだ
ったらICを検討する価値ない。(確かに縮まるがVCよりはこっちのケースでは
数百キロでかい)

あと、Qaxをはずしたコードが早くなったらそれこそ笑っちゃうじゃない。
だからQaxをつけた状態でVCに比して速度的に? だったらIC何やってんの?
って思う。実際今そう。

>>48
検証ありがとう^^;
実行時間は1%じゃ誤差の範囲かなあ。吐かれたコードのキャッシュへの
たまたまの乗り具合で変動しちゃうこともあるし。

ファイルサイズについては良いですね。 総じてこういうケースなら
ICをサイズ最適化用のコンパイラとして評価することもできるんだけど、
いかんせんこっちのケースではどうしようもない。

ベンチじゃなくて、ご自身がご飯食べているコードで幸せになりましたか?
そういう生の声が聞きたい。





50 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 21:40:12 ]
>>48
www5e.biglobe.ne.jp/~liquor/raytrace/

ソース見てみましたが、これじゃサイズとして参考にならないと思う。
文句ばかり言って気を悪くしたらごめんなさい。

プログラムが小さすぎて、EXEにくっつくランタイムの大きさとかの差が
もろに出てしまってるのでは?

VC8のランタイムは、VC6,7(ICはこっちを使ってるでしょ?)に比べてかなり
大きいような気がする。




51 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 21:42:16 ]
Aviutlプラグインフィルタ自作していますが、VS2003付属のコンパイラ
より3割ほど速くなりました。

ICCはとてもいいコンパイラですね。

52 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 21:46:27 ]
>>51
指定オプションおしえて
あと、プログラムは浮動少数使いまくり?


53 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 21:59:49 ]
>>52
VSのオプション設定に加えたのは/fastだけ。

単精度使いまくりです。

54 名前:637 ◆jUbpU.TPuw mailto:sage [2005/06/20(月) 22:11:21 ]
Ogg Vorbisの最適化やってるけどサイズはGCCとICLではあまり差が出ない。
最もSSE最適化を使っているのでP3以上のCPU専用コードでビルドしていて
SSE非対応CPU用のコードを含んでいないせいかもしれない。
速度の方はやっぱりICLが速いけど手動SSE最適化を進めるとGCCとの差が短くなる傾向にある。
8.1と9.0では有意な速度差は見られなかった。


55 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 22:11:28 ]
それならそうかもね。


56 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 22:20:16 ]
>>53
プププレスコ?

57 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 22:41:14 ]
>>53
総じて

・でかい
・ある程度規模のあるアプリでは速度差はあまり無い
・浮動小数演算に向いている

かな。今のところ

>>54
>GCCとICLではあまり差が出ない。
GCCとICはどっちもVCよりかなりでかいとどこかで見た気がする。
LINUX?

>手動SSE最適化を進めるとGCCとの差が短くなる傾向にある。
それでもICLの方が早いの?

相当がんばれば手動SSEの方が早くなると思う。まあ、それやっちゃうと
ICはいらんがな。
SSE無しと比べてどのくらい早いですか?


58 名前:637 ◆jUbpU.TPuw mailto:sage [2005/06/20(月) 23:07:20 ]
24分59秒の曲をAthlonXP 1700+でエンコードした場合

GCC SSE最適化なし 2分53秒09 8.6657倍
GCC SSE最適化あり 2分31秒97 9.8700倍
ICL SSE最適化あり 2分29秒00 10.0667倍
GCC 手動最適化 1分28秒99 16.8555倍
ICL 手動最適化 1分18秒27 19.0533倍

GCCとICLの自動SSE最適化であまり差が無いのはAthlonでの傾向だと思う。
ICLの手動最適化ではプロファイラを使用した2パスコンパイルを実施している。

ICLは基本性能に加えて

小数点演算のSSE/SSE2によるレジスタオペレーション(GCCでもできる)
 ベクタライズ化

が優れているんだけどコンパイラによる自動ベクタライズ化では単純な処理しか
できなくてシャッフルを使ったデータの組み換えや条件分岐の置換などは無理。

VC7に関してはあまり使ってないのでよくわからないけど以前見た感じでは
SSEビルトイン命令の最適化が今ひとつだった。


59 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 23:13:15 ]
EM64T版でインラインアセンブラは可能ですか?

60 名前:デフォルトの名無しさん mailto:sage [2005/06/20(月) 23:17:37 ]
>自動ベクタライズ化では単純な処理
そうそう。出力見ていてベクトル化が成功したとか出ると
おおーっ、と感動したが、該当するソースを見てみると
なんだこれか、これはどうでもいいよ、みたいな。
簡単なものしか成功しないみたいだった。




61 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 00:13:53 ]
>>59
不可

62 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 02:02:10 ]
>>58
>GCC SSE最適化なし 2分53秒09 8.6657倍
>ICL SSE最適化あり 2分29秒00 10.0667倍

おお、早くなってますね! モノによっては効くんだ、ICLのSSE最適化。

VC8での性能も知りたいところだなあ。VC8はガイドプロファイリングオプティマイズ
がかなり賢いから、もしそういうの好きだったら競争させて見てはどうかな



63 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 07:10:16 ]
>>50
>VC8のランタイムは、VC6,7(ICはこっちを使ってるでしょ?)に比べてかなり

ICL、MSCともに同じコマンドプロンプト上で実行しているので
インクルードファイル、ライブラリともに同じものを使っていると思います。

64 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 10:56:19 ]
>>63
例えばレイトレベンチではなくて、

#include "stdio.h"

main(){
printf("hello");
}

だったら似通ったサイズになりますか?

さすがにこれだけだと、生成コードに大差は無いでしょうから。



65 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 11:05:28 ]
それだけ小さいと、main()以外のものが多すぎて比較にならない希ガス。

66 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 11:07:02 ]
リリースビルドで変更箇所/O1 /OPT:NOWIN98のみ
icc9.0:28672バイト
vc.net2002:27648バイト


インテルだめぽ
orz

67 名前:デフォルトの名無しさん mailto:sage [2005/06/21(火) 12:43:06 ]
>>65
>それだけ小さいと、main()以外のものが多すぎて比較にならない希ガス。

むしろそれが狙い。これやって大きさが変わるようなら、63殿の状況で
ICがVCとは違うものを引っ張ってきている可能性大

>>66
もしかして64に対する返信? ほとんど変わらないんだったら、
www5e.biglobe.ne.jp/~liquor/raytrace/
に対してはインテル優秀と言えるのでは。

何でだめぽなの?




68 名前:デフォルトの名無しさん mailto:sage [2005/06/22(水) 23:26:45 ]
ICL8.1(windows) を利用しているのですが sleep 文を使うとそんな命令はありませんと
怒られてしまいます。 intel compiler には sleep 文は無いのでしょうか?
もしくは適当なヘッダファイルを include する必要があるのでしょうか?
ご存知の方がいらっしゃいましたら、ご教授よろしくお願いいたしますm(__)m

69 名前:デフォルトの名無しさん mailto:sage [2005/06/22(水) 23:28:14 ]
>>68
<Windows.h>にはSleep関数がある。

70 名前:デフォルトの名無しさん mailto:sage [2005/06/23(木) 00:02:28 ]
スリープみたいな石鹸♪花王石鹸ホワイト♪



71 名前:68 mailto:sage [2005/06/23(木) 00:47:09 ]
>>69
ありがとうございます!Sleep を使用する事にします。

72 名前:デフォルトの名無しさん mailto:sage [2005/06/23(木) 12:23:48 ]
次の質問は、「Sleep(10)しても10秒止まってくれないのは何ででしょう」かな?

73 名前:デフォルトの名無しさん [2005/06/23(木) 13:21:01 ]
誰か、HTかマルチプロセッサ環境で、ループの自動並列化が
役に立った香具師いるかい?

どんなアプリかも教えてほしい


74 名前:デフォルトの名無しさん mailto:sage [2005/06/25(土) 19:12:33 ]
ICCを手放しでほめてるやつがいてきもいな

75 名前:デフォルトの名無しさん mailto:sage [2005/06/25(土) 22:53:57 ]
二日ぶりのレスがそれかよ〜

手放しでほめてるやつんなんていないんじゃない?


76 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 00:06:46 ]
>>74
よくわからんけど、君がキモイ

77 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 06:05:38 ]
athlon64などAMDのプロセッサで使用した際の最適化は他のコンパイラと比較してどうなのでしょうか?

78 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 10:16:27 ]
3DNow!叩かないからUnko
SSEはおまけ程度だし

79 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 10:37:46 ]
そこで PathScaleですよ

80 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 16:59:53 ]
久々に進んでると思ったら('A`)

>>76
ムキになるほど心当たりがあるってことだろ
釣られるんじゃね



81 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 17:59:00 ]
IA64スレでちとやってたけど、ICはVCと単純に入れ替えただけじゃあ
さほどうまみが無いという結論になりますた。

この上にある単精度演算の優位性と、あとは組み込みSIMD関数
を使った時の自動命令スケジューリングが命のようです。


82 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 18:26:01 ]
工作員が入り込んでいるようですね。

83 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 18:39:03 ]
VS2005 beta2手に入れたので、Apache2.0.54 Win32をビルドして
ab.exeで速度をはかってみました。
やり方はpc8.2ch.net/test/read.cgi/mysv/1048494944/

icc8.1と比べVS2005は12%ダウンですた。

>>82
君はどこの工作員?

84 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 18:50:01 ]
>>83
どっちもコンパイルオプションキボンヌ

85 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 19:01:51 ]
両方ともApacheに入っていた同じプロジェクトファイル使っていて
速度に関するオプションは/O2だけかと思います。

86 名前:85 mailto:sage [2005/06/26(日) 19:02:15 ]
>>84

87 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 19:43:55 ]
>>85
もし暇で面倒でなかったら、どちらも最大全力ガチンコ勝負させてみてくれい。
広域最適化やガイドオプチ、インテルの方はQax系も…めんどうだなorzわがままスマソ



88 名前:85 mailto:sage [2005/06/26(日) 21:00:53 ]
>>84
ごめん逆。12%アップの間違い。
iccとvsでapcacheのディレクトリをそれぞれ作ったんだけど
それぞれ逆のディレクトリにビルドしてしまったorz

89 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 21:43:51 ]
>>88
逆って……またひとつインテルだめぽ伝説がorz

90 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 22:10:32 ]
>>74
使ってもいないのに、文句たれているやつが一番キモイと思います。




91 名前:85 mailto:sage [2005/06/26(日) 22:16:49 ]
>>87
あまりにもプロジェクト数が多いので、オプション書き直すのが大変です。
すみませんが、ご自分でお試しください。

92 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 22:49:28 ]
8.1から9.0でほとんど違いはないけど、アセンブラ出力してみると
微妙に違う。依存関係のある演算はなるべく間をおくようになっている。
例えばこんな感じ。

addpsxmm2, xmm4
mulpsxmm2, xmm7
por  xmm3, xmm1

addpsxmm2, xmm4
por  xmm3, xmm1
mulpsxmm2, xmm7

CPUのスケジューラでやってくれそうなことだけど、効果あるのかな?

93 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 23:29:19 ]
>>92
効果があるなんてもんじゃない。

例えば手動で組むときもそれやんないとCの汎用ルーチンより
遅くなることも珍しくない

つーか今までやってなかったのか?

94 名前:デフォルトの名無しさん mailto:sage [2005/06/26(日) 23:31:35 ]
>>92
>>93は、オウトオブオーダーをCPUがやってくれたとしても
さらに効果あるよ、ということ。オレの実経験上の話だけど。

95 名前:デフォルトの名無しさん mailto:sage [2005/06/27(月) 02:23:09 ]

      ,.ィ , - 、._     、
.      ,イ/ l/       ̄ ̄`ヽ!__
     ト/ |' {              `ヽ.            ,ヘ
    N│ ヽ. `                 ヽ         /ヽ /  ∨
   N.ヽ.ヽ、            ,        }    l\/  `′
.  ヽヽ.\         ,.ィイハ       |   _|
   ヾニー __ _ -=_彡ソノ u_\ヽ、   |  \   
.      ゙̄r=<‐モミ、ニr;==ェ;ュ<_ゞ-=7´ヽ   > インテルのコンパイラが速いというのは
.       l    ̄リーh ` ー‐‐' l‐''´冫)'./ ∠__   アポーが写真屋の一部のフィルターの処理だけ比べて
       ゙iー- イ'__ ヽ、..___ノ   トr‐'    /    Pen4より速いと宣伝するのと同じくらい信用出来ないことなんだよ!
       l   `___,.、     u ./│    /_ 
.        ヽ.  }z‐r--|     /  ト,        |  ,、
           >、`ー-- '  ./  / |ヽ     l/ ヽ   ,ヘ
      _,./| ヽ`ー--‐ _´.. ‐''´   ./  \、       \/ ヽ/
-‐ '''"  ̄ /  :|   ,ゝ=<      /    | `'''‐- 、.._
     /   !./l;';';';';';';\    ./    │   _
      _,> '´|l. ミ:ゝ、;';';_/,´\  ./|._ , --、 | i´!⌒!l  r:,=i   
.     |     |:.l. /';';';';';|=  ヽ/:.| .|l⌒l lニ._ | ゙ー=':| |. L._」 ))
      l.    |:.:.l./';';';';';';'!    /:.:.| i´|.ー‐' | / |    |. !   l
.     l.   |:.:.:.!';';';';';';';'|  /:.:.:.:!.|"'|.   l'  │-==:|. ! ==l   ,. -‐;
     l   |:.:.:.:l;';';';';';';';| /:.:.:.:.:| i=!ー=;: l   |    l. |   | /   //
       l  |:.:.:.:.:l;';';';';';';'|/:.:.:.:.:.:.!│ l    l、 :|    | } _|,.{::  7 ))
        l  |:.:.:.:.:.:l;';';';';'/:.:.:.:.:.:.:.:| |__,.ヽ、__,. ヽ._」 ー=:::レ'  ::::::|;   7
.      l |:.:.:.:.:.:.l;';';'/:.:.:.:.:.:.:.:.:.|. \:::::\::::: ヽ  ::::::!′ :::|   .:/

96 名前:デフォルトの名無しさん mailto:sage [2005/06/27(月) 14:02:00 ]
3DNowとかAMD系の命令は使えますか?

97 名前:デフォルトの名無しさん mailto:mage [2005/06/27(月) 21:00:42 ]
9.0は警告が少なくなったような気がするが。

98 名前:デフォルトの名無しさん mailto:sage [2005/06/28(火) 22:09:50 ]
インテルのコンパイラに変えたら
20パーセントも速くなりました。
やっぱりハイパースレッディングに対応させたのが良いですね。
こんなに素晴らしいコンパイラを提供出来るインテルは
凄いと思います。

と、一度言ってみたい。

99 名前:デフォルトの名無しさん mailto:sage [2005/06/28(火) 22:20:42 ]
>>98
それチョウチン記事と一緒


100 名前:デフォルトの名無しさん mailto:sage [2005/06/28(火) 23:38:32 ]
>>98
一部ループが/Qparallelで90%ほど速くなりましたが。Opteronで








[ 続きを読む ] / [ 携帯版 ]

次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<84KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef