[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 09/08 07:40 / Filesize : 264 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

AviUtl総合スレッド51



971 名前:BS [2008/12/23(火) 22:27:30 ID:qfqIdVCu0]
>>945
まずアセンブラレベルで使えるようになること。
Instric命令で作るときにも無駄の無いコードが書けます。

私の場合、まずMMXの頃にキュービック法静止画拡大プログラムを書いたりしました。
そのときにMMXのプログラム本を参考にしたのですが、今からやるならインテルのサイトから
IA32アーキテクチャのドキュメントを落としてきましょう。SSE3までなら日本語版のものがあります。

『IA-32 インテルR アーキテクチャ・ソフトウェア・デベロッパーズ・マニュアル』
上巻:基本アーキテクチャ(資料番号253665-013J)
中巻A:命令セット・リファレンスA-M (資料番号253666-013J)
中巻B:命令セット・リファレンスN-Z (資料番号253667-013J)
下巻:システム・プログラミング・ガイド(資料番号253668-013J)

下巻は特に必須ではありません。

後は他人のプログラムを見たほうがいいです。自分の得意なジャンルで等価の非SIMDコードと比較したりします。
参考本は単なる命令セットの羅列に終わったり、需要が少なく高価だったりしますのであまりお勧めしません。

単にSIMD化しただけでは早くならない場合もあります。データ構造を変えたり16バイトアラインメントに気を使ったりします。
warpsharp mtの場合も最も重いInterpolateCubicで単にSIMD化しただけでは早くならずいったん浮動小数点を経由させ計算数を減少させたりしています。
不要な条件分岐を減らすなどの通常の最適化テクニックも必要です。

SIMDが世に出てからしばらく立ちますが最適化が出来る人はなかなか増えません。ぜひ、習得してください。






[ 続きを読む ] / [ 携帯版 ]

全部読む 前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<264KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef