- 1 名前:デフォルトの名無しさん [2009/01/25(日) 02:16:01 ]
- 前スレ
cellプログラミングしちゃいなよ3 pc11.2ch.net/test/read.cgi/tech/1215388508/l50
- 178 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/03(火) 05:16:14 ]
- 言ってる意味がわからん。
dpの配列の実体はダレが決めるの?君以外が決めるの? 君が自由に決めることができるなら、その配列に、alignオプションを指定しておきなさい。 自由にならないのなら、交渉しなさい。 駄目なら、そこではじめてミスアラインロードを検討すればいい。 __attribute__((aligned(16)))という指定は、配列の定義を指定された通りにデータを配置されるというもので 元々あるデータ配置を移動するものではない。 ポインタにalignやってもポインタ型が16バイト境界に配置されるだけで 実体は実体の定義通りに配置される。
- 179 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/03(火) 05:17:08 ]
- ポインタ理解してないのにSIMDとか無茶ですから
- 180 名前:デフォルトの名無しさん mailto:sage [2009/02/03(火) 05:31:20 ]
- なんだかんだ言って親切だな。
- 181 名前:デフォルトの名無しさん [2009/02/03(火) 05:34:33 ]
- ありがとうございます。
meschachというライブラリの中のループをSIMD化しているところなんです。プログラム自体をあまり理解してなくて。。 あと、また質問なのですが、SPEプログラムで実行時間を測りたい場合って、SPU Decrementerでprof.star()とかやるしかないですか? これってCELLシミュレーター上でしか使えないですよね? #include <time.h>でclock()とか使ってみたんですけど(ps3上で)、エラー出たので、サポートされていないのかなと。 よろしくお願いします。
- 182 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/03(火) 05:38:35 ]
- time.hは使えない。
SPU DecrementerはPS3やSpursEngine上のSPU実機でもつかえる。
- 183 名前:,,・´∀`・,,)っ-○◎● mailto:sageツンデレですが何か? [2009/02/03(火) 05:43:55 ]
- >>180
ば・・・ばか!だんごやさんはもっと殺伐としてるべきなんだよ!!!!11111
- 184 名前:デフォルトの名無しさん mailto:sage [2009/02/03(火) 05:47:30 ]
- え、PS3上でも使えるんですか!?何でエラーが出るんだろう…。涙
ありがとうございます。
- 185 名前:デフォルトの名無しさん mailto:sage [2009/02/03(火) 08:05:13 ]
- 根本的にスキルが足りてない気がするが……
ツンデレ団子がフォローしているから任せておくかw
- 186 名前:デフォルトの名無しさん mailto:sage [2009/02/03(火) 11:44:22 ]
- 団子さんはherumi氏を超えた!
- 187 名前:デフォルトの名無しさん mailto:sage [2009/02/03(火) 19:40:21 ]
- しかもはるか斜め上!!
- 188 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 13:55:16 ]
- ダンゴさんのネタ切れでスレが沈静化したな
- 189 名前:デフォルトの名無しさん [2009/02/05(木) 14:24:50 ]
- 荒らすな。団子のせいにするな。
- 190 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 14:55:40 ]
- んじゃネタ振り。
「任意の n に対し O(1) 解は存在し得ない。」 がんばって O(n) 最適化しよう。
- 191 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 15:07:57 ]
- o(n)とO(n)が別物と最近知った俺には
ちょとむつかしすぎる問題だ
- 192 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 15:08:52 ]
- 正直現状で構わん。やってたこと荒らしと変わらないし。
>>190 n<=INT_MAXに限ればあり得るだろ?速度はさておき。
- 193 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 15:09:06 ]
- そこはO(log(n))解を探せよチキン
- 194 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 15:25:55 ]
- おしまい
- 195 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 15:54:06 ]
- O(n)に実質的に落ち着くんじゃないの?
- 196 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 16:09:43 ]
- ×O(n)に実質的に落ち着くんじゃないの?
○>>195がO(n)のロジックしか思いつかない
- 197 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 16:39:07 ]
- 俺はO(n)で優勝する気満々だからおk
- 198 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 16:39:47 ]
- ヒントを書かせようとしてる奴がいるな。
そんな奴はもう参加賞で我慢しる。
- 199 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 16:55:41 ]
- >>197
無理だね。 気づいた人もいるだろうけど、O(n)を切るロジックは、ある。
- 200 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 17:07:23 ]
- どうしてもCellっぽく書けない・・・
これじゃまるでHack the MTだ。orz
- 201 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 17:11:20 ]
- なんか、13 も切ったしトランザムも(多分)解ったんだけど、なんか飽きちゃったw
- 202 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 17:17:25 ]
- ぶっちゃけCell自体に飽きた。
IntelのCtプログラミングの資料見つけたけどこれかなり面白い。 なによりC++ベースってのがよい。 CUDAやOpenCLよりよっぽど直感的に組める。__device__とか__gloval__とかアホか!
- 203 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 17:45:28 ]
- 話を逸らし始るくらいなら帰れ。
- 204 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 19:08:06 ]
- Frameworkの話なんだけど。理解できない奴は帰れよ。
CellをOpenCL対応させようとしてるのくらい知ってるだろ?
- 205 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 19:12:26 ]
- SpursEngineで遊ぶかな
- 206 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 19:13:42 ]
- ところでCt使うと1000×1000の行列の逆行列が求められたりするわけ?
- 207 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 19:21:20 ]
- なんじゃそりゃ?
Intel CPUでできることは一通り出来ると考えて良いんじゃね? 仮想アドレッシングをデフォでメモリの制約は プログラミングのノリとしてはThreading Building Blocksをもっと発展させたものって考えればいい。 見た目テンプレートベースのコンテナ、中身SIMD×マルチスレッドかな。 んで、中間言語がx86ベースで、ネイティブコードもx86。Intelベッタリ。 IntelのIntelによるIntel CPU/Larrabeeのための言語。
- 208 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 19:22:16 ]
- 投稿ミス
×仮想アドレッシングをデフォでメモリの制約は ○仮想アドレッシングをデフォでサポートするからメモリの制約は基本的に無いと思って良いと思う
- 209 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 19:38:12 ]
- 要はFortranのベクタ演算の自動SIMD化っぽいものをC++でも出来るようにって事?
その程度のtemplateベースライブラリなら自作のがあるからなあ。 コンパイラの自動ベクトル化よりかは小回り利くけど アドレスが単調増加しないような複雑なことをやろうとするとやっぱりOpenCLみたいな方がいいと思う。 ってOpenCL使ったことないで言ってる。 でもCtに関しては古い記事一つしか読んでないけど、仮装アドレッシングじゃなくて疎行列をサポートするって話じゃないの?
- 210 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/05(木) 19:46:42 ]
- 仮想アドレッシングはx86自体が持つ機能なので言語処理系でどうこうの問題じゃない。
VRAMが足りなくなればメインメモリやHDDにスワップということも理屈の上では可能ってこと。 結局はドライバに縛られるわけで、どこまでやるかは知らないが。 疎行列ねぇ。 それっぽいハードウェア機能はあるけど・・・。 CtはC/C++じゃなくて中間コードを吐く言語処理系だからC/C++の考え方はちと違う可能性はある 動的な再構成が可能って点ではネイティブのC/C++より優位性があるかもしれない。 SIMDが128ビットだろうが512ビットだろうが、1コアだろうが16コアだろうが Ctのランタイムが動く限り、コアを有効に使うことが出来るって意味で。 CellでもSPMDのフレームワーク出てたよな?MARSだっけ? ちと性能的にイマイチなんだが。。。
- 211 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 19:49:25 ]
- >>209
密はダメか?
- 212 名前:209 mailto:sage [2009/02/05(木) 19:56:44 ]
- >>210
とは言っても新しいベクタ長が出たらSIMDの基底型クラス追加するだけだし。 templateだから外側の配列クラスには影響しない。 当然多くの人にはそれが面倒だろうから助けにはなるだろうけど。 >>211 いや仮想アドレッシングをサポートするなら問題ないよ。 でもそうじゃないんじゃないの?ってだけ。 そうすると32bitプロセッサでは科学計算に使うようなばかでかい配列は用意できない。 メモリ4GB搭載も珍しくなくなって、OSも64bit版乗せるメーカーが出てきてるから 頑張って仮想アドレッシングをサポートしなくても 案外64bitへの移行は唐突にやってくるんじゃないかという気もしている。
- 213 名前:209 mailto:sage [2009/02/05(木) 19:59:51 ]
- > 助けにはなるだろうけど。
「Ctの存在は」が抜けた。
- 214 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 20:36:41 ]
- あー、ここでCtの話が始まってしまったか。
Intel某氏によると、CtのI/Fのオープン化を検討しているとか話があるようだから、 CellでもPLAでもなんにでも載せられる可能性はあるだろうね。 アーキテクチャごとに一一移植して調整すること考えたら楽になるよ。
- 215 名前:デフォルトの名無しさん mailto:sage [2009/02/05(木) 21:11:17 ]
- Ct を Cell に移植して調整するのはだれが?w
- 216 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/06(金) 01:40:40 ]
- まあ、「Microsoft Visual Ct」が出てくるだけだと思ってるわけだが。
>>213 現時点ではLarrabee上でマイクロOSなるものが動くことが明言されてる。 インオーダでSIMDバリバリやる以上は、論理レジスタ16本くらい最低限欲しいから、 最初から64ビットになるんじゃないのかな。 ホスト上のOSとカード上のOSは基本的にメモリ空間が独立しててドライバ経由での通信になる。 このへんはフィックスターズの売ってるぼったくりCellカード上でYDLが動くのと同じ理屈かと。
- 217 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/06(金) 06:16:36 ]
- 困ったことに、PS4はGPUにLarrabee採用なんて噂が・・・
- 218 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 07:30:58 ]
- んな話聞いたことねえよ。
中の人がお前にそう言ったのかもしれないし実際乗るかも知れないが、どう考えても(お前の/中の人の)脳内妄想の域。 開発するからにはあらゆる方法でスピードとコストバランスを検討するのは当然だから その程度の噂でいいなら俺だっていくらでもホラ吹けるぜ。
- 219 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/06(金) 07:33:25 ]
- www.theinquirer.net/inquirer/news/851/1050851/intel-design-playstation-gpu
↓ www.techradar.com/news/gaming/sony-shoots-down-intel-gpu-in-ps4-rumours-525563 ↓ www.realworldtech.com/forums/index.cfm?action=detail&id=96090&threadid=95504&roomid=2←今ここ
- 220 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 07:49:00 ]
- 団子って、結構面白いところに居そうだよな。
そういうところに居る人間と居ない人間では触れる情報が全然違うんだから、 妄想だのなんだの言うだけ野暮。
- 221 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/06(金) 07:59:48 ]
- 居そうにみせかけてるだけで実は人一倍情報収集してるだけだったり。
Intelの開発者向けサイトなんて宝の山だぜ。
- 222 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 09:05:26 ]
- Cellってもう4年位前のCPUなんだな
最新のCPUと戦い続けるのは無理があるだろうに 新型Cellとか出る気配もないしFixstarsこれからどうするつもりなんだろうなぁ
- 223 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 09:11:19 ]
- Power ISA 2.06
www.power.org/resources/downloads/PowerISA_V2.06_PUBLIC.pdf POWER 7に搭載されるVSXが追加 AltiVecの256bit拡張とか10年近く前から噂だけはあるけど全然見えてこないな。
- 224 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 10:07:09 ]
- 1337ページってすごいな
- 225 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 12:30:50 ]
- Intel will design PlayStation 4 GPU
www.theinquirer.net/inquirer/news/851/1050851/intel-design-playstation-gpu これが本当になったらfixstarsどうするの? Cell専門って既に強みじゃないような気が・・・
- 226 名前:デフォルトの名無しさん mailto:sage [2009/02/06(金) 20:10:16 ]
- >>216
独自拡張の Visual Ct/CLI ですね、分かります
- 227 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 03:30:32 ]
- アンローリング無しで20倍
HTC開始から40日。やっとここまでこれたわ
- 228 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 16:15:27 ]
- >>225
MPUとGPUとは別にCell搭載するんじゃないの?
- 229 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 16:25:38 ]
- sonyはCELLの為に工場作ったし、そう簡単にcellは捨てないだろう。
- 230 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 16:32:51 ]
- 団子より速そうな人のブログ見つけた。
チェックサムチートはしてないっぽいけど 結果が凄すぎて何やってるか想像つかない
- 231 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:09:24 ]
- そのblog教えてください。
- 232 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:22:46 ]
- 近頃の奴は・・
ぐぐって探せカスが・・ つ"hack the cell" それでも見つけられないならもう一度書き込め
- 233 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:34:07 ]
- みつからねーよ
教えろ、このヤロー
- 234 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 17:44:20 ]
- お前の書き方が気に入らないので教えない
1/31だ
- 235 名前:227 ◆eZQcaIaFJs mailto:sage [2009/02/07(土) 17:56:19 ]
- インラインアセンブラ無しで9.5cycleって神がかってるような…。
- 236 名前:227 ◆eZQcaIaFJs mailto:sage [2009/02/07(土) 18:04:10 ]
- ちなみに、Tempering+加算を「まじめに」やると11cycleかかるので、
トランザム組確定っぽいですな。
- 237 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 18:52:25 ]
- >>234
ヒント
- 238 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 19:25:18 ]
- >>237
235は自分でたどりつけたぞ。 お前もやれば出来るはず。 hack the cell でググレば50件以内には出てるぞ
- 239 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 20:45:22 ]
- ききっくすさんとかはまちさんとかその辺の人ことじゃないかなぁと予想
- 240 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 22:13:06 ]
- トランザム組かそうじゃないかは処理時間/処理数の切片を見れば大体分かる
235のは概算で3000ticks位かかってるからトランザム組とみていいんじゃね
- 241 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 22:15:21 ]
- >>236
なんか11である根拠とかあるのか? 15や13の壁だって破れるまではそこそこかかったはずだけど と言いつつ俺は普通のやり方じゃ11.5も割ってないけど
- 242 名前:227 ◆eZQcaIaFJs mailto:sage [2009/02/07(土) 22:27:23 ]
- >>241
y ^= (y >> 11); // 2 y ^= (y << 7) & 0x9d2c5680UL; // 3 y ^= (y << 15) & 0xefc60000UL; // 3 y ^= (y >> 18); // 2 r += y; // 1 なもんで、11cycle切ってればトランザム組と判断してます。
- 243 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 22:38:42 ]
- >>229
東芝に売却したような
- 244 名前:デフォルトの名無しさん mailto:sage [2009/02/07(土) 23:22:19 ]
- セカンドガレージってブログは団子さん家だったと思う。ちがったっけ?
- 245 名前:,,・´∀`・,,)っ-●◎○ mailto:sage [2009/02/08(日) 04:07:27 ]
- >>242
そこも削れるだろ厳密に言えば
- 246 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 07:05:27 ]
- むしろtemperingを59命令未満にする方法を考えないと
- 247 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 09:04:32 ]
- なんで「second」なんだろうな?
たぶん、中の人の本サイトが別にあるからだと思うけど
- 248 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 09:26:26 ]
- >>229
あそにおると事件で有名な諫早のFabだろ? 既に東芝に1000億で売っちゃったよ。資金繰りに困って損切り。
- 249 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 09:55:18 ]
- 東芝も高い買い物したよなぁ。
- 250 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 10:06:23 ]
- ソニーからすれば減価償却考えても1000億は安すぎるわけだが
切らなきゃ大損害を被ってたろうね。 この度の不況により東芝は諫早も含めて生産規模縮小中。
- 251 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 10:25:56 ]
- 諫早はどうでもいいんだが、大分の縮小は困る。
- 252 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 11:12:56 ]
- >>246
本命がその方法なら同じことをアセンブリでやってる俺の勝ちなんで非常に助かるんだがな O(n)を切ってる奴には残念ながら勝てないがソース公開は楽しみでもある
- 253 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 12:25:55 ]
- 残念だが俺は君とは違う方法をやってる
- 254 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:08:53 ]
- 団子さんの本サイトってどこ
- 255 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:19:46 ]
- 団子の正体は日本史の二流研究者
"日本史" "排仏毀釈"で調べれば見つかるぞ
- 256 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 13:26:09 ]
- >>253
それは残念 3/20を楽しみにしとくよ
- 257 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 21:42:58 ]
- コンテストと関係なくて初心者質問で恐縮ですが
SPEプログラムってマルチスレッドのみならず関数呼び出しの場合も レジスタ全部退避するんでしょうか もしそうなら全部main()で済ますのが正解?
- 258 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 22:41:35 ]
- 70番〜127番までのレジスタは関数呼び出しの前後で保存されてなきゃならないって決まりがあるっぽい
って事はレジスタが余ってる限りは退避しないようになってるんじゃないかと 確かめたわけじゃないから絶対とは言えんけどもレジスタ大量にあるのがSPEの特長だしね
- 259 名前:デフォルトの名無しさん mailto:sage [2009/02/08(日) 22:44:35 ]
- そういうのはABIで決まってるから
- 260 名前:,,・´∀`・,,)っ-○◎● mailto:sage [2009/02/08(日) 23:32:26 ]
- 小さい関数なら__inlineキーワード付けなくとも最大の最適化オプションならインライン展開される
- 261 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 10:49:54 ]
- 素晴らしい解法を思いついたと思ったが
最終段がDLPだよ......orz.....検討し直し
- 262 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 11:34:05 ]
- DLPって何の略?
- 263 名前:デフォルトの名無しさん mailto:sage 離散対数問題と思われ [2009/02/09(月) 11:47:12 ]
- ja.wikipedia.org/wiki/DLP
プロジェクタの一種
- 264 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 12:08:29 ]
- ありがと
- 265 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 14:28:17 ]
- >>261
ニヤニヤ
- 266 名前:デフォルトの名無しさん mailto:sage [2009/02/09(月) 23:04:12 ]
- 普通にやって10%切るの難しいって誰か書いてなかったっけ?
土曜から始めて、今、mtテーブルの初期化が終わった。 ループ展開などする前でも10%切るんだけど。かなりハードル低くないか? それとも、このあとのTemperingがきついのかな?
- 267 名前:デフォルトの名無しさん mailto:sage [2009/02/10(火) 00:07:25 ]
- 10%切るの意味が分からないけど10倍速は素直なSIMD化だけでできる
- 268 名前:266 mailto:sage [2009/02/10(火) 00:16:40 ]
- >>267 普通そうだよな。それに、今回の課題はオリジナルがいちいち
関数呼び出しているからオーバヘッドが大きい。 だから、オリジナルの3%を切るくらいが普通の書き換え組みの最低ラインだろう。 とはいえ、俺がそのラインに届くかどうかどうか知らんが。
- 269 名前:デフォルトの名無しさん mailto:sage [2009/02/10(火) 10:30:49 ]
- 3%はSIMD化してアンロールするだけで届く
普通の書き換えならそこからさらに倍速になってからが勝負
- 270 名前:デフォルトの名無しさん mailto:sage [2009/02/10(火) 22:57:42 ]
- 駄法螺吹きが多いな、ここはw
- 271 名前:デフォルトの名無しさん mailto:sage [2009/02/12(木) 01:43:38 ]
- 課題の制限で、mt_mine.c 以外のファイルを変更してはならないというのがあって、
spe 用のファイルの追加ができなくて困っているのだけど、 ttp://cell.fixstars.com/ps3linux/index.php/3.2%E3%80%80簡単なSPEプログラム や ttp://cell.fixstars.com/ps3linux/index.php/4.6%E3%80%80埋め込みSPEプログラム 以外で、どうやって spe 用のコードを書くのでしょうか。
- 272 名前:デフォルトの名無しさん mailto:sage [2009/02/12(木) 01:50:28 ]
- mt_mine.cをいじるだけで事足りるんじゃ?
- 273 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 00:54:08 ]
- >>272
spe 用の main を mt_mine.c に書くと一つのバイナリに二つ main が入ることになってシンボルが衝突してしまいます。 また、spe2 のライブラリにリンクしないと、spe_program_load などがリンカエラーを起こします。 Makefile を変更しないとどうにもならない気がするのですが、何か根本的に間違えているのでしょうか。
- 274 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 02:46:28 ]
- >>273
根本的に間違えてるよ そもそもppeプログラムは不要で,speプログラムだけしかない. コンパイルしてできた実行ファイルを実行すると1つのSPEにロードされて処理される.
- 275 名前:デフォルトの名無しさん mailto:sage [2009/02/13(金) 08:14:29 ]
- たいして量ないから課題についてきたすべてのファイルのぞいてみな。
全体の構造がわかるから
- 276 名前:デフォルトの名無しさん mailto:sage [2009/02/14(土) 00:48:22 ]
- >>267
ソース見せて? いや、ホントに素直なSIMD化だけで?
- 277 名前:デフォルトの名無しさん mailto:sage [2009/02/14(土) 00:49:48 ]
- >>274
>>275 ありがとうございます。腑に落ちました。
- 278 名前:デフォルトの名無しさん mailto:sage [2009/02/14(土) 20:04:19 ]
- SIMD化したら単純に4倍になるだけじゃないからな
SPEでスカラ演算しようとしたらそれ以上のコストがかかる
|

|