[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 2chのread.cgiへ]
Update time : 05/09 23:35 / Filesize : 266 KB / Number-of Response : 1002
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

cellプログラミングしちゃいなよ3



1 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:55:08 ]
前スレ

Cellプログラミングしちゃいなよ2
pc11.2ch.net/test/read.cgi/tech/1183091522/

2 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:56:25 ]
Cell Broadband Engine 技術情報公開
cell.scei.co.jp/

PLAYSTATION3 Linux Information Site
cell.fixstars.com/ps3linux/index.php

The Cell Processor - PukiWiki
cell.fixstars.com/pukiwiki/index.php

developerWorks : Cell Broadband Engine resource center(IBMのCell技術情報)
www-128.ibm.com/developerworks/power/cell/

Cell Broadband Engine Architecture forum (Cellプログラミングの掲示板)
www.ibm.com/developerworks/forums/dw_forum.jsp?forum=739&cat=46

Multicore Programming Primer: PS3 Cell Programming
(マサチューセッツ工科大学のPS3を使ったマルチコアプログラム演習。ソースコードなど有り)
cag.csail.mit.edu/ps3/

CellPerformance
www.cellperformance.com/articles/

3 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 08:57:33 ]
一応たててみたもののスレタイみすった/(^o^)\

4 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 17:47:02 ]
>>1 乙。久しぶりに話題投下してみる。

あるshort値の配列があって、それをlog2()するような感じで指数が欲しい。
指数未満の値、つまり仮数部は四捨五入する。

また、マイナス値とプラス値は連続させて結果をコンパクトにしたい。
趣味で作ってるプログラムだから結果のフォーマットはこれ以外に変わっても構わない。
疑似コードで書くと、いまのところこんな感じの実装にしてある。

(short)round(log(abs(a))/log(2)) + (a > 0 ? 16 : 0);

で、これを最適化できないかなという話。
とりあえず2つ程考えてみたので貼ってみる。

5 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 17:48:46 ]
vec_short8 log2_1(vec_short8 v) {
  static const vec_uchar16 vPack = (vec_uchar16)
  { 2,  3,  18, 19,   6,  7,  22, 23,
   10, 11,  26, 27,  14, 15,  30, 31};

  vec_short8 v1      = spu_splats((int16_t)1);
  vec_short8 v0x100  = spu_splats((int16_t)0x100);
  vec_uint4  vEven   = (vec_uint4)spu_convtf(spu_mule(v, v1), 0);
  vec_uint4  vOdd    = (vec_uint4)spu_convtf(spu_mulo(v,  1), 0);
  vec_uint4  vExpE   = spu_rlmask(vEven, -22);
  vec_uint4  vExpO   = spu_rlmask(vOdd,  -22);
  vec_short8 vExp    = (vec_short8)spu_shuffle(vExpE, vExpO, vPack);
  vExp = spu_rlmask(vExp + spu_and(vExp, 1), -1); // round
  vExp = spu_add(spu_and(vExp, 0xff), -126)
       + spu_rlmask(spu_andc(v0x100, vExp), -4); // sign
  vExp = spu_andc(vExp, (vec_short8)spu_cmpeq(v, 0));
  
  return vExp;
}

6 名前:デフォルトの名無しさん mailto:sage [2008/07/07(月) 17:50:12 ]
vec_short8 log2_2(vec_short8 v) {
  static const vec_uchar16 vPack = (vec_uchar16)
  { 2,  3,  18, 19,   6,  7,  22, 23,
   10, 11,  26, 27,  14, 15,  30, 31};

  vec_ushort8 v1     = spu_splats((uint16_t)1);
  vec_ushort8 vIsPos = spu_cmpgt(v, 0);
  vec_ushort8 vAbs   = (vec_ushort8)spu_sel(-v, v, vIsPos);
  vec_ushort8 vRound = (vAbs & ~spu_rlmask(vAbs, -2)) + spu_rlmask(vAbs, -1);
  vec_uint4   vEven  = spu_mule(vRound, v1);
  vec_uint4   vOdd   = spu_mulo(vRound,  1);
  vec_uint4   vExpE  = spu_sub(32, spu_cntlz(vEven));
  vec_uint4   vExpO  = spu_sub(32, spu_cntlz(vOdd));
  vec_short8  vExp   = (vec_short8)spu_shuffle(vExpE, vExpO, vPack);
  vExp += (vec_short8)spu_and(vIsPos, 16); // sign
  
  return vExp;
}

7 名前:デフォルトの名無しさん mailto:sage [2008/07/08(火) 00:21:46 ]
>>6
同時に32個以上突っ込めるなら後者の方が良いな

8 名前:デフォルトの名無しさん mailto:sage [2008/07/08(火) 00:25:46 ]
音声圧縮かな?

nop / lq
nop / shufb
csflt / shufb
csflt / shufb
nop / shufb
rlmaskbyte

とか妄想してみた

9 名前:デフォルトの名無しさん mailto:sage [2008/07/08(火) 07:35:05 ]
>>7
その心は?

>>8
鋭いです。
ところでそのコード、シャッフルが一回多いような気が。
アンパックx2、パック、後は何?

10 名前:デフォルトの名無しさん mailto:sage [2008/07/10(木) 23:47:30 ]
>>9
パック一回で十分だね



11 名前:デフォルトの名無しさん mailto:sage [2008/07/15(火) 00:31:59 ]
CUDA本格的になってなんたらエンジン窮地に立たされる

12 名前:デフォルトの名無しさん mailto:sage [2008/07/15(火) 11:10:40 ]
>>11
よくわかんねーよw

13 名前:デフォルトの名無しさん mailto:sage [2008/07/16(水) 00:45:58 ]
>>11
大丈夫、スパースエンジンなんて最初っから立場がないから。

14 名前:デフォルトの名無しさん mailto:sage [2008/07/17(木) 05:09:34 ]
Cell が GPU に敵う進化を続けられるかは別だが。

そもそもの HPC 的視点が、Cell は超並列プロセッサであり、GPU はハイパーSIMD/MIMD なわけだ。
それぞれに得意な分野があるから、どちらが滅んでどちらが栄えるという話ではない。


滅ばないとも言わないが。

15 名前:デフォルトの名無しさん mailto:sage [2008/07/17(木) 14:44:19 ]
実際問題、超並列プロセッサっていっても、ハイパーSIMD/MIMDと変わらないような用途でしか使ってないだろう。
プロセッサがいくつかあって、すごいことがいつできるんだ。LinuxがSPEに仕事割り振れるようにでもなればなあ。

16 名前:デフォルトの名無しさん mailto:sage [2008/07/17(木) 15:29:40 ]
ブロードバンドエンジンは内蔵されたホストCPUがPen4程度の低性能、
スパースエンジンは並列度が落ちた挙句にホストCPUが外付け。
某芝の目指す方向はどこなんだか。

17 名前:デフォルトの名無しさん mailto:sage [2008/07/18(金) 00:24:09 ]
>>15
> 実際問題、超並列プロセッサっていっても、ハイパーSIMD/MIMDと変わらないような用途でしか使ってないだろう。
俺には単に、GPU での処理に向いたアプリケーションの、並列コンピュータからの置き換えが、まだまだ進んでいないだけのようの思える。
そいういう意味で無いなら、俺の知らない分野のことを言っているようだから、教えてくれると有り難い。

18 名前:デフォルトの名無しさん mailto:sage [2008/07/18(金) 01:41:44 ]
つーか超並列はMIMDでしか作らない訳だが。

19 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 17:18:45 ]
Cellプログラミングをやろうと思い
PS3にxUbuntuをいれSynapticパッケージマネージャでCell-sdkとbinfbinfmts-supportを入れました。
spu-gcc でhello world

20 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 17:21:01 ]
途中で送信してしまいました

Cellプログラミングをやろうと思い
PS3にxUbuntuをいれSynapticパッケージマネージャでCell-sdkとbinfbinfmts-supportを入れました。
spu-gcc でhello worldを表示するプログラムをつくりコンパイルをするところまではできたのですが

いざ実行してみると
spu_create(): no such file or directory
spe_create_single: Bad address
とでてしまい実行できませんでした。

いろいろ調べても見たのですがこれといった解決策も見つからず途方にくれています。
原因をご存知の方がいらっしゃいましたら教えていただけないでしょうか。



21 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 17:28:49 ]
素直にfedoraかYellowdogにしれ。

22 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 17:36:35 ]
レス有難うございます
xUbuntuだと結局Cellやるのには問題多いんですかね・・・
軽いって話を聞いたんですけど。無理そうならFedoraにしときます。

23 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 20:07:23 ]
PS3で開発って辺りが結構無茶っぽい。
いいクロス開発環境ないのかねぇ。

24 名前:デフォルトの名無しさん mailto:sage [2008/07/19(土) 20:19:10 ]
SPU用のバイナリのファイル名が違ってるか作られてないのでは?
俺のとこはxじゃないUbuntu7.10だけど問題なくセルフ開発できてる

25 名前:デフォルトの名無しさん [2008/07/19(土) 22:21:43 ]
>>23
そうだよな
開発成果をBDまたは仮想BDで出力する環境が欲しい

26 名前:デフォルトの名無しさん mailto:sage [2008/07/20(日) 04:17:30 ]
素直に一旦ゲーム屋に行けよw

27 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 14:59:52 ]
>> 20
うちはxubuntuで上手く行ってる。24の指摘通りではないでしょうか。

28 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 16:22:12 ]
>>24,27
レスありがとうございます。
はじめに実行したときcannot execute binary file と表示されたのでSPU用のバイナリが原因かもしれません。
それを解決するためにbinfbinfmts-supportを入れてみたのですが・・・解決にはなってなかったかもしれないですね。
SPU用のバイナリについて勉強不足であまりよくわからないので調べてみたいと思います。

29 名前:24 mailto:sage [2008/07/21(月) 19:54:53 ]
SPU のは普通は直接起動できず,起動するのは PPU 用のバイナリ.
そこから spe_image_open と spe_program_load 使って load する.
さらに thread を 6つ創って spe_context_create, spe_context_run する.
SPU 用のバイナリを埋め込んじゃえば _open の方は要らない.
後,spu-gcc のオプションに -standalone を指定すれば,
直接起動できるプログラムを生成してくれたはず.

30 名前:デフォルトの名無しさん mailto:sage [2008/07/21(月) 22:19:00 ]
本当にSPUを活用したいなら、
使える立場にいるならSPURSとか、
MARS,Ctk,そのほかの
SPU自律カーネルみたいなのを立てて
それにジョブを投げた方が楽だよ。



31 名前:デフォルトの名無しさん mailto:sage [2008/07/22(火) 17:07:48 ]
仕事でやるんならそうだね

32 名前:デフォルトの名無しさん [2008/07/25(金) 17:42:28 ]
ftp://ftp.infradead.org/pub/Sony-PS3/mars
どうなんだい?

33 名前:デフォルトの名無しさん [2008/07/25(金) 17:46:45 ]
追記
ftp://ftp.infradead.org/pub/Sony-PS3/mars/MARS-GATECH-20080711-final.pdf

34 名前:デフォルトの名無しさん mailto:sage [2008/07/25(金) 20:04:08 ]
自分も是非感想を聞きたい。

35 名前:デフォルトの名無しさん mailto:sage [2008/07/25(金) 21:36:54 ]
誰かファイル操作についてのCの制御文?(printfのようなもの)知らない?
知ってる分だけ伝授してほしいです

36 名前:デフォルトの名無しさん mailto:sage [2008/07/25(金) 22:18:18 ]
>>35
スレ違い。

37 名前:デフォルトの名無しさん mailto:sage [2008/07/25(金) 22:20:24 ]
MARSってコンテキスト量減らせるだけ?

38 名前:デフォルトの名無しさん mailto:sage [2008/07/26(土) 16:27:04 ]
MARSでやれるようなことは、GPGPUだとたぶん無理だと思う。こういうことにこそ、Cellの強みがあるんじゃないかな。
実際どれだけ使えるようになっているのかが問題だ。

39 名前:デフォルトの名無しさん mailto:sage [2008/07/26(土) 17:09:50 ]
データの入れ替えには対応してないみたいだな。(まだ)


40 名前:デフォルトの名無しさん mailto:sage [2008/07/26(土) 18:03:22 ]
CPUの省エネ、後編(CELL、BG/Lを参考に考える。)
www.ne.jp/asahi/comp/tarusan/main190.htm

電力消費量的にLSはよいと。うまくつかえればの話だけど。


それじゃあ、キャッシュとLSを二つ持って、使い分ければいいのかとも思うけど、
2つの使い分けを把握しないといけないから、煩わしさが増えると。



41 名前:デフォルトの名無しさん mailto:sage [2008/07/31(木) 11:56:30 ]
「5年は追いつけないでしょう」──東芝が作るAVノートの新しい未来形・Qosmio G50の革新性とは
ttp://journal.mycom.co.jp/articles/2008/07/30/qosmio/001.html

通常
ttp://journal.mycom.co.jp/photo/articles/2008/07/30/qosmio/images/005l.jpg
supers engine
ttp://journal.mycom.co.jp/photo/articles/2008/07/30/qosmio/images/006l.jpg

これは結構いいな。

42 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 12:39:21 ]
問題はノートでここまでの要求があるかだが

43 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 13:31:07 ]
映画好きの人とか、結構、本気で欲しがるんじゃないか?
自宅で使うデスクノートとして。まあ、あくまでマニア需要かな。

でも、世間的に意外とこんなんで火がついたりとかありえそうな気もするが。

QosmioのSupersは直接いじれないらしから、すれ違いだけどね。

44 名前:デフォルトの名無しさん mailto:sage [2008/08/01(金) 18:24:08 ]
アプリは自作用のカードに乗らないから色々なメーカーに期待するって……
自作用カード出しても、エコシステムが回るほどアプリが出てくる思えないな。

45 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 21:36:42 ]
Qosmio G50新兵器、SpursEngineがスゴすぎる件【前編】
ascii.jp/elem/000/000/157/157525/

NvidiaのGPUまわせば、SpursEngineいらないんじゃ…。

46 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 21:38:57 ]
The Barcelona Supercomputing Center has a new prototype
to investigate the supercomputing of the future
www.bsc.es/media/1762.pdf

Roadrunnerを超えるCellスパコンができるらしい。

47 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 21:52:37 ]
ついにベールを脱いだIntelのCPU&GPUハイブリッド「Larrabee」
pc.watch.impress.co.jp/docs/2008/0804/kaigai457.htm

Intel版Cellといろんなところで騒がれていますな。Cellとがちだけど、GPUとして
登場するところは大きな違いであり、?でもある。

48 名前:デフォルトの名無しさん mailto:sage [2008/08/09(土) 22:01:41 ]
そろそろCellも次世代のバージョンの詳細がでてくるだろうか。2PPE+32SPEがでる
っていう情報はでてるけど、それ以上の話はまだなくて、今まさに検討中なんだろう。

Sonyが腰が引け気味で、Toshibaが違った方向に進みつつあり、IBMはHPC路線で突き進んでいる。

また、PS3の状況は、次世代Cellに大きく関わってくるんだろう。PS3の状況はよくなりつつあるが、
まだ厳しそうだ。次世代に向けて動き出すときこのときに、今のような不透明な状況であることが、
次世代のCellに一体どう作用するか…。Sonyの求心力が弱まることで、よりIBM主導のアーキテクチャに
進むのだろうか?果たして…。

49 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 01:51:45 ]
>>45
> Qosmio G50新兵器、SpursEngineがスゴすぎる件【前編】
> ascii.jp/elem/000/000/157/157525/
>
> NvidiaのGPUまわせば、SpursEngineいらないんじゃ…。

GPUでまっとうなC/C++使える日が来たらそうかもね。

50 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 04:02:39 ]
MSが次のXBOXにLarrabee使うんじゃ



51 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 09:51:21 ]
>>49
CUDAでいいんじゃね。

52 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:02:33 ]
>>51
> >>49
> CUDAでいいんじゃね。

「まっとうなC/C++」というのはCUDAへの皮肉だよw
Cellの方がはるかに作りやすい。
まぁ作りやすい以上の動機があるからCUDAが使われているわけだけど。


53 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:05:28 ]
三角関数も全く使えなくても、最適化が馬鹿でも、メモリ転送命令が低レベルでしか実装されていなくても、
それでもCellの方がはるかに作りやすいんですね、判ります。

54 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:15:24 ]
超越関数使えるのは便利だわな。
それ以外のツッコミは的外れ。

55 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 10:41:47 ]
超越関数なんて(細かい注文付けなきゃ)簡単に実装できるだろ?
何が問題なんだ?

56 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 11:31:49 ]
そりゃハードで超越関数の演算器持ってくれてた方がうれしいだろ。

57 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 14:27:13 ]
ハードウェアの超越関数ってスループットが5サイクルくらいなんでしょ?
4要素計算しても20サイクル、馬鹿っ速いじゃないか。

58 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 15:16:58 ]
超越関数つーかsqrtがあれば十分だな。1/sqrtでも良いけど。

59 名前:デフォルトの名無しさん mailto:sage [2008/08/10(日) 16:28:14 ]
>>52
LSの容量制限でC++はやりにくかろう。結果的にCellもCUDAもそんなに変わらんと思うが。

60 名前:デフォルトの名無しさん mailto:sage [2008/08/11(月) 01:27:06 ]
>>59
そういうことはどっちもやってみてから言ってくれ。



61 名前:デフォルトの名無しさん mailto:sage [2008/08/11(月) 11:15:00 ]
どっちもCとちょっとの拡張で書ける程度だからねえ。書くだけならどっちもそこまで大差ないさ。
問題は最適化の段階だな。でも、これもコツを覚えて、そこそこの最適化でいいんならそんなには苦労しないと思う。
個人的な感想では、CUDAのメモリ周りの最適化がちょっと難ありか。Cellは最初からアラインメントとらないとそもそも
DMA転送できないようになっているから、あんまり考える必要ないが、CUDAの場合は、スレッドごとのDRAMへのアクセスパターンを
考えないと駄目というのが、う〜ん。あとshared memoryのバンクコンフリクトを考えないと、とんでもないことに
なるときがある。ここらへんを、コンパイラかハードでなんとかしてくれるといんだけど。


62 名前:デフォルトの名無しさん mailto:sage [2008/08/22(金) 21:02:45 ]
Qosmio G50新兵器、SpursEngineがスゴすぎる件【後編】
ascii.jp/elem/000/000/162/162488/index-3.html
円弧職人の夢がここに


63 名前:デフォルトの名無しさん mailto:sage [2008/08/25(月) 12:11:23 ]
ググってたらこんなんめっけた

www.ibm.com/developerworks/jp/power/library/j_pa-asmvis/
第 1 回 asmVis を試してみよう
www.ibm.com/developerworks/jp/power/library/j_pa-asmvis2/
第 2 回 パイプラインを最適化する

64 名前:デフォルトの名無しさん mailto:sage [2008/09/10(水) 10:54:28 ]
リードテック、東芝のメディアプロセッサ
「SpursEngine」搭載PCIe拡張カード
pc.watch.impress.co.jp/docs/2008/0910/leadtek.htm

65 名前:デフォルトの名無しさん mailto:sage [2008/09/10(水) 23:28:57 ]
(゚听)イラネ

66 名前:デフォルトの名無しさん mailto:sage [2008/09/19(金) 18:29:04 ]
いくらくらいになるんだ?

67 名前:デフォルトの名無しさん mailto:sage [2008/09/19(金) 19:06:43 ]
東芝、'09秋に発売のCell TVの高速映像処理をデモ
av.watch.impress.co.jp/docs/20080918/toshiba7.htm
45nmを積むんだろな。

68 名前:デフォルトの名無しさん [2008/09/24(水) 00:02:00 ]
次世代CELLは4PPE+32SPEか

368: 2008/09/22 22:10:38 RPIGcU63O [sage]
>>364
MACオタソースですけど、次世代CELLのクロックは3.8GHz止まりです。

> 6/10のセミナー資料、もう少し掘っていたら次世代CELLについて言及した別のがあったす。
> www-06.ibm.com/jp/solutions/deepcomputing/events/pdf/080610_Cell_Strat_JHC_Japan.pdf
>  ・従来型Cell/B.E.わ2009年に45nmプロセス化
>  ・以前のロードマップにあった2*PPE + 32*SPEの"PowerXCell 32ii"わキャンセル。代わりに
>   4*PPE + 32*SPEの"PowerXCell 32iv"へ。
>  ・PowerXCell 32ivの世代でPPEに手を入れる -> PPE' へ
>  ・同じくSPEわ"eSPE"に進化
>  ・クロックも上げる、〜3.8GHz
>  ・その他PowerXCell 32iv世代の特徴わ、下記の通り
>   - 100% backward compatible
>   - PPE性能わ大幅向上
>   - SPEわ新命令追加以外わ現状並 (新命令セットを使用するソフトわ大幅に性能向上)
>   - SPE間の通信レイテンシ削減
>   - More on-chip memory (LS増量か?)
>   - メインメモリアクセスの大域幅増強とレイテンシ削減

69 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 04:02:42 ]
marsが微妙にバージョンUp

70 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 08:23:16 ]
>>68
それ何時出るんだ?
何プロセスで作ったら現実的なんだよ。
んな金があったら、拡張ボードを出すか、現状のアレな点を修正した
マイナーアップバージョン出した方が良いと思うんだが。



71 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 11:45:22 ]
拡張ボードってなんだ?
あれな点とは?

72 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 18:34:33 ]
>>70
微細化が進んだら規模を拡大するのは当たり前の話。サーバ用のCPUなんだから。

それに従来のCellの改良版なら、既に製品化されてるよ。

73 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 19:21:37 ]
>>68が出たらPS3みたいに不良コアをいくらか殺してくれて構わないから安く手に入らないかなあ。

74 名前:70 mailto:sage [2008/09/25(木) 20:43:25 ]
ああ、初代 Cell.B.E は 90nm だったのか。
だったら、4倍増(+LS増量)+αならありえる話か。ごめん。

どちらにしろ、PS3 限定状態じゃ流行らんだろな。
Atom + GeForce の方がやりやすそう。

75 名前:デフォルトの名無しさん mailto:sage [2008/09/25(木) 21:04:32 ]
そりゃAtomの方が数は出るだろうけど、そもそも競合してないだろ。

ttp://www-06.ibm.com/systems/jp/bladecenter/hardware/qs22/

76 名前:デフォルトの名無しさん mailto:sage [2008/09/26(金) 15:13:55 ]
Cellの将来はSonyとIBMと東芝がそれぞれ違う分野での使い方を想定し
異なる開発計画を持ってるから、「どの会社の計画なのか?」を
指定しないと話がスレ違いしまくりなんだよな。

Sony:ゲーム機(PS3及びその後継)
東芝:家電(画像処理)&ノートPC用コプロセッサ(SpursEngine)
IBM:ブレードサーバー&HPC用CPU

77 名前:デフォルトの名無しさん [2008/09/26(金) 16:25:38 ]
BDエンコーダとか、BDエンコーダとか・・・

78 名前:デフォルトの名無しさん mailto:sage [2008/09/26(金) 18:06:51 ]
Cell触ってみたいな
仕事では絶対やだけど

79 名前:デフォルトの名無しさん mailto:sage [2008/09/26(金) 18:40:58 ]
>>78
仕事でSuperEngine触るかもしれん

80 名前:デフォルトの名無しさん mailto:sage [2008/09/26(金) 21:15:49 ]
そいつはSuperですね



81 名前:デフォルトの名無しさん [2008/10/16(木) 14:54:02 ]
helloworldプログラムを作ったのですが、実行させると。
spu_create(): Invalid argument
spe_context_create: Bad addressとでます。
プログラムソースはfixstarsのチュートリアルどおりで、
PS3にはFedora7、SDKは3.0を導入しました。
ここの>>20さんの質問とほぼかぶっているのはわかるのですが、解決策がわかりません。
>>24さんのいう、バイナリのファイルが違っている、もしくは作られていない場合はどうしたらよろしいのでしょうか?

82 名前:デフォルトの名無しさん mailto:sage [2008/10/16(木) 19:08:19 ]
>>76
> Sony:ゲーム機(PS3及びその後継)
SCEではなくSonyでなんでゲーム機限定?
音響も視野に入ってくるだろ。

83 名前:デフォルトの名無しさん mailto:sage [2008/10/18(土) 00:24:16 ]
ヒント: 事業部の壁

84 名前:デフォルトの名無しさん mailto:sage [2008/10/18(土) 10:04:21 ]
>>81
fixstarsのチュートリアルの3.2章にあるソース(PPE/SPE用)をコンパイルしたということですよね。
私の環境では、Fedora7 + SDK3(厳密には3.0.0.3ですが関係ないでしょう)、で問題なく実行できます。

PS3 linux上でmountを実行した際に、spufsはマウントされていますか?
Linux環境周りの問題のような気がします。

85 名前:デフォルトの名無しさん mailto:sage [2008/10/18(土) 18:11:22 ]
GT200とかLarrabeeとかのニュースもひと段落して、最近、新しい話がなくて退屈だ。
そろそろ、つぎのCellの話がでてきていいはずだよな。

86 名前:デフォルトの名無しさん mailto:sage [2008/10/18(土) 18:40:44 ]
初代Cellは出たころは、9コアをいきなり実現して、業界にそれなりのインパクト、影響を与えたと思う。

次のCellは2010年後半で36コアだけど、どうなるだろうか。

さすがに32個もSPEがあると、本質的に今までと変わってくることが出てくる。

まず、一番問題なのはメモリの帯域だろう。現状でも帯域は演算に追いついていないが、
そこまで厳しい要求があるアプリケーションばかりでないので、実用には問題ない。
しかし、次のCellではコア数増で、帯域不足がより問題になるんじゃないだろうか。

IBMはもちろんそこら辺は考えた上で設計してるから、解決してるのだろう。その解決の
仕方がどうやっているのかが聞いてみたい。

次に、性能のスケーラビリティは32SPEでも問題なく保てるのかどうかだ。
これはメモリの話とも関係してくることではあるけど。初代Cellでは8コアで
ほぼリニアにスケールするという話がよく聞かれ、Cellの一つの売りになっていた。
2Cellで16SPEでもスケールするなんて話もあったような気がするが、次のCellでは
どうだろうか。

これが、32SPEくらいまでだったらスケールしたから、32SPEに設計しました
とかっていうのか、もっと100くらいまでいけることを確認しているのか、20個くらいが
限界で、あとは別用途で同時実行してくださいっていうのか、非常に重要だ。

Cellのスケーラビリティがよいというのは、他の半導体メーカーも注目しているはずで、
30個ぐらいでも性能でるめどがあるとなったら、他も真似して追従したくてしょうがないだろう。
8コアくらいまでが実用の上限なんて話もあるから、ここら辺の見極めをしたいはずだ。
まあ、アプリケーションによるけど。でもMARSが32SPEで効果的に働くってなったら、ちょっと
いいんじゃないだろうか?

87 名前:デフォルトの名無しさん mailto:sage [2008/10/18(土) 19:19:41 ]
このCellのスケール性がLSのコヒーレンシを考える必要がないことが本質だったら、
次のCell、その次のCell(120コアくらい?)で、その効果が指数関数的に出てくるはず。
そうすると、LSの再評価みたいなのが起きてくるんじゃないだろうか。
このLSに相当するGPUのshared memoryはその先取りかもしれないし、もしくは
メニーコアの必然として同じアーキテクチャにたどりついたといえるのかもしれない?
まあ、スクラッチパッドなんて昔からあったから、そんなに偉いもんかわからないけど。

LSといえば、プログラマはみんな容量を増えることを、次のCellでは期待しているだろう。
Cellのスピードチャレンジで今年優勝した人は、LSの容量が本質的に計算の高速化
と関係するようなことをいってた。プログラムが楽とかいうことではなく。
LSの容量が許せば、SPEごとのローカリティの高いアルゴリズムに変更できることがある
というようなことらしい。

Cellがでてだいぶみなが人柱になることで、LSの容量はこれくらいあるべきというのが、
ユーザーからあがりつつある。LSの増加は当然トランジスタ予算を食うわけで、SPE数を増やす
ほうがいいのか、LSを増やすほうがいいのかの天秤につるして、次のLSの容量もきまるんだろう。

次世代のCellで面白いのは、競合するGPUが存在するなかでのデビューになり、Larrabeeとの競争は
激しいものになるだろうことだ。

88 名前:デフォルトの名無しさん mailto:sage [2008/10/19(日) 02:08:02 ]
PPE:3
SPE:21
LS容量:12MB
これくらいがいい。

89 名前:デフォルトの名無しさん mailto:sage [2008/10/20(月) 17:17:47 ]
>>84さん ありがとうございました。
エラーの原因は>>84さんの記述どおり、spufsがmountされていなかったためでした。

90 名前:デフォルトの名無しさん mailto:sage [2008/10/24(金) 11:44:38 ]
mars1.0.0にバージョンアップ



91 名前:デフォルトの名無しさん mailto:sage [2008/10/27(月) 11:35:38 ]
とりあえずロックフリーキューで全部差し替えないとmutex大杉

92 名前:デフォルトの名無しさん mailto:sage [2008/10/27(月) 14:01:17 ]
SDK3.1
www-128.ibm.com/developerworks/forums/thread.jspa?threadID=231196&tstart=0

93 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 17:49:52 ]
質問なんですが、SDK3.0を入れても、コンパイルエラーが出て、
gccはインストールされていませんとでたのですが、
どこで入手したらよいのでしょうか?

94 名前:デフォルトの名無しさん mailto:sage [2008/11/04(火) 18:15:30 ]
パスはちゃんと設定してあるのか? いずれにしても、cellプログラミングと関係ないじゃん。

95 名前:デフォルトの名無しさん mailto:sage [2008/11/05(水) 07:30:28 ]
何この態度でかそうな奴

96 名前:デフォルトの名無しさん mailto:sage [2008/11/05(水) 08:11:16 ]
お前が言うなw

97 名前:デフォルトの名無しさん mailto:sage [2008/11/08(土) 00:31:51 ]
Fedora9にSDK3.1とシミュレータをインストールしました。
SDK付属のeclipse上から、シミュレータを実行すると、カーネルを読み込んで
立ち上がったところで、コマンド入力待ちになり、先に進まなくなってしまいます。
何か設定しなければならない項目等があるのでしょうか?


98 名前:デフォルトの名無しさん mailto:sage [2008/11/08(土) 01:34:37 ]
コマンド入力待ちになるなら、コマンドを入力すればいいんじゃね?

99 名前:デフォルトの名無しさん mailto:sage [2008/11/08(土) 01:46:11 ]
Run→Open Run Dialog...ウインドウのTargetタブで、起動したシミュレータを指定すればいいですよ

100 名前:デフォルトの名無しさん mailto:sage [2008/11/10(月) 08:20:40 ]
www.ibm.com/developerworks/jp/power/library/j_pa-sdk31/








[ 続きを読む ] / [ 携帯版 ]

次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧]( ´∀`)<266KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef