アセンブラ… ( ゚д゚ ..
[2ch|▼Menu]
368:デフォルトの名無しさん
07/07/14 12:45:45
>>366
目頭が熱くなった

369:デフォルトの名無しさん
07/07/14 15:45:53
ハードウェアを知ることは無駄と言うが、
ハードウェアも知らずにプログラムとは笑わせる。

370:デフォルトの名無しさん
07/07/14 15:51:40
だれも言ってないとおもうぞ。

371:デフォルトの名無しさん
07/07/14 16:00:22
>>365
そんなに必死になる事でもないだろ。
煽りを入れないと文章書けない人か?

372:デフォルトの名無しさん
07/07/14 16:07:10
>>354
回線のボトルネックを疑うだろ普通

373:デフォルトの名無しさん
07/07/14 16:08:50
>>365
そんなお前でも童貞じゃないんだろうなぁと思うと自分が悲しくなってくる。
俺いつまで童貞なんだろう。

374:デフォルトの名無しさん
07/07/14 16:15:50
CPU が 20 個あるのにプロセスが 1 個しか上がってないのかもしれない

375:デフォルトの名無しさん
07/07/14 16:19:50
プロセスつーかネイティブスレッドか

376:・∀・)っ-○◎●
07/07/14 16:20:54
リソースに余裕があるなら仮想化したら?
あとRailsとかの重量級フレームワーク使えばけっこう食ってくれるはず

377:デフォルトの名無しさん
07/07/14 16:22:12
Sleepやらアイドルの間隔が長いコードかもしれない。

378:デフォルトの名無しさん
07/07/14 18:53:18
つーかこの問題のどこにアセンブラが関係しているのだろう・・・

379:デフォルトの名無しさん
07/07/14 22:01:59
アセンブラでCGI書いてたりするんじゃないの?知らないけど。

380:デフォルトの名無しさん
07/07/14 22:13:18
各CPUごとにアセンブラコードを最適化したい場合、
いったいどうやってやればいいんですか?
IntelとAMDだと速度が出るコードの傾向がちょっと違いますし、
Intelのなかでもいろいろありますよね。
各CPUのPCを何台も用意して、試行錯誤繰り返すしかないんでしょうか?

381:デフォルトの名無しさん
07/07/14 22:33:47
>>380
最適化出来たかどうかを試すのには、結局各 CPU の PC を何台も用意して
確認する必要があるでしょ。机上で試したいなら CPU ベンダーがシミュレータを
作っている場合もあるけど。

382:デフォルトの名無しさん
07/07/14 22:39:04
アセンブラに置き換える前に、アルゴリズムを見直した方が良い結果が得られる。

383:・∀・)っ-○◎●
07/07/14 22:52:21
SSEを使える(並列化できる)部分を見つけてまずそこを置き換える

コーディングのお供はAgnerのドキュメントかな。
疲れるだけだから、無駄に机上試験なんてやらない。




384:デフォルトの名無しさん
07/07/14 22:56:12
そんな限定された話題だったのか?

385:・∀・)っ-○◎●
07/07/14 23:04:03
さあ、4倍とか8倍とかになり得るのはSSE使ったときくらいじゃないの?
今時のx86向けのC/C++コンパイラは優秀だしCPU側にOoOもあるから、
ただアセンブリコードに置き換えるだけじゃそんなに速くならんよ。



386:デフォルトの名無しさん
07/07/14 23:18:33
2倍くらいなら命令順を工夫すれば・・・って、
その程度ならコンパイラが頑張ってくれるか?

387:デフォルトの名無しさん
07/07/14 23:26:43
誰も4倍とか8倍なんて言ってないと思うが…

388:・∀・)っ-○◎●
07/07/14 23:49:20
逆に、差が出ないのに処理わけする意味なんてないでしょ
1.x倍程度ならわざわざ手間はかけないでしょ。



まあ確かにCPUによっては

sh; eax. 3

よりも

add eax. eax
add eax. eax
add eax. eax

のほうが速かったりするけどさ、一般的なコードのシーケンスの中では
そんなに差は出ないことのほうが多い

389:デフォルトの名無しさん
07/07/14 23:56:56
CPUの中でも分岐予測などの最適化が行われるから?

390:デフォルトの名無しさん
07/07/15 00:02:40
>>388
それは要件次第じゃないの。50% 速くなったら、それはそれで嬉しいと思うが。

391:デフォルトの名無しさん
07/07/15 00:17:16
リヌァックスでは、SSE1〜4最適化しないAltivec最適化しない
という最適化一切なし状態ではCore2はPPC970の足元にも及ばない。

SSE3最適化あり
Altivec最適化なし
こうすると、2倍くらい早くなる。

392:デフォルトの名無しさん
07/07/15 00:23:22
>>391
SIMD 使うアプリなんて殆ど無い

393:デフォルトの名無しさん
07/07/15 00:23:32
なにそのおいしそうな西洋菓子みたいなOS

394:・∀・)っ-○◎●
07/07/15 00:31:02
AltiVec最適化ありの場合は?w
性能によっちゃiMacG5の中古良品を確保しておくんだが。

395:デフォルトの名無しさん
07/07/15 00:36:13
だんごちゃんって煽られたりしないの?

396:デフォルトの名無しさん
07/07/15 01:37:35
煽られるというか、晒される事はあるよな。

「CellでSSE」とか

397:デフォルトの名無しさん
07/07/15 01:52:18
VMXやAltivec最適化を効かせても、現状のAthlon64と似たようなもんだよ
浮動小数点演算では結構食らいついていくが、整数となるとcore 2に負ける。

それにスレッディング前提のCPUだからシングルスレッドじゃ、てんでダメだしな



398:デフォルトの名無しさん
07/07/15 02:15:03
マ板のオブジェクト指向スレに住み着いた痴呆どもを見慣れてる俺には
団子はまともなコテに見えるぞ

399:・∀・)っ-○◎●
07/07/15 02:32:21
読解力が無い子と話するのは苦手なんですよ

400:デフォルトの名無しさん
07/07/15 02:32:57
自分の間違いを人のせいにするチョン加減w

401:・∀・)っ-○◎●
07/07/15 02:36:11
まあ、CellのSPEがAltiVecとして使えるとか言う痛い子が住み着いちゃってるけど
処方箋なんてないでしょ


402:デフォルトの名無しさん
07/07/15 02:47:48
SPUはベクトル演算器であるとは書かれているがw
Altivecが何たるかも知らんド素人かw

403:デフォルトの名無しさん
07/07/15 02:49:57
Wikipedia項目リンク


Altivecとは何なのか、よ〜く勉強しようね
ド素人は理解できないかw

404:デフォルトの名無しさん
07/07/15 02:52:00
ハイ おさらい。
スレリンク(tech板)l50

SSE実行できないCellでSSEの実測をしたという捏造の瞬間wwwww

864 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/06/17(日) 16:22:27
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0


こんな感じで繰り返せば一応往復のレイテンシは計測できるよね
で、何クロックかかるのかな?

答えてね。俺より頭いい子ならすぐわかるはず。


もっとも俺は実測結果あるけど


866 名前: デフォルトの名無しさん [sage] 投稿日: 2007/06/17(日) 16:26:12
CellでSSEって

405:デフォルトの名無しさん
07/07/15 02:52:54
871 名前: デフォルトの名無しさん 投稿日: 2007/06/17(日) 16:30:08
どちらもSIMDユニットだから、ハードの役割としては同等

というのに、ISAが同じだと捏造していたとw


バカだあのド素人w



Cellも知らずプログラムもできないチョンw
保存しとこうやw


864 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/06/17(日) 16:22:27
movd xmm0, eax

406:・∀・)っ-○◎●
07/07/15 02:56:19
はい釣れた

407:デフォルトの名無しさん
07/07/15 02:57:34
URLリンク(www.media-k.co.jp)


釣れた【つれた】[名]

自分の当てずっぽうレスを大勢に突っ込まれ&馬鹿にされた時に厨房が
悔し紛れに言う単なる逃げ口上の最後っ屁。
その後放置される。


408:・∀・)っ-○◎●
07/07/15 03:00:24
ごめんね良スレだったのに変なの呼び込んじゃって。

メール欄空白の奴をあぼーんする設定にしとくといいよ

409:デフォルトの名無しさん
07/07/15 03:34:22
ところで最近はトリップつけてないのに良く成り済まし(少なくともそう思われるレスは見てない)被害に遭わないな。
まぁ、平穏なのはいい事だが。でもこのレスを皮切りに以下成り済ましの嵐になるかもね。あーあ、黙ってればいいものを・・・。

410:デフォルトの名無しさん
07/07/15 03:37:55
既に395を皮切りに荒れているが

411:・∀・)っ-○◎●
07/07/15 03:40:02
たまにいるよ。
中尾さんファンクラブ会費年30ドル払わないとなり済ませないけど。


412:デフォルトの名無しさん
07/07/15 06:22:16
CellでSSE使えるとか捏造するのがマトモなのか?w

413:デフォルトの名無しさん
07/07/15 06:31:51
SSEはインテルの商標だからCellに乗ってるわけないだろw

・・・と煽ろうと思ったが、実は違ったのな。MMXは商標なのに。
Streamingを目的としたSIMD拡張ならSSEと呼んでいいのかもしれない。

414:デフォルトの名無しさん
07/07/15 09:59:22
>>413
いやダメだろ。SSEは商標ではないとしても固有名詞化してるからな。

415:・∀・)っ-○◎●
07/07/15 13:37:02
なに?SPEがAltiVecとしても使えて、PPE←→SPEの転送レイテンシが1とか言ってた負け犬がまだ居ついてるの?

IntelアーキでSSE2の汎用レジスタ←→XMMレジスタ間転送なら1だとは言ったけどね
物理的に同じコアのレジスタ間転送だから当然


416:・∀・)っ-○◎●
07/07/15 13:39:19
SSEはx86ネイティブの命令セットじゃないとも言ってたな。
【拡張】命令の意味がわかってないらしい。

全く別物の命令セット(元の命令を実行すらできない)じゃないんだよ。



417:デフォルトの名無しさん
07/07/15 20:18:22
871 名前: デフォルトの名無しさん 投稿日: 2007/06/17(日) 16:30:08
どちらもSIMDユニットだから、ハードの役割としては同等

というのに、ISAが同じだと捏造していたとw


バカだあのド素人w



Cellも知らずプログラムもできないチョンw
保存しとこうやw


864 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/06/17(日) 16:22:27
movd xmm0, eax

418:デフォルトの名無しさん
07/07/15 20:18:54
ハイ おさらい。
スレリンク(tech板)l50

SSE実行できないCellでSSEの実測をしたという捏造の瞬間wwwww

864 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/06/17(日) 16:22:27
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0


こんな感じで繰り返せば一応往復のレイテンシは計測できるよね
で、何クロックかかるのかな?

答えてね。俺より頭いい子ならすぐわかるはず。


もっとも俺は実測結果あるけど


866 名前: デフォルトの名無しさん [sage] 投稿日: 2007/06/17(日) 16:26:12
CellでSSEって

419:デフォルトの名無しさん
07/07/17 09:48:53
アセンブラってアーキテクチャごとに違いが大きいから、x86とそれ以外にスレを分けてもいい気がするんだ。
てか、x86でしか通用しない話題多すぎ

420:デフォルトの名無しさん
07/07/17 10:46:38
バカが沸かなきゃ一緒でいいよ。

421:・∀・)っ-○◎●
07/07/17 22:40:36
BroadwayがPPC970互換でマルチスレッディング対応はワロタ

422:デフォルトの名無しさん
07/07/18 02:13:57
ダンゴの自演多すぎワロタ

423:デフォルトの名無しさん
07/07/18 11:03:31
どの辺が自演?

424:デフォルトの名無しさん
07/07/18 15:47:59
↑こいつ団子

425:423
07/07/18 16:22:41
ちゅがうよ。

426:デフォルトの名無しさん
07/07/18 16:50:55
424 ←こいつが団子

427:デフォルトの名無しさん
07/07/18 18:01:31
いやいや俺俺

428:デフォルトの名無しさん
07/07/18 18:52:33
どうぞどうぞ

429:デフォルトの名無しさん
07/07/20 07:37:37
PPC970って1コア2スレッド対応だろ

430:デフォルトの名無しさん
07/07/20 08:39:12
429 名前:デフォルトの名無しさん[sage] 投稿日:2007/07/20(金) 07:37:37
PPC970って1コア2スレッド対応だろ



431:デフォルトの名無しさん
07/07/20 09:34:49
>>430
CellのPPEは命令セットがPowerPO 970互換なだけで970とは全くの別設計。
いつからPPEがPPC970そのものになったんだ?ばか。

WiiのBroadwayは750(G3)系のカスタムCPUでVMXも64ビットも非対応。

432:デフォルトの名無しさん
07/07/21 22:41:41
詳細は非公開

433:デフォルトの名無しさん
07/07/21 22:42:26
PPE は64bit POWERアーキテクチャであり、
命令セットはPowerPC G5互換ではあるが、
既存のPowerPC系 CPU と異なる内部構造(Xbox 360のPowerPCコアに似ている)をもつ
新設計のコアである。




2スレッドを同時に実行することが可能で、

434:デフォルトの名無しさん
07/07/21 23:04:10
そういやさ

サーバー用CPUというのは、1コアで8スレッド処理できるものとかザラじゃん。
コンシューマばかり触れてきた奴に通じないのだから参ったことがあった

「1コア8スレッドで、8コアだから64スレッドがオン・ダ・フラーイできるわけ」

「そんなCPUあるわけない!そもそもCPUってのは1コアにつき1つのスレッドまで!」



自称パソコン歴15年のがね。こういうのさ

435:デフォルトの名無しさん
07/07/21 23:45:16
1コアで8スレッドなんて制限があるCPUなんて聞いたこと無いんだが。

436:デフォルトの名無しさん
07/07/21 23:55:01
>>434
昔の人間にとっては、
CPU = ALU + RegFile
だから。

ALU + ALU + ... + ALU + RegFile
みたいなのは、1つのCPUと言いたくないんだろう。

437:デフォルトの名無しさん
07/07/22 00:02:10
> ALU + ALU + ... + ALU + RegFile

そんな構成でどうやって1コアで8スレッドを実行するんだよ。

438:デフォルトの名無しさん
07/07/22 06:03:13
きっとスレッド=演算なんだろ

439:デフォルトの名無しさん
07/07/22 06:11:42
同時に処理できるのは1コア1スレッドまでだけどな。

440:デフォルトの名無しさん
07/07/22 06:19:18
シングルコアのマルチスレッドは所詮は幻想なんだな

441:デフォルトの名無しさん
07/07/22 08:14:01
この場合は、こういうことじゃないか?

> 今日まで市場で使用されてきた主要なサーバ向けプロセッサは、シングルコアもしくはデュアルコアであり、
> デュアルコア・プロセッサの中でも各々のコアで2スレッドが実行可能なものが技術的に最も進んだものと捉えられてきました。
> UltraSPARC T1は、この状況を一変させました。
> UltraSPARC T1プロセッサには、最大8つのコアが搭載され、各コアは、4つのスレッドを実行可能です。
URLリンク(jp.sun.com)

442:デフォルトの名無しさん
07/07/22 08:31:54
で、8スレッド制限の根拠未だ?

443:デフォルトの名無しさん
07/07/22 08:57:04
同時に実行できるのが8スレッドまでなんじゃないかな

444:デフォルトの名無しさん
07/07/22 11:21:52
1コア8スレッド同時実行てことは、PCも1コアあたり8個あるってことか?

445:デフォルトの名無しさん
07/07/22 11:38:32
1コア1スレッドまでという制限があるなんてはじめて聞いたんだが。
またチョンが敗北したw

446:デフォルトの名無しさん
07/07/22 11:40:26
「同時に処理できるのは」と書いておろうが

447:デフォルトの名無しさん
07/07/22 12:02:27
いやだから、1でも2でも、4でもない、8って数字の根拠未だ?

448:デフォルトの名無しさん
07/07/22 12:08:21
HTテクノロジーなんか、1コア2スレッドの典型例ジャマイカ
あれは1つのコアに2つのコンテキストを含んでるんじゃなかったっけ

449:デフォルトの名無しさん
07/07/22 12:23:20
同時実行スレッド数の話でいいのかな?
それだったらHTはそうだね。
で、8スレッドって話はどこから?

450:デフォルトの名無しさん
07/07/22 12:41:50
どっかに 8 スレッド使えるやつがあるのかな。

451:デフォルトの名無しさん
07/07/22 13:44:07
アセンブラ… ( ゚д゚)ウッウー
って何?

452:デフォルトの名無しさん
07/07/22 13:50:02
(><)ワカンナイデス!

453:デフォルトの名無しさん
07/07/22 13:58:42
同時に処理しなくていいなら、386ですら無限大のスレッド扱えるじゃん

454:デフォルトの名無しさん
07/07/22 14:31:00
ふーむ

455:デフォルトの名無しさん
07/07/22 14:47:12
>>448
1コア8スレッドの「8」は、たまたまそういう規格だっただけだろう。
実際、>>441は同時4スレッドっぽいし。

456:お約束の突っ込みだが (w
07/07/22 15:17:46
>>453
有限のメモリで無限のスレッドを管理できるんだ。

そんな凄いOSの名前をぜひ教えてくれまいか。

457:デフォルトの名無しさん
07/07/22 15:36:29
>>434は2ちゃんでも繰り返されたなw

458:デフォルトの名無しさん
07/07/22 16:26:33
これってアセンブラに関係する話なのか?

459:デフォルトの名無しさん
07/07/22 17:50:30
これは「 ( ゚д゚)ウッウー」に関係する話

460:デフォルトの名無しさん
07/07/22 19:03:36
「スレッド」の意味するものがコンテキストによって変化する例ですな

461:デフォルトの名無しさん
07/07/22 19:28:06
ストリーミングすりゃ、どんなCPUでも無限のスレッド使えるよwww


今日一日20スレッド処理し明日20扱い・・・・・・

どんどん増えていくなw

ド素人>>439の考えてることはこういうことだろ?w



462:デフォルトの名無しさん
07/07/22 19:28:48
439 名前: デフォルトの名無しさん [sage] 投稿日: 2007/07/22(日) 06:11:42
同時に処理できるのは1コア1スレッドまでだけどな。



で、これの根拠はどこなのだろうね

HTでも既に同時処理できているのに「1コア1スレッド」




団子無知すぎるw

463:デフォルトの名無しさん
07/07/22 20:04:52
>>462
おや、団子フォビアですか?

464:デフォルトの名無しさん
07/07/22 20:19:26
まんじゅう恐い

465:・∀・)っ-○◎●
07/07/22 20:55:44
馬鹿じゃね?

シンメトリックFGMTは1サイクル毎にスレッドを切り替えて実行するもので「同時」とは言わない。
同時なのはPentium 4のSMT方式

466:・∀・)っ-○◎●
07/07/22 21:01:09
>>434
on the flyがどう読んだらオン「ダ」フライになるんですか。中学生以下の英語力乙

467:デフォルトの名無しさん
07/07/22 21:16:53
>>466
オーストラリアをバカにするな!

468:デフォルトの名無しさん
07/07/22 21:21:49
アイゴートゥーオフィストゥダイ

469:デフォルトの名無しさん
07/07/22 21:35:31
もう荒れるから団子禁止にしようよ


470:・∀・)っ-○◎●
07/07/22 21:37:40
荒らしてるのはゲハのCellマンセー厨だろwww

471:デフォルトの名無しさん
07/07/22 23:13:05
そういうのを呼び寄せてるじゃんかw


472:デフォルトの名無しさん
07/07/22 23:45:22
レスの口調がすでにホイホイ全開だからなぁ
団子の欠点の1つだ

473:デフォルトの名無しさん
07/07/23 00:30:19
1コア1スレッドということは、SMTすら否定してるんだからw


団子はどんだけバカなんだw

474:・∀・)っ-○◎●
07/07/23 00:35:57
>>439は俺じゃないけどwww

ただFGMTやCGMTは「同時」実行機能はない。
レジスタファイルを多重化して高速にスレッドを切り替えてるだけ。

同じクロックタイミングに別々のスレッドが処理されることは原則的にあり得ない。

475:デフォルトの名無しさん
07/07/23 00:40:53
保険が利いたのかw


「ヤバそうなことは名無しで」


あとはしらばっくれりゃいいとw

476:・∀・)っ-○◎●
07/07/23 00:48:20
名無しが卑怯だと思うならコテ付ければ?常時卑怯なクソGKさんwww
俺は外す理由はないが

ちなみに>>439はPPEやNiagaraに限っては何も間違ったことは言ってない。


477:デフォルトの名無しさん
07/07/23 00:49:27
「スレッド」も「同時」も定義色々。
自分に都合のいい定義を選んだ上での議論に何の意味があるんだろう。


478:デフォルトの名無しさん
07/07/23 01:02:39
>PPEや



ハァ??????????
URLリンク(www-06.ibm.com)

このコードをダウンロードして実行した場合、

PPE SMT (同時マルチスレッド化) による加速が明らかになるのは、

フィボナッチ数列の実行が数千回以上繰り返された時点からです。
基本的に、スレッドの作成と管理によるオーバーヘッドは、
ある時点で、

スレッドを SMT で加速して実行することから

得られる高速化によって克服されます。

479:・∀・)っ-○◎●
07/07/23 01:04:20
インオーダパイプラインで複数コンテクストの命令コードを交互にフェッチするのはSMTとは言わんよ。
エグゼキューションのタイミングもほぼ例外なくデコード順。
アウトオブオーダのスーパースケーラでこそ「同時」になりうる。

SMTはフルスピードのシングルプロセッサとしても使えるが、
シンメトリックFGMTは分割数に依存して1スレッドあたりの最大スループットが落ちる。

SunのNiagaraはサーバ用途に限定してコンテクストスイッチを回避するために使ってるからな。
シングルスレッド性能が落ちても痛くない用途でだけ番長になれればいいのよ。
この会社、Intelにシングルスレッド性能で負けるようになった頃からずっと負け惜しみのごとく
「スループットコンピューティング」を提唱してる。

480:デフォルトの名無しさん
07/07/23 01:05:31

URLリンク(pc.watch.impress.co.jp)

さらに、PPEはIntelのHyper-Threadingと
類似のSMT(Simultaneous Multithreading)機能も搭載し、
2つのスレッドを同時に実行することができる。

2wayのSMTを実装したPPEと、8個のSPEで、
Cell全体では10スレッドを並列に実行できる。
つまり、ソフトウェア側から見るとCellの中に
10個のCPUがあるように見えることになる。
PPE は、512KBのL2キャッシュも備える。

481:デフォルトの名無しさん
07/07/23 01:06:23
どうなっとんだ!
オイコラ団子!!

IBMですらSMTと言ってるんだよ!!
で、挙動もまさしくHTと同じようなSMT。

団子!コラオイ!

482:・∀・)っ-○◎●
07/07/23 01:10:46
そんな学術的権威のかけらもない頭の悪い子の書いた記事を真に受けるなんて(ry

そこのSMTのSはSymmetricの略でSimultaneousじゃないだろw
同時実行じゃなくて交互実行。



483:デフォルトの名無しさん
07/07/23 01:11:46
また何の反証もせずに捏造かよw

484:デフォルトの名無しさん
07/07/23 01:12:31
URLリンク(www-06.ibm.com)



ここなんか設計・開発元じゃんw
権威も何も開発元wwwwwwwwwww

485:・∀・)っ-○◎●
07/07/23 01:12:49
全然
トレースキャッシュからのフェッチから実行まで2スレッドをごちゃ混ぜで処理できるHTと
尾っぽから先まで【交互】実行のFGMTが同じ技術なんて頭悪すぎ

486:・∀・)っ-○◎●
07/07/23 01:14:45
IEEEの論文引っ張り出してきてくださいwww
訳文が間違ってるのか原文が間違ってるのか知らんが、そのドキュメント書いた奴は頭悪すぎる

まあオン「ダ」フライなんて言ってる子にはわからんだろうけど

487:デフォルトの名無しさん
07/07/23 01:15:03
先にSMTではない証拠を出さないといかんだろ

488:・∀・)っ-○◎●
07/07/23 01:16:30
後藤はコンピュータの仕事にかかわったこともないただの記者。
伝えられた情報もろくに検証せず嘘も嘘のまま書く。


489:デフォルトの名無しさん
07/07/23 01:18:11
Linuxのgnome-system-monitorで見ていると、HTのXeonはCPU1とCPU2が両方負荷が上がっていくのに
PPEはCPU1とCPU2が交互にしか負荷が上がっていかないのはそういうわけか。

490:・∀・)っ-○◎●
07/07/23 01:18:38
>>487
現実にはSymmetric MultithreadingもSMTと略されるので頭の悪い子は混同しがちなんですよ。
本当はHyperTransportとHyperThreadingくらい違うのに。

URLリンク(www.google.co.jp)

491:デフォルトの名無しさん
07/07/23 01:22:12
いやだからPPEがSMTではない証拠はどこなんだよ。

492:デフォルトの名無しさん
07/07/23 01:22:50
どうせまた得意の捏造w

ド素人が知ったかコイて「1コア1スレッド」などとホザくと恥をかくとw

493:・∀・)っ-○◎●
07/07/23 01:23:42
URLリンク(www.radiumsoftware.com)

この辺みてね。馬鹿でも理解できるように違いが書いてある。

494:・∀・)っ-○◎●
07/07/23 01:24:45
だから「同時」実行できるスレッドは1つじゃん
交互実行できるのは2スレッドだけどな


495:デフォルトの名無しさん
07/07/23 01:26:02
だからSMTは同時じゃん

自分で言ってるのに分からんと?

496:デフォルトの名無しさん
07/07/23 01:26:36
用語の使い方なんか聞いてない。
PPEがSMTではない証拠。

497:・∀・)っ-○◎●
07/07/23 01:27:22
お前の大好きな後藤先生がSMTとFGMTが明確に違う、またPPEが後者であることを
明言してますよ

URLリンク(pc.watch.impress.co.jp)
●GPUは粒度の細かなスレッディングを採用

 マルチスレッディングには、制御の方式によっていくつか種類がある。

SMT(Simultaneous Multithreading)
Fine-Grained(細粒度) Multithreading
Coarse-Grained(粗粒度) Multithreading

 SMTはPentium 4のHyper-Threadingのように、複数のスレッドの命令を1サイクルの中で同時に実行することが
できるアーキテクチャだ。スレッドを切り替えるのではなく、異なるスレッドの命令を完全に混合して実行できる。

 それに対して、Fine-Grained Multithreadingは、同じサイクルに複数スレッドの命令は同時実行できない。
1サイクル単位でスレッドを切り替えて実行できる。CellプロセッサのPPE(Power Processor Element)など
のマルチスレッディングがこの方式だ。



498:・∀・)っ-○◎●
07/07/23 01:30:56
んで、これの日付をみましょうね。
URLリンク(pc.watch.impress.co.jp)

↑後藤の悪い癖は過去の記事の間違いは訂正しないこと。
だから後からみると矛盾がある

499:デフォルトの名無しさん
07/07/23 02:02:54
URLリンク(www.google.co.jp)

うんうん、PPEはSMTだねえ。

団子は後藤の言うことはすべてウソというので、
SMTではないと言う後藤の弁もウソなのだろうw


よって真SMTであると。

「SMTではない証拠が一切ない」しね。


500:デフォルトの名無しさん
07/07/23 02:04:33
PPEがSMTである証拠は山ほどあるが
SMTではない証拠は一切なしw
ひたすらド素人チョンが「用語の解説だけ」に終始しているザマw



SMTである証拠

>PPEや



ハァ??????????
URLリンク(www-06.ibm.com)

このコードをダウンロードして実行した場合、

PPE SMT (同時マルチスレッド化) による加速が明らかになるのは、

フィボナッチ数列の実行が数千回以上繰り返された時点からです。
基本的に、スレッドの作成と管理によるオーバーヘッドは、
ある時点で、

スレッドを SMT で加速して実行することから

得られる高速化によって克服されます。


501:・∀・)っ-○◎●
07/07/23 02:21:09
誤用をソースにされても。。。

1クロック毎に交互に実行するって公式に書いてあるのにそれすら読めない?


まあマーケティング用語としては何とでも言えるしね。
Pentium 4と同じ方式って言えば聞こえがいいし。ほとんど詐欺だけど。

502:・∀・)っ-○◎●
07/07/23 02:23:31
IBMの捏造は文化と化してるし

503:デフォルトの名無しさん
07/07/23 03:03:41
貶したかと思ったら突然採用するド素人チョンw
自分の言ったことすら分からんらしいw



488 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/07/23(月) 01:16:30
後藤はコンピュータの仕事にかかわったこともないただの記者。
伝えられた情報もろくに検証せず嘘も嘘のまま書く。





497 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/07/23(月) 01:27:22
お前の大好きな後藤先生がSMTとFGMTが明確に違う、またPPEが後者であることを
明言してますよ

504:・∀・)っ-○◎●
07/07/23 03:16:15
だから信用できないんだよ後藤は。情報の学位も持ってない素人だし。
俺が指摘するまで後藤の記事の矛盾に気づかなかったおばかさん。

仕事あるから寝るわ。

505:デフォルトの名無しさん
07/07/23 03:39:18
497 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/07/23(月) 01:27:22
お前の大好きな後藤先生がSMTとFGMTが明確に違う、またPPEが後者であることを
明言してますよ




これそのものがウソなんじゃんw



IBMでは明確に同時SMTといってるわけだしw
それを覆してない団子の負けw

506:・∀・)っ-○◎●
07/07/23 04:47:55
同時にSMTやるのか
頭痛が痛い人だな

インオーダコアで「同時」なんて無理だと何度言ったらわかるかなこのアホは。
学術論文を読みましょう。

URLリンク(ieeexplore.ieee.org)

あ?IEEEの会員じゃないから読めない?
私はCPUを語るに値しない馬鹿ですって言ってるようなもの。



あとここ読んだら?訳した奴が馬鹿だよ多分。
URLリンク(www-01.ibm.com)



507:・∀・)っ-○◎●
07/07/23 04:58:04
恩田フライくんは英語もよめなそうだな

> Well, fine-grained processing is used in a lot of CG type stuff, but it also allows for true multithreading
> during cache misses and such. Say for example both threads passing through the PPE are active and
> fine-grained. When one thread is not active or is stalled for whatever reason, the PPE will activate
> the 2nd thread and that thread will issue an instruction each cycle while the other thread figures out
> what has gone wrong,


508:デフォルトの名無しさん
07/07/23 05:22:27
インテルの次次世代コアはインオーダでHTありだよなw

509:・∀・)っ-○◎●
07/07/23 05:41:55
Itanium 2に搭載されたCGMTもIntelはHyper-Threaingと称してるがな。
マーケティング用語としてなら何とでも言える。

同様に、教科書通りのFGMTなのにSMTっていうのはマーケティング用語としてだろう。
キャペリンをシシャモだと言って売るのと同じようなもんかな。

510:・∀・)っ-○◎●
07/07/23 05:55:52
32nmプロセスの「Gesher」までCoreマイクロアーキテクチャベースのロードマップが公開されてる上で
派生プロダクトとして出すストリーミングプロセッサが「次次世代」なんて(笑)
Cellが正当進化だと思いたい電波らしい発言だなwww

アレはGPGPUによるストリーミングプロセッシングを置き換えるもので既存のCPUを置き換えるものではない。
キャッシュの構成からして今のGPUに酷似してる。

大体に22nmプロセスなら今のCore2を32コア化できるのでコアを退化させる必要自体ない。

511:・∀・)っ-○◎●
07/07/23 06:01:47
LarrabeeはPCI Express Gen2接続のアクセラレータボードで提供されるもの。
じゃあ、メインCPUのソケットには何が刺さるんだよwww

何に対して「次次世代」なのかよく考えて書くように。


512:デフォルトの名無しさん
07/07/23 09:40:41
自説がトンデモだと証明され
intelにまでケチつけはじめた

513:デフォルトの名無しさん
07/07/23 09:46:22
団子と取り巻き連中はスレタイ嫁

514:デフォルトの名無しさん
07/07/23 09:46:48
>>513
なんで?

515:デフォルトの名無しさん
07/07/23 10:12:51
1クロックで命令が完結するわけではないので同時実行という認識も間違っているわけではない
齟齬の原因は団子がSMTの定義を狭めすぎている事

516:デフォルトの名無しさん
07/07/23 13:27:09
命令が完結していなくても、処理が一時停止してるのであれば
その状態では命令を「実行」しているとは言えないんじゃないのか。

517:デフォルトの名無しさん
07/07/23 20:25:53
つまり、スレッド1のレジスタへの書き戻しと、スレッド2のフェッチが
同時に実行されてないとか調べろ、とかか?

518:デフォルトの名無しさん
07/07/23 23:03:36
実行はあくまでExecutionパイプだろ。
それはともかく、インオーダパイプラインのステージレベルの並列化なら90年代初頭からのFGMTの概念そのまんま。
SMTという言葉が確立したのはモダンなRISCアーキテクチャが出て来てからの話。Alphaみたいな。

てかSMTの実装自体、旧DECが特許を持ってて、Pentium4のHTはわざわざ買い上げて使ってる。

Cellのは名前だけパクったバッタモン実装と言われても仕方がない。

519:デフォルトの名無しさん
07/07/23 23:25:49
WindowsでJavaくらいしかいじったことないんですが、アセンブラに手を出したい時のおすすめの本ってありますか?

520:・∀・)っ-○◎●
07/07/23 23:39:05
Larrabeeは特定用途向けの「アクセラレータ」だってIntelが明言してるのに
Core 2の「後継」だと思ってるなんて馬鹿だな。

ピーク性能を引き上げるためにモダンアーキテクチャから削った機能は
汎用プロセッシングには決して無駄なものじゃないことは
PS3 Linux界隈の惨状で既にわかったことだろう

521:デフォルトの名無しさん
07/07/23 23:40:46
とりあえず「The Java Virtual Machine Specification」でJava/JVM/Bytecodeの
スペシャリストになるってのは?

幸い?Java界では自己書き換えコードとかがbytecode tailoringとかいって
数年前から流行ってるわけだし、近年のJavaベースシステムのトリッキーな
実装の中身を知るのも役に立つよ。

522:デフォルトの名無しさん
07/07/24 00:18:06
JavaVMっすか、渋いっすねw
でもアレはなんかアセンブラバリバリ弄ってるぜって感じがしないんで
俺はx86を推しとく。なんつったって一番身近だしな。

だけどなー、最近はアセンブラに関する良書がめっきり減ってな。
とりあえず次の2つは教科書としては最悪だから避けとけ。(けっして内容が悪いわけではないんだけどな・・・)
URLリンク(www.amazon.co.jp)
URLリンク(www.amazon.co.jp)

JavaVMなら、俺は↓の本しか知らん。おそらく>521が挙げてるやつだ。
URLリンク(www.amazon.co.jp)

523:デフォルトの名無しさん
07/07/24 00:24:43
あー、うん、ごめんよ。
おとなしく「はじめての〜」読んどく。

524:デフォルトの名無しさん
07/07/24 00:44:24
>>519

アスキー はじめて読む8086
\1,602 ISBN:978-4-87148-245-5
1987/4/1

ある意味教典。
いきなり32ビットの本などで目を回すよりは基本の8086で基礎を固める。
セグメントとオフセットの関係を徹底的に刷り込む。過去に全くかじった
ことがないのであれば、まず頭をバイナリ脳にする必要がある。


日経BP プログラムはなぜ動くのか 第2版
\2,520 ISBN:978-4-8222-8315-5
2007/4/5

元々は2001年の書物。
そこから重版を重ね、更に今年になって改訂となってる辺りからも
この本の評価の高さが伺える。アセンブラ一辺倒という訳ではなく
ハードウェア周りからCなどの高級言語との兼ね合いなども網羅した
総合的な本。先にこの本で手応えを探ってみるのもアリ。

525:デフォルトの名無しさん
07/07/24 01:40:30
>>524
セグメントとオフセットは過去の遺物じゃないか。今更勧められたシロモノじゃない。
ページングの概念を学習する上で逆に邪魔になるだけだろ。

526:デフォルトの名無しさん
07/07/24 02:17:32
ああ、386のネイティブモード以前は、仮の姿だからな。
そんなもん覚えても無意味。

527:デフォルトの名無しさん
07/07/24 06:27:46
リアルモードや仮想86モードで何か書く時になってから調べればおっけ。
86のセグメントなんて、大層なもんじゃない。

528:デフォルトの名無しさん
07/07/26 16:17:49
RGBA→ARGBの変換を行いたいのですが、いったいどれが一番速いのでしょうか。

struct RGBA {unsigned char a, b, g, a; }; // rrggbbaa
struct ABGR {unsigned char r, g, b, a; }; // aabbggrr

void conv1(RGBA &x, ABGR &y) {
 x.r = y.r; x.g = y.g; x.b = y.b; x.a = y.a;
}

void conv2(RGBA &x, ABGR &y) {
 uint32_t t = *(uint32_t *)&y;
 *(uint32_t *)&x = (y.r << 24) | (y.g << 16) | (y.b << 8) | (y.a);
}

void conv3(RGBA &x, ABGR &y) {
 uint32_t t = *(uint32_t *)&y;
 *(uint32_t *)&x = ((t & 0x000000ff) << 24) | ((t & 0x0000ff00) << 8)
            | ((t & 0x00ff0000) >> 8) | ((t & 0xff000000) >> 24);
}

void conv4(RGBA &x, ABGR &y) {
 __m64 mm0 = _mm_cvtsi32_si64(*(uint32_t *)&y);
 mm0 = _mm_unpacklo_pi8(mm0, _mm_setzero_si64());
 mm0 = _mm_shuffle_pi16(mm0, _MM_SHUFFLE(0, 1, 2, 3));
 mm0 = _mm_packs_pu16(mm0, mm0);
 *(uint32_t *)&x = _mm_cvtsi64_si32(mm0);
}

529:デフォルトの名無しさん
07/07/26 16:22:41
試せば?

530:デフォルトの名無しさん
07/07/26 16:25:33
>>528
このスレ的には、アセンブリ出力を見比べてみろと言うことで。
どうせなら、inlineをつけるかなにかしてループ内で実際に使うロジックを見比べてみるといい。

531:デフォルトの名無しさん
07/07/26 16:39:38
インラインアセンブリでbswapはなしですか。

532:デフォルトの名無しさん
07/07/26 20:10:51
pshufb

533:デフォルトの名無しさん
07/07/26 23:00:19
void conv5(RGBA &x, ABGR &y) {
#if defined(_MSC_VER)
*(uint32_t *)&x = _byteswap_ulong(*(uint32_t *)&y);
#elif defined(LITTLE_ENDIAN) // 自分で定義してね
*(uint32_t *)&x = ntohl(*(uint32_t *)&y);
#else
conv1(x, y);
#endif
}


534:デフォルトの名無しさん
07/07/26 23:00:59
このスレ的には bswap しかないんじゃね。

535:デフォルトの名無しさん
07/07/26 23:04:19
533はまずbswapになる。
アセンブラを使うまでもない。

536:デフォルトの名無しさん
07/07/26 23:15:05
RGBAをBGRAに変換だとどうだろ。
ror と bswap がシンプルに見えるんだが。

537:デフォルトの名無しさん
07/07/27 09:42:34
( ゚д゚)ウッウー
ってどんなニュアンス?

538:デフォルトの名無しさん
07/07/27 10:41:56
A 「つか教科書忘れたぁ??!」
B 「( ゚д゚)ウッウー」

539:デフォルトの名無しさん
07/07/27 10:43:17
IM@Sか!

540:デフォルトの名無しさん
07/07/27 11:26:20
オレもアイマスネタ書こうと思ってた・・・

541:デフォルトの名無しさん
07/07/28 01:33:44
ハイ おさらい。
スレリンク(tech板)l50

SSE実行できないCellでSSEの実測をしたという捏造の瞬間wwwww

864 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/06/17(日) 16:22:27
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0
movd xmm0, eax
movd eax, xmm0


こんな感じで繰り返せば一応往復のレイテンシは計測できるよね
で、何クロックかかるのかな?

答えてね。俺より頭いい子ならすぐわかるはず。


もっとも俺は実測結果あるけど


866 名前: デフォルトの名無しさん [sage] 投稿日: 2007/06/17(日) 16:26:12
CellでSSEって


542:デフォルトの名無しさん
07/07/28 04:27:33
>>538
Uh-oh! のつもりか?

543:デフォルトの名無しさん
07/07/28 07:32:33
うっうー、全国のアセンブラーさん、おはようございます。

544:デフォルトの名無しさん
07/07/28 09:06:14
団子って知識があるのかないのかわからん

545:デフォルトの名無しさん
07/07/28 09:46:57
>>544
範囲が狭く時に間違っているが知識はある
つまり普通だな

546:デフォルトの名無しさん
07/07/28 09:49:24
86の各アセンブラ命令の実行サイクル数とかってマニュアルに載ってないよね?
基本的には命令数が少なければ速いでおk?

547:デフォルトの名無しさん
07/07/28 09:53:17
レイテンシとスループットなら Architecture Optimization の C に載ってるけど。

548:デフォルトの名無しさん
07/07/28 09:55:22
なるほど、レイテンシが実行サイクル数か!
探してみます、ありがとう

549:デフォルトの名無しさん
07/07/28 10:01:09
>>549
いや、そう単純じゃないから。まぁ、概ねそれでもいいけど。

550:デフォルトの名無しさん
07/07/28 10:12:55
前はμop 数とか載ってたな。

551:・∀・)っ-○◎●
07/07/28 12:36:37
SPEがAltivec互換とか言ってた負け犬うぜーな。俺はSSEのって最初っからことわってるのにwww




552:・∀・)っ-○◎●
07/07/28 12:39:07
既にほとんどの128bit SIMD命令のデータスループットがMMXの倍となった
Core 2アーキで、MMレジスタを有効活用する方法でも考えてけろ



553:デフォルトの名無しさん
07/07/28 12:43:45
MMレジスタなら浮動小数点演算で散々使ってるお (意味違

554:名無しさん@そうだ選挙に行こう
07/07/29 15:30:21
402 名前: デフォルトの名無しさん 投稿日: 2007/07/15(日) 02:47:48
SPUはベクトル演算器であるとは書かれているがw
Altivecが何たるかも知らんド素人かw

555:名無しさん@そうだ選挙に行こう
07/07/29 15:32:01
団子は「SPEがAltivecやVMXと同じベクトルユニットである」ことも知らず、
(AltivecとVMXが完全互換であることも知らないし、そもそもVMXとかAltivecって何?だったわけでw)

CellでSSE実行時間を測定などと




無知を自分からひけらかしているのだよw

556:名無しさん@そうだ選挙に行こう
07/07/29 16:52:37
毎週毎週ご苦労様。

557:・∀・)っ-○◎●
07/07/29 17:06:16
池沼(いけぬま)はスレタイくらい読(よ)もうね。

そして、コピペやってる自分自身(じぶんじしん)が一番(いちばん)恥(は)ずかしいことにきづこう

ゲハのCell(ごみくず)スレで相手(あいて)してあげるからさ、迷惑(めいわく)はかけないでほしいよ。



小学生でも読めるようにふりがな付きでレス

558:・∀・)っ-○◎●
07/07/29 17:08:56
ということで誘導。

Cell 91
スレリンク(ghard板)

559:名無しさん@そうだ選挙に行こう
07/07/29 17:44:47
自分の間違いは必死に言い訳とw

560:名無しさん@そうだ選挙に行こう
07/07/29 18:07:47
> 557 名前: ・∀・)っ-○◎● Mail: sage 投稿日: 2007/07/29(日) 17:06:16
> 池沼(いけぬま)はスレタイくらい読(よ)もうね。
(中略)
> 小学生でも読めるようにふりがな付きでレス


ちょwwwふりがな間違ってるw

561:名無しさん@そうだ選挙に行こう
07/07/29 18:19:52
俺も「いけぬま」派だな。正しい読み方は知ってるけど、所詮は当て字だからね。

562:・∀・)っ-○◎●
07/07/29 18:25:14
昔、「池沼博智」ってコテがいたんだよ。
音読みすんじゃねーぞwww

563:名無しさん@そうだ選挙に行こう
07/07/29 19:36:39

Cellの話してたのに都合悪くなると 「Cellが前提とは言ってない」


日本語も読めないチョンを紹介w


25 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/07/29(日) 17:57:45 ID:Vsv/zuV40
Cellが前提なんてひと言も言ってない。

564:・∀・)っ-○◎●
07/07/29 21:01:48
都合が悪くなるとコピペをやり出すwww
脳味噌なさすぎ

565:デフォルトの名無しさん
07/07/29 21:10:52
>コピペをやり出す
頭良さそうな文を書くね^^

566:デフォルトの名無しさん
07/07/29 21:13:59
くやしいのうwwwwくやしいのうwwwwwwww

567:デフォルトの名無しさん
07/07/29 21:57:03
つのだせwwwwwww
やりだせwwwwwwwww

568:デフォルトの名無しさん
07/07/29 23:21:11 0
アッオォゥ!

569:デフォルトの名無しさん
07/07/30 06:18:46
まあCASIOのZ-1GRに打ち込むのが一番だな

570:デフォルトの名無しさん
07/07/31 04:18:06
へんなのに粘着されてだんご可愛そう

571:デフォルトの名無しさん
07/07/31 04:52:49
都合が悪くなると
コピペだとか言い出すだけwwww


脳みそなさ杉w

572:デフォルトの名無しさん
07/07/31 04:56:54
よほど悔しかったんだろうなあw


Cellの話してたのに都合悪くなると 「Cellが前提とは言ってない」


日本語も読めないチョンを紹介w


25 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/07/29(日) 17:57:45 ID:Vsv/zuV40
Cellが前提なんてひと言も言ってない。

573:デフォルトの名無しさん
07/07/31 09:48:58
>>572
まあ、夏休みなんだから気のスムまで、このスレでどうぞ。 

お二人とも、
テクニカルな話題が好きな人が往々にしてなる症状なので、こうならないための反面教師みたいなもの。

あ、
アセンブラスレは他にもあるので、質問話題あれば別スレにどうぞ

574:デフォルトの名無しさん
07/07/31 10:42:23
そろそろダンゴさんに〆めて欲しいところだ

575:デフォルトの名無しさん
07/07/31 11:08:36
そのコピペやろうに今俺は絡まれているぞ。
PS3のトタン スレで。
俺のことを団子とかいいやがる。別人なのに。
マジデあいつ日本語やばいな。
使用する用語がいちいち自分定義だし。

576:デフォルトの名無しさん
07/07/31 12:07:46
名無し版のあの人か

577:デフォルトの名無しさん
07/07/31 15:15:42
アスペルまじうぜぇなぁ。
日本語の形を成してない意味の通らない文章を書いて、
挙句の果てに勝ち誇るのは止めて欲しい。
読んでるこっちは、どうして彼が勝ち誇っているのかサッパリわからんからな。

578:デフォルトの名無しさん
07/07/31 20:16:44
つ[チョンの勝ち誇り逃げ]

579:デフォルトの名無しさん
07/07/31 22:19:00
団子に間違われるなんて人間として終わりだろ?

580:デフォルトの名無しさん
07/08/01 08:34:11
和菓子として始まったな

581:・∀・)っ-○◎●
07/08/01 23:54:03
彼、見えない敵と戦ってる人なんで許してあげましょう


582:デフォルトの名無しさん
07/08/01 23:57:22
やっぱ団子だったのか


何もしらないことがまたバレたw

583:デフォルトの名無しさん
07/08/02 00:03:30
こういう、できもしないことを平気でぬかす
グラフィックスプログラミング知らん無知w

サーフェイスの取り扱いがどこにあるのかも知らないバーカw

スレリンク(ghard板)l50

687 名前: ・∀・)っ-○◎● [sage] 投稿日: 2007/08/01(水) 01:11:23 ID:+XsXi8L40
GPGPUじゃねーの?
箱○ってメモリ共有だからいちいちサーフェイス作って転送とかやんなくていいんだよな

584:デフォルトの名無しさん
07/08/02 00:12:49
わからんかったのうwwwwwwwwwwくやしいのうwwwwwくやしいのうwwwwwww

585:デフォルトの名無しさん
07/08/02 00:20:34
いいからケェレ

【くやしいのうww】はだしのゲンのガイドライン2
スレリンク(gline板)

586:・∀・)っ-○◎●
07/08/02 00:22:30
知ったかがまだ吼えてるのか


587:デフォルトの名無しさん
07/08/02 00:32:01
スレリンク(ghard板)l50

団子完膚なきまでに負けてらw

588:デフォルトの名無しさん
07/08/02 00:52:02
mmer板にだんごスッレッドッってないの?

589:・∀・)っ-○◎●
07/08/02 00:58:30
フェンリル板にだんごやさんスレがあるよ

590:デフォルトの名無しさん
07/08/02 02:15:49
ダンゴ隔離スレの機運が高まってきたな

591:デフォルトの名無しさん
07/08/02 13:16:57
ダンゴさんには隔離スレをピシっと引き締めてもらうことにして、
ここでのヤンチャはご勘弁願えないかな


592:デフォルトの名無しさん
07/08/02 21:01:19
いまだに整数掛け算は何百クロックもかかっているのか?
浮動小数点の掛け算とか1クロックで実行できるみたいだが。

593:デフォルトの名無しさん
07/08/02 21:56:32
1クロックで次に進めはするけど、
答えが返ってくるまでに時間がかかるんじゃなかったっけ?

594:デフォルトの名無しさん
07/08/02 22:10:50
外付けFPU1GHzで、つながってるプロセッサが2MHzとかなら余裕。

595:・∀・)っ-○◎●
07/08/02 23:31:08
>>592
どんなCPUのことだよ?

浮動小数の掛け算を1クロックで処理できるって言ってもパイプライン処理によるスループットのことで
レイテンシは数クロックはかかる。

仮に整数用の乗算ユニットがなかったとしても、単精度浮動小数の掛け算ユニットは
有効精度24ビットの整数乗算ユニットとしても使えるはずなので、整数がそんなに遅いわけがない。

596:デフォルトの名無しさん
07/08/02 23:57:05
整数かけ算が1クロックで済むようになってから久しいというのに、ここはどんだけの過去スレか?

597:・∀・)っ-○◎●
07/08/03 00:03:14
GeForce8とかのGPUとかCellのSPEなんかも整数使えるけど
単精度用設計の乗算ユニットを整数でも使えるようにしているだけなので
32ビットの乗算にスループットでも4クロック程度はかかる。


598:デフォルトの名無しさん
07/08/03 00:07:15
>>596
その手の命令どころかcmp test系命令すらないCPUでせこせこシフト加算している俺に対する挑戦だな。

599:・∀・)っ-○◎●
07/08/03 00:10:52
いまだにそういうのいるんだ

俺が触った一番小さい石でR8Cだからそのへんはわからん。
仮想CPUでいえばCOMET/COMET-II、あと、B2の教材として教授の設計した変なプロセッサ使った。

600:デフォルトの名無しさん
07/08/03 00:59:04
8086用コンパイラのlong(32bit)掛け算ルーチンを80386用に最適化したら、
殆ど速くならなくてがっくり来たことを思い出した。

601:デフォルトの名無しさん
07/08/03 01:02:41
ああいるよ。
そこらへんの家電やおもちゃの中に入ってるのはだいたいそういう奴だ。

602:デフォルトの名無しさん
07/08/03 12:59:48
ついこのあいだリモコンでそういうCPUをいぢった。

603:デフォルトの名無しさん
07/08/03 13:56:55
ちっぽけなリモコンだと乗除算なんて使わないしな。
ボタンに反応して割り込み入れるだけならシンプルなのがいいのかもしらん。

604:デフォルトの名無しさん
07/08/04 00:13:15
>俺が触った一番小さい石でR8C

強がりは見苦しいぞ



次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

5011日前に更新/204 KB
担当:undef