CPUアーキテクチャについて語れ 40 at JISAKU
[2ch|▼Menu]
[前50を表示]
700:Socket774
17/10/10 19:25:36.24 h2azpmeX0.net
停電の恐怖と記憶容量の制約から主記憶を解放するNVDIMM技術
URLリンク(pc.watch.impress.co.jp)
何度目かのNVDIMM展望

701:Socket774
17/10/11 12:37:40.96 FjOMGh0B0.net
Intelが17キュービットの量子コンピューター向け超伝導チップのプロトタイプを製造


702: - GIGAZINE http://gigazine.net/news/20171011-intel-17-qubit-superconducting-chip



703:Socket774
17/10/11 14:12:37.58 CAwo4jt5a.net
超伝導タイプの方に重きを置いてる感じがあるからな

704:Socket774
17/10/11 14:28:48.77 k5j9e++Wp.net
何度目かのNVIDIA展望に見えた

705:Socket774
17/10/11 21:01:40.93 emIG4S3x0.net
3D Xpointの普及はNVDIMMにかかってるてことか?

706:Socket774
17/10/11 21:48:05.61 kSAETy1k0.net
完全なバイナリ互換性を捨ててまであまり使われない命令を削減して新たな命令を追加した
MIPS64R6やMIPS32R6が無視されてMIPSは古い命令セットとか書かれてるんですけど
最近ではDebian 9からMIPS64R2でリトルエンディアンのmips64elをやりだしたね
MIPSの行方、生き残りの道はあるのか
URLリンク(eetimes.jp)

707:Socket774
17/10/11 21:50:43.39 kSAETy1k0.net
ただ、MIPSはMIPS64R2やMIPS32R2はエコシステムがある程度機能してるけど
完全なバイナリ互換性を捨てたMIPS64R6やMIPS32R6のエコシステムはまだまだなんだよね

708:Socket774
17/10/11 21:56:34.30 kSAETy1k0.net
The MIPS32 Instruction Set v6.05
URLリンク(cdn2.imgtec.com)
The MIPS64 Instruction Set v6.05
URLリンク(cdn2.imgtec.com)

709:Socket774
17/10/11 22:10:40.01 kSAETy1k0.net
ARMのAArch64のadrpのような命令がMIPS64R6やMIPS32R6では追加されてる
それが、これで下位16bitは0x0000になる
ALUIPC rs,immediate
それとは別に下位16bitを0x0000にしない命令も存在する
AUIPC rs, immediate
ただ、この2つの命令をアセンブラでどうやって書くかは知らない

710:Socket774
17/10/13 01:04:20.21 R32dL4A00.net
>>683
MIPS64ってPS2のEEのCPUコアにも使われたっけか?

711:Socket774
17/10/13 03:58:29.92 MNV6jxl00.net
>>687
MIPS32だね
PS、PS2、PSPのCPUコアがMIPS
MIPS64はNINTENDO64だね

712:Socket774
17/10/13 04:04:39.05 MNV6jxl00.net
MIPS64R6では主に下記のような改良が加えられてるがバイナリの下位互換性は失われた
・命令コードマップが将来の拡張を見込んで改良された
・遅延スロットのない分岐命令の追加
・遅延スロットのないジャンプ命令の追加
・レジスタの31-16、47-32、63-48に即値をロードまたは加算する命令の追加
・PC相対命令の追加
・乗除算結果を格納するHi、Loレジスタの削除。汎用レジスタでこれらの演算ができるようになった
・FPUがIEEE754-1985からIEEE-754R-2008に変更になった
・ソフトウェアによるプリフェッチ命令がL1、L2、L3まで拡張された
・スケール付きインデックス・アドレッシングがサポートされた

713:Socket774
17/10/13 17:34:29.26 mnN3nJpN0.net
MIPSのグダグダを見るにやはりamd64は正しいんだなと思う。

714:Socket774
17/10/13 17:51:10.39 RcjjtOIy0.net
Intelみたいにレガシー命令はマイクロコード実装すればいいのに
レガシー命令の実効速度が数分の1に落ちたところでだれも気にしない
レガシーコードが動くだけで十分

715:Socket774
17/10/13 17:54:11.54 RcjjtOIy0.net
ハードウェア実装しないレガシー命令の実効方法として、
・マイクロコード実装
・OSがトラップしてソフトウェアエミュレーション
・ハイパーバイザ的なところでトラップしてソフトウェアエミュレーション
あたりが考えられる

716:Socket774
17/10/13 18:04:14.58 I/2/ksfi0.net
モダンな命令だけを実行できる大型コアとレガシー命令も実行できる小型コア


717:フ組み合わせというのを思いついた



718:Socket774
17/10/13 18:16:42.94 mnN3nJpN0.net
> レガシー命令の実効速度が数分の1に落ちたところでだれも気にしない
これがMIPS、PowerPC、初期Pentiumの敗因。

719:Socket774
17/10/13 18:36:13.27 U4L8psLJM.net
初期Pentiumはレガシーだとそれほど速くならなかったが、一応高速化はした
低速化して叩かれたのは初代P6(Pentium Pro)だ

720:Socket774
17/10/13 19:00:29.50 eJDgeHRIa.net
70年代末にRISCの方が高効率と謳われたが
結局残ったのはCISCとCISCみたいな命令を実装したRISCだったのは
何でなんだろうか

721:Socket774
17/10/13 19:48:33.74 RcjjtOIy0.net
どんなアーキテクチャが高効率かはプロセス・トランジスタ数・クロックにもよる
またむかしのCPUは消費電力が低く、いまの消費電力の上限にぶつかって性能が上げれない時代とは違う
CPUが100万トランジスタ程度ならおそらくRISCが高効率
いまの数十億トランジスタみたいなのを想定してなかったからな

722:Socket774
17/10/13 20:11:39.32 mnN3nJpN0.net
設計が複雑になるからとフラグレジスタを削除するような輩なのだから、
ハナから高度で複雑なCPUを作る頭などなかったのだ。

723:Socket774
17/10/13 20:15:32.01 R32dL4A00.net
>>694-695
だよなあ
PentiumUで16ビットがまともに
動くように改良されたもんな

724:Socket774
17/10/13 20:17:59.25 R32dL4A00.net
>>688
ありがとう!
記憶があやふやだったもんで助かったよ
SGIがMIPSでブイブイ言わせてた時代が懐かしいわw

725:Socket774
17/10/13 20:34:17.21 MNV6jxl00.net
32bitのx86にはEIP(他のCPUでいうPC相当)相対アドレッシングがなかったが
AMDが64bitのAMD64でdispなしのRBP間接アドレッシングを潰して
RIP相対アドレッシングをねじ込んでくれたんだよな
しかもRIP相対アドレッシングのdispが32bit幅なので広範囲のRIP相対が実現できてる

726:Socket774
17/10/13 21:00:53.25 aZhwDAbG0.net
>>694
Netburstも仲間に入れてあげて

727:Socket774
17/10/13 21:18:35.19 MNV6jxl00.net
MIPSはMIPS32R5やMIPS64R5まではバイナリ互換性を維持してたけど
MIPS純正のIPコアで64bitのコアはMIPS64R6ばかりで
MIPS64R5以前のものがレガシーのMIPS 5Kとかしかない
なのにDebian 9でMIPS64R2のmips64elを提供してきたのは中国の龍芯3やXBurst2での利用を想定してるのかな
ちなみにAndroidの32bitMIPSはMIPS32R2用で64bitMIPSはMIPS64R6用
AndroidでMIPSは全くと言っていいほど使われてないけどね

728:Socket774
17/10/13 22:02:23.15 MNV6jxl00.net
>>696
ARMはiPhoneとAndroidに採用されただけ
SHやPowerPCがiPhoneやAndroidに採用されてれば、
SHやPowerPCが今のARMの地位にいただろうね

729:Socket774
17/10/13 22:07:41.15 66UWGLN6a.net
どっちもライセンス高いもん

730:Socket774
17/10/13 22:59:43.24 NoCHoAD+0.net
コスパワッパもそうだがpowerPCってARMに比べて弄り回せる奴が限られてそうなイメージ

731:Socket774
17/10/14 13:34:06.34 /BccE+s/0.net
>>704
スマホ以前から携帯電話での採用実績が全然違うだろ

732:Socket774
17/10/14 14:12:40.15 TqJLvbxE0.net
intelがモバイル向けで負け続けてる。intelに限ってはユーザはモバイルでも性能を要求するんだよね。
armは遅くても文句言われないのに。だがarm板windowsになるとやはりユーザは性能を要求してか全く売れなかった。

733:Socket774
17/10/14 15:02:42.35 PeW4bcLo0.net
>>708
ARM版のWindowsってサブセットでサードパーティのWin32アプリが動作しないLinux以下のゴミだったしな
今度出すARM版Windows10はフルセットのWindows10で
サードパーティのWin32アプリが動作するしx86エミュもするけどどうなるんだろうな

734:Socket774
17/10/14 15:16:25.85 PeW4bcLo0.net
32bitのARMはモバイル用途が多くて省電力設計だったけど
64bitのARMになって省電力じゃなくて性能重視になったんだよな
それでQualcommは64bitになってからハイエンドSoCの発熱で迷走してた
特にハイエンドのAndroidでは高性能コア4コアが一般的になってたからな
iPhoneのA10やA11のクロックあたりの性能はかなり高くて優秀
しかし、A10やA11はiPhoneやiPadにしか載らない
A10やA11に匹敵するようなシングルスレッド性能を持つARM純正のIPコアが出ればいいのにな

735:Socket774
17/10/14 15:24:41.57 PeW4bcLo0.net
そういえば、ARMの高性能分野といえば、NVIDIAがこんなの発表したな
NVIDIA、現行品の約13倍の性能を持つ「DRIVE PX PEGASUS」をドイツで発表。レベル5自動運転が実現可能に
320TOPS。搭載GPUはVoltaの次世代を2基
URLリンク(car.watch.impress.co.jp)
NVIDIA次世代SoC「Xavier」は進化版DenverとVoltaを搭載
URLリンク(pc.watch.impress.co.jp)

736:Socket774
17/10/14 15:25:36.47 Kdt2DDlsa.net
Uプロセッサ程度でも楽々処理できるエクセル計算が
ARMだとApple Aシリーズでも重くて無理になってるの見るに
x86てなんだかんだハイパフォーマンス狙うなら一番なんだろうなあ
スマートじゃないとか非効率だとか
そういったことを、多分20年以上前から言われてるアーキテクチャだけれど

737:Socket774
17/10/14 15:36:09.45 TZknH9220.net
重いGUI OS/重いGUIアプリでは、
L2/L3の容量や性能がかなり大きいのでは?
だから、ベンチマークでは早いはずのCPUが、実使用時にはもっさり遅くなる

738:Socket774
17/10/14 15:47:42.26 yfUY+iG70.net
>>712
ARM自体が高性能向きじゃねーからなー
それにx86は兎も角x64になってからはそんな事は言われてない筈
色々拡張されたし、現存のほか見ると一線級のハイパフォーマンスISAと言えるだろ
民需量販市場で何十年も先端走ってきただけはあるってこった
でもRyzenで大方追い付けたトコを見るに、これも限界近いかもな

739:Socket774
17/10/14 17:01:33.54 RLgkH1m+0.net
>>712
単純に最適化の度合いの差じゃないの?
以前の話だけどMac(PowerPC)向けに出てた3DCGソフトのPC版が出たすぐ、Macの半分も性能出なかったことあるぜ

740:Socket774
17/10/14 18:06:58.46 J5cw32BX0.net
ARM Windowsは動くことが重要だから性能は気にすんな

741:Socket774
17/10/14 18:35:20.33 HEQg5Ciqa.net
>>715
昔のゲームのはなし持ってきても
おおよそ現代には当てはまらないかと
HPC/WS向けソフトのパフォーマンスとかなら、たしかにearly runningとかの注記があるけれども
そもそも出てすぐの話じゃないよ

742:Socket774
17/10/14 18:36:37.17 rcRzkHfB0.net
ビジネス以外でwindows使わなくなった

743:Socket774
17/10/14 18:53:24.50 HEQg5Ciqa.net
失礼、CGソフトか

744:Socket774
17/10/14 19:00:07.34 PeW4bcLo0.net
NVIDIAは車載向けというある程度高価格で売れるSoCの売り先をよく開拓したよな
CPUというよりもGPUが売りのSoCになってるけど

745:Socket774
17/10/14 19:03:42.56 wkfpOhQ00.net
Ryzenは健闘したが、ハイエンド向け(対Xeon)だとどうなんだろうかねえ
EPYCはLAMMPSとかそういったもののソフトの各ベンチをいまだに見ないけれど

746:Socket774
17/10/14 20:20:55.34 cDlCUOrt0.net
>>720
そうだけど、最新のDenver2.0はかなり相当高性能らしいね

747:Socket774
17/10/14 20:28:05.81 J5cw32BX0.net
Denver2はDenver1とほとんど一緒で、最適化で30%向上とからしい
URLリンク(pc.watch.impress.co.jp)

748:Socket774
17/10/14 20:50:36.58 rcRzkHfB0.net
parkerのやつとはちがうで
XavierのCPUコアも、あるNVIDIA関係者によるとDenverコアだという。「Denverは我々が開発した最初のARMコアだった。(XavierのCPUコアは)そのファミリツリーに連なるCPUコアだ。
しかし、単なるDenverの再利用ではなく、多くの新機能が加えられている。Denverの拡張というより進化型のCPUコアだ」。

749:Socket774
17/10/14 21:20:30.81 cDlCUOrt0.net
>>723
ありがとう!
>>724
うる覚えだったのはそっちだった
XavierとParkerのDenverは同じものじゃないんだね

750:Socket774
17/10/14 21:21:15.29 cDlCUOrt0.net
すまん
sage忘れた

751:Socket774
17/10/14 22:22:32.06 2Bb9YUee0.net
>>688
いやEEのコアは64bitだぞ
MIPSIII世代+αのR5900 (東芝はTX79シリーズとして出してる)

752:Socket774
17/10/15 06:30:25.05 Ezr+ZGMB0.net
Wikipediaってすごいな
Emotion Engine
URLリンク(ja.wikipedia.org)
CPU (EE Core)
  MIPS R5900 ベース
  MIPS IIIに107個のマルチメディア拡張命令を追加
    一部 MIPS III 非準拠
     (セマフォ命令のLL・LLD・SC・SCD、および64bit 乗算および除算命令のDDIV・DDIVU・DMULT・DMULTUが削除)
    一部 MIPS IV 準拠(プリフェッチ命令のPREF、および条件転送命令のMOVN/MOVZが追加)
  クロック周波数: 294.912 MHz
    スーパースカラ 64 ビット 整数演算ユニット×2
    命令キャッシュ: 16 KB
    データキャッシュ: 8 KB
    データスクラッチパッドRAM: 16 KB
FPU
  32bit 単精度浮動小数点積和演算ユニット×1 + 浮動小数点除算ユニット×1

VPU0 (Vector Processing Unit)
EE Coreからのコプロセッサ命令に基づき、
第2コプロセッサ (COP2) として動作する「マクロモード」のほか、
独自したプロセッサとして動作する「マイクロモード」が存在している。
VPU1とは対照的に、EE Coreと密接な処理を行う。
  VU0
    32ビット MIPS COP2 命令(マクロモード時)
    64ビット LIW (Long Instruction Word) 命令(マイクロモード時)
    データ用RAM (VU Mem): 4KB
    マイクロ命令格納用RAM (Micro Mem): 4KB
    128ビット 150MHz
    浮動小数点積和演算ユニット×4 + 浮動小数点除算ユニット×1

753:Socket774
17/10/15 06:30:46.84 Ezr+ZGMB0.net
その他のプロセッサ
VPU1
EE Coreと独立したジオメトリエンジンとして動作する。
VPU0と違って「マイクロモード」でしか動作しない。
そのため、VU0よりもメモリが多めになっている。
  VU1
    64ビット LIW 命令
    データ用RAM (VU Mem): 16KB
    マイクロ命令格納用RAM (Micro Mem): 16KB
    浮動小数点積和演算ユニット×5 + 浮動小数点除算ユニット×2
    EFU(初等関数演算ユニット)搭載
IPU (Image Processing Unit)
画像データの展開処理を行うプロセッサであり、
MPEG-2ビットストリームの展開、I-Picture マクロブロックの復号のほかに、
ディザリング、YCbCrからRGBへの色変換、ベクトル量子化機能を持つ。
なお、MPEG-2のデコードの際の動き補償はIPUでは行わず、EE Coreのマルチメディア命令を用いる。

754:Socket774
17/10/15 06:39:27.48 Ezr+ZGMB0.net
MIPSはこんなこともやってたな
イマジネーション、CPUアーキテクチャの新教育プログラム「MIPSfpga」を発表
先進のMIPS CPUアーキテクチャ教育に革命を起こすと共に、MIPSfpgaプログラムにより
大学でのMIPS RTLコードの学習および実際のMIPS CPU研究が可能
URLリンク(www.imgtec.com)


755:3%E3%80%81cpu%E3%82%A2%E3%83%BC%E3%82%AD%E3%83%86%E3%82%AF%E3%83%81%E3%83%A3%E3%81%AE%E6%96%B0%E6%95%99%E8%82%B2%E3%83%97/ ホンモノのMIPSコアを無償で大学教育に Imaginationが11月に日本で実習付き講習会 http://techon.nikkeibp.co.jp/atcl/news/15/100400580/



756:Socket774
17/10/15 07:34:43.02 fePv+ANx0.net
教育機関はパタヘネヘネパタがRISC-Vになっちゃったからなあ。
URLリンク(news.mynavi.jp)
もう既に成果物も出始めているし。

757:Socket774
17/10/15 15:56:22.22 Ezr+ZGMB0.net
パタヘネ本はAmazon.comのランキングではMIPS、ARM64、RISC-Vの順になってるね
Amazon.co.jpのランキングだとARM64、MIPS、RISC-V
今のところ日本語訳はMIPS版しかない
パタヘネ本
Computer Organization and Design MIPS Edition, Fifth Edition
URLリンク(www.amazon.com)
Computer Organization and Design ARM Edition
URLリンク(www.amazon.com)
Computer Organization and Design RISC-V Edition
URLリンク(www.amazon.com)
Computer Organization and Design MIPS Edition, Fifth Edition
URLリンク(www.amazon.co.jp)
Computer Organization and Design ARM Edition
URLリンク(www.amazon.co.jp)
Computer Organization and Design RISC-V Edition
URLリンク(www.amazon.co.jp)
日本語訳
コンピュータの構成と設計 第5版 上
URLリンク(www.amazon.co.jp)
コンピュータの構成と設計 第5版 下
URLリンク(www.amazon.co.jp)

ヘネパタ本
Computer Architecture, Sixth Edition: A Quantitative Approach
URLリンク(www.amazon.co.jp)
日本語訳
ヘネシー&パターソン コンピュータアーキテクチャ 定量的アプローチ 第5版
URLリンク(www.amazon.co.jp)

758:Socket774
17/10/15 16:50:05.93 KiJn0iTR0.net
>>732
Super-Hは無いのかよ

759:Socket774
17/10/15 19:00:54.12 euRPWj93a.net
ドリキャスのSDK

760:Socket774
17/10/15 19:41:26.90 /vsKc7/w0.net
SHは組み込み用だからな。

761:Socket774
17/10/16 02:35:13.76 wcs9AFJP0.net
>>712
それどうやって比較したの?

762:Socket774
17/10/16 05:10:07.01 DUbAwxn+0.net
体感とか偏見とかじゃ?
実アプリの集合体のベンチ(SPECintとか)でちゃんとパフォーマンス出てるのに表計算に弱いとか考えにくいわ

763:Socket774
17/10/16 07:00:31.14 AurXJ8Sa0.net
GUIの処理が頻繁にキャッシュからはみ出るのでもっさり

CPUのキャッシュ増量してGUIもっさりしなくなりました

OS・ライブラリ・開発環境・アプリのGUIまわりが肥大化

GUIの処理が頻繁にキャッシュからはみ出るのでもっさり

CPUのキャッシュ増量してGUIもっさりしなくなりました

(略)
の繰り返し
現行PC用CPUは、コアごとに256〜512KB、L3も4M超あるので、おもいGUIでもそこそこ動くが、
一昔前のARMじゃPCの重いGUI処理だと頻繁にキャッシュから外れてもっさりなのでは?
最新ARMは、デスクトップ用PCかとおもうようにキャッシュ増量してるのもあるが 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)


764:Socket774
17/10/16 08:17:16.91 LKkeQ1rsa.net
SPECintもそこまで汎用性あるわけじゃないけどね
富士通やオラクルはおかしいと反発してたし
IntelやIBMもSPECintだけじゃ土台無理なので、多数の科学計算ソフトを比較として出して
アピールしてる

765:Socket774
17/10/16 14:05:37.70 qkhEXcg/0.net
2006まではコンパイラのチートが効くベンチが幾つか混入してたけど
2017では排除されたはず

766:Socket774
17/10/16 14:46:52.11 wcs9AFJP0.net
実測データ否定して妄想しかしとらんやんけ

767:Socket774
17/10/16 14:56:07.73 9hLpP1yFa.net
指標なんて心底当てにはならないものだよ
SPECにしたってそうだけど、複雑すぎる
まぁ正直なところPrime95みたいなヤツが比較には良いかもな

768:Socket774
17/10/16 15:09:21.33 z3QWontTa.net
>>741
実測ならPCworldが検証してて
ベンチほど早くないとしてるが

769:Socket774
17/10/16 15:26:02.89 +bHoGEbk0.net
異世界転生ものですかw

770:Socket774
17/10/16 16:03:12.42 z3QWontTa.net


771:Socket774
17/10/16 20:49:51.88 Q2ffnPTL0.net
SVEてどうなんだろ、現行のX-Gene、ThunderXにはまだ実装されてないみたいだけど
つか計算レジスタを結構拡張しないといけなくね?

772:Socket774
17/10/16 23:35:12.58 j0UvOGWvM.net
富士通が作ってARMに持ち込んだようなものだから、
ようやく次に載せるか載せないかの段階じゃないか。
ARM64のライセンス持ってりゃ使う事ができるとの事だが。

773:Socket774
17/10/16 23:45:09.44 V3D1gBWB0.net
ARM64は詳しく知らないが組み込みは切り捨てが基本だから
amd64みたいな互換性重視思想がないから楽だな。
確かiPhoneはバッサリだったよな。

774:Socket774
17/10/16 23:45:31.33 UHyd54u70.net
あそこまでの柔軟性と高ベクタを求める顧客自体が少ないし
Intelの例(AVX512)を見るにまだまだハードルは高そう
それはそうとSVE推しの某氏が出てこなくて寂しい

775:Socket774
17/10/16 23:53:50.83 j0UvOGWvM.net
>>748
組み込みっていうかサーバ市場の方だと思うんだが、
ARMサーバもこれから立ち上げなので過去のARMとの互換性はバッサリだわな

776:Socket774
17/10/17 03:53:58.59 egw6BOGq0.net
>>748
ARMだって過去の互換性はあるよ
32bitのA32やT32と64bitのA64で命令セットに互換性がないだけ
64bitのARMコアでも今までどおりA32、T32の命令も使える
それに64bit命令のA64だって全くの別物というわけじゃなくて
A32やT32を同時に実装しても性能が落ちないような実装をしてる
サーバ向けではA32やT32を実装せずにA64のみ実装してるものがある

777:Socket774
17/10/17 04:14:40.71 egw6BOGq0.net
あと、32bitのARMではCortex-Aシリーズになってからオプション扱いだった
Thumb-2(T32と呼ばれてて16bit長固定の命令セットのThumbを拡張して命令フォーマットが16bit長と32bit長が混在している命令セット)
が全CPUコアに導入された
今ではThumb-2がメインみたいな扱い
もちろんARM命令であるA32も使える
ワンチップマイコン向けのCortex-MはそれまでのARMとは互換性がなく
ARM命令が使えず、Thumb-2のみ実装した別物だと思った方がいい
Cortex-Mの中でもさらにCortex-M0は命令の大部分が16bitの長さの命令で
32bitの長さの命令はそんの数個しかない

778:Socket774
17/10/17 08:11:19.32 xGGASsixa.net
>>749
少ないのか?
Skylake-SPとか Amazon、MS、Googleと
クラウドの大手に引っ張りだこだけど
ハードルに関してはSVEは知らんが、AVX512はAVX2より柔軟で動かしやすいよ

779:Socket774
17/10/17 10:03:47.38 veWBylRf0.net
>>753
Core i9の爆熱ぐあいを見るにコンシューマに512bit幅のSIMDはまだ非効率
HPC狙いなら捌だけど、10nm/7nm世代ではワッパ的にもコスト的にもまだ早いと思う

780:Socket774
17/10/17 10:10:30.86 wogVyuQ0a.net
>>754
納得

781:Socket774
17/10/17 11:26:15.84 ZVtI8i8id.net
ワッパやコスト重視なら性能が低いCPUを使えば良い
性能を上げるためにクロックを上げたりコア数を増やしたりベクタ長を増やしたりしてる

782:Socket774
17/10/17 14:22:52.57 veWBylRf0.net
そう、だから


783:コンシューマではまだまだ先でしょって 高ベクタにするために内部配線が増えワッパが悪化 高ベクタにしたためにクロック低下じゃ採用しようというところも少なかろうて しかもSVE512以上で性能が上がるのはごく一部だけなんだからなおのこと



784:Socket774
17/10/17 14:57:17.97 L4oOnLfud.net
そう、だから君はスマホでいい

785:Socket774
17/10/17 15:18:34.79 xGGASsixa.net
そのごく一部が糞成長してる市場な訳で

786:Socket774
17/10/17 16:14:45.71 YZxjJkjYa.net
結局Skylakeってサーバー向け(AVX-512用)のアーキテクチャだったんだな
どおりで一般向けのメリットがわかりずらい訳だ

787:Socket774
17/10/17 16:16:29.33 veWBylRf0.net
糞成長?どう考えても↓でしょ
HPC・鯖<スマホ・車載

788:Socket774
17/10/17 18:06:21.13 mP/jOn0ta.net
>>761
成長率で見るという話なんだが
スマホの成長率は既に頭打ち間近、車載は高成長率になるかもしらんが

789:Socket774
17/10/17 18:09:26.08 csYXmM9S0.net
車載はともかくスマホはハイエンドはQualcommとAppleにローエンドはMediatekをはじめとする中華系メーカーで他は淘汰されたちゃったからなあ
nVidiaはスマホ市場はもう終わりって言って車載に切り替えたわけだし

790:Socket774
17/10/17 20:09:35.65 3H0i0HU50.net
 もう勝てない、でしょ。

791:Socket774
17/10/17 20:39:53.49 Giz2o/8z0.net
自動運転はnvd独擅場だいじゃん

792:Socket774
17/10/17 20:42:18.21 YRzeJ3Vo0.net
スマホに待ってるのはもうレッドオーシャンだで
んでそれらのサービス・根幹を支えてるシステムはビッグ7と言われる巨大なデータセンターに依存してる
スマホの販売台数なんて最早増えないが、持ってる人は多いので情報量は増える
必然的にあらゆる企業がそれらの処理をデータセンターに求めていくので
HPC/DCは物凄く成長していってる
車載は分からんが、自動運転が広まるとますますデータセンターの重要性が大きくなってくのは確実だろう

793:Socket774
17/10/17 20:50:32.29 Nytw5mwY0.net
回線に限界があるから端末側に処理させるのが今の流れ

794:Socket774
17/10/17 21:03:46.90 YRzeJ3Vo0.net
端末+回線の二つじゃねえの?

795:Socket774
17/10/17 21:10:27.95 jfO2PzFea.net
企業相手にデータセンターやあるいはそれのシステムのライセンスを貸し出すところが強いのは
以前から予想されてたことだが
ここまで大きくなるとは思ってた人少ないんじゃなかろうか?

796:Socket774
17/10/17 22:02:11.29 GUMk3kIp0.net
いや、思ってたよ、当たり前じゃん
デジタルで何か活動するたびにデータがたまる
企業だったら顧客情報とかその他もろもろ
とにかく何かするたびにデータがたまる
わざわざ古くなったからと言ってデータを消すやつはいないので
とにかくずっと溜まり続ける
ソフトの分野でも、Oracleなんかは企業相手にデータの人質を取ってるから安泰
暇なもんだから自社ソフトの検定試験まで作ってさらにウハウハ

797:Socket774
17/10/17 22:02:14.50 veWBylRf0.net
>>762
ごめんな成長率じゃなくて市場規模の話してた
けど、ARMはクアルコムやApple、Mediatekへライセンスする側だから痛くもかゆくもない
で、そのライセンスを受けてるメーカーが採用するかって言ったらかなり先(Appleは同列では語れないけど)
車載においてもCPUの魔改造よりGPGPU性能のほうがモノをいう
HPCはアリっちゃあり(元からここは否定してないが)

798:Socket774
17/10/17 22:59:58.57 XUCi/SsL0.net
最新の車載用プロセサはCore i9-7980XE×4個分の性能あるし
特定


799:用途ではまったく勝負にならない



800:Socket774
17/10/18 01:06:37.33 Vvr//TrX0.net
nvidiaが車載で強いのは、ハードウェアだけじゃなく開発支援環境が整ってるから

801:Socket774
17/10/18 02:03:48.02 MpmiBwWTa.net
車載はFPGAやASICなんかがあるし、CPUだけじゃ無理やろ
Intel自身がそう言うてるし

802:Socket774
17/10/18 09:43:28.62 gVO/Ndb90.net
mobleye 2018年サンプル出荷のEyeQ5が12Topsで5W
2018年のdrive px pegasusが320topsで500w

803:Socket774
17/10/18 11:48:04.42 /AdK7/Gi0.net
>>775
Drive PX pegasusはLevel5自動運転用にとにかく性能優先ってところじゃないかな
とはいえDrive PX Xavierも30TOPS/30Wだからワッパで負けてるけど

804:Socket774
17/10/18 13:05:22.27 gef/oZB6a.net
性能求めるとワッパ悪くなるのはしょうがないよ
前にというか提起されたとこまで戻るが、SVEをどこもやらんのはワッパ悪化するから
トランジスタ数も無駄に増えていってバランス悪くなるわでなんの旨味もないだろうし
あれはSPARC64でHPC運用実績のある富士通くらいしかやらないよ

805:Socket774
17/10/18 13:13:46.73 gef/oZB6a.net
例えばSVE256対応のソフトが多ければ問題はないだろうが
そうでもないし

806:Socket774
17/10/18 17:41:29.58 O6fuFVv+M.net
ペガサスは端末側でもトレーニングできそうだな

807:Socket774
17/10/18 18:39:13.28 2J+gfJLP0.net
ゲーミングPCですらスマホ以下の性能しかない時点でお察しください

808:Socket774
17/10/18 18:56:41.56 xFk2wHLbM.net
むしろx86で256bitSIMDが流行れば
対抗してSVE256は普及するかもしれない。
まあ近頃話題のRyzenさんはあんな調子だし、
256があって当然という時代にはまだなってないと思うが。

809:Socket774
17/10/18 21:18:53.40 Vvr//TrX0.net
14nmだと、HPC向けチップ以外でAVX512とか対応しても、
トランジスタ増加分・ダイ面積増加分とパフォーマンス増加分のバランスが悪い

810:Socket774
17/10/19 09:26:57.48 6YehU+7wF.net
まあコードを書く側からすると、1024ビット単位でデータを持たせて、後はコンパイラ側でSSE、AVX、AVX2、AVX512のコードを吐いてくれればいい。
まあこれ出来んのは、インテルコンパイラだけだけどね。

811:Socket774
17/10/19 12:55:14.16 nXAl5zCAd.net
そんな簡単な構造のデータしか扱わなくて良いなんて、楽な仕事ですね

812:Socket774
17/10/19 18:54:24.59 XhW53BrP0.net
…普通じゃね?
クロス環境ならどうせmasmとかgasとか書いて実装で分岐するだけだし

813:Socket774
17/10/19 18:56:58.03 XhW53BrP0.net
つかそもそもデータ構造複雑なのってAVXとかまともに使えなくね?
普通はキャッシュミスその他考えて単純な形に加工して連続処理すんだから

814:Socket774
17/10/19 19:21:17.50 HteAG4xl0.net
複雑なデータ構造に対して何とかするのが腕の見せどころ
AVX512はその為の仕組みが色々と追加されてる

815:Socket774
17/10/19 19:37:08.33 n31956aDd.net
クソコテご自慢の爆熱発生命令セット

816:Socket774
17/10/19 19:38:12.92 27Qb4ze+a.net
>>788
悪いのは命令セットそのものというより馬鹿正直に実装してあるユニットなんやで

817:Socket774
17/10/19 20:39:52.42 XhW53BrP0.net
ああ複雑ってその程度の話…

818:Socket774
17/10/19 21:23:50.77 HteAG4xl0.net
そう、その程度
比較対象は>>783だから

819:Socket774
17/10/19 21:25:10.61 HteAG4xl0.net
>>788
クソコテは使いこなすことは出来ない
頭でっかちで、実際はコードが書けない

820:Socket774
17/10/19 21:27:50.9


821:7 ID:HteAG4xl0.net



822:Socket774
17/10/19 21:30:43.49 DriSM3J9a.net
>>793
例のクソコテは前にその手のこと書き込んだけど
本職っぽい人に突っ込まれたら発狂してその人の
人格批判繰り返してたよね

823:Socket774
17/10/19 21:39:25.82 vL5OLP/rM.net
居なくても話題になるとはクソコテも浮かばれるだろう。

824:Socket774
17/10/19 22:25:20.34 AieLH5b8a.net
出さなくていいです
見たくもない

825:Socket774
17/10/20 01:14:05.01 vDVkcoJvM.net
URLリンク(i.imgur.com)

826:Socket774
17/10/20 19:28:56.09 qpxCv9jU0.net
ここでいろいろ言われたけどIntelはあっさりとAVX512を降ろしてきたな。

827:Socket774
17/10/20 20:17:42.13 R5bIxhT40.net
>>798
WillametteやPrescottでHTTやIntel64がOFFになってたのと同じ
SkylakeはAVX-512を実装するためのアーキテクチャ
なのに競合不在と発熱が凄いためOFFになっていた
今までSkylakeの特徴が見えづらかったのはこのため

828:Socket774
17/10/20 20:42:28.43 H/Yi4sUAp.net
いやいや元々積んでなかったって話だぞ

829:Socket774
17/10/20 21:03:53.19 YdnISd6d0.net
そもそも10nmでモバイル用しか予定のないcannonlakeで
AVX512をONにする理由がようわからん

830:Socket774
17/10/20 21:18:09.72 Z3s0bY8a0.net
AVX-512はたしかに電力食うけどそれ以上にパフォーマンスが上がるからワッパの上昇に寄与する
熱的にAVX-512使用時はクロック下がるだろうけど

831:Socket774
17/10/20 22:42:41.40 KnJO/C8N0.net
汎用処理ほど無駄なことはない
やはりこの結論になるのか

832:Socket774
17/10/20 23:00:30.71 RNgPvV+90.net
汎用プロセッサの性能上昇が著しく速かったから、時間をかけて特化ロジックを
作ってもすぐに置いて行かれて骨折り損という構造があったけど、
速さが鈍化してきて骨折り損にはならなくなったら、
汎用は凡庸の地位しか得られないという原則が復活する

833:Socket774
17/10/21 04:46:32.85 TWi0OczI0.net
AVX、TSX、persistent memory 何かは凡庸にならないために必要ってことかな。

834:Socket774
17/10/21 04:54:57.72 EJ+tDdsw0.net
AVXってGPGPUするほどじゃないときに使うものでしょ。

835:Socket774
17/10/21 04:59:31.59 TWi0OczI0.net
DBなんかはむしろAVX、TSX、persistent memoryの3点セットが最強になるんじゃない。

836:Socket774
17/10/21 05:20:54.07 TWi0OczI0.net
AVXは単純にGPGPU的な物って思たったら的外れになるんじゃないかね。
ちなみに、Skylake-SP/Wのダイ使ったSkylake-Xの高クロック耐性がかなり非凡だけど、
あれはHPC向けで採用されたとき何かに高クロックで性能稼ぐとかの目的もあるのだろうか?
一般向けSKUのスペックだと過剰としか思えない。

837:Socket774
17/10/21 08:44:24.11 u83AJQZe0.net
AVX大好き団子

838:Socket774
17/10/21 10:17:49.70 48l7D4Fk0.net
>>808
逆なんじゃねーかな
ぶん回せるようにに作っておけば多少品質がわるくてもそうやってラインナップを作れる

839:Socket774
17/10/21 10:33:49.82 lB+keWS+0.net
top500 に載るような規模のシステムは、その時点の高クロックXeonや
最多コア Xeonをほとんど使わない傾向がある。2.xGHzが
選ばれている理由は、たぶんFLOPS/ドルを優先しているからだろう
> TOP500 Xeonシステム アクセラレータなし
>      ソケット総数 平均コア数 平均クロック周波数
> 2007/11  約57万    2.79コア   2.68GHz
> 2011/11  約80万    


840:5.03コア   2.73GHz > 2015/11  約153万    8.37コア   2.47GHz > Xeon 多コア      高クロック > 2007  4コア(3.2GHz) 3.4GHz(2コア) > 2011 10コア(2.4GHz) 3.6GHz(4コア) > 2015 18コア(2.6GHz) 3.7GHz(6コア) http://potato.2ch.net/test/read.cgi/jisaku/1447725141/777



841:Socket774
17/10/21 10:49:51.36 TWi0OczI0.net
>>810の件は心配ないくらい回るみたいだよ。Sky-Xだけそんな超選別してるってことはないよね。
1Vくらいで全コア4GHz回って1.2V辺りで全コア4.5GHzくらい回るみたい。
単純にメインストリームと同じ物理設計にしてるだけなのかね。

842:Socket774
17/10/21 12:07:52.05 DSBCbTgfa.net
SKL-SPはなんもベクトル拡張命令使わなかったら
20コア以上でも特に電圧盛らなくても全コア3Ghz以上回るみたいだし
やはり選別品なんでは

843:Socket774
17/10/21 12:56:11.97 TWi0OczI0.net
Xeonはロックされてるから(パワーリミットの制限)、多コアになるほど上限クロックが
低いのは当然だけどね。大半のSkylake-SPは少数コアターボ3.7GHzだけど
Plutinum 8180は3.8GHz。8180もロック外したら結構回りそうな感じがする。

844:Socket774
17/10/21 13:55:14.38 Bjia1mM40.net
>>804
そらまあ90年代と比べたら遅くはなったけど
でもこの2010年代だけでも、AVX等のおかげで4倍くらいのパフォーマンス上昇は出来てると思うよ
何よりも特化型を作ると潰しが効きにくく、むしろ今は専用回路屋さんは苦しくなってると聞くけれど(流行りの機械/深層学習関連とかはともかく)

845:Socket774
17/10/21 15:44:04.32 qYfCv+auM.net
そうなるとZen2のAVX2対応が気になるな
時流のSIMD強化に乗ってくるのか、それともノンネイティブのままなのか

846:Socket774
17/10/21 15:54:11.85 TWi0OczI0.net
AVX2 1クロック、AVX512 2クロック、ダイ当たりメモリ4chくらいにしないと凡庸過ぎるかね。

847:Socket774
17/10/21 19:52:02.50 GBvNy1ML0.net
>>815
え?
プログラムなんてもんが必要な分だけ汎用回路のほうがイロイロ不利ですけど、それ事実?

848:Socket774
17/10/21 20:42:04.00 lB+keWS+0.net
組込の低電力汎用プロセッサの電力性能比が高まったから、
以前なら電力的に汎用が避けられた領域にある程度汎用が食い込んだ、
ということはあったと思う。専用ならもっと低電力にできるが
そこまで下げる必要はない、という分野もあるから。
しかし、今から成長が見込まれるIoTではそこまで下げたい場合の方が多いだろう。

849:Socket774
17/10/21 21:13:27.47 mfQ2h99Q0.net
汎用つってもARMだけなんだけどね

850:Socket774
17/10/21 21:15:27.10 Bjia1mM40.net
>>818
少なくともXilinxの人は、自分らが成長している要因としてんなこと言ってたけど

851:Socket774
17/10/21 23:01:24.05 fk7naOrSa.net
>>820
ARMのIoT部門の売上高ってどんなもんなの?

852:Socket774
17/10/22 00:03:30.23 qkhEXcg/0.net
IoT部門つーかCortex-Mは新規契約や出荷数で言うと全体の半分ぐらいになってるみたいね
金額ベースでどれぐらいになってるかは知らん
というかARMって今赤字なのね...
URLリンク(www.softbank.jp)


853:/



854:名無しさん@そうだ選挙に行こう! Go to vote!
17/10/22 09:11:22.87 AurXJ8Sa0.net
現状のIoT用プロセッサに足りないのはセキュリティだな
ザルなセキュリティのシステムがインターネットや無線LANに接続されてる

855:名無しさん@そうだ選挙に行こう! Go to vote!
17/10/22 13:32:38.78 2FDLxsYlM.net
トレンドマイクロがそれ向けに信用できない通信先と通信させないソリューション出してたな
まあ、自作板的にはSophosUTMでも使うんだろうか

856:Socket774
17/10/25 22:26:47.13 Rg8LLKBd0.net
Qualcomm Snapdragon 845 is 10nm
URLリンク(www.fudzilla.com)

857:Socket774
17/10/26 17:09:26.76 ZIlFRc+l0.net
>>826
記事読んだけど、そもそも来年に7nmとか可能なの?
SamsungやTSMCのインチキ7nmですら、搭載スマホが出るのは再来年だと思ってた

858:Socket774
17/10/26 17:18:43.62 yKcBEK7Z0.net
そもそも何億台とか必要なスマートフォンと
1万台程度必要なCPUとでは単価は違い過ぎるし出せるだろう

859:Socket774
17/10/26 18:16:22.61 zXq0ytmn0.net
>>821
FPGAの汎用性とCPUの汎用性は、ちと意味が違うんでないの?

860:Socket774
17/10/26 18:34:14.00 3bof4Je+0.net
LSIを起こしていたけどやめちゃってFPGAに移行した例
 新 URLリンク(www.altima.jp)
 旧 URLリンク(www.itmedia.co.jp)

861:Socket774
17/10/26 18:56:43.38 FclP1ytI0.net
NEC SXの新型来たな
アクセラレータ型になるからどうすんだろと思ったが、なるほどアプリ丸投げか
というかアクセラレータ型とホスト型の中間といった感じかな?

862:Socket774
17/10/26 20:12:07.10 9Vu7SezM0.net
>>830
少量生産品はFPGAが低コストだが、量産品はASICが低コスト
また量産品では低消費電力も求められるためにASIC有利

863:Socket774
17/10/26 20:19:07.40 9Vu7SezM0.net
NECの新型スパコンは、メモリにHBM2を採用
団子押しのHMCは採用されず

864:Socket774
17/10/26 22:34:07.54 6NPm5mWXa.net
>>833
ベクトルCPUのメモコンは超リッチだからとにかく帯域だけあればいいんだろう。
量積むにしてもHBMの方が安く済むしな。

865:Socket774
17/10/26 23:36:09.91 fTOeRoS60.net
競争が善≠フ時代は第三次世界大戦を持って終わらせる!
人類を、滅亡させる

866:Socket774
17/10/27 06:01:13.52 h5TI6LRZ0.net
まあHMCは実質死んじゃったしな

867:Socket774
17/10/27 08:35:50.76 bLi6ZmQPa.net
Bytes/FLOPSはSX-ACEより悪化したが
テラスケールノードで、演算性能当たりのメモリ帯域がリッチな構造ないしね
てか前の発表だとコア性能は半分だったんだが、上げられたんだね

868:Socket774
17/10/27 22:57:41.16 9hWLHZFr0.net
ベクトルプロセッサで1コア当たりの性能とか言われてもなって感はあるが

869:Socket774
17/10/27 23:26:00.31 FxEmtxIC0.net
URLリンク(twitter.com)

870:Socket774
17/10/28 02:22:15.54 htVMYtmP0.net
          Byte/Flop TB/s  GB TFlops
SX-Aurora 10A   0.49   1.2   48  2.45
SX-Aurora 10B   0.56   1.2   48  2.15 
SX-Aurora 10C   0.35   0.75  24  2.15
Tesla P100 PCIe  0.18   0.72  16  4.036


871: 過去のSXの4B/Fとか1B/Fとかに比べたら下がってしまったが、 今そんなことをやろうとしたら、容量が少な過ぎるとかレイテンシが 大き過ぎるとかになってしまうんだろうな



872:Socket774
17/10/28 03:00:42.57 /OrcDhJk0.net
NECの新製品、ノード間通信がInfinibandになったとか、ますますNECらしさがなくなったな
コスト当たりの性能で、nvidiaに勝てるのかどうか心配
また、忘れたころ(5年とか)に後継機を出すNECとちがって、毎年新機種を出すnvidiaは進化の速度が速い

873:Socket774
17/10/28 03:14:56.56 1cW/17cX0.net
まあ現状NVIDIAに対抗できてそうなのIntelぐらいしかないし…

874:Socket774
17/10/28 04:21:24.73 htVMYtmP0.net
PEZY-SC2 暁光/Gyoukou
         6月    11月
GFLOPS/W 10.226  14.69
  LINPACK 1.67713 14.13PFLOPS
   理論値 3.20768 19.89PFLOPS
TSUBAME3.0 14.111GFLOPS/W (6月 Green500 1位)
URLリンク(www.pezy.co.jp)
URLリンク(www.pezy.co.jp)

875:Socket774
17/10/28 04:39:16.11 1cW/17cX0.net
すごいけど11月のTop500/Green500にはTesla V100で組んだのが出てくるんじゃないかな…

876:Socket774
17/10/28 07:35:43.08 iQNfFpfBa.net
PEZYのがどんな規模なのしらんが
基本、規模の小さなクラスタほど電力効率は高くなるから
そういうの抜きに発表だけされてもね
理研はこういうとこがなあ

877:Socket774
17/10/28 07:37:07.10 iQNfFpfBa.net
それと今の時代にHPLとか……最早全く役に立たなくなった指標を出されても……

878:Socket774
17/10/28 07:48:34.88 1cW/17cX0.net
規模小さいって言っても密度が高いから演算能力は国内トップクラス
HPLはこれだけを指標にするのは意味がないとはいえ、演算能力の上限を見るくらいには今も使える

879:Socket774
17/10/28 09:32:48.81 4wm1UyAva.net
>>847
まあその意味のない上限とやらを見るくらいですな

880:Socket774
17/10/28 11:27:31.94 htVMYtmP0.net
> 14.13PFLOPS
この実測値は今年6月のリストなら世界で6番目に相当する「大きな」システム
PEZY-SC2 7056個、Xeon D 882個、962.3kW

881:Socket774
17/10/28 11:31:49.76 htVMYtmP0.net
暁光の関係機関はExaScaler、JAMSTEC、JST、NEDO

882:Socket774
17/10/28 11:48:39.07 htVMYtmP0.net
LINPACK様の処理とHPCG様の処理は科学技術計算で「同じくらい」に重要。
top500の公開が始まるよりも前から分かっていたこと。

883:Socket774
17/10/28 12:57:09.58 nLS9mFVF0.net
よう

884:Socket774
17/10/28 13:02:52.58 NlK3dXZRa.net
全然同じくらい重要じゃねえよw

885:Socket774
17/10/28 15:44:28.24 N0Np442Rd.net
>>830
>>815にはAVX云々とあるが?
どっからFPGAとLSI起こす話になったのか
そもFPGAはCPUでのプログラミングではなく、回路屋よりの開発かと

886:Socket774
17/10/28 19:20:21.43 iWrv7V4U0.net
このGyoukou(暁光)の正体って何なんですかね
NVIDIAのGPUは使ってないらしいけど全くの独自なんでしょうか?
URLリンク(www3.nhk.or.jp)

887:Socket774
17/10/28 19:21:11.02 mIrR/9YH0.net
>>848
LINPACK番長でも電力効率が高ければ実アプリに強いシステムにレベルを上げて物理で殴れば勝てるから意味はあるよ。

888:Socket774
17/10/28 19:21:55.05 iWrv7V4U0.net
誤爆

889:Socket774
17/10/28 19:29:18.07 /OrcDhJk0.net
A Linpack番長 実演算をしたときに効率10%
B Linpack番長では無い、実演算をしたときに効率50%
ただし同じ値段で買えるシステムではAがBの10倍Linpack


890:が早い たとえばこんなシステムだと、Linpack番長のAのほうが実演算でも早いことになる Linpack番長だって海外勢を馬鹿にしてたら、実演算でも負けてたりする



891:Socket774
17/10/28 20:02:03.18 ocPFkaadM.net
ただし消費電力は50倍違うとかありそう。

892:Socket774
17/10/28 20:06:21.38 w1pYB1Dt0.net
nv $200いった

893:Socket774
17/10/29 03:22:19.64 UFad80Jf0.net
>>855
>パソコン数百台分の処理を、たった1枚のプロセッサーが行うのです。
Core i7-7700 3.6GHz       230.4GFLOPS
PEZY-SC2 1984core 700MHz 2777.6GFLOPS
NHKの経済社会情報番組部ディレクター 大隅亮は全然だめだな

894:Socket774
17/10/29 03:26:29.69 UFad80Jf0.net
>>861 にCore i9 も入れたかったのだが、AVX512使用時のクロックに
関する情報が見つからなくて断念

895:Socket774
17/10/29 04:15:34.12 F4DtIX9F0.net
PEZY-SC2
ここで語られていた間近目標はクリア
と言うことか
URLリンク(s.news.mynavi.jp)

896:Socket774
17/10/29 04:17:37.16 2CWDKhS60.net
計算速度じゃなくコア数の比較では? 

897:Socket774
17/10/29 05:10:55.21 UFad80Jf0.net
>>864
処理は仕事をさばくことだ。コンピューターなら命令の実行の事だろう。
OPS /operations per second のことに他ならない

898:Socket774
17/10/29 06:57:51.46 sI4VwkZ/0.net
>>855
iPhone X一台でOK

899:Socket774
17/10/29 09:58:14.58 RE30jBre0.net
大量の中古パソコンをどっかに隠している

900:Socket774
17/10/29 10:37:06.38 eAXOYbAz0.net
>>863
2018年に7nmで性能5.3倍、電力効率2.6倍、メモリ帯域5.8倍
2020年に5nmで性能2.4倍、電力効率1.5倍、メモリ帯域2倍
16nm→5nmでは性能12.8倍、電力効率4倍、メモリ帯域11.6倍
ずいぶん薔薇色の将来だなw

901:Socket774
17/10/29 11:48:48.37 UFad80Jf0.net
PEZY-SC2のコア数は一度縮小してるようだな
 2016年4月の記事 8.2TFLOPS(4096コア)
 2017年1月の記事 2048コア 1GHz
 URLリンク(news.mynavi.jp)
 URLリンク(news.mynavi.jp)
>843のベンチマークは1984コア(31/32 x 2048)、700MHzだが
1GHzでも動くのかもな、電力効率が悪くなるだけで

902:Socket774
17/10/29 12:56:30.86 Co0KZp7y0.net
>>856
レベル上げって、スケールアップ?

903:Socket774
17/10/29 12:57:43.96 jtH+f6l40.net
クロックはパイプラインを深くして1ステージでやることを減らせばあげられるし、
その逆なら下げないといけない
PEZYがどのへんなのかはいまいちわからん

904:MACオタ
17/10/29 13:08:53.65 mJbZnbyr0.net
>>843-871
PEZYって科学予算をお友達に配分するために存在する政治案件なんすけど、アーキテクチャを語る価値はあるすかね?
URLリンク(blog.livedoor.jp) 👀
Rock54: Caution(BBR-MD5:25c410b0f26cd44c2938e4abb9639038)


905:Socket774
17/10/29 13:41:12.15 hBFZBP1P0.net
>>872
>新興スパコン業者に補助金降ろすのに、山口敬之氏が安倍首相の名前を使って介入した。
>普通なら新興の業者が参入する余地がないところを、山口氏がそうやって介入し決めさせ、
バックマージンを貰ってる
こう批判してたけどその補助金というのがNexTEPだったからNexTEPの趣旨を理解してないだけなんじゃで記事


906:が出た当時に片付けられたよ。



907:Socket774
17/10/29 13:47:26.22 UFad80Jf0.net
PEZY-SCのPE。PEZY-SC2も同じかどうかは未確認
URLリンク(accc.riken.jp)
 Processor Element
  8スレッドMulti-threading
   4スレッドを順番に切り替え x 2面
   8スレッド分のレジスタファイルを用意
  16 Stage pipelining
  In-order 2way SuperScaler
  例外なし、分岐予測なし
  キャッシュ間コンシステンシはソフトウェア責任
  独自ISAによる必要命令の絞り込み
 Ring + Crossbarを合わせたバス構造

908:MACオタ>873 さん
17/10/29 14:04:38.47 mJbZnbyr0.net
>>873
>こう批判してたけどその補助金というのがNexTEPだったから
それ以外にも公共事業に色々食い込んでいるすけど…
URLリンク(www.meti.go.jp)

909:Socket774
17/10/29 14:06:40.41 T/10NCuq0.net
世の中に税金に世話になってないスパコン業者なんているのかね

910:Socket774
17/10/29 14:24:22.64 2CWDKhS60.net
仮に政府とズブズブで真っ黒だったとしても、それとアーキテクチャとは別の問題

911:Socket774
17/10/29 14:40:45.41 hBFZBP1P0.net
>>875
ベンチャー企業にありえない支援ってわけじゃないのでロビー活動の範疇だろうって話よ。

912:Socket774
17/10/29 14:48:22.66 mWx8re7va.net
MACオタは本題からずれた箇所での揚げ足とりしかできない


次ページ
最新レス表示
スレッドの検索
類似スレ一覧
話題のニュース
おまかせリスト
▼オプションを表示
暇つぶし2ch

358日前に更新/235 KB
担当:undef