1 名前: ◆Meriken//XXX [2013/09/15(日) 12:32:11.22 ID:yp7r3EBt0] こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は こちらでどうぞ。 Meriken's Tripcode Finderは2013年8月現在で最速の12桁トリップ検索ツールです (最高速の記録は11112.48M tripcodes/s)。CUDA対応のNVIDIAのビデオカード、 もしくはHD 5xxx以降のAMD Radeonシリーズのビデオカード等のOpenCL対応デバイスを 使用すれば非常に高速に検索を行うことができます。特徴は以下の通りです。 ・ビデオカードのGPUによる超高速検索。 ・CPUによる高速検索。 ・GUIとCUIの両方に対応した柔軟なユーザーインターフェース。 ・強力な正規表現による検索パターンの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・検索パターンの数の制限の撤廃。 ・10桁トリップ検索への対応。 ・検索速度の実行時の最適化。 ・配布パッケージに同梱された検索ルーチンのソースコード。 ■入手先 ◆MERIKEN4.kのウェブサイト www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ 【トリップ検索】MERIKEN's Tripcode Finder その4 anago.2ch.net/test/read.cgi/software/1373110438/
40 名前: ◆Meriken//XXX mailto:sage [2013/09/18(水) 19:07:56.67 ID:0UI9u6yeP] >>37-38 これは非常に面白いですねえ。キーの漏洩が原理的に不可能というのは かなり美味しいです。キーの長さは実際どうなんでしょうねえ。 試しに遊びで56文字モードを付けてみようかしらん。
41 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/18(水) 20:07:49.89 ID:f7vVWxxs0] >>40 非常に面白いけど、メッセージの途中までを依頼側が制御できてしまうってのは色々アレですね。 SHA-1で署名されてるメッセージのラスト以外を捏造したSHA-1中間状態で依頼して…みたいな。 MD5で衝突させた実験はいくつかあったけどSHA1でやれるとちょっと面白い(では済まない?)かも。
42 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 02:49:03.85 ID:sTJqqQfeP] >>41 私はクラッキングには興味が無いですけど、クラッキングに分散処理を利用するというのは ありなのかもしれませんねえ。Bitcoinマイナーみたいなのにそういうコードを 入れといてもわからないでしょうからね。
43 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 03:23:02.42 ID:sTJqqQfeP] 一応>>30-32 をまとめておきます。 ・トリップのキーの長さをSHA-1のブロックの大きさに合わせて56文字にすることで、 12桁トリップ検索をさらに2割ほど高速化出来る。 ・ループの内部ではW[13]に対応するキーの53文字目から56文字目のみを変化させる。 ・SHA-1の最初の13個のラウンドはW[13]に依存しないので、 あらかじめループの外で計算しておく。 ・この方法はJens Steube氏のSHA-1ハッシュ値生成の最適化の手法と 組み合わせることも可能。その際はW[0]ではなくW[13]を中心にして計算を行う。 passwords12.at.ifi.uio.no/Jens_Steube/Jens_Steube_Passwords12.pdf 鳥屋氏はこのことに気づいていたみたいですが、なかなかにコロンブスの卵的な発想です。
44 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 04:55:49.99 ID:sTJqqQfeP] これ、こちらにも貼っておきますね。 > 24 : ◆Meriken//XXX : sage : 2013/09/19(木) 04:54:27.08 > そうそう、そろそろYggdrasilのAPIを新鯖に一本化したいので、バージョン1.0 (FE)以前の > MTFをお使いな方はバージョン1.0.1 (FE)以降に更新をお願いします。
45 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/19(木) 07:23:10.54 ID:Ywt2cZ170] 次のα版に乗り換えるかな…
46 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 07:46:53.91 ID:sTJqqQfeP] >>45 結構いろいろ改善されているのでぜひどうぞw >>43 の実装がいつになるのかはちょっと分かりませんが…
47 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 07:56:24.04 ID:sTJqqQfeP] 現在VecTripperのSHA-1のアセンブラのコードをせっせとMTFに移植中です。 とりあえずAVXで最初の14個のラウンドが動作することを確認しましたが、 かなり速いです。さすがです。これはかなり期待できそうです。
48 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 09:55:12.24 ID:sTJqqQfeP] 20回目のラウンドまで変換出来ました。 かなり最適化されたコードみたいで期待大ですが、 気を使う作業なのでとにかく疲れます。 続きは明日以降にしておきます。
49 名前:やんやん ◆yanyan/Pails mailto:sage [2013/09/19(木) 13:04:17.26 ID:yhS2wnZ30] アセンブラまで手を出していたのですね。おつかれさまです。
50 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 14:09:31.68 ID:sTJqqQfeP] アセンブラでないと限界まで速度を出せないですからね〜 10桁は書き換えたので次は12桁というわけです。
51 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 15:17:00.67 ID:sTJqqQfeP] ご飯を食べて元気が出たので、素のSHA-1のルーチンを一気にAVXで書き換えてしまいました。 結果は上々で、2割ほど速度が上がっています。もうちょっといじれば3割まで行きそうな 感じです。 ここまではわりとすんなりと行きましたが問題はこれからで、今度は特殊な最適化を施してある SHA-1のルーチンを書き換えなければなりません。これは1から書くしかないので、 少しづつ進めていくことにします。
52 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 18:40:13.43 ID:sTJqqQfeP] あれから素のSHA-1のルーチンの関数呼び出しのオーバーヘッドを 削って、合わせて27%の速度向上となりました。 VecTripperのルーチンは命令を削れるだけ削ってあるという印象です。 素晴らしいです。 最適化済みのルーチンもこんなふうに自分で書き直せればいいけど、 どうでしょうねえ〜
53 名前: ◆JouJaku.IYSv mailto:sage [2013/09/19(木) 19:10:47.14 ID:SvlqUu4y0] >>39 AVX2対応キターーー! ヽ(´Д`)ノ AVX2が目的でHaswellを選ぶなら、高いK付きを選ぶ必要は無いと思います。 HaswellはAVXを使うと極端にOC耐性が落ちます。更に殻割り+液体金属必須です。 K無しを定格で使うのが良い、とK付きで殻割りOCまで試した私は思います。
54 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 19:52:17.36 ID:sTJqqQfeP] >>53 確かにK付きはいらないですねえ。開発機の3770KもOC切っちゃったし… その代わりにマザボを奮発してQuad CrossFireが出来るのにしようかな。 AVX-512がコンシューマー市場に下りてくるのは当分先でしょうしね。
55 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 19:53:29.45 ID:sTJqqQfeP] 最適化されたルーチンをじっと眺めてたらなんだか出来そうな気がしてきたぞ。
56 名前: ◆Meriken//XXX mailto:sage [2013/09/19(木) 22:14:58.88 ID:sTJqqQfeP] おもむろに少し書き換えてみたらうまくいきましたw こりゃ思ったよりずっと簡単かも。
57 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/19(木) 22:45:49.09 ID:Ywt2cZ170] 開発が進んでいるようで何よりです 自分はPCの計算力を提供するぐらいしかできませんけど…
58 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 04:43:57.64 ID:PXGklweqP] いやいや、それだけで十分すぎですw うろつきさん、めちゃ速いですしね。
59 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 04:50:36.76 ID:PXGklweqP] 最適化済みのSHA-1のルーチンのアセンブラでの書き換えは 半分終わりました。既に元のSSE2 Intrinsicsでの実装より大分速くなっています。 思い切って手を付けてみて正解でした。
60 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 11:51:06.76 ID:PXGklweqP] x64版のAVXでの書き換えは一応終了。 最適化されたルーチンは15%ほど速くなりました。 もうちょっと命令を削れそうな感じです。
61 名前:名無しさん@お腹いっぱい。 [2013/09/20(金) 12:28:27.30 ID:rdeXteVM0] >>54 Z87のマザーだと、ASUS MAXIMUS VI EXTREMEがPCIe 3.0(x8/x16/x8/x8)駆動で最大だからQuad CrossFireするには勿体無さそうに思うけどな。 ttp://www.asus.com/jp/Motherboards/MAXIMUS_VI_EXTREME/#specifications Quad CrossFireがPCIe 3.0(x16/x16/x16/x16)で動作保障してくれるマザーってあるんだっけ?
62 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 12:39:25.81 ID:PXGklweqP] >>61 MTFでつかうぶんにはPCIeの帯域はほとんど関係ないので問題なしです。 買うとしたら検索君1号用なので他の用途には使わないですしね。 もうちょっと安いのでもいいんですけど、スロットの配置がいいのが ないんですよね〜
63 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 12:52:41.54 ID:PXGklweqP] 命令を2つばかり削ってちょびっと速くなりました。 さすがに疲れたのこのへんにしときます。 後はこれをSSE2に移植して、32bit版を作らなきゃいけないんだよなあ。 まあのんびりやろうっと。 とりあえずAVX2対応の準備はできたので十分でしょう。 CPUだけで250M TPS出せるかもしれません。ぐへへへへ…
64 名前: ◆Meriken//XXX mailto:sage [2013/09/20(金) 17:44:03.41 ID:PXGklweqP] SSE2版を作って命令を2オペランド化してみたらかえって元のより遅くなったぞorz たくさん作ってもメンテするの大変だし、アセンブラのルーチンは 64bit AVX/AVX2専用にしちゃおうかなあ。 …と、ここまで考えてから試しにVecTripperの真似をしてvmovdqaをmovaps に 変えたら、それだけでもとより速くなりましたw なぜだ…
65 名前: ◆JouJaku.IYSv mailto:sage [2013/09/20(金) 20:53:24.14 ID:BxgeVqsj0] >>61 ブリッジ挟んだなんちゃって仕様ならコレ。Haswellではありませんが。 ttp://www.asus.com/jp/Motherboards/P9X79E_WS/ なんちゃってなので、グラフィック用です。 大量のデータ転送を同時に行うGPGPU用途には使えません。 Nativeならこれくらい逝かないと無理です。 ttp://www.supermicro.com/products/motherboard/Xeon/C600/X9DRG-QF.cfm
66 名前: ◆Meriken//XXX mailto:sage [2013/09/21(土) 01:51:06.93 ID:axiLYME3P] >>65 今回の購入のメインはHaswellなので、やっぱりASUSのM6Eですかね〜 いやあ、楽しみだなあ。
67 名前: ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:05:15.56 ID:axiLYME3P] 最適化されたルーチンのSSE2への移植は完了しました。かなり速いです。 今まで58M TPSしか出ていなかったPhenom II X6で92M TPSでました。 Visual C++、効率が悪すぎだろう…
68 名前: ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:41:57.42 ID:axiLYME3P] というわけで、64bit版は最適化されたルーチンに 一本化することにしました。これで大分すっきりとしました。 あと32bitだとxmmレジスタの数が足りなさすぎなので、 アセンブラで書きなおすのはやめにしました。 これで後は念の為にもう一回テストするだけです。
69 名前: ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:55:33.92 ID:axiLYME3P] あ、でも最適化されたルーチンだけならレジスタ周りはそんなに厳しくないのか。 せっかくだから32bit版も書きなおそうかな。そうすれば大分すっきりするし…
70 名前: ◆YSRKEN.ceVZZ mailto:sage [2013/09/21(土) 10:51:27.68 ID:oxIT9/ma0] >>67 >Visual C++ iclですらない……そりゃ徹底的にアセンブラしたら速いでしょうねw これで私もCPUのみで15MTPS逝きそうですな……
71 名前: ◆Meriken//XXX mailto:sage [2013/09/21(土) 14:05:50.24 ID:axiLYME3P] >>70 お、お久しぶりです。 Intelのも一応試してみたけどほとんど速度は変わりませんでしたよ。 まあそんなにうまい話は転がってないですね。 限界まで性能を出したいならコンパイラに頼らずに自分でやるしかないですね。
72 名前:最近アマガミをオールクリアしました ◆Ayatsuji/uFC mailto:sage [2013/09/21(土) 18:39:07.87 ID:oxIT9/ma0] >>71 >お久しぶりです すみません、実は久しぶりというわけでもないのです。 うろつき ◆Urotsuki/1Caさんに見つけてもらったこの酉で最近はレスしてました。 諸事情により最近はノーパソをぶん回したまま放置ということができなかったので、レベルが上がりようがないという悲しみ…… ところで、複数PCで同じアカウントでログインしてゆぐちゃんに参加するとポイント(゚д゚)ウマーなんですよね?
73 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 01:22:54.37 ID:PJsMgXLsP] >>72 そういえばそうだったw そのトリップを見たのが久しぶりだったのでうっかりしてしまいました。 経験値はちゃんと加算されますよ。
74 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 05:48:35.29 ID:PJsMgXLsP] 新しい12桁トリップのCPU検索のルーチンの32bit版も出来ました。 手元のCore 2 Duoで試したら4割近く速度が上がっています。 やっぱコンパイラの最適化は当てにならないなあ。 とにかく検索ルーチンのアセンブラでの書き直しは終わったので、 明日あたりにGUIの修正と最終テストを行って、新しい開発版をうpします。
75 名前:やんやん ◆yanyan/Pails mailto:sage [2013/09/22(日) 06:06:23.54 ID:RUJc3/SX0] wktk
76 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 07:42:38.57 ID:B2mxp/B40] wktkですねこれは しかし相変わらずの化け物じみた速度… 自分は契約Aの問題でこれ以上速度あげられないんだよなぁ
77 名前: ◆shiexn/ngc mailto:sage [2013/09/22(日) 07:50:16.88 ID:XeDsKN+sP] 同一トリップ 別キー なんてのもちゃんと出てくるんですな
78 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 09:52:31.01 ID:PJsMgXLsP] TITANより速いとか、これはもう買うしかないのではなかろうか。 発表は25日か〜 wccftech.com/amd-hawaii-r9290x-gpu-volcanic-islands-benchmark-results-exposed-fastest-gpu-planet-1020-mhz-clock-speed/=
79 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 10:39:11.32 ID:PJsMgXLsP] >>76 7970 CFにしては抑え気味だなと思ってたんですけど、 そういうことだったんですね。私もこれで結構ギリギリで、 しょっちゅうブレーカーを飛ばしていますw
80 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 10:41:44.63 ID:PJsMgXLsP] >>78 のリンクが壊れてました。 wccftech.com/amd-hawaii-r9290x-gpu-volcanic-islands-benchmark-results-exposed-fastest-gpu-planet-1020-mhz-clock-speed/
81 名前: ◆Meriken//XXX mailto:sage [2013/09/22(日) 11:16:46.05 ID:PJsMgXLsP] >>72 あ、そうそう。私はアマガミはモジャ子で挫折しましたw 梨穂子ちゃんと先輩はなかなか良かったです。
82 名前: ◆Meriken//XXX [2013/09/22(日) 13:39:01.91 ID:PJsMgXLsP] 新しい開発版をうpしました。 MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 5 www.meriken2ch.com/programming/merikens-tripcode-finder Alpha 4からの主な変更点は以下の通りです。 ・12桁トリップのCPU検索のAVXへの対応。 ・12桁トリップのCPU検索の高速化。 CPUによってはかなり速くなっているようです。 診断の結果や前のバージョンとの比較を報告していただけると助かります。
83 名前: ◆Meriken//XXX [2013/09/22(日) 17:15:27.23 ID:PJsMgXLsP] 現在Meriken's Tripcode Engineの英語版を作成中。 プログラムに変更はすぐに終わったけど、 ドキュメントの翻訳が超めんどくさいです。
84 名前: ◆MOYASIMaXI mailto:sage [2013/09/22(日) 17:54:35.42 ID:B1RUuJ9x0] >>82 お疲れ様です。 12桁検索(CPUのみ)の速度を見てみました。 検索パターンは、先頭一致6完一つと特殊の純8連です。 【OS】Win7 Pro 64bit SP1 【CPU】Core i5 3570 【CPU検索スレッドの数】4 検索開始10分後の平均速度 MTF 1.1 FE Alpha4 74.21M tripcode/s MTF 1.1 FE Alpha5 91.94M tripcode/s めっちゃ高速化してます。
85 名前: ◆Meriken//XXX [2013/09/22(日) 18:58:57.07 ID:PJsMgXLsP] >>84 いい感じに速度が上がっていますね〜 AVXがかなり効いてるのかな? i7-3770Kより差が大きいのはおいしすぎですね。
86 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 19:02:33.93 ID:B2mxp/B40] おー新しいのきましたか CPU関連の効率化だけかなー? GPUメインにはあまり縁がないかなー… 取り敢えず測定してみようっと
87 名前: ◆Meriken//XXX [2013/09/22(日) 19:14:24.81 ID:PJsMgXLsP] ぜひお願いします。CPUによってほんとに速度の変化がバラバラなんですよね。
88 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 19:24:33.69 ID:B2mxp/B40] CPUの冷却が不安なので長い時間ぶん回せませんね… 取り敢えず結果です 【OS】Windows7 Pro 64bit SP1 【CPU】Intel Core i7-3930K(自動的に3.9GHzまでOC) 【CPU検索スレッドの数】12 【検索中の温度】 46〜59度(簡易水冷) 【検索パターン】先頭一致10完 1つ 検索開始5分後の平均速度 MTF 1.1 FE Alpha4 129.19M tripcode/s MTF 1.1 FE Alpha5 160.65M tripcode/s 速度がかなり上がりました OCしているので定格だとどうなるかわかりませんが上がり幅は同じだと思います
89 名前: ◆JouJaku.HzIz mailto:sage [2013/09/22(日) 20:09:04.92 ID:vk+5V6ZE0] 【診断の種類】検索速度(1パターン) 【MERIKEN's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4, 5 【OS】Microsoft Windows 7 Ultimate 64bit SP1 【検索デバイス】CPUのみ 【CPU】Intel Core i7 4770K@3.7GHz 【CPU検索スレッドの数】8 (HTon) 【検索プロセスの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】すべて 【検索パターン】 10文字完全前方一致1個 【10分間のCPU検索の平均速度】104.66(a4) → 122.57(a5) M tripcode/s 【その他】MTEngine64 -c -t 8 -l 12 2割近く速度が上がってますね。AVX2対応が楽しみです。
90 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 20:28:27.32 ID:Nb3CcrYX0] Win7 x64 / C2Q Q9650定格(3GHz)CPUのみ / 4スレッドでの 1.1FEα2 / 1.1FEα4 / 1.1FEα5の各バージョンの12桁検索の「各種診断」の実行結果です 共通 【診断の種類】検索速度(1パターン) 【検索デバイス】CPUのみ 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】自動 ※4スレッド 【SHA-1ハッシュ値生成の最適化(CPU)】最大 ※1.1FEα2 / 1.1FEα4のみ 【検索プロセスの優先度】通常以下 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【検索パターン】 10文字完全前方一致1個 1.1FEα2 【キーに使用する文字】すべて 【10分間のCPU検索の平均速度】 53.94M tripcode/s 1.1FEα4 【キーに使用する文字】1バイト文字のみ ※半角と全角 【10分間のCPU検索の平均速度】 55.22M tripcode/s 【キーに使用する文字】すべて 【10分間のCPU検索の平均速度】 55.17M tripcode/s 1.1FEα5 【キーに使用する文字】半角と全角 【10分間のCPU検索の平均速度】 62.22M tripcode/s 【キーに使用する文字】すべて 【10分間のCPU検索の平均速度】 62.20M tripcode/s 結果 ・1.1FEα4 / 1.1FEα5の【キーに使用する文字】の「半角と全角」と「すべて」の検索速度の違いはわずか ・1.1FEα2→1.1FEα4:約2.5%UP 1.1FEα2→1.1FEα5:約15.3%UP 1.1FEα4→1.1FEα5:約12.7%UP
91 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 20:32:12.34 ID:K2dEp/NJ0] すいません、MTF1.1FEのalpha2〜4はどこかでDL出来ますでしょうか? 手違いで消してしまいましたw
92 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 20:34:35.19 ID:TkU21XXd0] リンク先のファイル名を変えるだけで落とせたと思う。
93 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 20:36:50.06 ID:K2dEp/NJ0] あ、なるほど気が付きませんでした 無事落とせました
94 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 22:59:02.04 ID:K2dEp/NJ0] 【検索デバイス】GPUとCPU 【OS】 windows7 HP 64bit SP1 【使用するGPU】AMD Radeon HD 5570/5670 (OpenCL) 【1CUあたりのワークアイテムの数(OpenCL)】自動 【1WGあたりのワークアイテムの数(OpenCL)】自動 【1GPUあたりの検索プロセスの数(OpenCL)】1 【1検索プロセスあたりの検索スレッドの数(OpenCL)】2 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】自動 【SHA-1ハッシュ値生成の最適化(CPU)】最大 【検索プロセスの優先度】通常以下 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】すべて 【検索パターン】 10文字完全前方一致1個 α2 【10分間の平均速度】 366.70M tripcode/s 【GPU検索の平均速度】 340.43M tripcode/s 【CPU検索の平均速度】 26.27M tripcode/s α4 【10分間の平均速度】 366.74M tripcode/s 【GPU検索の平均速度】 340.08M tripcode/s 【CPU検索の平均速度】 26.66M tripcode/s α5 【10分間の平均速度】 364.47M tripcode/s 【GPU検索の平均速度】 340.61M tripcode/s 【CPU検索の平均速度】 23.86M tripcode/s 計測報告は初めてですがこんな感じでいいのでしょうか? 因みにα3はバグがあるとスレの初めに話題になってたようなので除外しました
95 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 23:11:48.99 ID:K2dEp/NJ0] 診断ではα5のCPU効率が若干低下してますが 検索実測でもα5はα2、4に比べてGPUCPU共 似たような効率低下傾向があるようです
96 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/22(日) 23:14:16.64 ID:K2dEp/NJ0] あ、これだとCPUが載ってないですね CPUは intel core i5-750 2.66GHz定格使用です
97 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 00:19:21.07 ID:s2zOHAYz0] >>17-22 を書いた者ですが 1.1FE Alpha 5で1.1FE Alpha 2と同等以上の検索速度になりました どうもありがとうございました ・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「半角と全角」の場合 【トリップの種類】12桁 【キーに使用する文字】半角と全角 【検索パターン】 10文字完全前方一致1個 【10分間の平均速度】 820.98M tripcode/s 【GPU検索の平均速度】 805.08M tripcode/s 【CPU検索の平均速度】 15.90M tripcode/s ・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「すべて」の場合 【トリップの種類】12桁 【キーに使用する文字】すべて 【検索パターン】 10文字完全前方一致1個 【10分間の平均速度】 820.92M tripcode/s 【GPU検索の平均速度】 805.02M tripcode/s 【CPU検索の平均速度】 15.90M tripcode/s ・Yggdrasilに参加して検索開始10分後の平均検索速度 1.1FE Alpha 2: 694.95MTPS (GPU: 681.99M, CPU: 12.96M) 1.1FE Alpha 4: 665.13MTPS (GPU: 652.14M, CPU: 12.99M) 1.1FE Alpha 5: 695.23MTPS (GPU: 680.68M, CPU: 14.56M)
98 名前:shirawa@mmo ◆GTExxuWcjk/9 mailto:sage [2013/09/23(月) 05:07:53.88 ID:jhI3+7LxP] 【診断の種類】検索速度(1パターン) 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4 → Alpha 5 【検索デバイス】GPUとCPU 【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz 【使用するGPU】NVIDIA GeForce GTX 660 (CUDA) 【1SMあたりのブロック数(CUDA)】自動 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】自動 【SHA-1ハッシュ値生成の最適化(CPU)】最大 【検索プロセスの優先度】通常以下 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】すべて 【検索パターン】 10文字完全前方一致1個 【10分間の平均速度】 622.09M tripcode/s → 635.74M tripcode/s 【GPU検索の平均速度】 535.55M tripcode/s → 534.50M tripcode/s 【CPU検索の平均速度】 86.54M tripcode/s → 101.25M tripcode/s
99 名前:累計 ◆wop.8OO8.qow mailto:sage [2013/09/23(月) 05:25:17.49 ID:J8box9ZP0] 【診断の種類】検索速度(1パターン) 【Meriken's Tripcode Finderのバージョン】1.1FEα5/1.1FEα4/1.0.1(安定版) 【検索デバイス】CPUのみ (i7 M620 @2.67GHz) 【CPUの命令セット】x64 + SSE2 【CPU検索スレッドの数】自動 【検索プロセスの優先度】アイドル 【GUIフロントエンドの優先度】アイドル 【トリップの種類】12桁 【キーに使用する文字】半角(※1バイト文字のみ) 【検索パターン】 10文字完全前方一致1個 【10分間のCPU検索の平均速度(TPS)】 1.1FEα5 1.1FEα4 1.0.1(安定版) ------------------------------------ 1) 27.84M 30.51M 31.67M 2) 27.80M 30.50M 31.77M 3) 27.69M 30.58M 31.67M 4) 27.85M 30.54M 31.68M 5) 27.83M 30.54M 31.64M
100 名前: ◆Meriken//XXX [2013/09/23(月) 05:48:41.37 ID:PDVnzk32P] 皆さん詳しい報告を有り難うございます。 どうもNehalemだけ遅くなっているようですね。難しスギィ!
101 名前: ◆LoveNico9g mailto:sage [2013/09/23(月) 06:02:36.35 ID:f6HE7yZK0] 【診断の種類】検索速度(1パターン) 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 3 -> 1.1 Free Edition Alpha 5 【OS】Windows 7 Professional SP1 【検索デバイス】GPUとCPU 【使用するGPU】すべて使用 【GPU】GeForve GTX 650 【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz 【1SMあたりのブロック数(CUDA)】8 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】1 【SHA-1ハッシュ値生成の最適化(CPU)】最大 【検索プロセスの優先度】アイドル 【GUIフロントエンドの優先度】アイドル 【トリップの種類】12桁 【キーに使用する文字】1バイト文字のみ 【検索パターン】 10文字完全前方一致1個 【10分間の平均速度】 215.90M tripcode/s -> 221.77M tripcode/s 【GPU検索の平均速度】 205.58M tripcode/s -> 207.19M tripcode/s 【CPU検索の平均速度】 10.32M tripcode/s -> 14.58M tripcode/s すごい改善率
102 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 06:25:27.19 ID:PDVnzk32P] >>101 こりゃ凄いですねw 結構さがでるもんですね〜
103 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 06:38:01.05 ID:PDVnzk32P] ■Alpha 3/4とAlpha5の12桁トリップのCPU検索の速度の比較 >>67 +58% Phenom II X6 AMD K10 >>101 +41% i3-3220 Ivy Bridge >>84 +24% i5-3570 Ivy Bridge >>88 +24% i7-3930K Sandy Bridge >>89 +17% i7-4770K Haswell >>98 +17% i7-3770 Ivy Bridge >>90 +13% C2Q Q9650 Core >>97 +12% C2D E7600 Core >>99 -9% i7-M620 Nehalem >>94 -11% i5-750 Nehalem やっぱNehalemだけ遅くなってますねえ。残念… VC++ 2010はNehalemに合わせて最適化されていたのかしらん。 まあでも他のアーキテクチャでは順当に速度が上がっていますね。 Hyper Threadingはないほうが効果がはっきり出るみたいです。
104 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 09:20:51.29 ID:PDVnzk32P] 英語版を作って本家Slashdotにストーリーを投稿してみました。 ぜひVote Upをよろしくお願いいたしますw Meriken's Tripcode Engine English 0.01 Released slashdot.org/submission/2986003/merikens-tripcode-engine-english-001-released Meriken's Tripcode Engine English www.meriken2ch.com/programming/merikens-tripcode-engine-english/index.html
105 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 09:21:02.61 ID:X4S3sHdy0] 1.1FEα5の鯖との定期通信の間隔は ・検索開始3分後までが10秒ごと ・以降3分ごと でよろしいでしょうか?
106 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 09:25:06.77 ID:PDVnzk32P] >>105 そうで〜す。このパラメーターはサーバー側で調整できるので、 サーバーが重くなってきたら増やすかもしれません。
107 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 09:40:34.70 ID:rVyLE6uw0] 【診断の種類】検索速度(1パターン) 【検索デバイス】CPUのみ 【CPU】Ibtel Core i7-980X CPU @ 4Ghz 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】自動 【SHA-1ハッシュ値生成の最適化(CPU)】最大 【検索プロセスの優先度】通常以下 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】1バイト文字のみ 【検索パターン】 10文字完全前方一致1個 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4 【10分間のCPU検索の平均速度】 148.51M tripcode/s 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 【10分間のCPU検索の平均速度】 129.78M tripcode/s 結構落ちますね。 -15%弱ってところでしょうか。
108 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 10:18:13.77 ID:PDVnzk32P] >>107 これもWestmere-EPだからNehalemの仲間ですね。 うまい具合にNehalemだけ検出できないかなあ。
109 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 10:42:19.95 ID:PDVnzk32P] WikipediaにCPUIDが載ってたけど、これほんとに当てになるのかな〜 > 0x0206e6, 0x0106a4, 0x0106a5, 0x0106e4, 0x0106e5 en.wikipedia.org/wiki/Nehalem_ (microarchitecture) > 0x0206f2, 0x0206c2, 0x020652, 0x020655 en.wikipedia.org/wiki/Westmere_ (microarchitecture) > 0x0206c0, 0x0206c1, 0x0206c2, 0x0206c3, 0x0206c4, > 0x0206c5, 0x0206c6, 0x0206c7, 0x0206c8, 0x0206c9, en.wikipedia.org/wiki/Gulftown
110 名前: ◆YSRKEN.ceVZZ mailto:sage [2013/09/23(月) 11:16:32.76 ID:R2WGY9Wb0] >>81 棚町(と七咲)は☆獲得に会話イベントでアタック成功させないと駄目な娘なので…… 順番を見るに、WikiのFAQを読みながらやったパターンですかね? >>82 乙です。早速ベンチしてみますね。 >>108 前に「GPU毎に処理方法変える為にデータベース作るか」と言われていたことを思い出しました……
111 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 11:25:52.53 ID:FllI0LcA0] こんな情報がありました Intel Architecture and Processor Identification With CPUID Model and Family Numbers ttp://software.intel.com/en-us/articles/intel-architecture-and-processor-identification-with-cpuid-model-and-family-numbers Nehalem / Westmere世代は [45nm] Bloomfield / Nehalem-EP : 0x106Ax Lynnfield / Clarksfield / Jasper Forest : 0x106Ex Nehalem-EX : 0x206Ex [32nm] Clarkdale / Arrandale : 0x2065x Gulftown / Westmere-EP : 0x206Cx Westmere-EX : 0x206Fx あたりでしょうか
112 名前:やんやん ◆yanyan/Pails mailto:sage [2013/09/23(月) 11:37:42.83 ID:BVWtjWSi0] 【診断の種類】検索速度(1パターン) 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 【検索デバイス】CPUのみ 【CPU】Intel Xeon W5590 ×2 (3.33GHz) 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】自動 【検索プロセスの優先度】通常以下 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】すべて 【検索パターン】 10文字完全前方一致1個 【10分間のCPU検索の平均速度】 84.98M tripcode/s
113 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 12:30:59.59 ID:PDVnzk32P] >>112 やっぱりNehalemだと駄目ですね〜 >>111 これで正解ですね。助かります。 Nehalemを検出したら元のルーチンを使うように修正しておきました。 時間のあるときに次の開発版をうpします。
114 名前: ◆YSRKEN.ceVZZ mailto:sage [2013/09/23(月) 13:28:13.13 ID:R2WGY9Wb0] 【診断の種類】検索速度(1パターン) 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4→5 【検索デバイス】GPUとCPU 【使用するGPU】すべて使用 【1SMあたりのブロック数(CUDA)】256 【CPUの命令セット】x64 + SSE2/AVX 【CPU検索スレッドの数】4 【SHA-1ハッシュ値生成の最適化(CPU)】最大 【検索プロセスの優先度】通常 【GUIフロントエンドの優先度】通常 【トリップの種類】12桁 【キーに使用する文字】1バイト文字のみ 【検索パターン】 10文字完全前方一致1個 【 5分間の平均速度】 96.97→102.79M tripcode/s 【GPU検索の平均速度】 64.32→64.30M tripcode/s 【CPU検索の平均速度】 32.64→38.49M tripcode/s ※CPUのみだと36.95→42.76M tripcode/s。ちなみに当方はi5-3210M=Ivy Bridge。
115 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 14:06:20.22 ID:C6NktFR4P] core i7 2700K 定格 HTオン 8スレッド 84Mから105Mに上がりました
116 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 16:21:00.62 ID:L5Ap3lnA0] >>104 > 英語版を作って本家Slashdotにストーリーを投稿してみました。 って事は、これからは外人さんも参加してくれる? 一気に人数が増えるといいな。
117 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 19:43:23.12 ID:dFD9pehG0] >>106 ご回答ありがとうございました
118 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:09:33.41 ID:PDVnzk32P] >>114 >>115 やっぱりNehalem以外では速くなってるんですよねえ… コンパイラの吐いたコードを調べてみようっと。
119 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:12:23.78 ID:PDVnzk32P] 新しい開発版をうpしました。 MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 6 www.meriken2ch.com/programming/merikens-tripcode-finder Alpha 5からの主な変更点は以下の通りです。 ・Nehalem系のCPUで12桁トリップのCPU検索が遅くなる不具合の修正。 引き続き前のバージョンとの速度の比較を報告していただけると助かります。
120 名前: ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:36:25.71 ID:PDVnzk32P] コンパイラの吐いた無駄だらけのコードを見てたら、movapsの代わりに movdqaを使っていました。まさかこれが原因じゃあるまいな…
121 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/23(月) 21:10:26.07 ID:zKQ1y1q50] 古いバージョンもあると比較しやすいのかな?
122 名前:107 mailto:sage [2013/09/23(月) 21:39:06.57 ID:rVyLE6uw0] 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 6 【10分間のCPU検索の平均速度】 148.50M tripcode/s とりあえず、戻ったようです。
123 名前:94 mailto:sage [2013/09/23(月) 21:52:01.56 ID:AdWli9Lo0] α6試してみました 条件は>>94 と同一です 【10分間の平均速度】 366.80M tripcode/s 【GPU検索の平均速度】 340.25M tripcode/s 【CPU検索の平均速度】 26.55M tripcode/s α4の水準に戻ったようです 中身的には暫定的にNehalemを検出してα4のプログラムで 処理してる感じでしょうか? 共通プログラムで全CPUを網羅するのは なかなか難しいのですね
124 名前:累計 ◆wop.8OO8.qow mailto:sage [2013/09/23(月) 23:33:54.95 ID:J8box9ZP0] 条件は>>99 と変わらず、1.1FEα6のみ検索速度(1パターン)を診断 【10分間のCPU検索の平均速度(TPS)】 1.1FEα6 1.1FEα5 1.1FEα4 1.0.1(安定版) ---------------------------------------------- 1) 31.89M 27.84M 30.51M 31.67M 2) 31.88M 27.80M 30.50M 31.77M 3) 31.97M 27.69M 30.58M 31.67M 4) 31.88M 27.85M 30.54M 31.68M 5) 31.89M 27.83M 30.54M 31.64M よかったよかったw
125 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/23(月) 23:47:40.78 ID:fLgQz4cK0] 修正お疲れ様ですー 明日以降入れとこう… そろそろ本気だす
126 名前: ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:05:07.93 ID:SuYpLKhoP] ちゃんとNehalemを検出できているようですね。かったよかった。 Nehalemを使っている人(Alpha 5で遅くなった人)は ぜひこちらも試してみてください。 www.meriken2ch.com/files/2013-09-23-Nehalem.zip 元のファイルに上書きすれば使えます。 あくまでも実験なので、元のファイルは取っておいてください
127 名前: ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:06:37.34 ID:SuYpLKhoP] >>125 > そろそろ本気だす おお、期待してますよw
128 名前: ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:12:46.79 ID:SuYpLKhoP] と書いたあとでゆぐちゃんの速度見たら凄いことになってたw うろつきさんもさすがですし、◆QZshizo.ptHさんもおひさしぶりですね〜
129 名前: ◆Meriken//XXX [2013/09/24(火) 06:44:32.39 ID:SuYpLKhoP] これ、こっちにも貼っておこうっと。 > 43 :◆Meriken//XXX :sage :2013/09/24(火) 06:42:26.23 > ゆぐちゃんの紹介のために、今度は日本語版のSlashdotにストーリーを > 投稿してみました。採用されるように、是非評価を上げてやってくださいw > > slashdot.jp/recent > > GPGPUによる分散トリップ検索サービス「Meriken's Tripcode Yggdrasil」 > slashdot.jp/submission/52745 toro.2ch.net/test/read.cgi/esite/1379214816/43n
130 名前: ◆Meriken//XXX [2013/09/24(火) 08:00:59.39 ID:SuYpLKhoP] >>123 > 中身的には暫定的にNehalemを検出してα4のプログラムで > 処理してる感じでしょうか? その通りです。 > 共通プログラムで全CPUを網羅するのは > なかなか難しいのですね 実際かなり難しいですね。試せる環境が手元にないのが大きいです。 >>126 のバージョンでは新しいルーチンに手を入れてるので、 Nehalemでも高速化できるかもしれません。
131 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/09/24(火) 12:09:59.10 ID:aK0ZMOZo0] Yggdrasilで検索中のPC一覧で見ることの出来る「名前」の項目のデータは編集できますか?
132 名前:94 mailto:sage [2013/09/24(火) 12:11:45.67 ID:XhDzCs6d0] お疲れ様です >>126 を試してみました 条件は>>94 です 【10分間の平均速度】 370.88M tripcode/s 【GPU検索の平均速度】 340.61M tripcode/s 【CPU検索の平均速度】 30.27M tripcode/s 診断ではCPUの効率向上 実測でもCPU24.54→27.47Mt/sという結果でした
133 名前: ◆Meriken//XXX [2013/09/24(火) 12:29:58.12 ID:SuYpLKhoP] >>132 キタ━━━━(゚∀゚)━━━━!! やっぱりmovapsが原因だったんですね。 他のCPUだとSSE2でmovapsを使ったほうが速いのに、 Nehalemだけmovdqaを使ったほうが速いようです。 こんなの普通わからないっちゅうねん。 なんにせよ助かりました。次の開発版に取り込んでおきます。
134 名前:やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 13:55:53.22 ID:yDbtGzZA0] >>126 でα5からの性能向上を確認 Before 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 【10分間のCPU検索の平均速度】 84.98M tripcode/s After 【Meriken's Tripcode Finderのバージョン】>>126 のNehalem用 【10分間のCPU検索の平均速度】 97.66M tripcode/s
135 名前: ◆Meriken//XXX [2013/09/24(火) 14:22:53.52 ID:SuYpLKhoP] >>131 MTFの「分散処理」タグで編集できますよ。次からはゆぐちゃんスレでお願いします。 【分散トリップ検索】Meriken's Tripcode Yggdrasil (p)toro.2ch.net/test/read.cgi/esite/1379214816/
136 名前: ◆Meriken//XXX [2013/09/24(火) 14:24:13.91 ID:SuYpLKhoP] >>134 ありがとうございます。ようやくこれで安心して寝られますw
137 名前: ◆Urotsuki/1Ca mailto:sage [2013/09/24(火) 15:36:32.45 ID:hElffOfN0] 電気料金の関係で当分稼働できそうにない… すみません…
138 名前:やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 16:26:07.84 ID:yDbtGzZA0] On some (but not all) micro-architectures, there are timing differences due to "domain crossing penalties". For this reason, one should generally use movdqa when the data is being used with integer SSE instructions, and movaps when the data is being used with floating-point instructions. For more information on this subject, consult the Intel Optimization Manual, or Agner Fog's excellent microarchitecture guide. Note that these delays are most often associated with register-register moves instead of loads or stores. だそうな、integerだったらmovqdnなんだと。マニアックすぐるw
139 名前: ◆Meriken//XXX [2013/09/24(火) 16:37:03.17 ID:SuYpLKhoP] >>138 ところがNehalem以外だとintegerでもmovapsのほうが movdqaよりも速いんですよねえ… VC++ 2010はマニュアル通りにmovdqaを使ってましたけど、 それだとうまくいかないようです。
140 名前: ◆Meriken//XXX [2013/09/24(火) 16:39:21.48 ID:SuYpLKhoP] >>137 電気料金は大きな壁ですよねえ… 今までお疲れ様でした。またいつでもお越しください。