- 1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680]
- こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce シリーズのビデオカードを使用すれば非常に高速に検索を行うことが できます。特徴は以下の通りです。 ・ビデオカードのGPUによる高速検索(CPU検索にも対応)。 ・GUIによる簡単な操作(コマンドラインからの使用も可能)。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ anago.2ch.net/test/read.cgi/software/1311428038/
- 855 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 08:47:43.45 ID:sid26Nen0]
- 今唐突に12桁トリップのCPU検索を高速化するアイディアを思いついたん
ですけど、1月の中旬まで帰省しているので実装はそれまでおあずけです。 残念… なんでMTFのCPU検索がSHArp Tripperやhip2に比べて遅かったのか 不思議で仕方がなかったんですけど、よく考えたら普通のSHA-1の ルーチンを使いまわしてたせいで、SSE2のレジスタをトリップ検索に 特化した形で効率的に使用していなかっただけでしたw 1個のハッシュの生成を高速化するより、SSE2の128bitレジスタを使って 4個同時に生成したほうが速いに決まってますよねえ。
- 856 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 09:05:24.37 ID:sid26Nen0]
- あと、よく考えたらキーの動的生成とBitslice DESのルーチンの動的書き換え
( >>712-713 )で10桁トリップのCPU検索も高速化できることに気づきました。 なんで時間のないときに限って面白い考えを思いつくんだろうorz
- 857 名前:ののたん ◆KiwamonoL. mailto:sage [2012/12/13(木) 13:36:10.93 ID:rNLBcKX70]
- >>855
えっ!? SIMD ってなかったの!(SIMD るってなんだよ。w まさか、Radeon でもやってないとか・・・・・。 ソースを読んでみる気は無い。www あとまあ Hashcat 知ってるんなら知ってるかもしれんが。 ttps://hashcat.net/p12/js-sha1exp_169.pdf
- 858 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/13(木) 16:42:37.91 ID:tgXDqPZ80]
- もうこれはMERIKENさんにメチャクチャ頑張ってもらうしかない展開
- 859 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 17:01:04.69 ID:sid26Nen0]
- >>857
SSE2を使ってるルーチンを拾ってきたんですけど、 ベクター化されてないのであんまり速度が出てなかったみたいです。 RadeonのほうはCUDA版のベタ移植なのでそれこそなにもしていませんw OpenCLドライバが頑張ってるのでせう。Southern Islandsだとベクトル化しても あんまり意味ないみたいですし… 資料のほうはあとでありがたく読ませて頂きます。 これでさらなる高速化が出来るかもしれないですね。ぐへへへへ…
- 860 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 17:06:59.50 ID:sid26Nen0]
- >>858
明日の朝の飛行機の便に間に合わせるのに徹夜で荷物をつめはじめたところなので さすがに帰省前は無理ですw 来月を楽しみにしていて下さい。 家を出る前に0.07の安定版はうpしておきます。
- 861 名前: ◆YSRKENkO6Y mailto:sage [2012/12/13(木) 19:27:33.63 ID:tgXDqPZ80]
- >>806です。
検索作業をサポートするソフトをリリースしてみます(実験版だけど)。 依頼を検索パターンに変換したり、特定パターンを自動生成したりできます。 良かったらどうぞ。 www1.axfc.net/uploader/so/2713626.zip
- 862 名前:名無しさん@お腹いっぱい。 [2012/12/13(木) 19:51:21.07 ID:DyqVV5mA0]
- レジューム機能がほしいです
- 863 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/13(木) 21:20:16.88 ID:tgXDqPZ80]
- >>862
なんで検索空間>>酉空間なのにみんなレジューム機能が欲しくなるんだろうな……いや俺も思ってたことあったけど 自動実行と自動保存はAlpha 7で既に実装されてるから除くとして
- 864 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/13(木) 21:44:28.47 ID:sR2+e44BP]
- Radeon HD8000シリーズ楽しみすぎる
- 865 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 23:04:23.15 ID:sid26Nen0]
- バージョン0.07の安定版です。
MERIKEN's Tripcode Finder 0.07 www.meriken2ch.com/programming/merikens-tripcode-finder Alpha 7からの変更点は以下になります。 ・OpenCLドライバがインストールされていないと起動できないバグの修正。
- 866 名前: ◆MERIKEN4.k mailto:sage [2012/12/13(木) 23:06:06.40 ID:sid26Nen0]
- 飛行機の時間ギリギリなってしまったのでレスはまた明日させて頂きます。
それではまた〜
- 867 名前: ◆YSRKENkO6Y mailto:sage [2012/12/15(土) 21:07:08.23 ID:GRSKcena0]
- >>861の更新版、「検索人の友 Ver.0.6」のお知らせ。
待て屋・SHArp・MERIKENの検索パターンを相互変換することができます。 (リンクはikura.2ch.net/test/read.cgi/qa/1321792877/667に貼りました)
- 868 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/16(日) 17:19:41.64 ID:V5+y2FbN0]
- 「検索人の友 Ver.0.8」のお知らせ。検索パターンと検索速度から、出現予定時間を算出する機能を追加。
(リンク:ikura.2ch.net/test/read.cgi/qa/1348736616/317に記載)
- 869 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/17(月) 06:52:14.80 ID:NsR6YqHWP]
- SHA256ハッシュを取ると全てのビットが0になるキーが知りたい
- 870 名前: ◆MERIKEN4.k mailto:sage [2012/12/17(月) 08:16:44.48 ID:obM+cmx70]
- >>862
レジューム機能は原理的に無理ですけど、 累計を保存する機能は近いうちにつけておきます。
- 871 名前: ◆MERIKEN4.k mailto:sage [2012/12/17(月) 08:32:18.59 ID:obM+cmx70]
- >>868
依頼変換は便利そうですね。スレから依頼を直接引っ張ってきたり、 「大小区別指定」をチェックボックスにして条件を複数同時に指定できると もっと便利かもしれません。帰省中で今は検索用のPCが使えない状態なので、 来月の中旬頃にはもっと詳しいことが書けると思います。
- 872 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/17(月) 16:23:37.32 ID:ilzoh/XC0]
- >>871
依頼引張り→依頼者が「正しい」形式で依頼してくるかが未知数という問題が・・・ 全部まとめたシステム的なものはムズカシイけど、コピペから自動認識程度なら検討可 チェックボックス→次のバージョン(Ver.2.0)で対応予定。 Ver.1.0に更新のお知らせ: ikura.2ch.net/test/read.cgi/qa/1348736616/320
- 873 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/17(月) 20:47:36.05 ID:tgzVEmdn0]
- >>869
なんでSHA256? 2chの12桁はSHA1だと思ったが…… 仮に2chのトリップがSHA256に対応したとして、BASE64で000000はAなのでAのx完のトリップになると思う
- 874 名前:名無しさん@お腹いっぱい。 [2012/12/25(火) 16:10:43.34 ID:8ibvVCIr0]
- おつかれさまです
現行では10酉探索にはradeonが使えないってことですが いつか改善される予定ってありますか?
- 875 名前: ◆MERIKEN4.k mailto:sage [2012/12/27(木) 14:10:32.77 ID:mxDEJqWX0]
- >>874
一応7xxxシリーズ限定で使えるものがほとんど出来上がっているんですけど、 速度に満足できないので公開を見合わせている状況です。 今考えているのはAMD ILをいじってレジスタ数の割付を最適化することです。 またまとまった時間が取れるようになったら色々試してみる予定なのでしばらく お待ちください。
- 876 名前: ◆YSRKENkO6Y mailto:sage [2012/12/27(木) 20:41:02.20 ID:dIBogKe10]
- 自作ソフトウェアの更新のお知らせ。ぜひお試しを。
[検索人の友 Ver.2.0] このソフトは、以下のような作業を自動化します。 ・検索依頼の各種形式への変換 →依頼スレでのテンプレに準拠。各種形式に変換して表示できます。 今回は大小指定の複数指定に対応。全大と全小を同時表示、なんてこともできます。 ・特定パターンの検索ワードの自動生成 →「純・準X連」「全数」「二構」「飛石」「最長」「最短」といったパターンの検索 ワードを自動的に作成します。10桁(待て屋)、12桁(MERIKEN)両方に対応。 ・各種トリップ検索ワードの相互変換 →「まあ、待て屋。」「SHArp Tripper」「MERIKEN's Tripcode Finder」の 3種類の検 索ソフトの検索ワードを互いに変換します。今回は「*」「+」といったパターンや、 「(|)」にて|が二つ以上の場合にも対応。 ・任意の検索ワードに対する出現確率を計算 →上記 3種類の検索ソフトでの検索ワードと検索速度を入力すると、発見予定時間を有 効数字4桁で表示します。発見予想順位を表示する機能も。 ・トリップテスト →10・12桁トリップをテストできます。生キー対応。 URL:www1.axfc.net/uploader/so/2732376.zip
- 877 名前: ◆YSRKENkO6Y mailto:sage [2012/12/27(木) 21:45:32.82 ID:dIBogKe10]
- 参考画面キャプ:
blog-imgs-52.fc2.com/y/s/r/ysrken/tf2nd.png
- 878 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/28(金) 07:15:58.38 ID:LSB18vp7O]
- 俺はHD5750なので、7xxx限定だと寂しい。
- 879 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/28(金) 10:11:27.22 ID:btW3tXEk0]
- そんなグラボ使ってもゴミみたいな速度だからさっさと7990買った方がいい
- 880 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/29(土) 15:30:34.93 ID:QBY9tjiXO]
- CPU単体より速いし。
- 881 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/30(日) 17:08:22.25 ID:283bEnYe0]
- ハイエンドグラボだと暖房つけなくていいし。
- 882 名前: ◆MERIKEN4.k mailto:sage [2012/12/30(日) 21:35:19.18 ID:3b9pWfKV0]
- >>876
お疲れ様です。チェックボックスに対応して下さったんですね。 ありがとうございます。
- 883 名前: ◆MERIKEN4.k mailto:sage [2012/12/30(日) 22:01:34.70 ID:3b9pWfKV0]
- >>878
自分も5770を持ってるので対応したいのはやまやまなんですけど、 性能を出そうと思ったら最適化を1からやりなおして相当頑張らないと だめでしょうね〜 OpenCLじゃなくてAMD ILで書かないとうまくいかないと思います。 方法がないこともないみたいなんですけど、コードはGPU依存みたいだし 実際どうなんでしょうねえ。 AMD IL openwall.info/wiki/john/development/AMD-IL
- 884 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/31(月) 00:33:06.19 ID:5dWhV9Q+O]
- いや性能を出す必要はなく、動作すればいいのですよ。
CPUと併用すれば、単体より絶対速くなるしね。 勿論、速い方がいいけど、所詮5750だし。 パフォーマンスアップは、ソフトじゃなく ハードでやるべき。
- 885 名前: ◆YSRKENkO6Y mailto:sage [2012/12/31(月) 02:23:57.88 ID:FP3iWdXs0]
- >>882
MERIKENさんが帰ってきた、だと・・・!? >>884 同意 パフォーマンスに拘るのはCOOLだと思うけど、 ちゃんと動くものがあればあるだけ欲しいと思う層もいるのですよ
- 886 名前: ◆MERIKEN4.k mailto:sage [2012/12/31(月) 06:11:35.03 ID:awFOsDcV0]
- >>884
7970用のルーチンも一応5770でも動きますけど、CPUよりずっと遅いですよ。 GPGPUの最適化は難しいのです。
- 887 名前: ◆MERIKEN4.k mailto:sage [2012/12/31(月) 06:32:32.71 ID:awFOsDcV0]
- >>885
その「ちゃんと動」かすのが10桁トリップ検索の場合結構大変なんですよ。 ソフトウェアの最適化なしだったらGPUでもせいぜい2〜3M TPSといったところで、 ここから数十M TPSまで持って行くにはGPUのアーキテクチャに合わせてかなり いろいろ工夫しないといけないのです。
- 888 名前: ◆YSRKENkO6Y mailto:sage [2012/12/31(月) 07:57:11.86 ID:FP3iWdXs0]
- >>887
>2〜3MTPS そうなのか・・・勉強になります 私の自作ツールの場合スクリプト言語で書かれたものですので 最適化とか心配しなきゃならないものでもありませんゆえ Ver.2.0では正規表現の再現度を上げるのが大変だた・・・よく「*」「+」の展開法思いついたなあの時の俺
- 889 名前: ◆MERIKEN4.k mailto:sage [2012/12/31(月) 08:42:39.52 ID:awFOsDcV0 BE:1862028274-2BP(12)]
- 正規表現は結構めんどくさいですよね。
あと、ご自分のツールのお話は新しくスレを立ててそちらでされてはいかがでしょうか。
- 890 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/31(月) 08:57:16.76 ID:eH5h6/ri0]
- 追い出されててワロタw
- 891 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/12/31(月) 10:07:06.18 ID:o6b6oLP20]
- 待て屋スレ過疎ってるからそっちでいいんじゃね
- 892 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/02(水) 08:30:53.92 ID:EBbdMn+A0]
- コレって
先頭から1234・・・・・・・みたいな場合はどうすればいいの?
- 893 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/02(水) 10:34:58.70 ID:j1GWXSL70]
- どうするじゃない、ちゃんと詳しく書け。
子供かお前は、人に伝える努力をしろ
- 894 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/02(水) 12:57:32.84 ID:EBbdMn+A0]
- ◆1234********
みたいなトリップがほしいのですが 正規表現だけだと ◆**1234******** とかになってしまうので 希望の文字を先頭に持ってくる方法を教えて下さい
- 895 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/02(水) 14:19:05.98 ID:B+O8PAt80]
- ^ググれよwww.mnet.ne.jp/~nakama/regexp2.html
- 896 名前: ◆YSRKENkO6Y mailto:sage [2013/01/02(水) 15:57:36.42 ID:dPGu+6vs0]
- >>892
このソフトの文法から言えば、 ---------- #regex ^1234 ---------- か、 ---------- #noregex 1234 ---------- でいい
- 897 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/02(水) 23:11:07.52 ID:EBbdMn+A0]
- >>895−896
ありがとうございます
- 898 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/03(木) 19:09:59.78 ID:ACm8OTnP0]
- HD7750 だとどのくらい出てるんでしょうか。
- 899 名前: ◆MERIKEN4.k mailto:sage [2013/01/03(木) 20:27:04.29 ID:uL2cvRSF0 BE:4256064588-2BP(12)]
- >>898
7750での報告はなかったはずです。コア数が7970の1/4なので、 クロック周波数の差を考え合わせると12桁トリップ検索で450M TPSぐらい じゃないでしょうか。
- 900 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/04(金) 08:22:04.31 ID:3pwj0oYQ0]
- >>899
今使ってる HD6670 だと 267M くらいなので 1.6倍かー
- 901 名前: ◆MERIKEN4.k mailto:sage [2013/01/04(金) 11:11:20.94 ID:9q/aQkBO0]
- 時間ができたので>>857の資料を読んでみました。MTFではトリップのキーの
長さは12桁に決め打ちしてしまっているのでかなりの速度向上が期待できそう です。資料では最適化の結果命令数が21%減ったとのことでしたが、もう ちょっと減らせるかもしれません。 それにしても、やっぱりソフトウェアの最適化についてあれこれ考えるのは 面白いですねえ。工夫一つで性能が数割から数倍に向上するのが GPGPUの醍醐味ですしね。
- 902 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/04(金) 17:52:21.79 ID:vJlizUDg0]
- >工夫一つで
プログラミングの腕って結局そこに結実するんでしょうな…… 上手くSIMDやGPGPUが決まった時の快感は異常
- 903 名前: ◆MERIKEN4.k mailto:sage [2013/01/05(土) 21:57:03.78 ID:7v0sXuCV0]
- >>902
ですよね〜 GPGPUにはなんとも言えない緊張感があります。
- 904 名前: ◆MERIKEN4.k mailto:sage [2013/01/05(土) 22:15:46.12 ID:7v0sXuCV0]
- >>857の資料の内容は大体理解できました。要はSHA-1のブロックの最初の
ワード以外を決め打ちにして計算の手間を省こうという話で、トリップ検索に そのまま応用できることがわかりました。PW[]を定数の配列にして CPU側であらかじめ計算してからカーネルに渡せばいいはずです。 これはかなり楽して速度が稼げる美味しい話みたいです。
- 905 名前: ◆JouJaku.HzIz mailto:sage [2013/01/09(水) 21:26:57.90 ID:htgpuiWN0]
- >>839
「QuadroにGeForceが合わないなら、Teslaを使えばいいじゃない。」 【GPU】Tesla K20c 【CPU】XeonX5680@3.33GHz x2 【OS】Win7Pro64SP1 【Ver】0.07 【Len】12 【BLK/SM】256 【Opt】-c -g -x 256 【Drv】310.70 【15minAv】777.25 MTPS 【GPU Av】705.03 MTPS 【CPU Av】72.22 MTPS 【GPU Ld】- 【GPU Tmp】- 【Oth】HT off, QuadroはCUDA off
- 906 名前: ◆JouJaku.HzIz mailto:sage [2013/01/09(水) 21:29:11.42 ID:htgpuiWN0]
- 今回はエラーも出ずに正常に動きました。
K20cはCPU負荷がGeForce5xxに比べて大きく、1枚でX5680の1コアを使い切る位です。 Open Hardware MonitorもGPU-ZもK20cにはまだ対応してないので、GPUの負荷や温度は分かりません。 整数演算はこんなものですかね。もう少し頑張って欲しかった。(´・ω・`)
- 907 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/10(木) 16:57:35.57 ID:d1+F/txNP]
- IDにgpu
- 908 名前: ◆MERIKEN4.k mailto:sage [2013/01/12(土) 14:28:42.75 ID:rJVHMMLY0]
- >>905-906
報告ありがとうございます。Tesla K20cにしてはちょっと遅いですねえ。 CC 3.5用のバイナリを実行ファイルに埋め込めば速くなるのかもしれませんが、 Toolkit 5.0を使うと他のカードでの速度が露骨に遅くなってしまうのが 悩みの種です。NVIDIAのカードでもOpenCL版を使えるように出来ないか 検討してみます。
|

|