- 1 名前: ◆MERIKEN4.k [2013/01/20(日) 09:12:21.39 ID:VNsWebzC0]
- こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2013年1月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 7428.97M tripcodes/s)。CUDA対応のNVIDIAのビデオカード、もしくは AMD Radeonシリーズのビデオカード等のOpenCL対応デバイスを使用すれば 非常に高速に検索を行うことができます。特徴は以下の通りです。 ・ビデオカードのGPUによる超高速検索。 ・CPUによる高速検索。 ・GUIとCUIの両方に対応した柔軟なユーザーインターフェース。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応(CPUとNVIDIAのビデオカードのみ)。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 ◆MERIKEN4.kのウェブサイト www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ 【トリップ検索】MERIKEN's Tripcode Finder anago.2ch.net/test/read.cgi/software/1348565078/
- 16 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 17:48:55.79 ID:VNsWebzC0]
- >>11
Intelの石だとちゃんと最適化の成果が出ているようですねえ。 >>10 >>12 それで問題ないです。情報提供、ありがとうございます。 >>13 GPU検索はもうちょっと速くなる予定です。期待してて下さい。 >>9 >>14 Alpha 2で遅くなるのはどうやらPhenom以降らしいですね。 CPUIDの仕様をみてゲンナリしたので、実行時に速度を計測してAlpha 2の最適化を 適用するかどうかを判断させることにします。しかしBulldozerはさすがに 速いですねえ。整数演算だけだったらCore i7-3770Kといい勝負ができてますね。
- 17 名前: ◆YSRKENkO6Y mailto:sage [2013/01/20(日) 18:25:03.16 ID:6cCMlcR80]
- >>16
>実行時に速度を計測 CPUIDで決めつけるよりは安全だと思いますよ ただ、場当たり的な対策な気もしますが GPUがこれ以上速くなったら俺でも100M/s超えるかもワーイ
- 18 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 18:29:42.27 ID:VNsWebzC0]
- >>17
将来どんなアーキテクチャが出てくるかわからないのでこれでいいんですよ。 手元にないハードウェアのために性能の良いソフトウェアを書くのは難しいのです。
- 19 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 18:45:41.37 ID:VNsWebzC0]
- とりあえずAlpha 2の最適化を使用するかどうかを実行時に決定できるように
なりました。あとはCUDAのときと同じ要領で実行時に速度を測定して 最適なアルゴリズムを選択できるようにしてやるだけです。
- 20 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 20:31:24.15 ID:VNsWebzC0]
- う〜ん、なかなかうまくいかないなあ…
動的な最適化のためにループをもう一段回深くしたら速度が落ちてしまいました。 多分コンパイラの最適化を邪魔してしまってるんだろうけど、これは困った。 元はといえばGetTickCount()の精度が悪すぎるのが原因といえば原因なんだけど、 これってなんとかならないのかしらん。
- 21 名前:ののたん ◆KiwamonoL. mailto:sage [2013/01/20(日) 20:46:30.35 ID:MWphMQ8K0 BE:1106146087-DIA(289888)]
- >>20
つ「timeGetTime」
- 22 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 20:55:46.61 ID:VNsWebzC0]
- >>21
あ、その節は貴重な資料を本当にありがとうございました。 経過時間の測定は次の方法で何とかなりました。 stackoverflow.com/questions/2150291/how-do-i-measure-a-time-interval-in-c 一応最適化のルーチンは動いているようなので、あとは微調整をしてやるだけです。
- 23 名前: ◆YSRKENkO6Y mailto:sage [2013/01/20(日) 21:38:13.30 ID:6cCMlcR80]
- >>20-22
まさか時間測定をGetTickCount()でやっていただなんて…… ところで、QueryPerformance系命令ははCPUクロックが動的に変化する場合、 「OSによっては値が信用できなくなる」なんてこともありえますゆえご注意を…… 参考: d.hatena.ne.jp/shiku_otomiya/20100218/p1 d.hatena.ne.jp/shiku_otomiya/20100504/p1 d.hatena.ne.jp/shiku_otomiya/20100917/p1
- 24 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/20(日) 21:49:35.86 ID:ourgxKXJ0]
- 3,300円につられてWin8にするんじゃなかった・・・HD4000系つかえないのね。
なのでQuadro FX4800 (GTX265級)CUDAでWin8をやってみました。 【GPU】Nvidia Quadro FX4800 x2 【CPU】Xeon E5540 x1 【OS】Windows 8pro 【バージョン】MERIKEN's Tripcode Finder 0.08alpha2 【トリップの種類】12桁 【1SMあたりのブロックの数(CUDA)】auto (16) 【1CUあたりのワークアイテムの数(OpenCL)】 【Display Driver】310.90 【GPUの平均速度】330 tripcodes/s 【CPUの平均速度】50 tripcodes/s 抜ける時に固まってしまうので、GPUのみにした方がいいか・・・。
- 25 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 22:00:31.90 ID:VNsWebzC0]
- >>23
なるほど、こんなこともあるんですね。いやあ、助かりますw そのせいかどうかわからないんですけど、動的な最適化は 完全には安定していないようです。やっぱりtimeGetTimeを使ったほうが いいのかしらん。
- 26 名前: ◆MERIKEN4.k mailto:sage [2013/01/20(日) 22:03:23.56 ID:VNsWebzC0]
- あと色々コードをいじって気づいたんですが、Phenom IIで遅くなる原因は
どうやら命令のオーダーにあるようです。うまく命令のオーダーを 調節してやれば実行時の最適化は必要なくなるかもしれません。 ちょっとこれから用事があるので、また後で試してみます。
- 27 名前: ◆YSRKENkO6Y mailto:sage [2013/01/20(日) 22:08:28.62 ID:6cCMlcR80]
- >>24
いや・・・Ver.0.07 alpha 7以降HD4000使えなくなったというのが俺の認識 (過去ログ見れば分かるが対応が難しいからだそう) その分Ver.0.08 alpha 1以降CPU検索がグッと速くなってるからそっちで補えるけど
- 28 名前:名無しさん@お腹いっぱい。 mailto:sage [2013/01/20(日) 22:28:54.48 ID:ourgxKXJ0]
- >>27
あらら。二重の意味でNGなんですね。AMDもHD2K3K4Kは去年の8月から 切っちゃってて、Win7までしかドライバ出てなかったんです。 Nvidiaがあるからいいや、みたいなのりでWin8にしてしまいましたが HD4000も過去帳入りですね・・・。
- 29 名前:名無しさん@お腹いっぱい。 [2013/01/20(日) 22:34:56.35 ID:/IyUB2p70]
- 【CPU】i7-3970x(OC 5.04GHz)
【OS】 Microsoft Windows 7 64bit 【トリップの種類】12桁 【その他のオプション】全てDL時のまま 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【CPUの平均速度】186.21M tripcodes/s さっきよりもうちょっと速くなったww 早すぎワロチwww
- 30 名前: ◆YSRKENkO6Y mailto:sage [2013/01/20(日) 23:57:59.33 ID:6cCMlcR80]
- >>28
>AMDもHD2K3K4K え、AMDにもIntel HD Graphics 4000みたいなのあるの……? ひょっとしてRadeonの方言ってる?? >>6でも書いてるけど、自分はCorei5+GeForce環境だから、 CPU検索が遅い際にはMERIKENでゲフォ+HDG4000を使い、 SHArp TripperでCPUを使っていたんだ でもVer.0.08以降CPU検索が速くなったからSHArp要らない→両方MERIKENでおkになった 決して「MERIKENシリーズではRadeon HD 4000シリーズは使えない」って意味じゃないからね!
- 31 名前: ◆MERIKEN4.k mailto:sage [2013/01/21(月) 01:19:54.68 ID:HDFcfntu0]
- >>29
これも滅茶苦茶速いですねえ。たしかこれ、Sandy Bridgeですよね。 OCでここまで回せるとは…
- 32 名前: ◆MERIKEN4.k mailto:sage [2013/01/21(月) 01:24:18.89 ID:HDFcfntu0]
- 実行時の最適化はなかなか安定してくれません。
まあ各検索スレッドがてんでバラバラに速度を測定してるので 仕方がないといえばそうなのですが… とりあえずtimeGetTimeを試してみて、これが駄目だったら また別の方法を考えて見ることにします。
- 33 名前:名無しさん@お腹いっぱい。 [2013/01/21(月) 01:54:18.92 ID:70EXSbRt0]
- 計測用に別の実行ファイルを用意してそちらでテスト
->設定書出 ->本体で設定ファイル読み込んで以下略 な感じで回避できないの? >>20
- 34 名前:名無しさん@お腹いっぱい。 [2013/01/21(月) 02:12:49.20 ID:iy3ZJANG0]
- >>31
さすがにXeon2個には勝てないけどなww
|

|