1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680] こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce シリーズのビデオカードを使用すれば非常に高速に検索を行うことが できます。特徴は以下の通りです。 ・ビデオカードのGPUによる高速検索(CPU検索にも対応)。 ・GUIによる簡単な操作(コマンドラインからの使用も可能)。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ anago.2ch.net/test/read.cgi/software/1311428038/
541 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 13:25:37.29 ID:ZBbfmQXZT] 低速のテスト用に4文字検索もOKにすればいいのに
542 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 13:30:40.11 ID:tCg9kOr10] >>536 CUI版でオプションスイッチが効かないような 設定してもデフォルトでの検索になります
543 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 13:43:05.04 ID:751Yphs90] >>541 ハッシュ値の計算の関係で5文字以上にしないと検索が遅くなるんです。 正規表現で"^TEST."のように指定してやれば4文字で検索できなくも無いです。
544 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 13:47:26.30 ID:751Yphs90] >>542 報告ありがとうございます。たしかにOpenCL対応のGPUが複数あると オプションが効かないですね。直しておきます。
545 名前: ◆supernova.rT mailto:sage [2012/11/10(土) 14:26:44.02 ID:AK5IPrBn0] 5870でAlpha 4を試しましたので、ちょい簡単に報告します >>487 を参考に数値を変えましたところ、-y 5120 -z 64 の設定で平均900M強出ました どうやら先日の報告はGPU使用率が低かったようです
546 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 14:37:28.94 ID:751Yphs90] >>542 で報告していただいたバグを修正した開発版をうpしました。 複数のGPUを使わない方はダウンロードする必要はありません。 MERIKEN's Tripcode Finder 0.07 Alpha 5 www.meriken2ch.com/programming/merikens-tripcode-finder
547 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 14:48:46.91 ID:751Yphs90] >>545 CUの数が5770の倍なのでちょうどそれぐらいの速度ですよね。 5870のデフォルトの値だけ変えられないか検討してみます。
548 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 15:39:17.37 ID:751Yphs90] >>545 CL_DEVICE_NAMEとCL_DEVICE_MAX_COMPUTE_UNITの組み合わせで 型番が特定できることがわかったので、5870のデフォルトの値だけを変えて おきました。次の開発版で反映されます。
549 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/10(土) 16:48:50.75 ID:Osc/R8BS0 BE:197526252-DIA(289888)] 【GPU】Radeon HD 6990 【CPU】i7-2600 【OS】Windows 7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 4 【トリップの種類】12桁 【1CUあたりのワークグループの数】2560 【1WGあたりのワークアイテムの数】64 【その他のオプション】なし 【Display Driver】CCC 12.10 【5分間の平均速度】1955.59Mtripcodes/s 【GPUの平均速度】1955.59Mtripcodes/s 【CPUの平均速度】N/A 【GPU使用率】97%前後 【その他】 GPUのみで検索 電力を20%盛って950MHzで計測 Performing a forward-matching search for 1 pattern (1 chunk) with 7 characters on GPU(s): OpenCL0: 1034.7M TPS, 2560 work-groups/CU, 64 work-items/WG OpenCL1: 920.9M TPS, 2560 work-groups/CU, 64 work-items/WG 0.577T tripcodes were generated in 0d 0h 5m 00s at: 1991.28M tripcodes/s (current) 1955.59M tripcodes/s (average) On average, it takes 25.6 minutes to find one match at this speed.
550 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 17:06:17.35 ID:751Yphs90] >>549 あ、ありがとうございます! ちゃんと性能通りの速度が出ているみたいですね。 よかったよかった。 > 【5分間の平均速度】1955.59Mtripcodes/s しかしこれは1枚のグラボの数字には見えないですねw 素晴らしいです。
551 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 17:37:48.81 ID:NYhfme2W0] >>549 >【5分間の平均速度】1955.59Mtripcodes/s 2枚にすればMERIKEN超えだよ!やったね!
552 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 18:34:33.46 ID:asBmjW5V0] こんばんわ alpha5 解凍したまんまです www.dotup.org/uploda/www.dotup.org3605227.png OSとそのドライバの影響でしょうか?うちの環境で40〜50%です
553 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/10(土) 19:06:49.70 ID:Osc/R8BS0 BE:355546692-DIA(289888)] >>552 6990 なら、電力を盛らないとホンキださないぜ。 6990 使いなら常識だぜ。w 【重要:盛って壊れても俺は責任持たないからな。】
554 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:07:57.03 ID:asBmjW5V0] >>553 盛っても変わらなかったからデフォでやったw
555 名前:名無しさん@お腹いっぱい。 [2012/11/10(土) 19:16:08.42 ID:pOMmt27e0] 壊れてナンボがデフォ。
556 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 19:17:25.07 ID:751Yphs90] >>552 これは実にもったいない… ぶっちゃけAMDのOpenCLの実装がちゃんと 複数のGPUを生かしきれてないのが問題なんですけどねえ。 同じ設定でTripcode Finderを2つ同時に動かしたらどうなるか、 試してみていただけませんか?
557 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:33:15.40 ID:asBmjW5V0] GPUのみの並列実行しても使用率に変化はありません CPU&GPU GPUの並列実行も同じです
558 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 19:40:37.23 ID:751Yphs90] >>557 あとはワークグループの数を5120とか10240にしてみるぐらいしか 思いつかないですねえ。スレッドの数を変えてみるといいのかもしれないんですけど、 このオプション、Alpha 5ではちゃんと動いてませんでした… 次の開発版で 直しておきます。
559 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:49:37.93 ID:NYhfme2W0] >>552 のように、ラデ使いのSSに写ってるカッコイイ画面>>432 ってグラボ標準のユーティリティなん? 高いGPUなんて買ったことないからよく分かんない…… 使用率見るのにGPU-Zより分かりやすいのはいいけど ところでこの壁紙って誰のですか?
560 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:50:17.66 ID:NYhfme2W0] なんで>>432 って付いてるの↑…… 無視してください
561 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 20:09:58.65 ID:asBmjW5V0] www.dotup.org/uploda/www.dotup.org3605668.png いろいろやった結果 CU=2560 WG=32 のみ固定し行けました 6990はクーラントブッカケしたものなんでたまにマザーが見失ったりするんでそのせいかもしれません ツールはMSIのサイトから落とせますよ 壁紙は台湾MSから 日本MSのちっぱいには興味ありません
562 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 20:59:00.78 ID:NYhfme2W0] >>561 ウチMSIには縁がないもので…… ↓壁紙はいただきました。冷静に考えるとM$キャラでちっぱいは少ないような…… www.microsoft.com/taiwan/silverlight/collection.htm
563 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 21:47:13.33 ID:asBmjW5V0] >>562 無料ツールだろw MSI行って落とせよ
564 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 21:51:37.91 ID:EjblPgPX0] ^0123456789$のように$で終わらせた検索条件を含む 10桁トリップと12桁トリップの複合検索は トリップの種類12桁 でもできますか?
565 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 22:48:53.43 ID:tCg9kOr10] >>562 どこのメーカーのものでも使えますよ event.msi.com/vga/afterburner/download.htm
566 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 02:08:24.80 ID:jethYJ0v0] >>564 おっしゃっていることがさっぱりわからないんですが… Tripcode Finderで10桁トリップと12桁トリップを同時に 検索することはできません。
567 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 02:30:34.47 ID:shOUqygm0] >>565 thx!インストールしてみる→ --------------------------- MSI Afterburner --------------------------- 一部の MSI アフターバーナーのコンポーネントが期限切れ、紛失、または壊れています。 --------------------------- OK --------------------------- 起動しないよorz ノートじゃ駄目か……
568 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 03:27:58.86 ID:jethYJ0v0] >>561 う〜ん、まだまだ力を出し切れていない感じですねえ。 自分でも試してみたいけど、さすがにこれ以上はグラボは買えません。無念なり…
569 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 10:55:22.93 ID:VopdUwvA0] 【GPU】SAPPHIRE VAPOR-X HD5770 1G (OC: GPU 960MHz MEM 1265MHz) 【CPU】Intel Core i7-3770(無印) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 5 【トリップの種類】12桁 【1CUあたりのワークグループの数】3200 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.10 【10分間の平均速度】498.00M tripcodes/s 【GPUの平均速度】463.44M tripcodes/s 【CPUの平均速度】34.56M tripcodes/s 【GPU使用率】99% 【GPUの温度】64℃ (室温20℃) 【その他】テスト時間10分33秒、7完1タゲ Intel HD4000 にセカンドディスプレイを接続して使用していますが、Intel 社の OpenCL ドライバはインストールしていないので HD5770 だけでのテスト となりました。
570 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 12:58:41.29 ID:jethYJ0v0] >>561 あの後ちょっと調べてみたんですけど、ひょっとしてCrossFireXが有効になってませんか? Catalyst Control CenterでCFXを切れば、デフォルトの設定でうまくいくかもしれません。
571 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:02:30.40 ID:6A5ebb7J0] >>570 切ってみます
572 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 13:07:04.34 ID:jethYJ0v0] >>569 詳しい報告、ありがとうございます。ワークグループの数は2560より3200のほうが いいのかな。うちの5770でもうちょっと詳しく調べてみます。
573 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:10:54.23 ID:6A5ebb7J0] 切れてた… 2560/64は2560/32より遅かった模様
574 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 13:21:12.44 ID:jethYJ0v0] >>573 う〜ん、何で6990 CFXだけなかなか速度が出ないんでしょうねえ。 ほかのOpenCLアプリケーションでは6990 CFXでもちゃんと性能が出るという報告が あったので、なにかしら方法はあると思うんですが… もうちょっと調べてみます。 Bitcoin Mining GPU Performance Comparison www.hardocp.com/article/2011/07/13/bitcoin_mining_gpu_performance_comparison/3
575 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:41:23.09 ID:shOUqygm0] >>569 >Intel社の OpenCL ドライバ そんなのがあったのか……と思ってググってみたが、SDKのことか? →インストールしたら、アホの子でOpenCL検索使えた! (ただし4M/sぐらいだけど) サンクス!
576 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:55:31.58 ID:shOUqygm0] あ、後、タスクマネージャ見てたら隠しパラメータがあることに気づいたw -a 2←1つのAMDのGPUに対する検索スレッドの数? -m MutexForMERIKENsTripcodeFinder-6496←Intel HD Graphics 4000でOpenCLを使うおまじない?
577 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 15:10:23.29 ID:jethYJ0v0 BE:1197019229-2BP(12)] >>576 > -a 2←1つのAMDのGPUに対する検索スレッドの数? これはあってます。2番目のはGUI版とCUI版が通信するときに使うおまじないです。
578 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 18:53:29.24 ID:jethYJ0v0] これまで使っていた検索君1号のFermi軍団に加えて、開発用PCの7970でも同時に 検索をしているのですが、ここ数日で3回ブレーカーが落ちましたw GTX 590の電圧を絞ることでなんとか対処しましたが、 消費電力のほうもそろそろ限界です。
579 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 19:25:42.41 ID:6A5ebb7J0] 単相200V契約しよう
580 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:09:00.62 ID:tLApF2aS0] 前スレだったと思いますが、ドライバを触ったらこのソフトからGPUが認識されなくなったと書き込んだものです。 相変わらず認識されないままですが、今日system32に入っているclinfo.exeというプログラムでOpenCLの情報を取得できると知ったので、 取得できたテキストをアップロードしておきます。 cyclotron.moe.hm/up/small/src/cyclotron_s4856.zip 念のため正常に使用できるPCのぶんも入れておきます。
581 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:10:29.57 ID:kFGFk5jZ0] USAは、110ボルトですね。
582 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:22:46.82 ID:jethYJ0v0] >>580 ひょっとしてこのスレの>>395 さんですか? たしかに両方ともRadeonが見えていますね。 OSが64bit版ならCUI64ならうまく動くかもしれません。
583 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:29:24.47 ID:jethYJ0v0] >>579 したいのはやまやまなんですけど、今のアパートだと無理なんです… >>581 120Vです。15Aなので1800Wまで大丈夫なんですが、グラボ4枚で1100Wぐらい いってます。やばいです。
584 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:42:11.43 ID:tLApF2aS0] >>582 あ、このスレでしたか。 Alpha5をダウンロードしてCUI64を起動してみましたが MERIKENsTripcodeFinderCUI: OPENCL FUNCTION FALL FAILED: CL_DEVICE_NOT_FOUND (file 'Source Files\MTF_CUI_Main.cpp', line 732) と表示されてそこから進みません。 c++は門外漢でソースちらっと眺めただけですけど、プラットフォームが2個あって、最初の片方がCPUのみってところでなんかコケたりしてません?
585 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:47:49.07 ID:jethYJ0v0] >>584 CPUは無視するようにしているので問題はありません。 32bit版のMERIKENsTripcodeFinderCUI.exeではどうですか?
586 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:51:41.93 ID:tLApF2aS0] >>585 32bitでも同じエラーです。
587 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 21:06:57.97 ID:jethYJ0v0] う〜ん、やっぱりCL_DEVICE_NOT_FOUNDが返されているのかなあ。 うちのIntelのドライバではエラーは出なかったんですが… これから修正して新しい開発版をうpするので、そちらを試してみてください。
588 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 21:57:58.95 ID:jethYJ0v0] >>580 で報告していただいた、環境によっては起動できないバグを修正した 開発版をうpしました。というか、これで直っているといいんですけど… MERIKEN's Tripcode Finder 0.07 Alpha 6 www.meriken2ch.com/programming/merikens-tripcode-finder
589 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 22:02:50.51 ID:tLApF2aS0] >>588 ありがとうございます。 起動できるようになりました。
590 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 22:08:25.91 ID:jethYJ0v0] >>589 それはよかった! こちらこそバグ報告をありがとうございました。
591 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 22:12:41.07 ID:jethYJ0v0] もうそろそろ安定してきたと思って10桁トリップ検索の移植の作業を 始めてたんですけど、まだ結構不具合が残っていますねえ。
592 名前: ◆GTX680Mcys3u mailto:sage [2012/11/12(月) 06:26:56.37 ID:2Urt7HcK0] >>588 全グラフィックチップ(680M+iHD4000)指定だと 検索開始後エラーメッセージなしでソフトごと落ちます HD4000はバッサリ切った方がいいかと思われます
593 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 07:13:21.49 ID:x4jnfC130] >>592 ありゃりゃ… こりゃいかんですねえ。テスト用には便利だったんですけど しょうがないですね。次の開発版からは無視するようにします。
594 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 07:34:25.71 ID:x4jnfC130] というわけで面倒くさいのでIntelのプラットフォームは最初から無視することに しちゃいました。OpenCLはオープンスタンダードな分だけそれに伴う 問題も多いですね。
595 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 08:51:49.76 ID:x4jnfC130] 気を取り直して10桁トリップ検索の移植作業を続けます。 CPU側のコードは10桁の場合とほとんど同じなのですぐに終わりました。 問題はOpenCLのコードですが、バグが紛れ込むと見つけるのが 非常に困難になるので、慎重に作業を進めてます。
596 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 10:00:14.78 ID:x4jnfC130] カーネルの入り口の部分の書き換えは終了しました。 あとはBitslice DESの本体だけですが、CUDAのコードをコピペするだけなので 問題はないでしょう。うまく動いてくれるといいんだけど、どうでしょうね〜
597 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 10:29:57.20 ID:FaMyVn9Z0] geforceでopenCL版って動くの? 動いてもcudaよりは遅い?
598 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 13:13:54.13 ID:x4jnfC130] >>597 いまはNVIDIAのカードでは強制的にCUDAを使うようにしています。 OpenCLでも動くことは動くと思いますけど、基本的に全く同じコードなので 速度は変わらないでしょう。
599 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 13:27:00.53 ID:x4jnfC130] OpenCLの10桁検索のコードは1発で動いたんですけど、Bitslice DESで使う変数を 何も考えずに全部__privateメモリ空間に突っ込んだら、案の定というか まったく速度が出ていませんw まあでもコードの書き換え自体は問題なかったよう なので、とりあえず一安心です。これから__globalと__localを試してみます。
600 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:31:46.97 ID:ClnWJME80] khronosの姿勢として標準のカーネルコンパイラを用意しないのはわかるんだけど やっぱりglslの轍をちょっとは生かしてほしかったってのが個人的な思い meriken氏乙
601 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:37:18.53 ID:/PHpLzn40] >>594 当方では一応4M/sぐらいで動くので、 IntelHD4000を使うか否かをチェックボックスとかで決めればいいと思いまーす
602 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:56:47.61 ID:FaMyVn9Z0] >>598 そうなんだ ありがとう
603 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 21:58:25.06 ID:+66fUhHT0] OpenCLで盛り上がっているところにCPUのみの結果を報告。 【GPU】Quadro FX 3800 【CPU】Xeon X5680@3.33GHz x2CPU 【OS】MS Windows 7 Pro 64bit 【バージョン】0.07 Alpha 3 CUI64 【トリップの種類】12桁 【Display Driver】307.32 【その他】HT on 【その他のオプション】-c -t 24 【60時間の平均速度】80.51M TPS 【その他】HT off 【その他のオプション】-c -t 12 【2時間の平均速度】79.04M TPS CPUだけで実行してもHTは殆ど効きません。NehalemとSandy Bridgeでは全然違うのかな? ちなみにHT on の状態で、"-c -t 12"と指定すると、2CPU12コアに割り当てられずに、1CPU6コア12スレッドに割り当てられてスピードが出ません。
604 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 21:59:57.08 ID:+66fUhHT0] Alpha 6に上げて再度実行してみましたが、NVIDIAコントロールパネルの"3D設定"→"3D設定の管理"で"CUDA-GPU"を"なし"に設定すると、CUI64で"-c"オプションをつけても下記エラーが出て落ちます。 MERIKENsTripcodeFinderCUI: OPENCL FUNCTION FALL FAILED: Unknown (file 'Source Files\MTF_CUI_Main.cpp', line 715)
605 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 23:26:48.48 ID:ODHrB/Fw0] NVIDIA,第2世代Kepler「GK110」搭載の「Tesla K20」を正式発表。CUDA Core数は最大2688基に www.4gamer.net/games/121/G012181/20121110004/
606 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 23:34:15.80 ID:cklfqCrp0] X5680はOCすりゃいいじゃん
607 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 02:39:21.60 ID:FPgsAJYQ0] DualCPUにQuadro突っ込んでるようなガチWS機でOCとかあり得んでしょ
608 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 02:50:45.59 ID:l+bGYcyn0] 倍率ロックフリーだろ?
609 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:21:00.78 ID:FpPqufE20] 今気づいたんですけど「1CUあたりのワークグループの数」じゃなくて 「1CUあたりのワークアイテムの数」ですね、これ。 こりゃ当分の間安定版は出せないな…
610 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:26:29.04 ID:FpPqufE20] >>603-604 報告ありがとうございます。CPU検索ももうちょっと何とかしたいですね〜 "Unknown"のエラーが出ているのは謎ですが、そこのエラーは無視するように 直しておきます。
611 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:38:08.95 ID:FpPqufE20] 予想通りというべきか、10桁トリップ検索はなかなかスピードが出てくれません。 まじめにプロファイラを使わないと駄目ですね、こりゃ。 まあCUDAのときもそうだったので、のんびり時間をかけて取り組むことにします。
612 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 07:26:06.97 ID:FpPqufE20] >>605 GK110も試してみたいんですけどね〜 Amazon Cluster GPU Instancesで使えるようにならないかしらん。
613 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 09:29:27.60 ID:FpPqufE20] Bitslice DES用の一時変数をどのメモリ空間に置けばいいのかいまいち よくわからないので、とりあえず#ifdefで切り替えられるようにしておきます。 あと、一回のBitslice DESを複数のスレッドで同時に処理するかどうかも CPU側で設定できるようにする予定です。こういうところは実行時にカーネルを ビルドできるOpenCLはいいですねえ。
614 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 09:34:06.33 ID:ATY55mX00] 【GPU】HD7970 CFX 2GUPs 【CPU】FX-8350 【OS】Win7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 6 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】40 【その他のオプション】-c -g -t 6 -a 8 (-aオプションは有効なのか?) 【Display Driver】Catalyst 12.10 【10分間の平均速度】2614.21tripcodes/s 【GPUの平均速度】2575.40tripcodes/s 【CPUの平均速度】38.31tripcodes/s 【GPU使用率】95% 【その他】7完1タゲ いろいろ調整したら瞬間最大風速では3000M程度出るようにはなりました ラデはCPU負荷高いですね フルにCPU8スレッドで回すと却って速度が出ないです CPU単体でなら50M程出るんですが それと、CFXの有効無効では速度は変わらないですよ www.rupan.net/uploader/download/1352766539.png
615 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 14:32:35.77 ID:1xHvqvP20] ついにデュアルTahitiカードがAMDから登場。エーキューブ,サーバー向けグラフィックスカード「FirePro S10000」を国内発売 www.4gamer.net/games/133/G013322/20121113023/
616 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 14:34:05.53 ID:1xHvqvP20] XeonPhiってどうなんですかねえ
617 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 15:01:20.15 ID:PlVYlKIA0] 負荷で思い出したけど、同じGPU使用率でもmtyのGPU版は95℃までいくけどMERIKENは89℃までしか上がらないね。
618 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 17:19:59.24 ID:VU2bD6Zz0] >>615 サーバ向けのFireProだし、3599ドルらしい。 >>616 OpenMPが使えて既存アプリの移植が楽らしいけど、既にOpenCLになっている場合はメリット薄そう。
619 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:10:11.95 ID:FpPqufE20] >>614 なかなか良い感じに仕上がってますね。それだけOCした7970なら単体で1500M TPS近く いくはずなので、単純に2枚で2倍の速度という訳にはいかないみたいですが… Alpha 6では-aオプションは有効なはずです。CFXの話は別のところで見かけたんですが、 関係無かったみたいですね。
620 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:22:18.89 ID:FpPqufE20] >>617 Bitslice DESはSHA-1の処理に比べてメモリへのアクセスの量が段違いですからねえ。
621 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:30:43.61 ID:FpPqufE20] >>615 いいですね〜 いつかこういうのをたくさんラックマウントサーバーに乗っけて Tripcode Finderを動かしてみたいですw
622 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:59:41.68 ID:FpPqufE20] Southern Islandsだとコンスタントメモリは場合によってはグローバルメモリと 同じぐらい遅くなるそうで…こりゃCUDAと同じコードじゃ遅くなるわけだわ。 頻繁に使うのは最初にローカルメモリに移しておいたほうがいいな。 > 3. Varying Index > More sophisticated addressing patterns, including the case where each work- item > accesses different indices, are not hardware accelerated and deliver the same > performance as a global memory read.
623 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 20:10:06.56 ID:FpPqufE20] あとローカルメモリにアクセスする際はuint2を使うといいみたいです。 > Currently, the native format of LDS is a 32-bit word. The theoretical > LDS peak bandwidth is achieved when each thread operates on a > two-vector of 32-bit words (16 threads per clock operate on 32 banks). vector data typesの使い方はここに書いてありました。 Programming with OpenCL C www.informit.com/articles/article.aspx?p=1732873&seqNum=3
624 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 20:28:02.76 ID:ES3128Qj0] >>614 壁紙についてkwsk MERIKENさんの公式記録が越される日も近いか……
625 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 23:12:02.50 ID:ATY55mX00] >>624 この辺で拾ってます これがいつのものだったかは忘れましたw www.smashingmagazine.com/tag/wallpapers/
626 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 23:43:31.28 ID:ES3128Qj0] >>625 そのまま2012/11の記事を見ても出てこないorz www.smashingmagazine.com/2012/10/31/desktop-wallpaper-calendar-november-2012/ よろしければ画像アップローダに上げてくれませんか?
627 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 00:24:53.55 ID:mDY3eRDW0] >>624 それはどうでしょうね… ( ̄ー ̄)ニヤリ
628 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:35:11.76 ID:E/rQ2cMp0] >>626 ほい www.rupan.net/uploader/download/1352820886.jpg
629 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:38:28.17 ID:eHqSRvz80] >>621 どうせならHD7970 X2に行きませんか? 消費電力が凄まじいのと、スロット占有が問題ですけどw なんかリンクが貼れないので詳細は検索してください デスクトップ向けにHD7950のデュアルが出てくれれば一番ですけどね。 HD7950のCFはグラフィックでも割りと良いというレビューもあったので、需要もある程度ありそうですし。
630 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:50:05.56 ID:eHqSRvz80] >>622-623 OpenCLは以前よりは情報も増えたようですが、まだ茨の道なのでしょうかね・・・
631 名前:626 mailto:sage [2012/11/14(水) 01:34:12.64 ID:vuLXlPiG0] >>628 ありがとうございます!
632 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:39:17.60 ID:mDY3eRDW0] >>630 >>622-623 はJohn the Ripperのメーリングリストを見てて気づきました。 www.openwall.com/lists/john-dev/2012/08/13/8 www.openwall.com/lists/john-dev/2012/09/10/5 このAlexanderという方はJohn the RipperとBitslice DESの偉い人です。 流石です。 www.openwall.com/lists/john-users/2011/06/22/1
633 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:40:56.22 ID:mDY3eRDW0] >>630 まあGPGPUの不条理な制約にはCUDAで慣れっこになっているので どうということはありませんw
634 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:45:30.91 ID:mDY3eRDW0] >>629 うちの検索用マシンにはGTX 580が2枚と590が1枚載っているので、 7970 2枚は余裕ですw 今590を売っぱらって6990を買おうかどうか 考えているところです。
635 名前: ◆supernova.rT mailto:sage [2012/11/14(水) 02:04:56.65 ID:Bf0HEkX10 BE:1020114162-DIA(123421)] 僕はもうラデ2枚構成にしたのでゲフォ売ります 10桁検索対応が楽しみですよー
636 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 02:16:09.00 ID:eHqSRvz80] >>633 頼もしいです、頑張ってください。 >>634 HD7970を1ボードに2基載せたもので8ピンx3で3スロット占有という モンスターというかクレイジーな代物が出るらしいですw それの複数枚挿しは電源だけでなくマザボもかなり選びそうです。 HD7950のデュアルで8ピンx2で2スロットであればまだマシなのですけどねえ。
637 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 03:47:50.59 ID:peEcrqnb0] やっぱりさよならゲフォの流れになったね
638 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 06:49:17.05 ID:AbSbupmCP] RADEONは普及用チップでも倍精度が高速なのがいい
639 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 07:58:59.38 ID:vuLXlPiG0] mtyGPUがRadeonしか対応してないから、むしろゲフォ対応検索は(10桁では)貴重なんだが
640 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 13:24:08.27 ID:85Ooiiep0] >>638 マジレスすると倍精度演算が速いのは7970だけだしトリップ検索に倍精度演算の出番は無いぞ
641 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 14:42:36.69 ID:mDY3eRDW0] >>635 10桁トリップ検索は12桁よりかなり難しいので、実際どこまで速度を出せるかは わかりませんけどね〜 というか12桁検索の移植は正直うまくいきすぎでしたw 地道に取り組む予定なので、のんびり待っていて下さい。