1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680] こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce シリーズのビデオカードを使用すれば非常に高速に検索を行うことが できます。特徴は以下の通りです。 ・ビデオカードのGPUによる高速検索(CPU検索にも対応)。 ・GUIによる簡単な操作(コマンドラインからの使用も可能)。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ anago.2ch.net/test/read.cgi/software/1311428038/
321 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/02(金) 13:54:01.66 ID:ayT59sJq0] >>318 それを知ってるのに秘孔は知らないのか? ttp://sourceforge.jp/projects/naniya/svn/view/branches/mty-makai/hikou.c?root=naniya&view=log 効果があるかどうかはしらん。w
322 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 14:53:44.04 ID:pOqRQijG0] >>321 その処理をTripcode Finderに組み込もうとしたらAPIが古過ぎてコンパイル できませんでした(´・ω・`)
323 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/02(金) 17:13:31.39 ID:ayT59sJq0] >>322 効果があるか試すだけなら、バイナリもあるぜ。 trip2ch.net/wiki/index.php?%E3%81%BE%E3%81%82%E3%80%81%E5%BE%85%E3%81%A6%E5%B1%8B%E3%80%82 やってることは単純だから、今のAPIで同じことをやればいいんだろうけど。
324 名前:名無しさん@お腹いっぱい。 [2012/11/02(金) 19:08:34.63 ID:druh0GIy0] つyy43.60.kg/test/read.cgi/tripageruo/1274911652/
325 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/02(金) 20:45:07.84 ID:RumtBqwhP] 目指せ純12連発見
326 名前:前スレ927 mailto:sage [2012/11/03(土) 01:40:23.60 ID:nhwVplaB0] HTがトラウマになったので、影響を調べてみました。 CPU: Xeon X5680@3.33GHz x 2 GPU: Quadro FX 3800 Prg: 0.06a1 Len: 12 Targ: "TEST/" Opt: -c -g -x 16 Drv: 306.79 この条件でOSとHTを買えて計測しました。
327 名前:前スレ927 mailto:sage [2012/11/03(土) 01:45:43.54 ID:nhwVplaB0] 先ずはXPから。 Case 1-1 CPU: HT off (12 thread) OS: WinXP SP2 64bit 1hrAv: 240.76M TPS Others: 243.23M TPS (curr) 171.13M TPS (GPU) 72.11M TPS (CPU) Case 1-2 CPU: HT on (24 thread) OS: WinXP SP2 64bit 30minAv: 247.84M TPS Others: 247.50M TPS (curr) 171.13M TPS (GPU) 76.72M TPS (CPU)
328 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 01:50:13.99 ID:nhwVplaB0] 次は7です。 Case 2-1 CPU: HT off (12 thread) OS: Win7 SP1 64bit 30minAv: 241.77M TPS Others: 241.44M TPS (curr) 169.01M TPS (GPU) 72.43M TPS (CPU) Case 2-2 CPU: HT on (24 thread) OS: Win7 SP1 64bit 30minAv: 246.28M TPS Others: 246.97M TPS (curr) 170.87M TPS (GPU) 76.10M TPS (CPU)
329 名前:前スレ927 mailto:sage [2012/11/03(土) 02:01:41.49 ID:nhwVplaB0] 連投済みません。 XPから7にしても性能変わらんねぇ。(´・ω・`) HT on/offでも大して変わらんねぇ。(´・ω・`) GTX590を追加しようとしたのですが、電源容量が足りないことが判明。 GPU用に8ピンx2を用意する上手い方法は無いでしょうか? ATX電源だと確かスイッチ入れないと出力されなかったような気が・・・
330 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/03(土) 02:51:49.87 ID:ZeqW5mDD0] >>329 つ「ttp://www.freedom-pc.com/product/card_reader.html」 一台目の電源ユニットに連動するやつも見たことあるけど。 だがしかし、おすすめはしない。いろんな意味で【危険】だから。 素直に電源ユニットをいいやつに交換したほうが。
331 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 02:53:51.82 ID:0Ur2Ic2+0] >>329 HTを有効にしても速度が上がらないのはかなり意外ですねえ。 Core i7-3770KではHTはかなり有効だったので… 電源は入れ替えたほうが早いような気もしますけど、 一応別に用意することもできます。 https://www.google.com/webhp#q=atx+%E9%9B%BB%E6%BA%90+%E3%82%B7%E3%83%A7%E3%83%BC%E3%83%88
332 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 03:10:23.14 ID:0Ur2Ic2+0] >>323 hikou.exeは多少効果がありましたけど、それでもGPU使用率は70%ほどでした。 GPU検索スレッドを増やす方向で行きたいと思います。
333 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 03:50:36.64 ID:BiGdIpnm0] 一瞬、複数の電源系統を使って、1台での最速を目指すのかと思ってしまいましたw >>311 こういった情報はありがたいですね。
334 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 03:55:42.16 ID:BiGdIpnm0] >>317 >>319 Intelの方はグラフィック特化で、とりあえずOpenCLに対応はさせたということなのでしょうかね。 AMD APUの方は上位だと3桁行きそうな感じですね。
335 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 07:52:02.05 ID:CKknzRPb0] >>329 今から追加するならラデのほうが速くて良くね? openCL版もそろそろ公開されそうだし 今更性能の悪いCUDAカード追加するのはクレバーとは言えないよ 暖房に使うならありかもしれないけどねwww
336 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 09:17:27.77 ID:0Ur2Ic2+0] >>335 ん? OpenCL版は公開するなって? そうかそうかw …という冗談は置いといて、正直GCNアーキテクチャのRadeonで どれぐらいの性能が出るかは全くの未知数です。あとTripcode Finderの Radeon対応版の公開はもうちょっと先になるでしょう。10桁検索の 実装はこれからだし、この先実生活のほうでかなり忙しくなるので ひょっとしたら1月中旬までずれ込むかもしれません。まあ気長に 待ってて下さい。
337 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 09:19:54.73 ID:0Ur2Ic2+0] >>334 IntelのはなぜハイエンドのCPUに統合したのか理解に苦しむレベルです。 AMDのAPUだったら3桁は余裕でしょう。
338 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 09:26:59.16 ID:0Ur2Ic2+0] >>333 この資料のお陰で他の資料を読まずに済みましたw あとで一応AMDの最適化のマニュアルには目を通しておきますけど…
339 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 16:58:25.33 ID:JFLtV7Ft0] コマンドライン上から1枚目のカードを検索の動作から外すのはどう指定すればいいのでしょうか。
340 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 17:08:51.68 ID:0Ur2Ic2+0] >>339 今のところカードは1枚指定するか全部指定するかどちらかしか出来ないので、 CUI版を複数同時に起動する必要があります。 任意の複数のGPUを指定する機能は今後の課題として検討させて頂きます。
341 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 21:47:33.80 ID:0Ur2Ic2+0] あれからOpenCL検索の最適化をすすめて、HD 5770で390M TPS出るようになりました。 とはいってもglobal_item_sizeとlocal_item_sizeの値をいろいろと 変えてみただけですが… これらの値の自動設定は無理そうなので、 GPUの種類を判別してあらかじめ決められた値を使うようにしておきました。 あとIntelのもちょこっと上がって3.7M TPSになりましたw
342 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 21:54:41.47 ID:nALhqe3q0] ゲフォを捨てる日も近いな
343 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/04(日) 00:42:16.84 ID:UfxuJC360] Amazon Cluster GPU Instances($2.6/h)でやってみた img11.imageshack.us/img11/8029/29089004.jpg
344 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/04(日) 00:49:29.80 ID:kuWvI2yC0] >>341 >GPUの種類を判別してあらかじめ決められた値を 性能別にざっくり分ける感じですか?
345 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 01:17:42.41 ID:00/F8mIE0] >>343 FermiベースのTesla C2075が2枚刺さってますね。 Amazon Web ServicesでCUDAが使えるとは知りませんでした。 2週間回し続けたらGTX 590が買えるお値段になっちゃうけど、 なかなか面白いですねえ。ネットワーク分散処理に対応したら これで記録を立ててみようかなw
346 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 01:29:24.24 ID:00/F8mIE0] >>344 global_item_sizeとlocal_item_sizeはオプションで指定できるように するつもりです。最初はGPUのアーキテクチャ毎にデフォルトの値を 設定しておいて、データが集まったらカード毎に値を変えるようにする予定です。
347 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/04(日) 01:57:32.32 ID:kuWvI2yC0] >>346 なるほど……
348 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 03:30:45.58 ID:00/F8mIE0] AMDのOpenCLのマニュアルをちょこっと読んだんですけど、 ベクターレジスタがこれでもかというぐらいあって思わず笑ってしまいましたw AMD Accelerated Parallel Processing OpenCL Programming Guide developer.amd.com/tools/hc/AMDAPPSDK/assets/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf これによると5970は5770の3.41倍の速度が出るそうで、単純計算だと 391M TPS * 3.41 = 1333M TPS出ることになりますけど、本当なんでしょうか…
349 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 03:53:31.57 ID:00/F8mIE0] あ、5970はdual-GPUなんですね。あ〜びっくりしたw しかしお値段を考えるとかなりお得で夢が広がります。 年末に日本に帰省してるあいだは開発はできなくなるので、 なんとかそれまでにRadeon対応版を仕上げたいです。
350 名前:前スレ927 mailto:sage [2012/11/04(日) 08:23:26.67 ID:wspvDmvD0] いろいろ情報ありがとうございます。 訳有って電源を変えることもCUDAを捨てることもできないのです。 電源を変えたいのは山々なんですが。 >>330 >>331 複数電源やってる人多いんですね。確かにいろいろな意味で危険だ。 でもこれしか今のところ手が無いので、この方法で行ってみます。 NehalemからSandy BridgeになったところでCPUコアに大幅に手が入っているから、HTの効果がより大きくなったのではないでしょうか? 詳しいことは全然知りませんが。 余った電源を探しに押入れを漁ったのですが見つからず。代わりに大昔のGTX480が出てきました。 見なかったことにするか・・・。
351 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 09:47:14.72 ID:00/F8mIE0] >>350 > 代わりに大昔のGTX480が出てきました。 いらないのでしたらテスト用に欲しいのでぜひ譲って下さいw
352 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 09:56:21.45 ID:00/F8mIE0] >>313 と>>316 のエラーですが、結局巨大なキービットマップが__constantの メモリ空間に収まらなかったということみたいです。まあ当然ですよねw で、代わりにかなり小さめのキービットマップを用意してやったら、 なんと407M TPSまで速度が上がりましたw これ、CUDAのでも使えるんじゃない かしらん。
353 名前:名無しさん@お腹いっぱい。 [2012/11/04(日) 10:00:03.60 ID:3mBasjXYP] SHA256ハッシュだとこんな感じの速度になるらしい ttps://en.bitcoin.it/wiki/Mining_hardware_comparison
354 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 10:28:15.44 ID:00/F8mIE0] やっぱりSHA-1よりは大分数字が落ちますねえ。 ここらへんの数字はなかなか面白いです。 > 5970 $421 Limited 704 > 6990 $622.99 Limited 772 > 7970 $420 Easy 685 トリップ検索が目的なら安い5970を中古で買ったほうが いいのかもしれません。
355 名前: ◆MERIKEN4.k mailto:sage [2012/11/04(日) 10:49:10.65 ID:00/F8mIE0] 小さめのキービットマップを追加するついでにコードを大分整理しました。 もう十分速度は出ているので、最適化は適当に切り上げて OpenCLの12桁検索だけ先に仕上げてしまうことにします。
356 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 06:52:49.50 ID:fpizldxB0] 前方一致以外の正規表現の検索への対応も終わって、 CUI版のOpenCLでの12桁検索対応の作業はほぼ終了しました。 あとはglobal_work_sizeとlocal_work_sizeをオプションで 出来るようにして、GUI版を修正するだけです。 本当は10桁検索にも対応させてから公開する予定だったけど、 こっちは難物で最適化に時間がかかりそうなので後回しにします。 あ、あとIntelのコンパイラは新しいOpenCLのカーネルをコンパイル できませんでしたw clGetProgramBuildInfoであっち側に行ったきり 帰って来ません。まあカーネルがマクロ使いまくりでちょっと 複雑なのは事実なんですが、どうせIntelのドライバのバグだろうし HD 4000ちゃんは全く性能の出ないアホの子だということが わかってしまったので、このままにしておきます。
357 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 07:03:38.38 ID:U1XO/30v0] >>356 峠は越えましたね乙です 公開を楽しみにしております
358 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 12:19:08.63 ID:fpizldxB0] >>357 どもども。あとちょっとなので頑張ります。CUI版の作業は一応全部終わりました。 あとはGUI版だけです。
359 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 12:20:14.73 ID:fpizldxB0] その前にバージョン0.06の正式版をうpしなきゃ… すっかり忘れてた。
360 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 13:29:17.33 ID:fpizldxB0] バージョン0.06の安定版です。 MERIKEN's Tripcode Finder 0.06 www.meriken2ch.com/programming/merikens-tripcode-finder 機能的にはBeta 1と変わりません。バージョン0.05の安定版からの変更点は 以下になります。 ・64bit版の追加。 ・CPU検索の速度向上。
361 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 16:10:33.81 ID:XSg5TiK+0] >>360 早速テストしてみましたよー(検索ワードは「^TEST/」) 環境:ASUS K55VD(Corei5-3210M+GeForce610M,64bitWin7) 10桁結果: GPUのみ GPUとCPU CPUのみ 6.0β 2.92 7.00(3.0/4.0) 5.26 6.0 3.07 7.00(3.1/4.0) 5.25 12桁結果: GPUのみ GPUとCPU CPUのみ 6.0β 43.02 53.54(42.8/10.8) 14.47 6.0 43.02 55.72(44.9/10.8) 14.50 (単位はM tripcode/s) ところで、「検索の最適化中...」ってどんなことをしているんですか? このテストの際も、その表示が消えるのを待ってやった方が良かったのか迷いました……
362 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 16:46:55.43 ID:fpizldxB0] >>361 詳しい報告、ありがとうございます。検索の最適化では「詳細設定」の 「1SMあたりのブロック数」の自動設定をしています。この報告でもCPU検索の 正確な速度とGPU検索のおよその速度は分かりますが、GPU検索の正確な速度を 測定したい場合は手動でブロック数を設定する必要があります。 この場合CUI版を使えば最適なブロック数の目安を知ることができます。
363 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 16:47:10.20 ID:fpizldxB0] 安定版をビルドしたついでに一気にGUI版の作業も終わらせました。 これでちゃんとOpenCLでの12桁検索ができるようになりました。 機能的にもCUDA版に遜色ないはずです。というか全く普通に検索できているので シュールに感じるぐらいですw しばらく手元で色々試してから、問題なければ 2、3日中に次の開発版として公開する予定です。
364 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 17:01:06.40 ID:wg8KNqxN0] みんながゲフォを捨てる日も近いな
365 名前: ◆999984973989 [2012/11/05(月) 19:14:24.79 ID:Igv9XM2P0] >>360 お疲れ様です。 CUDA DEVICE =========== CUDA Device Count: 1 Device No.: 0 Device Name: GeForce GTX 460 Multiprocessor Count: 7 Clock Rate: 1400MHz Compute Capability: 2.1 CPU === Number of Processors: 8 Number of Search Threads: 7 TARGET(S) ========= 0: "trip/" Performing a forward-matching search for 1 pattern (1 chunk) with 5 characters on CPU and GPU(s): CUDA0: 278.7M TPS, 96 blocks/SM 0.150T tripcodes were generated in 0d 0h 9m 08s at: 302.83M tripcodes/s (current) GPU: 281.89M tripcodes/s CPU: 20.94M tripcodes/s 272.94M tripcodes/s (average) On average, it takes 2.7 seconds to find one match at this speed. 123 matches found at 807.78 matches/h and 1.22G tripcodes/match. The actual matching probability is 3% lower than expected. 9% of matching tripcodes were invalid.
366 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 00:44:34.13 ID:5vgBlR+s0] アホの子(笑)Intel HD4000 の計算する姿が見れると聞き、3770 マザーボードを 設定変更して HD4000 Graphics を有効にし、これまで Radeon HD5770 につないで いた2台のディスプレイのうちサブのほうを 3770 マザーボードのオンボードグラ フィックに接続して使っています。 2〜3日後の開発版の公開が楽しみです。 HD5770 について、これまで非シバキ時の GPU CLOCK が 400MHz を下回るのを見た ことがなかったのですが、今回デュアル接続をやめたら 157MHz まで下がるように なり、非シバキ時の GPU 温度も10℃近く下がりました。これはうれしい。
367 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 01:17:04.58 ID:TazUQgso0] >>354 プロセスルール的に消費電力が気になりましたが、HD 5970は300W弱で8ピン+6ピンだったのですね。 VLIWや制御ユニットの集中などのアーキテクチャの違いでピーク時のワットパフォーマンスは良いのでしょうかね。 そろそろグラボの補助電源で6ピンx2はやめて8ピンx1にならないのでしょうかね・・・ 6+2ピンの電源ユニットも増えていますし、6ピンx2を8ピンx1に変換するケーブルとかもありますし。 >>360 >>363 乙です。OpenCL版が楽しみです。
368 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 02:02:47.13 ID:MxK7yrlF0] >>366 残念ながらIntelのドライバのバグが直るまでHD 4000では動きませんです。 エラーでプログラム自体が落ちるのでもとに戻しておいたほうが良いかもしれません。 5770だけでも十分に幸せになれますしね。昨日OCして速度を測ってみたら 7完1タゲで452M TPS出てました。
369 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 02:18:41.18 ID:MxK7yrlF0] >>367 ワッパ的には5970はかなり美味しいでしょうね。5770もOCさせても せいぜい60℃ぐらいまでしか上がらないのでやっぱりアーキテクチャの違いなんでしょう。 Fermiとはエラい違いですw 補助電源のコードの取り回しも普通のケースだと 結構面倒くさいですよね。うちの検索君1号(仮)の電源からはPCI-Eの補助電源用の ケーブルが6本にょきにょきと伸びていますw
370 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 05:17:20.34 ID:MxK7yrlF0] 8970の出荷が思ったより遅くなりそうなので、さきほど7970を注文してしまいました。 AMDの新「Venus」コアは2013年3月のRadeon HD 8970から? ascii.jp/elem/000/000/741/741077 OpenCLの10桁検索の作業を進めるにあたって、GCNアーキテクチャでの性能を 確認しておきたいというのが大きいですが、いくらなんでも散財し過ぎなので、 これで当分の間グラボを買うことはないでしょう。
371 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 09:14:36.69 ID:MxK7yrlF0] 意味不明なエラーが出て終了するのも何なので、Intel HD Graphicsシリーズは 最初に弾くようにしておきました。将来のドライバ更新に期待といったところです。 もう修正したいところは全部修正したので、これから配布パッケージを用意して 開発版を公開することにします。
372 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:02:36.31 ID:MxK7yrlF0] というわけでRadeonに対応した開発版です。 MERIKEN's Tripcode Finder 0.07 Alpha 1 www.meriken2ch.com/programming/merikens-tripcode-finder 変更点は以下になります。 ・AMD Radeonシリーズ等のOpenCL対応デバイスでの12桁トリップ検索への対応。 相変わらず出来立てほやほやの人柱専用です。
373 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:09:06.68 ID:MxK7yrlF0] 動作報告をしていただける方にはこちらのテンプレを使っていただけると 大変助かります。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】 【その他】
374 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:37:40.94 ID:MxK7yrlF0] 自分の環境ではこんな感じで動いています。 オプションが紛らわしいので「検索デバイス」と「CPUの命令セット」の 項目を追加しておきました。 【GPU】Sapphire Radeon HD 5770 (OC: 960MHz) 【CPU】Intel Core i7-3770K (OC: 4300MHz) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【検索デバイス】GPUとCPU 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【CPUの命令セット】x64 + SSE2 【その他のオプション】 【Display Driver】Catalyst 12.9 【10分間の平均速度】488.51M tripcodes/s 【その他】7完1タゲ。CPU検索の速度は約39.4M tripcodes/s。
375 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 12:12:14.01 ID:MxK7yrlF0] 普段使っている正規表現の検索パターンをRadeonで回してみましたが ちゃんと動いているようです。しばらくこれで放っておいて、きちんと 動作するかどうか確認することにします。 これで12桁トリップ検索を常時3G TPSで回せる環境が整ったわけですが、 自分の部屋の電力使用量が常に1500W前後と、とんでもないことに なっています。7970をもう1枚追加したら本当にギリギリです。 しかし2台で同時に検索しているとやはりネットワーク機能が欲しく なりますねえ。まあこれは当分先の話ですね。
376 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 13:47:22.39 ID:MxK7yrlF0] しかしこれ、CPU検索とGPU検索の平均が別々にわからないのは 結構大きな欠陥ですねえ。なんで今まで気づかなかったんだろう…
377 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 13:50:33.66 ID:MxK7yrlF0] 間違えた。これ、明日直しておこうっと。 ☓平均が別々にわからないのは ○平均速度が別々にわからないのは
378 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 14:11:46.66 ID:ZJO9ySv90] 【GPU】Radeon HD 6970(880MHz) 【CPU】Intel Core i7-2600(3.40GHz) 【OS】Windows 8 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.10 【6分間の平均速度】 832M tripcodes/s 【その他】12完1タゲ。最初Catalystをインストールしてないことに気づかず回していたら 250M tripcodes/sくらいでした 非常に早くて驚きました。これは素晴らしいです
379 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/06(火) 14:23:33.61 ID:I3Z78Ya30 BE:355547063-DIA(289888)] 【GPU】N/A 【CPU】i7-2600 【OS】WIndows 7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】N/A 【1WGあたりのワークアイテムの数】N/A 【その他のオプション】なし 【Display Driver】N/A 【10分間の平均速度】19M 【その他】タゲは TEST// のみで 10 分ではヒット無し 同条件で hip2 だと 52M ぐらいで 2 個ヒット。 てか、CPU が 100% にはりつきっぱなのをみると、使い切ってるというよりも競合とかで無駄が出てるのでは? hip2 だとだいたい 95% 前後をふらつく。
380 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 14:57:58.35 ID:MxK7yrlF0] >>378 いきなり凄いのが来ましたねえ! GPUだけで800M TPS前後出ている計算になりますね。 全く素晴らしいとしか言いようが無い数字です。
381 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:07:24.85 ID:xNUnDM0r0] 【GPU】 Radeon HD 7970 (925MHz) 【CPU】 Intel Xeon E5645 (2.4GHz) 【OS】 Windows 7 x64 SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】 512 【1WGあたりのワークアイテムの数】 64 【その他のオプション】 【Display Driver】 Catalyst 12.10 【10分間の平均速度】 1175.36M tripcodes/s 【その他】GPUのみ
382 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:07:42.96 ID:MxK7yrlF0] >>379 う〜ん、うちのi7-3770Kでは1タゲで43M TPS出ているのでi7-2600で その数字は低すぎですねえ。Intelの開発者が書いたコードを使っておいたほうが 無難だったかな… CPU検索の高速化にはまた後で挑戦し直す予定です。 あ、あとよかったらぜひhip2を公開して下さいw
383 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:14:09.49 ID:MxK7yrlF0] >>381 ( д) ゚ ゚
384 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:30:44.15 ID:MxK7yrlF0] あ〜、びっくりしたw しかし気になっていたNorthern Islandsと Southern Islandsでちゃんと性能が出ているようで安心しました。 >>378 さんと>>381 さん、どうもありがとうございました。
385 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:33:25.72 ID:xNUnDM0r0] >>383 GPUが少し暇そうにしている(使用率80%弱ぐらいで推移)のですが、 これ使用率上げられたらもう少し早くなるんですかねえ。
386 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:39:25.06 ID:MxK7yrlF0] >>385 あ、それは間違い無く速くなります。 次の開発版では検索スレッドをもう一つ増やしておきます。 テンプレにも「GPU使用率」の項目を追加しておいたほうがいいのかな。 しかし物凄い性能ですねえ。
387 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:55:22.84 ID:Ppsoxtpd0] さようならゲフォ
388 名前:名無しさん@お腹いっぱい。 [2012/11/06(火) 16:25:42.06 ID:gwnx7VAP0] 【GPU】Radeon HD 5870(850MHz) 【CPU】Corei7 2600K(4.6GHz) 【OS】Windows 8 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】GPUのみ 【Display Driver】Catalyst 12.11beta 【10分間の平均速度】436.79M tripcodes/s 【その他】タゲはTEST/ ほとんどの場面でGPU使用率が50%まで行かないです。 42〜49%あたりをふらふらしてる感じたまーに50%超えてるときは 現在の速度が500M tripcodes/s前後まで行ってます
389 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/06(火) 17:36:01.43 ID:I3Z78Ya30] >>382 盛ってると思うよな、やっぱり。 自分でもそう思うぜ。www ra8.s31.xrea.com/ に仮置きしてみた。てーすとってのがそうだ。 i7 用ってか SSE4.2 仕様の 64bit 版。 CPU 以外では動かないようにいろいろ細工してある。 全数字は勝手に探す仕様だ。 実際に表示の速度が出てるか確認用に入れてた。 -N2 オプションあたりが最速じゃないかな、多分。 なんかの参考にでも。って、ソース非公開だが。www まあ開発途中で投げたやつなのでいろいろアレだが気にスンナ。www
390 名前: ◆999984973989 [2012/11/06(火) 17:58:07.86 ID:osy8A/YB0] 【GPU】N/A 【CPU】i7-860 2,8GHz 【OS】WIndows 7 32bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】N/A 【1WGあたりのワークアイテムの数】N/A 【その他のオプション】なし 【Display Driver】N/A 【10分間の平均速度】23.8M 【その他】タゲは TEST// のみで 10 分ではヒット無し CPU === Number of Logical Cores: 8 Number of Search Threads: 8 TARGET(S) ========= 0: "TEST//" TRIPCODES ========= STATUS ====== Performing a forward-matching search for 1 pattern (1 chunk) with 6 characters on CPU. 0.015T tripcodes were generated in 0d 0h 10m 10s at: 23.78M tripcodes/s (current) 23.77M tripcodes/s (average) On average, it takes 33.0 minutes to find one match at this speed. No matches were found yet.
391 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 19:55:11.07 ID:+lFrJltU0] GPU】HD7970 CFX 2GPUs @1150MHz 【CPU】FX8350 @5GHz 【OS】Win7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】default 【1WGあたりのワークアイテムの数】default 【その他のオプション】-g -c -t8 【Display Driver】Catalyst 12.10 【8分間の平均速度】1015.07M 【その他】12完1タゲ 待て屋。爆速版でもしばしば起きていましたがGPUが全力出してないみたいです www.rupan.net/uploader/download/1352198271.png
392 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 19:56:50.52 ID:+lFrJltU0] あ、平均間違った
393 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 23:56:31.04 ID:cZ1d8VQd0] こういうのってどうなんでしょうね techon.nikkeibp.co.jp/article/NEWS/20121106/249731/?ref=rss&utm_source=twitterfeed&utm_medium=twitter
394 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:17:27.55 ID:TO2+iqd80] メリケンさんに聞きたいのですが、 「1SMあたりのブロック数」をいろいろ弄って最速の設定はどれかを試していたら、 「上げれば上げるほど速い」という謎の結論に達しました……(ちなみにノーパソのGeForce) 目一杯上げてもハードに悪影響を与えたりしませんよね?
395 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:20:11.33 ID:DRUtyFmt0] ラデ+HD4000環境で起動するとMERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.って言われちゃうんだが…… とりあえずドライバ更新とOpenCL再インスコしたが駄目だった
396 名前:395 mailto:sage [2012/11/07(水) 00:35:24.34 ID:DRUtyFmt0] .NETの修復をしてWindowsUpdateして再起動したらなんか悪化した OPENCL FUNCTION FALL FAILED: CL_DEVICE_NOT_FOUND (file 'Source Files\MTF_CUI_Main.cpp', line 676)
397 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:36:16.17 ID:LUmvVcmd0] i.imgur.com/xjVFI.png ドライバ更新しないで起動したら量子コンピュータもびっくりでワロタ
398 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:51:49.53 ID:TO2+iqd80] >>397 averageで9完が2.4分で終わるレベルwwww
399 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 01:02:29.81 ID:XRqsjajg0] >>395 この段階なら、絶対パスで起動すれば動いただろうな。
400 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:49:42.41 ID:+2zE6v+s0] >>396 ドライバ入れ直したほうがいいですね。>>395 のはOpenCLのソースコードが 実行時に見つからないときに表示されるエラーですが…
401 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:51:58.38 ID:+2zE6v+s0] >>394 気になるのでしたらSpeedFanとかMSI AfterburnerとかでGPUの温度を 確認するのがいいと思います。
402 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:53:40.49 ID:+2zE6v+s0] >>393 こりゃおもしろそうですね。やることなくなったらハードウェアハックにも手を 出してみようかなw
403 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:58:19.17 ID:+2zE6v+s0] >>390 >>391 やっぱり検索スレッドの数を増やしたほうがいいんでしょうねえ。 たくさん盛るのは簡単なんですけど、オーバーヘッドが心配なので いま調べているところです。
404 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:01:13.80 ID:+2zE6v+s0] >>390 ありがとうございます。CPUだけのデータもまとめておいたほうがいいのかな…
405 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:04:03.93 ID:+2zE6v+s0] >>389 盛っているというか、Tripcode Finderの数字が低すぎなのが気になります。 hip2は次にCPU検索の最適化の作業をするときに参考にさせて頂きます。 他に比較対象がないので助かります。
406 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:54:08.65 ID:+2zE6v+s0] あ、間違えてる。>>403 は>>388 さんと>>391 さん宛でした。
407 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:38:47.96 ID:+2zE6v+s0] 開発版を修正しました。 MERIKEN's Tripcode Finder 0.07 Alpha 2 www.meriken2ch.com/programming/merikens-tripcode-finder Alpha 1からの変更点は以下になります。 ・AMDのGPUでGPU使用率が低くなる問題を修正。 ・GPUとCPUの平均速度の表示。 とりあえず1つのAMDのGPUあたりの検索スレッドの数は4に決め打ちに しておきました。
408 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:42:48.47 ID:+2zE6v+s0] こちらは新しい報告用のテンプレです。ぜひよろしくお願いします。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】tripcodes/s 【GPUの平均速度】tripcodes/s 【CPUの平均速度】tripcodes/s 【その他】
409 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:59:21.00 ID:+2zE6v+s0] 「GPU使用率」を付け足すのを忘れてたorz 動作報告はこちらのテンプレでお願いします。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】tripcodes/s 【GPUの平均速度】tripcodes/s 【CPUの平均速度】tripcodes/s 【GPU使用率】 【その他】
410 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 06:02:57.05 ID:+2zE6v+s0] >>391 よくみたら、これGPU使用率が35%しかないですねえ。 検索スレッドが1GPUあたり4個だとたりないかもしれません。 足りないようだったら次の開発版でオプションで検索スレッドの数を 変えられるようにしておきます。
411 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 06:57:03.71 ID:4Ex6pXTl0] 【GPU】GeForce GTX 570 / Radeon HD 5870 【CPU】Core i7-2600K 【OS】Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 (CUI64) 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.11 beta 【10分間の平均速度】1216.38M tripcodes/s 【GPU使用率】GeForce 96%, Radeon 未計測 【その他】8完1タゲ、GPU検索のみ CUDA DEVICE =========== Device No.: 0 Device Name: GeForce GTX 570 Multiprocessor Count: 15 Clock Rate: 1464MHz Compute Capability: 2.0 OPENCL DEVICE ============= Vendor: Advanced Micro Devices, Inc. Name: Cypress Number of Compute Units: 20 Clock Frequency: 875MHz Global Memory Size: 1024M bytes Max. Work Group Size: 256 Version: OpenCL 1.2 AMD-APP (1084.2) Driver Version: 1084.2 (VM)
412 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 06:57:43.67 ID:4Ex6pXTl0] STATUS ====== Performing a forward-matching search for 1 pattern (1 chunk) with 8 characters on GPU(s): CUDA0: 565.0M TPS, 192 blocks/SM OpenCL0-0: 139.0M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-1: 176.8M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-2: 175.5M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-3: 175.6M TPS, 5120 work-groups/CU, 64 work-items/WG 0.740T tripcodes were generated in 0d 0h 10m 08s at: 1219.88M tripcodes/s (current) 1216.38M tripcodes/s (average) 連投失礼しました。 変則構成のせいかもしれませんが、どうにも挙動が怪しい気がします。 これらは実行ファイルのダブルクリックによる直接起動の結果です。 コマンドラインからオプション無しで起動した場合は、以下のエラーが発生しCUDA検索のみ有効となります。 TRIPCODES ========= MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.
413 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:34:53.53 ID:+2zE6v+s0] >>411 5870だったらもうちょっと速度が出てもいいはずですね。 GPU使用率が100% 近いなら、-yオプションでワークグループの数を調整したほうが いいのかもしれません。 コマンドラインでエラーが出るのはOpenCLのソースが読み込めていないだけなので、 GTX 570とは関係ないはずです。ちょっと調べてみます。
414 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:40:07.03 ID:+2zE6v+s0] コマンドラインから起動してエラーが出たのはOpenCLのソースへのパスが きちんと取得できていないだけでした。なんという凡ミス… argv[0]でフルパスが取得できないとなるとどのAPIを使えばいいんだろう。
415 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:47:40.66 ID:+2zE6v+s0] >>412 _fullpath()を使ったらエラーは出なくなりました。 次の開発版ではちゃんとコマンドラインから起動できるようになるはずです。
416 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 07:58:44.95 ID:4Ex6pXTl0] >>415 どうもです。次の開発版で-yオプションを試したいと思います。 ついでに補足ですが、GeForceのドライバは310.33 BETAでした。
417 名前:394 mailto:sage [2012/11/07(水) 08:11:24.58 ID:TO2+iqd80] >>401 調べてみたのですがこんな感じです。 ttp://uploda.cc/img/img5099980c9f2a2.png よく分かりませんが、負荷が掛かり過ぎると自動検知して時々休んだりするんですかね? (なお速度は50M弱で安定している模様) ついでに一つ。自動設定で走らせた場合に、 検索停止後にそのパラメータを「詳細設定」タブに反映して欲しい…… 毎回検索の最適化されるのは辛いですので
418 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:25:54.89 ID:+2zE6v+s0] >>417 最適なパラメータは検索の条件によって変わってくるので 「詳細設定」タブに反映させるのは難しいのです。 あらかじめ値がわかっているならその値を指定しておけば 最適化は行われません。
419 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:27:48.12 ID:+2zE6v+s0] >>417 あ、あとこの温度だったら全然問題無いです。
420 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:29:58.28 ID:+2zE6v+s0] >>416 次の開発版では検索スレッドの数も変えられるようになっているので、 そちらのほうも是非試してみて下さい。
421 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 08:53:06.82 ID:4Ex6pXTl0] >>420 -yと-zですね。5870に最適の数値が見つかりましたら報告致します。