1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680] こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce シリーズのビデオカードを使用すれば非常に高速に検索を行うことが できます。特徴は以下の通りです。 ・ビデオカードのGPUによる高速検索(CPU検索にも対応)。 ・GUIによる簡単な操作(コマンドラインからの使用も可能)。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ anago.2ch.net/test/read.cgi/software/1311428038/
357 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 07:03:38.38 ID:U1XO/30v0] >>356 峠は越えましたね乙です 公開を楽しみにしております
358 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 12:19:08.63 ID:fpizldxB0] >>357 どもども。あとちょっとなので頑張ります。CUI版の作業は一応全部終わりました。 あとはGUI版だけです。
359 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 12:20:14.73 ID:fpizldxB0] その前にバージョン0.06の正式版をうpしなきゃ… すっかり忘れてた。
360 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 13:29:17.33 ID:fpizldxB0] バージョン0.06の安定版です。 MERIKEN's Tripcode Finder 0.06 www.meriken2ch.com/programming/merikens-tripcode-finder 機能的にはBeta 1と変わりません。バージョン0.05の安定版からの変更点は 以下になります。 ・64bit版の追加。 ・CPU検索の速度向上。
361 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 16:10:33.81 ID:XSg5TiK+0] >>360 早速テストしてみましたよー(検索ワードは「^TEST/」) 環境:ASUS K55VD(Corei5-3210M+GeForce610M,64bitWin7) 10桁結果: GPUのみ GPUとCPU CPUのみ 6.0β 2.92 7.00(3.0/4.0) 5.26 6.0 3.07 7.00(3.1/4.0) 5.25 12桁結果: GPUのみ GPUとCPU CPUのみ 6.0β 43.02 53.54(42.8/10.8) 14.47 6.0 43.02 55.72(44.9/10.8) 14.50 (単位はM tripcode/s) ところで、「検索の最適化中...」ってどんなことをしているんですか? このテストの際も、その表示が消えるのを待ってやった方が良かったのか迷いました……
362 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 16:46:55.43 ID:fpizldxB0] >>361 詳しい報告、ありがとうございます。検索の最適化では「詳細設定」の 「1SMあたりのブロック数」の自動設定をしています。この報告でもCPU検索の 正確な速度とGPU検索のおよその速度は分かりますが、GPU検索の正確な速度を 測定したい場合は手動でブロック数を設定する必要があります。 この場合CUI版を使えば最適なブロック数の目安を知ることができます。
363 名前: ◆MERIKEN4.k mailto:sage [2012/11/05(月) 16:47:10.20 ID:fpizldxB0] 安定版をビルドしたついでに一気にGUI版の作業も終わらせました。 これでちゃんとOpenCLでの12桁検索ができるようになりました。 機能的にもCUDA版に遜色ないはずです。というか全く普通に検索できているので シュールに感じるぐらいですw しばらく手元で色々試してから、問題なければ 2、3日中に次の開発版として公開する予定です。
364 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/05(月) 17:01:06.40 ID:wg8KNqxN0] みんながゲフォを捨てる日も近いな
365 名前: ◆999984973989 [2012/11/05(月) 19:14:24.79 ID:Igv9XM2P0] >>360 お疲れ様です。 CUDA DEVICE =========== CUDA Device Count: 1 Device No.: 0 Device Name: GeForce GTX 460 Multiprocessor Count: 7 Clock Rate: 1400MHz Compute Capability: 2.1 CPU === Number of Processors: 8 Number of Search Threads: 7 TARGET(S) ========= 0: "trip/" Performing a forward-matching search for 1 pattern (1 chunk) with 5 characters on CPU and GPU(s): CUDA0: 278.7M TPS, 96 blocks/SM 0.150T tripcodes were generated in 0d 0h 9m 08s at: 302.83M tripcodes/s (current) GPU: 281.89M tripcodes/s CPU: 20.94M tripcodes/s 272.94M tripcodes/s (average) On average, it takes 2.7 seconds to find one match at this speed. 123 matches found at 807.78 matches/h and 1.22G tripcodes/match. The actual matching probability is 3% lower than expected. 9% of matching tripcodes were invalid.
366 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 00:44:34.13 ID:5vgBlR+s0] アホの子(笑)Intel HD4000 の計算する姿が見れると聞き、3770 マザーボードを 設定変更して HD4000 Graphics を有効にし、これまで Radeon HD5770 につないで いた2台のディスプレイのうちサブのほうを 3770 マザーボードのオンボードグラ フィックに接続して使っています。 2〜3日後の開発版の公開が楽しみです。 HD5770 について、これまで非シバキ時の GPU CLOCK が 400MHz を下回るのを見た ことがなかったのですが、今回デュアル接続をやめたら 157MHz まで下がるように なり、非シバキ時の GPU 温度も10℃近く下がりました。これはうれしい。
367 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 01:17:04.58 ID:TazUQgso0] >>354 プロセスルール的に消費電力が気になりましたが、HD 5970は300W弱で8ピン+6ピンだったのですね。 VLIWや制御ユニットの集中などのアーキテクチャの違いでピーク時のワットパフォーマンスは良いのでしょうかね。 そろそろグラボの補助電源で6ピンx2はやめて8ピンx1にならないのでしょうかね・・・ 6+2ピンの電源ユニットも増えていますし、6ピンx2を8ピンx1に変換するケーブルとかもありますし。 >>360 >>363 乙です。OpenCL版が楽しみです。
368 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 02:02:47.13 ID:MxK7yrlF0] >>366 残念ながらIntelのドライバのバグが直るまでHD 4000では動きませんです。 エラーでプログラム自体が落ちるのでもとに戻しておいたほうが良いかもしれません。 5770だけでも十分に幸せになれますしね。昨日OCして速度を測ってみたら 7完1タゲで452M TPS出てました。
369 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 02:18:41.18 ID:MxK7yrlF0] >>367 ワッパ的には5970はかなり美味しいでしょうね。5770もOCさせても せいぜい60℃ぐらいまでしか上がらないのでやっぱりアーキテクチャの違いなんでしょう。 Fermiとはエラい違いですw 補助電源のコードの取り回しも普通のケースだと 結構面倒くさいですよね。うちの検索君1号(仮)の電源からはPCI-Eの補助電源用の ケーブルが6本にょきにょきと伸びていますw
370 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 05:17:20.34 ID:MxK7yrlF0] 8970の出荷が思ったより遅くなりそうなので、さきほど7970を注文してしまいました。 AMDの新「Venus」コアは2013年3月のRadeon HD 8970から? ascii.jp/elem/000/000/741/741077 OpenCLの10桁検索の作業を進めるにあたって、GCNアーキテクチャでの性能を 確認しておきたいというのが大きいですが、いくらなんでも散財し過ぎなので、 これで当分の間グラボを買うことはないでしょう。
371 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 09:14:36.69 ID:MxK7yrlF0] 意味不明なエラーが出て終了するのも何なので、Intel HD Graphicsシリーズは 最初に弾くようにしておきました。将来のドライバ更新に期待といったところです。 もう修正したいところは全部修正したので、これから配布パッケージを用意して 開発版を公開することにします。
372 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:02:36.31 ID:MxK7yrlF0] というわけでRadeonに対応した開発版です。 MERIKEN's Tripcode Finder 0.07 Alpha 1 www.meriken2ch.com/programming/merikens-tripcode-finder 変更点は以下になります。 ・AMD Radeonシリーズ等のOpenCL対応デバイスでの12桁トリップ検索への対応。 相変わらず出来立てほやほやの人柱専用です。
373 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:09:06.68 ID:MxK7yrlF0] 動作報告をしていただける方にはこちらのテンプレを使っていただけると 大変助かります。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】 【その他】
374 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 10:37:40.94 ID:MxK7yrlF0] 自分の環境ではこんな感じで動いています。 オプションが紛らわしいので「検索デバイス」と「CPUの命令セット」の 項目を追加しておきました。 【GPU】Sapphire Radeon HD 5770 (OC: 960MHz) 【CPU】Intel Core i7-3770K (OC: 4300MHz) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【検索デバイス】GPUとCPU 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【CPUの命令セット】x64 + SSE2 【その他のオプション】 【Display Driver】Catalyst 12.9 【10分間の平均速度】488.51M tripcodes/s 【その他】7完1タゲ。CPU検索の速度は約39.4M tripcodes/s。
375 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 12:12:14.01 ID:MxK7yrlF0] 普段使っている正規表現の検索パターンをRadeonで回してみましたが ちゃんと動いているようです。しばらくこれで放っておいて、きちんと 動作するかどうか確認することにします。 これで12桁トリップ検索を常時3G TPSで回せる環境が整ったわけですが、 自分の部屋の電力使用量が常に1500W前後と、とんでもないことに なっています。7970をもう1枚追加したら本当にギリギリです。 しかし2台で同時に検索しているとやはりネットワーク機能が欲しく なりますねえ。まあこれは当分先の話ですね。
376 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 13:47:22.39 ID:MxK7yrlF0] しかしこれ、CPU検索とGPU検索の平均が別々にわからないのは 結構大きな欠陥ですねえ。なんで今まで気づかなかったんだろう…
377 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 13:50:33.66 ID:MxK7yrlF0] 間違えた。これ、明日直しておこうっと。 ☓平均が別々にわからないのは ○平均速度が別々にわからないのは
378 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 14:11:46.66 ID:ZJO9ySv90] 【GPU】Radeon HD 6970(880MHz) 【CPU】Intel Core i7-2600(3.40GHz) 【OS】Windows 8 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.10 【6分間の平均速度】 832M tripcodes/s 【その他】12完1タゲ。最初Catalystをインストールしてないことに気づかず回していたら 250M tripcodes/sくらいでした 非常に早くて驚きました。これは素晴らしいです
379 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/06(火) 14:23:33.61 ID:I3Z78Ya30 BE:355547063-DIA(289888)] 【GPU】N/A 【CPU】i7-2600 【OS】WIndows 7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】N/A 【1WGあたりのワークアイテムの数】N/A 【その他のオプション】なし 【Display Driver】N/A 【10分間の平均速度】19M 【その他】タゲは TEST// のみで 10 分ではヒット無し 同条件で hip2 だと 52M ぐらいで 2 個ヒット。 てか、CPU が 100% にはりつきっぱなのをみると、使い切ってるというよりも競合とかで無駄が出てるのでは? hip2 だとだいたい 95% 前後をふらつく。
380 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 14:57:58.35 ID:MxK7yrlF0] >>378 いきなり凄いのが来ましたねえ! GPUだけで800M TPS前後出ている計算になりますね。 全く素晴らしいとしか言いようが無い数字です。
381 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:07:24.85 ID:xNUnDM0r0] 【GPU】 Radeon HD 7970 (925MHz) 【CPU】 Intel Xeon E5645 (2.4GHz) 【OS】 Windows 7 x64 SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】 512 【1WGあたりのワークアイテムの数】 64 【その他のオプション】 【Display Driver】 Catalyst 12.10 【10分間の平均速度】 1175.36M tripcodes/s 【その他】GPUのみ
382 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:07:42.96 ID:MxK7yrlF0] >>379 う〜ん、うちのi7-3770Kでは1タゲで43M TPS出ているのでi7-2600で その数字は低すぎですねえ。Intelの開発者が書いたコードを使っておいたほうが 無難だったかな… CPU検索の高速化にはまた後で挑戦し直す予定です。 あ、あとよかったらぜひhip2を公開して下さいw
383 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:14:09.49 ID:MxK7yrlF0] >>381 ( д) ゚ ゚
384 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:30:44.15 ID:MxK7yrlF0] あ〜、びっくりしたw しかし気になっていたNorthern Islandsと Southern Islandsでちゃんと性能が出ているようで安心しました。 >>378 さんと>>381 さん、どうもありがとうございました。
385 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:33:25.72 ID:xNUnDM0r0] >>383 GPUが少し暇そうにしている(使用率80%弱ぐらいで推移)のですが、 これ使用率上げられたらもう少し早くなるんですかねえ。
386 名前: ◆MERIKEN4.k mailto:sage [2012/11/06(火) 15:39:25.06 ID:MxK7yrlF0] >>385 あ、それは間違い無く速くなります。 次の開発版では検索スレッドをもう一つ増やしておきます。 テンプレにも「GPU使用率」の項目を追加しておいたほうがいいのかな。 しかし物凄い性能ですねえ。
387 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 15:55:22.84 ID:Ppsoxtpd0] さようならゲフォ
388 名前:名無しさん@お腹いっぱい。 [2012/11/06(火) 16:25:42.06 ID:gwnx7VAP0] 【GPU】Radeon HD 5870(850MHz) 【CPU】Corei7 2600K(4.6GHz) 【OS】Windows 8 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】GPUのみ 【Display Driver】Catalyst 12.11beta 【10分間の平均速度】436.79M tripcodes/s 【その他】タゲはTEST/ ほとんどの場面でGPU使用率が50%まで行かないです。 42〜49%あたりをふらふらしてる感じたまーに50%超えてるときは 現在の速度が500M tripcodes/s前後まで行ってます
389 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/06(火) 17:36:01.43 ID:I3Z78Ya30] >>382 盛ってると思うよな、やっぱり。 自分でもそう思うぜ。www ra8.s31.xrea.com/ に仮置きしてみた。てーすとってのがそうだ。 i7 用ってか SSE4.2 仕様の 64bit 版。 CPU 以外では動かないようにいろいろ細工してある。 全数字は勝手に探す仕様だ。 実際に表示の速度が出てるか確認用に入れてた。 -N2 オプションあたりが最速じゃないかな、多分。 なんかの参考にでも。って、ソース非公開だが。www まあ開発途中で投げたやつなのでいろいろアレだが気にスンナ。www
390 名前: ◆999984973989 [2012/11/06(火) 17:58:07.86 ID:osy8A/YB0] 【GPU】N/A 【CPU】i7-860 2,8GHz 【OS】WIndows 7 32bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】N/A 【1WGあたりのワークアイテムの数】N/A 【その他のオプション】なし 【Display Driver】N/A 【10分間の平均速度】23.8M 【その他】タゲは TEST// のみで 10 分ではヒット無し CPU === Number of Logical Cores: 8 Number of Search Threads: 8 TARGET(S) ========= 0: "TEST//" TRIPCODES ========= STATUS ====== Performing a forward-matching search for 1 pattern (1 chunk) with 6 characters on CPU. 0.015T tripcodes were generated in 0d 0h 10m 10s at: 23.78M tripcodes/s (current) 23.77M tripcodes/s (average) On average, it takes 33.0 minutes to find one match at this speed. No matches were found yet.
391 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 19:55:11.07 ID:+lFrJltU0] GPU】HD7970 CFX 2GPUs @1150MHz 【CPU】FX8350 @5GHz 【OS】Win7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】default 【1WGあたりのワークアイテムの数】default 【その他のオプション】-g -c -t8 【Display Driver】Catalyst 12.10 【8分間の平均速度】1015.07M 【その他】12完1タゲ 待て屋。爆速版でもしばしば起きていましたがGPUが全力出してないみたいです www.rupan.net/uploader/download/1352198271.png
392 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 19:56:50.52 ID:+lFrJltU0] あ、平均間違った
393 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/06(火) 23:56:31.04 ID:cZ1d8VQd0] こういうのってどうなんでしょうね techon.nikkeibp.co.jp/article/NEWS/20121106/249731/?ref=rss&utm_source=twitterfeed&utm_medium=twitter
394 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:17:27.55 ID:TO2+iqd80] メリケンさんに聞きたいのですが、 「1SMあたりのブロック数」をいろいろ弄って最速の設定はどれかを試していたら、 「上げれば上げるほど速い」という謎の結論に達しました……(ちなみにノーパソのGeForce) 目一杯上げてもハードに悪影響を与えたりしませんよね?
395 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:20:11.33 ID:DRUtyFmt0] ラデ+HD4000環境で起動するとMERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.って言われちゃうんだが…… とりあえずドライバ更新とOpenCL再インスコしたが駄目だった
396 名前:395 mailto:sage [2012/11/07(水) 00:35:24.34 ID:DRUtyFmt0] .NETの修復をしてWindowsUpdateして再起動したらなんか悪化した OPENCL FUNCTION FALL FAILED: CL_DEVICE_NOT_FOUND (file 'Source Files\MTF_CUI_Main.cpp', line 676)
397 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:36:16.17 ID:LUmvVcmd0] i.imgur.com/xjVFI.png ドライバ更新しないで起動したら量子コンピュータもびっくりでワロタ
398 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 00:51:49.53 ID:TO2+iqd80] >>397 averageで9完が2.4分で終わるレベルwwww
399 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 01:02:29.81 ID:XRqsjajg0] >>395 この段階なら、絶対パスで起動すれば動いただろうな。
400 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:49:42.41 ID:+2zE6v+s0] >>396 ドライバ入れ直したほうがいいですね。>>395 のはOpenCLのソースコードが 実行時に見つからないときに表示されるエラーですが…
401 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:51:58.38 ID:+2zE6v+s0] >>394 気になるのでしたらSpeedFanとかMSI AfterburnerとかでGPUの温度を 確認するのがいいと思います。
402 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:53:40.49 ID:+2zE6v+s0] >>393 こりゃおもしろそうですね。やることなくなったらハードウェアハックにも手を 出してみようかなw
403 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 03:58:19.17 ID:+2zE6v+s0] >>390 >>391 やっぱり検索スレッドの数を増やしたほうがいいんでしょうねえ。 たくさん盛るのは簡単なんですけど、オーバーヘッドが心配なので いま調べているところです。
404 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:01:13.80 ID:+2zE6v+s0] >>390 ありがとうございます。CPUだけのデータもまとめておいたほうがいいのかな…
405 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:04:03.93 ID:+2zE6v+s0] >>389 盛っているというか、Tripcode Finderの数字が低すぎなのが気になります。 hip2は次にCPU検索の最適化の作業をするときに参考にさせて頂きます。 他に比較対象がないので助かります。
406 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 04:54:08.65 ID:+2zE6v+s0] あ、間違えてる。>>403 は>>388 さんと>>391 さん宛でした。
407 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:38:47.96 ID:+2zE6v+s0] 開発版を修正しました。 MERIKEN's Tripcode Finder 0.07 Alpha 2 www.meriken2ch.com/programming/merikens-tripcode-finder Alpha 1からの変更点は以下になります。 ・AMDのGPUでGPU使用率が低くなる問題を修正。 ・GPUとCPUの平均速度の表示。 とりあえず1つのAMDのGPUあたりの検索スレッドの数は4に決め打ちに しておきました。
408 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:42:48.47 ID:+2zE6v+s0] こちらは新しい報告用のテンプレです。ぜひよろしくお願いします。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】tripcodes/s 【GPUの平均速度】tripcodes/s 【CPUの平均速度】tripcodes/s 【その他】
409 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 05:59:21.00 ID:+2zE6v+s0] 「GPU使用率」を付け足すのを忘れてたorz 動作報告はこちらのテンプレでお願いします。 【GPU】 【CPU】 【OS】 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】 【1WGあたりのワークアイテムの数】 【その他のオプション】 【Display Driver】 【10分間の平均速度】tripcodes/s 【GPUの平均速度】tripcodes/s 【CPUの平均速度】tripcodes/s 【GPU使用率】 【その他】
410 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 06:02:57.05 ID:+2zE6v+s0] >>391 よくみたら、これGPU使用率が35%しかないですねえ。 検索スレッドが1GPUあたり4個だとたりないかもしれません。 足りないようだったら次の開発版でオプションで検索スレッドの数を 変えられるようにしておきます。
411 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 06:57:03.71 ID:4Ex6pXTl0] 【GPU】GeForce GTX 570 / Radeon HD 5870 【CPU】Core i7-2600K 【OS】Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 (CUI64) 【トリップの種類】12桁 【1CUあたりのワークグループの数】5120 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.11 beta 【10分間の平均速度】1216.38M tripcodes/s 【GPU使用率】GeForce 96%, Radeon 未計測 【その他】8完1タゲ、GPU検索のみ CUDA DEVICE =========== Device No.: 0 Device Name: GeForce GTX 570 Multiprocessor Count: 15 Clock Rate: 1464MHz Compute Capability: 2.0 OPENCL DEVICE ============= Vendor: Advanced Micro Devices, Inc. Name: Cypress Number of Compute Units: 20 Clock Frequency: 875MHz Global Memory Size: 1024M bytes Max. Work Group Size: 256 Version: OpenCL 1.2 AMD-APP (1084.2) Driver Version: 1084.2 (VM)
412 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 06:57:43.67 ID:4Ex6pXTl0] STATUS ====== Performing a forward-matching search for 1 pattern (1 chunk) with 8 characters on GPU(s): CUDA0: 565.0M TPS, 192 blocks/SM OpenCL0-0: 139.0M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-1: 176.8M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-2: 175.5M TPS, 5120 work-groups/CU, 64 work-items/WG OpenCL0-3: 175.6M TPS, 5120 work-groups/CU, 64 work-items/WG 0.740T tripcodes were generated in 0d 0h 10m 08s at: 1219.88M tripcodes/s (current) 1216.38M tripcodes/s (average) 連投失礼しました。 変則構成のせいかもしれませんが、どうにも挙動が怪しい気がします。 これらは実行ファイルのダブルクリックによる直接起動の結果です。 コマンドラインからオプション無しで起動した場合は、以下のエラーが発生しCUDA検索のみ有効となります。 TRIPCODES ========= MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel. MERIKENsTripcodeFinderCUI: Error: Failed to load an OpenCL kernel.
413 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:34:53.53 ID:+2zE6v+s0] >>411 5870だったらもうちょっと速度が出てもいいはずですね。 GPU使用率が100% 近いなら、-yオプションでワークグループの数を調整したほうが いいのかもしれません。 コマンドラインでエラーが出るのはOpenCLのソースが読み込めていないだけなので、 GTX 570とは関係ないはずです。ちょっと調べてみます。
414 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:40:07.03 ID:+2zE6v+s0] コマンドラインから起動してエラーが出たのはOpenCLのソースへのパスが きちんと取得できていないだけでした。なんという凡ミス… argv[0]でフルパスが取得できないとなるとどのAPIを使えばいいんだろう。
415 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 07:47:40.66 ID:+2zE6v+s0] >>412 _fullpath()を使ったらエラーは出なくなりました。 次の開発版ではちゃんとコマンドラインから起動できるようになるはずです。
416 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 07:58:44.95 ID:4Ex6pXTl0] >>415 どうもです。次の開発版で-yオプションを試したいと思います。 ついでに補足ですが、GeForceのドライバは310.33 BETAでした。
417 名前:394 mailto:sage [2012/11/07(水) 08:11:24.58 ID:TO2+iqd80] >>401 調べてみたのですがこんな感じです。 ttp://uploda.cc/img/img5099980c9f2a2.png よく分かりませんが、負荷が掛かり過ぎると自動検知して時々休んだりするんですかね? (なお速度は50M弱で安定している模様) ついでに一つ。自動設定で走らせた場合に、 検索停止後にそのパラメータを「詳細設定」タブに反映して欲しい…… 毎回検索の最適化されるのは辛いですので
418 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:25:54.89 ID:+2zE6v+s0] >>417 最適なパラメータは検索の条件によって変わってくるので 「詳細設定」タブに反映させるのは難しいのです。 あらかじめ値がわかっているならその値を指定しておけば 最適化は行われません。
419 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:27:48.12 ID:+2zE6v+s0] >>417 あ、あとこの温度だったら全然問題無いです。
420 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 08:29:58.28 ID:+2zE6v+s0] >>416 次の開発版では検索スレッドの数も変えられるようになっているので、 そちらのほうも是非試してみて下さい。
421 名前: ◆supernova.rT mailto:sage [2012/11/07(水) 08:53:06.82 ID:4Ex6pXTl0] >>420 -yと-zですね。5870に最適の数値が見つかりましたら報告致します。
422 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 12:07:48.18 ID:XRqsjajg0] 【GPU】N/A 【CPU】i7-2600 【OS】WIndows 7 64bit 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】N/A 【1WGあたりのワークアイテムの数】N/A 【その他のオプション】なし 【Display Driver】N/A 【5分間の平均速度】26M 【その他】タゲは TEST// のみで 5 分ではヒット無し 同条件で hip2 だと 74M ぐらいで同じくヒット無し。 >>379 と CPU とかは同じだが、別個体なので SDK のバージョンとかが違うかも。 なんかしらんが、>>379 の個体は遅いな。w あとものすごくどうでもいい情報だが、Radeon HD 4000 番台では動かんな。
423 名前:381 mailto:sage [2012/11/07(水) 13:21:31.88 ID:H54C/50b0] うーん。Alpha 2 だとパフォーマンスあまり出ないなあ。むしろ下がっている。 代わりに、OCしてAlpha 1で計測したものを。 【GPU】 Radeon HD 7970 (OC:1125MHz) 【CPU】 Intel Xeon E5645 (2.4GHz) 【OS】 Windows 7 x64 SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 1 【トリップの種類】12桁 【1CUあたりのワークグループの数】 512 【1WGあたりのワークアイテムの数】 64 【その他のオプション】 【Display Driver】 Catalyst 12.10 【10分間の平均速度】 1230.65M tripcodes/s 【その他】GPUのみ
424 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 15:39:45.37 ID:+2zE6v+s0] >>423 結構OC耐性がありますねえ。あと検索スレッドの数を無闇に増やせばいいという ものでもないみたいですね。自分の環境ではワークグループの数を半分に したらGPU使用率が98〜99%で安定するようになりました。次の開発版では デフォルトの値を調整しておきます。 【GPU】Sapphire Radeon HD 5770 (OC: 960MHz) 【CPU】Intel Core i7-3770K (OC: 4300MHz) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 2 【トリップの種類】12桁 【1CUあたりのワークグループの数】2560 【1WGあたりのワークアイテムの数】64 【その他のオプション】 【Display Driver】Catalyst 12.9 【10分間の平均速度】486.23 tripcodes/s 【GPUの平均速度】454.71 tripcodes/s 【CPUの平均速度】31.52 tripcodes/s 【GPU使用率】98〜99% 【その他】7完1タゲ。
425 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 15:43:12.49 ID:+2zE6v+s0] >>422 う〜ん、それは全く謎ですね。>>389 のリンクは切れていてダウンロード できませんでした。
426 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 15:55:32.36 ID:+2zE6v+s0] あしたあたりに7970が届くはずなので、それでいろいろ実験して デフォルトのパラメータを調整してから次の開発版をうpします。
427 名前:395 mailto:sage [2012/11/07(水) 16:00:26.76 ID:DRUtyFmt0] 若干スレチですが・・・ 12-10をアンインストールしてから再インストールしても駄目でした。 12-8、12-6、12-4も試しましたが駄目でした。 AMD APP SDKで改善することはありえますか?
428 名前:395 mailto:sage [2012/11/07(水) 16:17:06.99 ID:DRUtyFmt0] ちなみにBOINCのGPGPU(WCGのHCC)や待て屋GPU版はこの状態でも動作します。
429 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 16:28:57.68 ID:+2zE6v+s0] >>427 GUI版は起動できますか? コマンドラインから起動できないバグかもしれません。
430 名前:395 mailto:sage [2012/11/07(水) 16:31:45.44 ID:DRUtyFmt0] >>429 GUI版では使用出来るGPUが見つかりませんでしたと出ます。
431 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 16:36:59.52 ID:+2zE6v+s0] それは謎ですねえ。AMD APP SDKで改善するかもしれませんけど…
432 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 16:48:29.13 ID:XRqsjajg0] >>425 >>405 の時点で落としたものと思って消したわ。w 復活させたが、あんなもんをずっと置いとく気は無いので落としたら言ってくれ。 >>430 今コレを書いてるPCでも同じことになったんだが、CCC 12-6 入れて SDK v2.7 入れたら直ったぜ。 どっかの WindowsUpdate でなんかやられたのかもしれん。 12-6 なのは、4000 番台だからだ。このバージョンがいいとかいうわけではない。
433 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 16:56:10.78 ID:+2zE6v+s0] >>432 あ、そうですか。今落としたのでもう消していただいて大丈夫です。 それにしても、うちのi7-3770Kで95M TPS出てますけど、これは一体どういう 仕組みなんでしょうか…
434 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 17:16:21.42 ID:+2zE6v+s0] >>422 書き忘れてたけど、多分パラメータを替えれば4000番台でも動くと思いますよ。 CUI版ではどんなエラーが出ていますか?
435 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 17:26:15.21 ID:XRqsjajg0] >>433 実際に速度分ヒットしてるか確認したほうがいいな。w 速度表示のバグとかかもしれんぞ。うひ。 なにせ途中で飽きてほうりだしたものだしな。 >>434 いや、処理そのものを書き換えないと動かないな。 理由はこれだ。 The 4XXX series does not have the requisite hardware to support byte addressable store, so it will never be supported.
436 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 17:37:35.12 ID:XRqsjajg0] つーかさ、これも多分そのぐらいの速度なんじゃないかな。 trip2ch.net/wiki/index.php?SHArp%20Tripper MERIKEN's Tripcode Finder はまだまだチューニングの余地があるというか、 まだやりはじめたばっかりなんだろ。 そのうち hip2 なんざ超えるんじゃね?
437 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 17:45:31.86 ID:+2zE6v+s0] >>435 ヒット率をチェックするルーチンを最初から組み込んでおくといろいろ安心ですよ。 Tripcode Finderの開発ではそれで随分助かりました。 4XXXシリーズの制限はちょっと厳しすぎですねえ。残念…
438 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 18:33:41.58 ID:+2zE6v+s0] >>436 MERIKEN's Tripcode Finderは他のプログラムに比べてキーの探索空間が広いので 単純に比較できないんですけど、ちょっと気になったのでCPU検索の速度を 調べてみました。CPUはCore i7-3770K 4300MHz、ターゲットは前方一致の "TEST/"のみで、検索時間は5分です。 SHArp Tripper 1.1 報告された速度: 74.6M TPS ヒットしたトリップの数: 19個 hip264.exe 報告された速度: 102.6M TPS ヒットしたトリップの数: 0 MERIKEN's Tripcode Finder 0.07 Alpha 2 報告された速度: 42.8M TPS ヒットしたトリップの数: 11 hip2は5完のターゲットだとちゃんと動いていないようです。
439 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 18:45:49.58 ID:XRqsjajg0] >>438 hip2 は6完以上しか探せない仕様だ。w 5完しかタゲにないと 0 ターゲット読み込みました。 ってなるはず。はず。はずなんだよなぁ・・・・・。 ちなみに hip2 の検索空間というかキーの組み合わせ数は、 81189040166334863750412839195508736 個 だ。 MERIKEN's Tripcode Finder はこれの何倍だ? つか、トリップの総数を考えるとこの辺にすると思うんだが。
440 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 18:51:17.50 ID:XRqsjajg0] >>439 oi. おい。 オイィィィ。 この辺、じゃねぇな。w これでもかなり多すぎるな。 なんでこんなに広げたんだよ。>昔の俺 64^12=4722366482869645213696 だもんなぁ。
441 名前:395 mailto:sage [2012/11/07(水) 18:52:20.25 ID:DRUtyFmt0] >>431-432 AMD APP SDKにはGPU向けのドライバは入ってなさそうでした。 アンインストールしてから12-6、SDKの順に入れても駄目でした。 他のOpenCL対応ソフトなんかの挙動を確認してみたんですが、 PhotoShopCS6ではRadeonを認識していて、「OpenCLを使用」のチェックも入れられました。 OpenCLを使用するというぼかしフィルターも使えています。
442 名前:395 mailto:sage [2012/11/07(水) 18:55:51.64 ID:DRUtyFmt0] 連レスすみません 大きい画像でぼかしフィルターを試すとぼかし処理の開始と同時にGPU Loadが増えるので、まず間違いなくPSでは動いていると思います。
443 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 18:56:42.88 ID:+2zE6v+s0] >>439 なるほど、そういうことだったんですね。Tripcode FinderはShift-JISのキーを 全てカバーするようになっているのでその数字より大分大きいはずです。 トリップの変換は全単射ではないのでキーの組み合わせの数と トリップの総数(64^12)は必ずしも一致しません。
444 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 19:03:19.07 ID:+2zE6v+s0] hip2は全数字のターゲットは自動的に拾うようになっているようなので そっちのほうでも比較してみました。検索時間は10分です。 hip264.exe 報告された速度: 102.6M TPS ヒットしたトリップの数: 13 MERIKEN's Tripcode Finder 0.07 Alpha 2 報告された速度: 37.6M TPS ヒットしたトリップの数: 7 hip2のほうが大分速度が出ているようですが、実際の速度が報告通りかどうかは 微妙なところです。
445 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 19:08:29.22 ID:XRqsjajg0] >>443 またそんなてきとーなことを。www hip2 の検索空間のほうが「かなり」広いぞ。 ちょっとは考えようよ。 つーかさ、全単射じゃないかもしれないからこうしてるんだし。 4722366482869645213696 = 64^12 81189040166334863750412839195508736 = hip2 の検索空間 俺のことどんだけバカだと思ってるんだよ。www
446 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 19:15:01.56 ID:XRqsjajg0] >>444 自分でつくっといてなんだが、 >実際の速度が報告通りかどうかは微妙なところ には同意だ。てへ。 まあ、10分じゃ運の要素が強いが・・・・・。 Ivy 買ったらまたやろうかとか考えてたけど、もうあの頃の情熱はない。うわぁ。 そもそも鳥屋がぐてやを投げるから悪いんだ。 ぐてやは試作段階でhip2よりも速かったんだぜ? チクショウ あの野郎やるやる詐欺でほったらかしだしな!!!!
447 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 19:16:27.33 ID:+2zE6v+s0] >>445 見た感じでは1バイト文字のキーしか探索していないようでしたけど、違うんでしょうか。 Shift-JISのキーを網羅的に探索するTripcode Finderのほうがキーの探索空間が広いのは 自明だと思うのですが…
448 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 19:22:00.88 ID:lVCLYKZJ0] キー探索空間は 64 ^ 12 = 2 ^ 72 = 4722366482869645213696 だけで十分ではないのですか? ↓の資料を読む限りでは。 > 与えられたハッシュ値に対応する入力を求めるために必要な計算量は、 > ハッシュ値が n ビットであるとき、ハッシュ関数の計算を 2^n 回行うための計算量を超えない。 www.jnsa.org/seminar/2008/0703/data/09_panel03.pdf#page=7
449 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 19:25:30.34 ID:XRqsjajg0] >>447 なんだかなぁ。 なんで確認しないの? なんでTripcode Finderのキー空間計算してみないの? 私、怒っちゃったから答えは教えてあげないよ〜だ。 >>448 簡単に言うと、 違うキーで同じトリップになることがあるかもしれない ってことだよ。だから、総トリップ数よりも多くしておくべきなんだよね。
450 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 19:27:35.72 ID:+2zE6v+s0] >>448 実用的な観点からはトリップのキーはわかりにくければわかりにくいほど良いので 自分としては妥協したくないところです。
451 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 19:29:51.83 ID:+2zE6v+s0] >>446 > あの野郎やるやる詐欺でほったらかしだしな!!!! ご愁傷様です… しかし実にもったいないですね。海外にいるとのことでしたけど 元気にされているんでしょうか。 Tripcode FinderのCPU検索はSHA-1のルーチン以外はサボりまくりなので 改善の余地はまだ大分あるんでしょうねえ。次に最適化に挑戦するのは もうちょっと勉強してからにします。
452 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 19:30:50.57 ID:lVCLYKZJ0] >>449 ハッシュ値の衝突はわかります。 それも踏まえた上で > ハッシュ値が n ビットであるとき、ハッシュ関数の計算を 2^n 回行うための計算量を超えない。 ということではないのですか?
453 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 19:36:59.82 ID:+2zE6v+s0] >>449 私には (1) 1バイト文字のみのキーの総数 と (2) 1バイト文字とShift-JIS文字を含んだキーの総数 を比較したら後者のほうが大きいのは当然に見えるのですが違うんでしょうかねえ。 計算は面倒くさいのでしませんw
454 名前: ◆MERIKEN4.k mailto:sage [2012/11/07(水) 20:14:53.11 ID:+2zE6v+s0] 私がトリップ検索に興味を持ったのは、私のトリップを騙る荒らしが現れたのが そもそもの原因なので、Tripcode Finderを作るときには実用性が全てにおいて 優先しています。いままで考えてもみなかったですけど、純粋な知的好奇心以外の 明白な動機があるというのが自分の作ったプログラムにも反映されているのかも しれません。
455 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 20:24:17.18 ID:TO2+iqd80] あれ? CPU側にhip2、GPU側にMERIKEN使えば最強なんじゃね?
456 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/07(水) 21:33:59.97 ID:XRqsjajg0 BE:632084148-DIA(289888)] >>455 hip2はホントにアルファレベルのでき。 タゲの制限も実用的なものじゃないし。 速度の検証しようとしたところで投げたから、マジで表示速度は怪しい。 もちろん、わざと盛るなんてことはやってないけど。w 『ホンキで最速を目指すんなら、キーを○×△□にしろよ。』 と鳥屋に言われた。一部伏せ字。w 最初意味がわからなかったけど、よく考えたらわかった。 ヤツは私の理解の外にいる。 待て屋のソース見るとよくわかる。 もったいないよなぁ・・・・。
457 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/07(水) 21:57:24.06 ID:c5GjquhW0] 部外者の俺が答え言っちゃっていいのかは知らんが、 MERIKEN氏は12桁トリップのキーが12バイト以上を取りうるということを失念しているのだと思う 10桁トリップと違って12桁トリップはキーを長くするだけで簡単にキー探索空間が広がる hip2が手元にないので確認できんが、>>439 の数=152^16からhip2はキー16バイトで探索しているのだと推測される このことを考えれば現状のキー探索空間は圧倒的にhip2の方が大きいというのはすぐに分かる ここからは俺の偏見的見解だが、両者の違いは hip2はわざわざShift_JIS空間を探索するより、単にキーを長くして簡潔・高速に探索することが目的 一方MERIKEN氏の方は>>450 >>454 からわかるように、「わかりにくいキー」を探索することを優先している ということなんじゃないかと思う