1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680] こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は こちらでどうぞ。 MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は 2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は 1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce シリーズのビデオカードを使用すれば非常に高速に検索を行うことが できます。特徴は以下の通りです。 ・ビデオカードのGPUによる高速検索(CPU検索にも対応)。 ・GUIによる簡単な操作(コマンドラインからの使用も可能)。 ・正規表現によるターゲットの指定。 ・漢字等のShift-JIS文字を含むキーの探索。 ・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。 ・ターゲットの数の制限の撤廃。 ・10桁トリップ検索への暫定的対応。 ・検索速度の実行時の最適化。 ・GPLv3で公開されたソースコード。 ■入手先 www.meriken2ch.com/programming/merikens-tripcode-finder ■前スレ anago.2ch.net/test/read.cgi/software/1311428038/
231 名前:名無しさん@お腹いっぱい。 [2012/10/22(月) 20:01:07.08 ID:8SpyKQvk0] つyy51.60.kg/test/read.cgi/ra8plus/1298452105/
232 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 08:28:38.16 ID:Y+4Wukci0] 新しい開発版です。今回の変更点は10桁トリップCPU検索の速度向上です。 MERIKEN's Tripcode Finder 0.06 Beta 1 www.meriken2ch.com/programming/merikens-tripcode-finder
233 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 08:36:00.46 ID:Y+4Wukci0] >>231 なるほど、これが>>200 のブツですね。なんか普通にNVIDIAとIntelの GPUで動いてますね… ちょっと自分でも試してみよう。
234 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 08:37:16.76 ID:Y+4Wukci0] 結局OpenCLならどのベンダのライブラリを使っても他のベンダの GPUが使えるということなんでしょうか。
235 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 09:03:33.94 ID:Y+4Wukci0] 次のページを参考にしてAMD APP SDKのOpenCLのライブラリを Tripcode Finderにリンクしてみました。 stackoverflow.com/questions/9595971/open-cl-with-amd stackoverflow.com/questions/8969709/clgetplatformids-return-two-platforms-but-they-are-the-same なんか普通にOpenCLからGTX 580もHD 5770も見えてます。 > OpenCL reports 2 platforms. > > Platform 0: NVIDIA Corporation NVIDIA CUDA OpenCL 1.1 CUDA 4.2.1 > Platform 1: Advanced Micro Devices, Inc. AMD Accelerated Parallel > Processing OpenCL 1.2 AMD-APP (1016.4) Core i7-3770KのGPUは見えていないようなのでIntelのドライバを入れて もう一回試してみます。
236 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 09:24:02.40 ID:Y+4Wukci0] よく見たらこれGPUじゃなくてプラットフォームなのか。 なにはともあれドライバをインストールしたらIntelのプラットフォームも 見えるようになりました。 > Platform 0: NVIDIA Corporation NVIDIA CUDA OpenCL 1.1 CUDA 4.2.1 > Platform 1: Advanced Micro Devices, Inc. AMD Accelerated Parallel > Processing OpenCL 1.2 AMD-APP (1016.4) > Platform 2: Intel(R) Corporation Intel(R) OpenCL OpenCL 1.1
237 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 10:02:37.30 ID:Y+4Wukci0] デバイス一覧を取得しました。なぜかCore i7が2つあります。 JuniperってHD 5770のコードネームか。紛らわしいなあ… > OpenCL reports 3 platforms. > > Platform 0: [NVIDIA Corporation] [NVIDIA CUDA] [OpenCL 1.1 CUDA > 4.2.1] > 0: [NVIDIA Corporation] [GeForce GTX 580] > Platform 1: [Advanced Micro Devices, Inc.] [AMD Accelerated Parallel > Processing] [OpenCL 1.2 AMD-APP (1016.4)] > 0: [Advanced Micro Devices, Inc.] [Juniper] > 1: [GenuineIntel] [ Intel(R) Core(TM) i7-3770K CPU @ 3.50GHz] > Platform 2: [Intel(R) Corporation] [Intel(R) OpenCL] [OpenCL 1.1 ] > 0: [Intel(R) Corporation] [ Intel(R) Core(TM) i7-3770K CPU @ 3.50GHz]
238 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 10:27:30.20 ID:Y+4Wukci0] 2つ見えているIntelのは両方共CPUみたいです。 HD 4000はどこに行ったんだろう…
239 名前:ののたん ◆KiwamonoL. mailto:sage [2012/10/23(火) 11:38:20.45 ID:Mm6auUgH0] もうどこからつっこめばいいのかわからんなこれ。w CPU Only のランタイムしかいれてないんじゃねーの? やったことないから知らんけど。www
240 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 12:01:55.08 ID:Y+4Wukci0] いや〜、これちょっとやばいですよね… IntelのOpenCLのSDKをインストールしても見えなかったのでおかしいなと 思ってたんですけど、なんとマザボにディスプレイを繋いだらようやく OpenCLのAPIからIntel HD 4000を認識できるようになりました。 > 1: [Intel(R) Corporation] [Intel(R) HD Graphics 4000] [GPU] CUDAと違って、OpenCLはかなりカオスですねえ…
241 名前: ◆MERIKEN4.k mailto:sage [2012/10/23(火) 12:37:57.54 ID:Y+4Wukci0] やはりディスプレイをつながないとHD 4000はOpenCLデバイスとして 認識されないようです。ここでIntelの人がそう言っているので確実でしょう。 なんというか、いろいろ勿体無いです。 HD Processor Graphics failed to load as a device in Code Samples software.intel.com/en-us/forums/topic/277886
242 名前:ののたん ◆KiwamonoL. mailto:sage [2012/10/23(火) 17:48:47.97 ID:Mm6auUgH0] いやいや、つっこみどころが多いのは OpenCL に対してじゃなくて。 ちゃんとマニュアルとか読んだ方がいいんじゃね? まあまだサンプル動かしてみただけの段階なんだろうけど。
243 名前: ◆999984973989 [2012/10/23(火) 19:21:09.50 ID:I3p6Oxvg0] 夫婦漫才ですね。 このすれは・・・
244 名前: ◆MERIKEN4.k mailto:sage [2012/10/24(水) 00:31:25.16 ID:idf8ye870] もともとマニュアルは絶対必要にならないと読まない方なんでw それよりサンプル読んでたほうが参考になるし… まあCUDAと似たようなものなので、近いうちに動くものが出来るように なるでしょう。
245 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/24(水) 20:28:41.44 ID:qG+AQb1B0] 一時停止の状態を保存できないのでしょうか。
246 名前: ◆MERIKEN4.k mailto:sage [2012/10/24(水) 20:40:18.19 ID:idf8ye870] >>245 それは難しいですね。 累計検索時間と生成されたトリップの累計を表示させることなら出来ます。 次のバージョンでプログラムの構造に大きく手を入れる予定なので、 これまでに希望のあった機能はまとめて追加する予定です。
247 名前: ◆MERIKEN4.k mailto:sage [2012/10/24(水) 20:44:36.27 ID:idf8ye870] とりあえずこのサンプルを読んだら大体の流れはわかりました。 Getting started with OpenCL and GPU Computing www.thebigblob.com/getting-started-with-opencl-and-gpu-computing/ まずSHA-1とDES cryptのルーチンを移植して、ちゃんと動くのが確認してから 実際の検索ルーチンを作成することにします。やることはCUDAの場合と ほとんど変わらないので、割とすんなり行きそうな予感…
248 名前: ◆MERIKEN4.k mailto:sage [2012/10/24(水) 20:49:35.03 ID:idf8ye870] そうそう、今日テストベンチ用の部品が届くので、後で580+590をそっちに 移してTripcode Finderを動かして見ることにします。 2G TPS超は確実ですが、どこまで上乗せできるか楽しみです。
249 名前:245 mailto:sage [2012/10/24(水) 21:05:41.68 ID:qG+AQb1B0] >>246 ありがとうございました。楽しみにしてます。
250 名前:名無しさん@お腹いっぱい。 [2012/10/25(木) 20:33:30.73 ID:ocjKS/zjP] SHA256ハッシュを取ると全ビットが0になるキーを探してください
251 名前: ◆CCCCkCCCCk mailto:sage [2012/10/25(木) 22:22:49.94 ID:w8XLKVhj0] 初めまして。 なんとなくトリップ検索(特に12桁)を再開したくなり、 ひょんなことから、こちらの安定版を頂きました。 残念ながらラデオン使用+中古パーツ寄せ集めの自作なんで、 貴ソフトを100%活用できていませんが、表示される検索数には驚いていますw CPU検索+スレッド自動ですが、 Phenom U Black x6 が、6コア100%稼動するのを初めて見ました。 ソフトの進化、期待しています。 (こっちのハードも進化させねばorz)
252 名前: ◆MERIKEN4.k mailto:sage [2012/10/25(木) 23:29:49.74 ID:gkWWDV1H0] テストベンチに580+590を移したのでまた最高速の測定をしてみました。 590は意外にOC耐性があります。ビデオカードはむき出しで間を空けてあるので GPUの温度は84度に抑えられています。 【GPU】NVIDIA GeForce GTX 580 (OC: 940/2004MHz) + GTX 590 (OC: 830/1728MHz) 【CPU】AMD Phenom II X6 1100T (定格) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.06 Beta 1 【トリップの種類】12桁 【オプション】-x 192 -c -g 【Display Driver】306.23 【10分間の平均速度】 2291.56M tripcodes/s 【その他】7完1タゲ。CPUの速度は約19.6M TPS。
253 名前: ◆MERIKEN4.k mailto:sage [2012/10/25(木) 23:33:19.55 ID:gkWWDV1H0] >>251 12桁のCPU検索は限界に近い速度が出ていると思われます。 近いうちにラデにも対応する予定なのでその時はテストをお願いします。
254 名前: ◆MERIKEN4.k mailto:sage [2012/10/25(木) 23:37:05.64 ID:gkWWDV1H0] >>250 見つけるのに一体何世紀かかるんでしょうねえ…
255 名前: ◆MERIKEN4.k mailto:sage [2012/10/26(金) 04:37:11.50 ID:2pNAGJzV0] >>251 よく読み返したら安定版だったんですね。 それだったら次の安定版で5M TPSほど速くなります。
256 名前: ◆MERIKEN4.k mailto:sage [2012/10/26(金) 09:17:26.32 ID:2pNAGJzV0] 最高速の測定の続きです。あの後まさかと思って580をもう一枚 追加したらあっさり3G TPS超えできました。さすがテストベンチw でもGPUの温度は最高で89℃なのでそろそろ限界でしょう。 温度さえ何とかなれば590 3-Way SLIで4G TPS超えも出来そうですが… 【GPU】NVIDIA GeForce GTX 580 SLI (OC: 930/2004MHz) + NVIDIA GeForce GTX 590 (OC: 830/1728MHz) 【CPU】AMD Phenom II X6 1100T (定格) 【OS】Microsoft Windows 7 64bit SP1 【バージョン】MERIKEN's Tripcode Finder 0.06 Beta 1 【トリップの種類】12桁 【オプション】-x 192 -c -g 【Display Driver】306.23 【10分間の平均速度】 3080.98M tripcodes/s 【その他】7完1タゲ。CPUの速度は約13.1M TPS。
257 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/26(金) 18:49:10.26 ID:8HQ+za6d0] >>241 ディスプレイを繋がなくても、Windowsの設定で"画面を拡張"にしたらできますよ
258 名前: ◆MERIKEN4.k mailto:sage [2012/10/27(土) 02:20:50.37 ID:y8rBUfat0] >>257 試してみたけどやっぱりOpenCLのAPIからは見えていません。 実際に物理的にディスプレイをつながないと駄目なようです。 折角の機能なのにもったいない… これって将来のドライバ更新で 改善されたりするものなんでしょうかねえ。
259 名前: ◆MERIKEN4.k mailto:sage [2012/10/27(土) 02:49:49.84 ID:y8rBUfat0] あのあとテストベンチのGPUの電圧のクロック周波数をAfterburnerで細かくいじって、 普段使っている検索パターンで安定して2.3G tripcodes/s出せるようになりました。 正規表現を使ったかなり複雑なパターンなので、その分だけGPUの温度も上がって しまい苦労しました。室温はだいたい30℃で、GPUの温度は最高で91℃です。熱すぎです。 GTX 580 (975mV 700/2004MHz) GTX 580 (975mV 480/1000MHz) GTX 590 (925mV 800/1728MHz) このように上から順番に隙間なく並んでいるのですが、真ん中の580の放熱が やはりというかうまくいかないらしく、クロック周波数を限界まで落とさざるを 得ませんでした。
260 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/27(土) 03:09:40.84 ID:QA+aurA10] そこまでクロックを落とすのなら無理せず他のGPU乗せた方が…
261 名前: ◆MERIKEN4.k mailto:sage [2012/10/27(土) 03:30:05.40 ID:y8rBUfat0] もともと真ん中の580は乗っけるつもりがなくて、 590を買って余ってたのを使っただけなのでこれでいいのですw 最初はグラボを3枚のっけるなんて考えてもいなかったので… 余った580はオクで売っぱらう予定だったんですけど、 今の構成が思いのほかうまく動いているので当分このままにしておきます。
262 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/27(土) 04:09:48.65 ID:Gt8Alwps0] 各マシンに分散したらいいんじゃないの? ということで家庭内分散コンピューティング対応のネットワーク検索に期待してます SETI@homeみたいな
263 名前: ◆MERIKEN4.k mailto:sage [2012/10/27(土) 05:59:49.53 ID:y8rBUfat0] >>262 最終的にはそこに行きつくんでしょうねえ。 いずれぜひ取り組んでみたいけど、その前にスタンドアロンで 最高のトリップ検索プログラムを作るのを先にしたいと思います。
264 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/27(土) 11:13:11.34 ID:RRaDuUU/0] >>258 BIOSで常に有効にしたり出来ないのでしょうかね? >>259 冬も暖房不要になりそうですねw グラボの冷却は最終的にはやはり水冷なのでしょうかねえ・・・
265 名前: ◆MERIKEN4.k mailto:sage [2012/10/27(土) 12:59:43.56 ID:y8rBUfat0] >>264 BIOSの設定も色々いじってみたけど駄目でした。 >>241 のリンク先でIntelの人がはっきりと無理だと言ってるので無理なんでしょう。 恐らく消費電力はシステム全体で1000W近いので、電気ヒーターなど目ではありませんw まあ性能のことだけ考えるなら水冷のほうがいいんでしょうけど、 保証がなくなるのと手軽にグラボの交換ができなくなるのは痛いですね。 590 4枚差しとかちょっと見てみたい気がしますけどねw
266 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/27(土) 19:54:23.00 ID:sNktJKqm0] >>265 BIOS設定でもどうにもならないとなると厳しいですね。 手持ちの電気ヒーターの消費電力を測ってみたことがあるのですが 強では表示どおり1200W、弱で600Wだったのでなかなか手ごわいですよw GTX590を4枚となると1500Wを超えて電源が2系統必要になりそうです。
267 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/27(土) 20:22:25.50 ID:QA+aurA10] 200V端子なら… いや市販のプラグとコード見たことないけど
268 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 00:33:21.89 ID:Xbgvyzs00] 家庭用電源だとさすがに厳しいですねw 590 3枚あたりが個人でできる限界でしょうか。
269 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 00:37:03.15 ID:Xbgvyzs00] Tesla K20がようやく発売開始になったみたいですね。 www.sabrepc.com/p-2920-nvidia-900-22081-2220-000-tesla-k20-kepler-gpu-computing-processor.aspx $3500なのでK10と似たようなお値段ですが、手が出ないことにはかわりませんw 誰かTripcode Finderをこれで動かしてみてくれないかな〜
270 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 06:46:31.10 ID:Xbgvyzs00] >>247 のサンプルをTripcode Finderのソースに組み込むことに成功しました。 ちゃんと実行ファイルと同じディレクトリにあるOpenCLのソースファイルが コンパイルされて実行できてます。次はCUDAのSHA-1のルーチンを コピペして動作するかどうか確認することにします。
271 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 07:07:21.83 ID:Xbgvyzs00] 1年前に書いたCUDAのSHA-1のルーチンを読み返してみたけど、 やはりDES cryptに比べると相当簡単です。これならテストも割りと すんなりといくかな。
272 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 09:39:11.88 ID:Xbgvyzs00 BE:4788072498-2BP(12)] サンプルを書き換えてOpenCLのSHA-1のルーチンをテストするコードを でっち上げたのですが、1発で12桁トリップの変換に成功しました。 10桁CPU検索の作業に比べてなんと楽なことよ…
273 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 09:52:54.49 ID:Xbgvyzs00] 私の机の隣で爆音を立てて熱風を撒き散らしつつ24時間稼働している 「検索君1号(仮名)」ですが、あまりにうるさいので昔買って放置してあった Sonyのノイズキャンセリングヘッドフォンを引っ張りだしてきました。 効果は抜群で、数ヶ月ぶりに自室に(見かけ上の)静寂が訪れました。 580 1枚でうるさいと持ってた頃が懐かしいです…
274 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/28(日) 09:55:29.83 ID:xpUhApe40] これは12桁での速度を維持しながら10桁での検索も可能ということなのでしょうか?
275 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 10:02:40.32 ID:Xbgvyzs00] >>274 違います。NVIDIA以外のグラボでもGPU検索ができるようになるかも、という話です。 計算量が桁違いなので、理論的に10桁検索が12桁検索と同じぐらい速くなるということは あり得えないです。 ただ、RadeonのグラボはNVIDIAのものに比べて10桁検索に向いているということは ありそうです。というかCUDAと10桁検索が壮絶に相性が悪いだけなのかも しれませんが…
276 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/28(日) 11:16:46.22 ID:JD+mWdaq0] >>268 電源ユニット2台で別系統のコンセントを使えば大丈夫かと思いますw そこまでするなら複数台に分けた方がいいですけど。
277 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/28(日) 11:23:26.19 ID:JD+mWdaq0] >>275 Radeonがアーキテクチャ的にDES cryptの計算もやりやすいのでしょうか? OpenCLならGeForceでもマシになったりするのかも気になります。
278 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 11:33:10.81 ID:Xbgvyzs00] >>277 ゲフォよりもラデのほうがレジスタの数が多いとかいう話をどこかで見かけました。 それにラデのほうが実際に速度が出てますしね。OpenCLはCUDAより遅くなるのが 目に見えているのでラデへの対応はありません。
279 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 11:34:57.99 ID:Xbgvyzs00] 間違えた。>>278 の最後の行は「ゲフォへの対応はありません」だった。
280 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/28(日) 11:41:03.95 ID:JD+mWdaq0] やはりレジスタが一番の理由ですか。 GeForceはKeplerでの方向性とか見ていると厳しくなりそうですね。
281 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 12:15:12.94 ID:Xbgvyzs00] >>280 レジスタの数がそこまでなくても、高速なメモリがあればそれでいいんですけどね。 CUDAの10桁検索も共有メモリの量さえ増えれば多分倍以上の速度が出るでしょう。 オンダイの高速メモリをL1キャッシュに使うぐらいならもっと共有メモリを 増やして欲しいもんです。 GeForceでのGPGPUの今後はわかりませんね〜 GK110がGeForceに降りてきてくれればいいんですけど…
282 名前: ◆MERIKEN4.k mailto:sage [2012/10/28(日) 21:10:17.36 ID:Xbgvyzs00] >>276 やっぱそうですよね〜 トリップ検索を始めたときにはこんなに熱処理に悩まされるとは 思いもしませんでした。分散処理対応を真剣に考えよっと。
283 名前: ◆CCCCkCCCCk mailto:sage [2012/10/28(日) 23:07:58.09 ID:XmyhG/mG0] こんばんは。 >>253 ちょっと古いグラボなんでどうなるか分かりませんが、データ取りにはなると思います。 年明けなら、うまくいけば上位のヤツが手に入りそうです。 >>255 おおっ、楽しみにしています。 >>282 コンピューターの歴史は熱との戦い・・・ 真空管のENIACなんか、凄かったでしょうね。 // とりあえず、ご報告。 CPUはAMD PhenomU x6 1090T Black Edition 3.2Ghz ターゲット5種・5完〜12完で稼動です。 最高で23.68Mtrip/sぐらいです。 ターゲットを12種にしたら、高21.88Mtrip/s、平21.66Trip/sぐらいです。 そちらと同じ検索条件にすれば、もっと早くなるのは分かってますが、つい・・・^^; ではまた。
284 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 02:42:12.63 ID:nQV6S3Gh0] >>283 データ取りでも有難いです。ぜひよろしく。
285 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 02:47:14.79 ID:nQV6S3Gh0] あのあとOpenCLのSHA-1のルーチンの速度を測定しようとしたのですが、 適当な作りのテスト用コードではちゃんと測定できませんでした。残念… やはりある程度検索ルーチンを作りこまないといけないようです。 まあしょうがないといえばしょうがないですね。 とりあえず前方一致検索の分だけ作ってみます。
286 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 02:53:39.55 ID:nQV6S3Gh0] これはRadeon向けの最適化の資料です。あとでじっくり読もうっと。 AMD Accelerated Parallel Processing OpenCL Programming Guide developer.amd.com/tools/hc/amdappsdk/assets/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf
287 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 06:19:58.32 ID:nQV6S3Gh0] あまりも検索君1号(仮)のGPUの温度が高すぎて心臓に悪いので、 こんなものを注文しました。 BestDealUSA PCI-E Express 16X Riser Card Extender Extension Cable Ribbon Flex www.amazon.com/gp/product/B00646VJDG これで真ん中のグラボを浮かせてやって空気の流れを良くしようという狙いです。 まあ見た目は悪くなるだろうけど、効果は確実にあるでしょう。
288 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 09:44:46.80 ID:nQV6S3Gh0] OpenCLのルーチンをデバッグしてるんですけど、 実行時にOpenCLのコードのコンパイルに失敗しても 結構詳しいエラーメッセージが取得できるので助かります。 CUDAほどお手軽ではないですけど、 思ったより手間がかからずに済みそうです。
289 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 12:57:58.70 ID:nQV6S3Gh0] CUI版を少しずつOpenCL対応のために書き換え始めました。 CUI版での変更がGUI版に自動的に反映されるのが便利といえば便利です。 とりあえず"AMD HD 5770"と"Intel HD Graphics 4000"はGUI版から見えるように なりました。OpenCL対応は単純作業が多そうなので、毎日少しづつ 進めていくことにします。
290 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 14:04:33.31 ID:yyXkW2IU0] つまりオンボだけどCore iしりーずな人でもGPUパワーが使えるのか……胸熱
291 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 14:36:56.78 ID:5Sl8Z/AoP] 自分はOpenCLでSHA256ハッシュを探索して ハッシュの先頭に0のビットが多く並ぶキーを探すプログラムを書いているんですが Windows7で265MHash/s出ていたのが80MHash/sしか出なくなって 原因調査中です
292 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 19:19:37.57 ID:mTINnVu80] >>290 前に別のところで聞いた話だとすずめの涙みたいな計算速度だった覚えが
293 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 21:24:08.35 ID:myu28mTs0] 8800GT メモリ2GBのPCですが、検索停止ボタンを押すと完全に固まります フリーズ中はGPUのファンは静かになっていて、HDDが規則的なリズムでガリガリと鳴りつづけていました さきほど1分ほど動かして検索停止ボタンを押した時は15分経っても復帰しませんでした。多分、そのまま動かし続けてもフリーズするのは時間の問題だと感じました 再起動した後、とりあえず10秒(検索速度などの表示が出るまで)で止めてみたのですが、停止ボタンを押した後に一瞬画面が真っ黒になって「ディスプレイドライバの応答停止と回復」のポップアップが表示されました この調子ですぐ止めればセーフか?と思い、続いてブロック数を自動から1に変更して開始したところ、同じように10秒で止めても完全にフリーズしてしまいました メモリの容量か何かが関係しているのかとも思いましたが、それにしては検索中もメモリの利用率は別に増えてなかったのが不思議です。 使っていて変な汗が出たソフトナンバーワンなのは間違いないです
294 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 21:30:51.78 ID:nQV6S3Gh0] >>293 多分問題は電源かGPUの温度でしょう。メモリは殆ど使わない作りになっているので まず関係ないです。SpeedFanとかAfterburnerで温度をチェックすると いいかもしれません。
295 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 21:32:28.03 ID:nQV6S3Gh0] >>290 >>292 実際に検索させてみないことにはわからないですけど、 性能はあんまり期待できないでしょうね〜 まあおまけみたいなもんです。
296 名前: ◆MERIKEN4.k mailto:sage [2012/10/29(月) 21:34:25.08 ID:nQV6S3Gh0] >>291 なかなか不思議なプログラムですねえ。手直しすると突然速度が落ちるという ことはよくあります。バージョン管理は必須ですね。
297 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 21:44:29.50 ID:myu28mTs0] >>294 電源ですか!なるほどなるほど・・・なんだか靄が晴れた気分です
298 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/29(月) 23:27:29.31 ID:5Sl8Z/AoP] >>296 すいません291はWindows8にしたらって書くのを忘れてました
299 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/10/30(火) 00:35:03.80 ID:DNUGLhjc0] >>295 AMD APUの場合は www.amd.com/jp/press-releases/Pages/second-generation-amd-a-series-2012may15.aspx A10-5800Kで理論値はCPU部分が約120GFLOPS、GPU部分が約600GFLOPSと5倍程度差があるらしいので うまく利用できるとそこそこ期待できそうですが、問題はVLIWへの最適化でしょうかね?
300 名前: ◆MERIKEN4.k mailto:sage [2012/10/30(火) 03:13:30.53 ID:6+f0bjdv0] いい機会なのでコードの整理をして、パターン処理の関数を1つのファイルに まとめました。正規表現のパーサが含まれているので結構な大きさです。 これでコードもすっきりしたのでOpenCLデバイスの処理を追加しやすくなりました。 コード全体を眺めるのは久しぶりなんですけど、継ぎ足しに継ぎ足して 随分たくさん書いたもんです。
301 名前: ◆MERIKEN4.k mailto:sage [2012/10/30(火) 03:17:19.66 ID:6+f0bjdv0] >>299 トリップ検索では浮動小数点演算は使わないのでFLOPSはあんまりあてにならない んですけど、AMDのAPUならそこそこ性能は出るでしょう。最適化については 今のところ全く分かりませんw とりあえず動くOpenCLのコードができてから 考えることにします。
302 名前: ◆MERIKEN4.k mailto:sage [2012/10/30(火) 08:03:47.74 ID:6+f0bjdv0] OpenCLデバイスの初期化の処理も実装し終わりました。 あとはスレッド周りを修正すれば、実際の検索ルーチンに取り掛かれます。 ---- Using GPU(s) as a search device. OPENCL DEVICE ============= OpenCL Device Count: 2 Vendor: Advanced Micro Devices, Inc. Name: Juniper Clock Frequency: 850MHz Global Memory Size: 1024M bytes Version: OpenCL 1.2 AMD-APP (1016.4) Driver Version: 1016.4 (VM) Vendor: Intel(R) Corporation Name: Intel(R) HD Graphics 4000 Clock Frequency: 350MHz Global Memory Size: 1624M bytes Version: OpenCL 1.1 Driver Version: 8.15.10.2761
303 名前: ◆GTX680Mcys3u mailto:sage [2012/10/31(水) 02:24:34.52 ID:h5Ao5/fb0] お久しぶりです。 ノート用でGTX680M発売決定らしいです。 www.geforce.com/hardware/notebook-gpus/geforce-gtx-680mx/specifications GK104コアでCUDAコア数はGTX680同等、クロックはGTX680Mと同等 メモリクロックはGTX680M比で40%増し。 ノートも段々デスクトップと変わらなくなってきましたね。 性能次第じゃGTX680Mの時と同じでeBayからMXMカード取り寄せるかも…。
304 名前: ◆GTX680Mcys3u mailto:sage [2012/10/31(水) 20:45:23.81 ID:h5Ao5/fb0] >>303 まちがい 新しいGTX680相当のSMX数で出るのは680MXです
305 名前: ◆MERIKEN4.k mailto:sage [2012/11/01(木) 08:07:20.98 ID:pqoHlXrk0 BE:1197018836-2BP(12)] >>303-304 なるほど、こういうのでアップグレードするんですね。 www.ebay.com/sch/i.html?_nkw=MXM+%22680%22 ちょっと割高な気もするけど、これだけコンパクトにまとまっているのは凄いですねえ。
306 名前: ◆MERIKEN4.k mailto:sage [2012/11/01(木) 08:11:48.87 ID:pqoHlXrk0] OpenCL検索のスレッド周りの処理も一応仕上がりました。 これでいよいよ検索ルーチンの実装を始められます。
307 名前: ◆MERIKEN4.k mailto:sage [2012/11/01(木) 18:28:16.36 ID:pqoHlXrk0] 検索ルーチンを作り始めたんですけど、Intelの実装とAMDのとで微妙に挙動が違って きますね、これ。AMDのではエラーがでなくてもIntelのでエラーが出たりしてます。 思ったよりデバッグに時間がかかるかもしれません。 とりあえず両方のプラットフォームでトリップの変換ができていることは確認できました。 やっぱりIntelのほうが大分遅いですねえ。
308 名前: ◆MERIKEN4.k mailto:sage [2012/11/01(木) 19:11:17.86 ID:pqoHlXrk0] そうそう、検索君1号(仮)ですが、一番下のPCI-EスロットにGTX 590を移したら 温度の問題は全て解決しましたw いい具合に2番目と3番めのカードのあいだに 1スロット分の隙間が出来ました。590とマザボのピンが干渉するので ケースの電源ボタン等は使えなくなったけど、別のがマザボについているので今のところ 困っていません。普段使っている検索パターンで安定して2.7G TPSでています。 1年前に800M TPS出して大喜びしていたのが遠い昔のようですw もうさすがに買わないですけど、電源の容量から計算すると590 3枚でも 十分動作しそうです。3072コアで同時にトリップ検索なんて考えただけで 胸が熱くなりますw
309 名前: ◆GTX680Mcys3u mailto:sage [2012/11/01(木) 20:24:07.51 ID:d/NjzRgi0] >>305 それです。 その一番大きなMXM3.0bという規格でもデスクトップ用の半分以下のサイズだと思いますよ。 ちょっと安いところのが撤退してますねぇ。 今出てる一番安いのはAlienware用のVRAM2GB版だけど 自分が買った時はVRAM4GB版でも799ドルだったのに。 さすがに999ドルなら自分も買ってなかったでしょうけども。 日本ってこういうパーツ全く出回らないんですよね。ニッチだけど需要はありそうなのに。
310 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 02:08:46.32 ID:pOqRQijG0] >>309 部品が手に入りづらいとストレス溜まりますよね。 アメリカの人達はわりと大型のノートPCを好むというのもあるかもしれません。
311 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 02:21:27.01 ID:pOqRQijG0] OpenCL検索のGPU側のコードを書き終えました。 とは言っても次の資料を見てCUDAのコードを書き換えただけですが… Porting CUDA Applications to OpenCL developer.amd.com/Resources/hc/OpenCLZone/programming/pages/portingcudatoopencl.aspx あとはCPU側のコードを用意してやればOpenCL検索ができるようになるはずです。 OpenCLのコードは問題なくビルドできているので、あと残っているので めんどくさそうなのはメモリ周りの処理ぐらいです。まあなんとかなるでしょう。
312 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 05:21:44.88 ID:pOqRQijG0] CPU側のコードを用意ができたのでOpenCL検索を試してみたのですが、 Radeonだとwork-groupの数が不正だと怒られて動かせませんでした。 で、Intelのほうを試してみたら、奇跡的にトリップは生成されました。 が、めちゃくちゃ遅い! 遅すぎる! 仕方がないのでとりあえず Radeonで動くようにしてからコードの見直しをすることにします。
313 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 05:34:17.58 ID:pOqRQijG0] ちょっと手直ししたら今度はclEnqueueNDRangeKernelで CL_OUT_OF_RESOURCESが出てしまいました。 仕様書を見たらレジスタやカーネルへの引数の数が多すぎるとこのエラーが出るらしいです。 いろいろ面倒くさいなあ…
314 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 05:39:42.98 ID:pOqRQijG0] どうやらwork-groupのサイズはclGetKernelWorkGroupInfoで取り出さないと いけない模様。これでうまくいくといいけど…
315 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 07:27:52.40 ID:pOqRQijG0] あの後色々調べてみたけど原因はわかりませんでした。 う〜ん、CUDAの検索ルーチンをそのまま移植するんじゃなくて、 少しづつ動くのを確認しながら作り込んでいったほうがよかったのかなあ。 完全に煮詰まってしまったので食事をしてきます。
316 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 10:39:28.35 ID:pOqRQijG0] AMDのOpenCLの実装で動かなかった理由がようやくわかりました。 16M bytesあるキービットマップの配列へのポインタをカーネルの引数で渡していたのが 原因でした。CUDAで実装したときも我ながら無茶な実装だと思ったものですが、 今の今まですっかり忘れていましたw 取りあえずなくても動くので OpenCLではキービットマップを使わないことにしておきます。 多ターゲットの検索だとキービットマップがかなり有効なのはわかっているので、 あとで小さめのも作ることにします。
317 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 12:03:11.26 ID:pOqRQijG0] というわけでOpenCLの12桁検索の試験実装がめでたくRadeon HD 5770で 動くようになりました。GPU使用率65%で190M TPS出ているので、CUDAの実装の ベタ移植にしては上出来でしょう。ヒット率も綺麗に予想値に収束しています。 いや〜これでようやく安心できました。 あ、あとIntel HD 4000では同じコードで3M TPSしかでていませんw こりゃほんとにおまけですねえ。
318 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 12:29:52.07 ID:pOqRQijG0] GPU使用率を上げようといろいろ頑張ってみたのですが、 ちっとも上がってくれません。global_work_sizeとlocal_work_sizeを いじっても駄目でした。mtyのときも似たようなことがあったし、 ドライバの仕様なのかなあ。
319 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 13:03:48.65 ID:pOqRQijG0] ちっともGPU使用率が上がらないので、思いつきで1つの5770に対して 2つの検索スレッドを走らせたら、見事にGPU使用率が96%まで上がって 301M TPS出るようになりましたw 冗談みたいな話ですが ヒット率は予測通りなのでちゃんとうごいているようです。 なんか釈然としないけど、きちんと動作しているのでこのままにしておきます。
320 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 13:23:20.71 ID:pOqRQijG0] しかしRadeonは思った以上に性能が出ますねえ。 5770でこれなら7970だったら1枚で1G TPSを超えるかもしれません。 10進検索のほうも楽しみです。OpenCL検索の実装が順調に進んで、 GTX 780が噂通り680の改良版なら、次に買うのは8970になるかもしれません。
321 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/02(金) 13:54:01.66 ID:ayT59sJq0] >>318 それを知ってるのに秘孔は知らないのか? ttp://sourceforge.jp/projects/naniya/svn/view/branches/mty-makai/hikou.c?root=naniya&view=log 効果があるかどうかはしらん。w
322 名前: ◆MERIKEN4.k mailto:sage [2012/11/02(金) 14:53:44.04 ID:pOqRQijG0] >>321 その処理をTripcode Finderに組み込もうとしたらAPIが古過ぎてコンパイル できませんでした(´・ω・`)
323 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/02(金) 17:13:31.39 ID:ayT59sJq0] >>322 効果があるか試すだけなら、バイナリもあるぜ。 trip2ch.net/wiki/index.php?%E3%81%BE%E3%81%82%E3%80%81%E5%BE%85%E3%81%A6%E5%B1%8B%E3%80%82 やってることは単純だから、今のAPIで同じことをやればいいんだろうけど。
324 名前:名無しさん@お腹いっぱい。 [2012/11/02(金) 19:08:34.63 ID:druh0GIy0] つyy43.60.kg/test/read.cgi/tripageruo/1274911652/
325 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/02(金) 20:45:07.84 ID:RumtBqwhP] 目指せ純12連発見
326 名前:前スレ927 mailto:sage [2012/11/03(土) 01:40:23.60 ID:nhwVplaB0] HTがトラウマになったので、影響を調べてみました。 CPU: Xeon X5680@3.33GHz x 2 GPU: Quadro FX 3800 Prg: 0.06a1 Len: 12 Targ: "TEST/" Opt: -c -g -x 16 Drv: 306.79 この条件でOSとHTを買えて計測しました。
327 名前:前スレ927 mailto:sage [2012/11/03(土) 01:45:43.54 ID:nhwVplaB0] 先ずはXPから。 Case 1-1 CPU: HT off (12 thread) OS: WinXP SP2 64bit 1hrAv: 240.76M TPS Others: 243.23M TPS (curr) 171.13M TPS (GPU) 72.11M TPS (CPU) Case 1-2 CPU: HT on (24 thread) OS: WinXP SP2 64bit 30minAv: 247.84M TPS Others: 247.50M TPS (curr) 171.13M TPS (GPU) 76.72M TPS (CPU)
328 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/03(土) 01:50:13.99 ID:nhwVplaB0] 次は7です。 Case 2-1 CPU: HT off (12 thread) OS: Win7 SP1 64bit 30minAv: 241.77M TPS Others: 241.44M TPS (curr) 169.01M TPS (GPU) 72.43M TPS (CPU) Case 2-2 CPU: HT on (24 thread) OS: Win7 SP1 64bit 30minAv: 246.28M TPS Others: 246.97M TPS (curr) 170.87M TPS (GPU) 76.10M TPS (CPU)
329 名前:前スレ927 mailto:sage [2012/11/03(土) 02:01:41.49 ID:nhwVplaB0] 連投済みません。 XPから7にしても性能変わらんねぇ。(´・ω・`) HT on/offでも大して変わらんねぇ。(´・ω・`) GTX590を追加しようとしたのですが、電源容量が足りないことが判明。 GPU用に8ピンx2を用意する上手い方法は無いでしょうか? ATX電源だと確かスイッチ入れないと出力されなかったような気が・・・
330 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/03(土) 02:51:49.87 ID:ZeqW5mDD0] >>329 つ「ttp://www.freedom-pc.com/product/card_reader.html」 一台目の電源ユニットに連動するやつも見たことあるけど。 だがしかし、おすすめはしない。いろんな意味で【危険】だから。 素直に電源ユニットをいいやつに交換したほうが。
331 名前: ◆MERIKEN4.k mailto:sage [2012/11/03(土) 02:53:51.82 ID:0Ur2Ic2+0] >>329 HTを有効にしても速度が上がらないのはかなり意外ですねえ。 Core i7-3770KではHTはかなり有効だったので… 電源は入れ替えたほうが早いような気もしますけど、 一応別に用意することもできます。 https://www.google.com/webhp#q=atx+%E9%9B%BB%E6%BA%90+%E3%82%B7%E3%83%A7%E3%83%BC%E3%83%88