[表示 : 全て 最新50 1-99 101- 201- 301- 401- 501- 601- 701- 801- 901- 2chのread.cgiへ]
Update time : 02/04 02:30 / Filesize : 321 KB / Number-of Response : 909
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

【トリップ検索】MERIKEN's Tripcode Finder



1 名前: ◆MERIKEN4.k [2012/09/25(火) 18:24:38.09 ID:BDWiD/680]
こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。

MERIKEN's Tripcode Finder(旧CUDA SHA-1 Tripper MERIKEN's Branch)は
2012年9月現在で最速の12桁トリップ検索プログラムです(最高速の記録は
1689.88M tripcodes/s)。CPUのみでも検索できますが、NVIDIA GeForce
シリーズのビデオカードを使用すれば非常に高速に検索を行うことが
できます。特徴は以下の通りです。

・ビデオカードのGPUによる高速検索(CPU検索にも対応)。
・GUIによる簡単な操作(コマンドラインからの使用も可能)。
・正規表現によるターゲットの指定。
・漢字等のShift-JIS文字を含むキーの探索。
・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。
・ターゲットの数の制限の撤廃。
・10桁トリップ検索への暫定的対応。
・検索速度の実行時の最適化。
・GPLv3で公開されたソースコード。

■入手先
www.meriken2ch.com/programming/merikens-tripcode-finder

■前スレ
anago.2ch.net/test/read.cgi/software/1311428038/

552 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 18:34:33.46 ID:asBmjW5V0]
こんばんわ alpha5 解凍したまんまです
www.dotup.org/uploda/www.dotup.org3605227.png
OSとそのドライバの影響でしょうか?うちの環境で40〜50%です

553 名前:ののたん ◆KiwamonoL. mailto:sage [2012/11/10(土) 19:06:49.70 ID:Osc/R8BS0 BE:355546692-DIA(289888)]
>>552
6990 なら、電力を盛らないとホンキださないぜ。
6990 使いなら常識だぜ。w

【重要:盛って壊れても俺は責任持たないからな。】

554 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:07:57.03 ID:asBmjW5V0]
>>553
盛っても変わらなかったからデフォでやったw

555 名前:名無しさん@お腹いっぱい。 [2012/11/10(土) 19:16:08.42 ID:pOMmt27e0]
壊れてナンボがデフォ。

556 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 19:17:25.07 ID:751Yphs90]
>>552
これは実にもったいない… ぶっちゃけAMDのOpenCLの実装がちゃんと
複数のGPUを生かしきれてないのが問題なんですけどねえ。
同じ設定でTripcode Finderを2つ同時に動かしたらどうなるか、
試してみていただけませんか?

557 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:33:15.40 ID:asBmjW5V0]
GPUのみの並列実行しても使用率に変化はありません
CPU&GPU GPUの並列実行も同じです

558 名前: ◆MERIKEN4.k mailto:sage [2012/11/10(土) 19:40:37.23 ID:751Yphs90]
>>557
あとはワークグループの数を5120とか10240にしてみるぐらいしか
思いつかないですねえ。スレッドの数を変えてみるといいのかもしれないんですけど、
このオプション、Alpha 5ではちゃんと動いてませんでした… 次の開発版で
直しておきます。

559 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:49:37.93 ID:NYhfme2W0]
>>552のように、ラデ使いのSSに写ってるカッコイイ画面>>432
ってグラボ標準のユーティリティなん?
高いGPUなんて買ったことないからよく分かんない……
使用率見るのにGPU-Zより分かりやすいのはいいけど

ところでこの壁紙って誰のですか?

560 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 19:50:17.66 ID:NYhfme2W0]
なんで>>432って付いてるの↑……
無視してください



561 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 20:09:58.65 ID:asBmjW5V0]
www.dotup.org/uploda/www.dotup.org3605668.png
いろいろやった結果 CU=2560 WG=32 のみ固定し行けました
6990はクーラントブッカケしたものなんでたまにマザーが見失ったりするんでそのせいかもしれません

ツールはMSIのサイトから落とせますよ
壁紙は台湾MSから 日本MSのちっぱいには興味ありません

562 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 20:59:00.78 ID:NYhfme2W0]
>>561
ウチMSIには縁がないもので……
↓壁紙はいただきました。冷静に考えるとM$キャラでちっぱいは少ないような……
www.microsoft.com/taiwan/silverlight/collection.htm

563 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 21:47:13.33 ID:asBmjW5V0]
>>562
無料ツールだろw
MSI行って落とせよ

564 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 21:51:37.91 ID:EjblPgPX0]
^0123456789$のように$で終わらせた検索条件を含む
10桁トリップと12桁トリップの複合検索は
トリップの種類12桁
でもできますか?

565 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/10(土) 22:48:53.43 ID:tCg9kOr10]
>>562
どこのメーカーのものでも使えますよ

event.msi.com/vga/afterburner/download.htm

566 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 02:08:24.80 ID:jethYJ0v0]
>>564
おっしゃっていることがさっぱりわからないんですが…
Tripcode Finderで10桁トリップと12桁トリップを同時に
検索することはできません。

567 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 02:30:34.47 ID:shOUqygm0]
>>565
thx!インストールしてみる→

---------------------------
MSI Afterburner
---------------------------
一部の MSI アフターバーナーのコンポーネントが期限切れ、紛失、または壊れています。
---------------------------
OK
---------------------------
起動しないよorz
ノートじゃ駄目か……

568 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 03:27:58.86 ID:jethYJ0v0]
>>561
う〜ん、まだまだ力を出し切れていない感じですねえ。
自分でも試してみたいけど、さすがにこれ以上はグラボは買えません。無念なり…

569 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 10:55:22.93 ID:VopdUwvA0]
【GPU】SAPPHIRE VAPOR-X HD5770 1G (OC: GPU 960MHz MEM 1265MHz)
【CPU】Intel Core i7-3770(無印)
【OS】Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 5
【トリップの種類】12桁
【1CUあたりのワークグループの数】3200
【1WGあたりのワークアイテムの数】64
【その他のオプション】
【Display Driver】Catalyst 12.10
【10分間の平均速度】498.00M tripcodes/s
【GPUの平均速度】463.44M tripcodes/s
【CPUの平均速度】34.56M tripcodes/s
【GPU使用率】99%
【GPUの温度】64℃ (室温20℃)
【その他】テスト時間10分33秒、7完1タゲ

Intel HD4000 にセカンドディスプレイを接続して使用していますが、Intel
社の OpenCL ドライバはインストールしていないので HD5770 だけでのテスト
となりました。

570 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 12:58:41.29 ID:jethYJ0v0]
>>561
あの後ちょっと調べてみたんですけど、ひょっとしてCrossFireXが有効になってませんか?
Catalyst Control CenterでCFXを切れば、デフォルトの設定でうまくいくかもしれません。



571 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:02:30.40 ID:6A5ebb7J0]
>>570
切ってみます

572 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 13:07:04.34 ID:jethYJ0v0]
>>569
詳しい報告、ありがとうございます。ワークグループの数は2560より3200のほうが
いいのかな。うちの5770でもうちょっと詳しく調べてみます。

573 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:10:54.23 ID:6A5ebb7J0]
切れてた… 2560/64は2560/32より遅かった模様

574 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 13:21:12.44 ID:jethYJ0v0]
>>573
う〜ん、何で6990 CFXだけなかなか速度が出ないんでしょうねえ。
ほかのOpenCLアプリケーションでは6990 CFXでもちゃんと性能が出るという報告が
あったので、なにかしら方法はあると思うんですが… もうちょっと調べてみます。

Bitcoin Mining GPU Performance Comparison
www.hardocp.com/article/2011/07/13/bitcoin_mining_gpu_performance_comparison/3

575 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:41:23.09 ID:shOUqygm0]
>>569
>Intel社の OpenCL ドライバ
そんなのがあったのか……と思ってググってみたが、SDKのことか?
→インストールしたら、アホの子でOpenCL検索使えた!
(ただし4M/sぐらいだけど)
サンクス!

576 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 13:55:31.58 ID:shOUqygm0]
あ、後、タスクマネージャ見てたら隠しパラメータがあることに気づいたw
-a 2←1つのAMDのGPUに対する検索スレッドの数?
-m MutexForMERIKENsTripcodeFinder-6496←Intel HD Graphics 4000でOpenCLを使うおまじない?

577 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 15:10:23.29 ID:jethYJ0v0 BE:1197019229-2BP(12)]
>>576
> -a 2←1つのAMDのGPUに対する検索スレッドの数?

これはあってます。2番目のはGUI版とCUI版が通信するときに使うおまじないです。

578 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 18:53:29.24 ID:jethYJ0v0]
これまで使っていた検索君1号のFermi軍団に加えて、開発用PCの7970でも同時に
検索をしているのですが、ここ数日で3回ブレーカーが落ちましたw
GTX 590の電圧を絞ることでなんとか対処しましたが、
消費電力のほうもそろそろ限界です。

579 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 19:25:42.41 ID:6A5ebb7J0]
単相200V契約しよう

580 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:09:00.62 ID:tLApF2aS0]
前スレだったと思いますが、ドライバを触ったらこのソフトからGPUが認識されなくなったと書き込んだものです。
相変わらず認識されないままですが、今日system32に入っているclinfo.exeというプログラムでOpenCLの情報を取得できると知ったので、
取得できたテキストをアップロードしておきます。
cyclotron.moe.hm/up/small/src/cyclotron_s4856.zip

念のため正常に使用できるPCのぶんも入れておきます。



581 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:10:29.57 ID:kFGFk5jZ0]
USAは、110ボルトですね。

582 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:22:46.82 ID:jethYJ0v0]
>>580
ひょっとしてこのスレの>>395さんですか?
たしかに両方ともRadeonが見えていますね。
OSが64bit版ならCUI64ならうまく動くかもしれません。

583 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:29:24.47 ID:jethYJ0v0]
>>579
したいのはやまやまなんですけど、今のアパートだと無理なんです…

>>581
120Vです。15Aなので1800Wまで大丈夫なんですが、グラボ4枚で1100Wぐらい
いってます。やばいです。

584 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:42:11.43 ID:tLApF2aS0]
>>582
あ、このスレでしたか。
Alpha5をダウンロードしてCUI64を起動してみましたが
MERIKENsTripcodeFinderCUI: OPENCL FUNCTION FALL FAILED: CL_DEVICE_NOT_FOUND (file 'Source Files\MTF_CUI_Main.cpp', line 732)
と表示されてそこから進みません。

c++は門外漢でソースちらっと眺めただけですけど、プラットフォームが2個あって、最初の片方がCPUのみってところでなんかコケたりしてません?

585 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 20:47:49.07 ID:jethYJ0v0]
>>584
CPUは無視するようにしているので問題はありません。
32bit版のMERIKENsTripcodeFinderCUI.exeではどうですか?

586 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 20:51:41.93 ID:tLApF2aS0]
>>585
32bitでも同じエラーです。

587 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 21:06:57.97 ID:jethYJ0v0]
う〜ん、やっぱりCL_DEVICE_NOT_FOUNDが返されているのかなあ。
うちのIntelのドライバではエラーは出なかったんですが…
これから修正して新しい開発版をうpするので、そちらを試してみてください。

588 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 21:57:58.95 ID:jethYJ0v0]
>>580で報告していただいた、環境によっては起動できないバグを修正した
開発版をうpしました。というか、これで直っているといいんですけど…

MERIKEN's Tripcode Finder 0.07 Alpha 6
www.meriken2ch.com/programming/merikens-tripcode-finder

589 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/11(日) 22:02:50.51 ID:tLApF2aS0]
>>588
ありがとうございます。
起動できるようになりました。

590 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 22:08:25.91 ID:jethYJ0v0]
>>589
それはよかった! こちらこそバグ報告をありがとうございました。



591 名前: ◆MERIKEN4.k mailto:sage [2012/11/11(日) 22:12:41.07 ID:jethYJ0v0]
もうそろそろ安定してきたと思って10桁トリップ検索の移植の作業を
始めてたんですけど、まだ結構不具合が残っていますねえ。

592 名前: ◆GTX680Mcys3u mailto:sage [2012/11/12(月) 06:26:56.37 ID:2Urt7HcK0]
>>588
全グラフィックチップ(680M+iHD4000)指定だと
検索開始後エラーメッセージなしでソフトごと落ちます
HD4000はバッサリ切った方がいいかと思われます

593 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 07:13:21.49 ID:x4jnfC130]
>>592
ありゃりゃ… こりゃいかんですねえ。テスト用には便利だったんですけど
しょうがないですね。次の開発版からは無視するようにします。

594 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 07:34:25.71 ID:x4jnfC130]
というわけで面倒くさいのでIntelのプラットフォームは最初から無視することに
しちゃいました。OpenCLはオープンスタンダードな分だけそれに伴う
問題も多いですね。

595 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 08:51:49.76 ID:x4jnfC130]
気を取り直して10桁トリップ検索の移植作業を続けます。
CPU側のコードは10桁の場合とほとんど同じなのですぐに終わりました。
問題はOpenCLのコードですが、バグが紛れ込むと見つけるのが
非常に困難になるので、慎重に作業を進めてます。

596 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 10:00:14.78 ID:x4jnfC130]
カーネルの入り口の部分の書き換えは終了しました。
あとはBitslice DESの本体だけですが、CUDAのコードをコピペするだけなので
問題はないでしょう。うまく動いてくれるといいんだけど、どうでしょうね〜

597 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 10:29:57.20 ID:FaMyVn9Z0]
geforceでopenCL版って動くの?
動いてもcudaよりは遅い?

598 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 13:13:54.13 ID:x4jnfC130]
>>597
いまはNVIDIAのカードでは強制的にCUDAを使うようにしています。
OpenCLでも動くことは動くと思いますけど、基本的に全く同じコードなので
速度は変わらないでしょう。

599 名前: ◆MERIKEN4.k mailto:sage [2012/11/12(月) 13:27:00.53 ID:x4jnfC130]
OpenCLの10桁検索のコードは1発で動いたんですけど、Bitslice DESで使う変数を
何も考えずに全部__privateメモリ空間に突っ込んだら、案の定というか
まったく速度が出ていませんw まあでもコードの書き換え自体は問題なかったよう
なので、とりあえず一安心です。これから__globalと__localを試してみます。

600 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:31:46.97 ID:ClnWJME80]
khronosの姿勢として標準のカーネルコンパイラを用意しないのはわかるんだけど
やっぱりglslの轍をちょっとは生かしてほしかったってのが個人的な思い
meriken氏乙



601 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:37:18.53 ID:/PHpLzn40]
>>594
当方では一応4M/sぐらいで動くので、
IntelHD4000を使うか否かをチェックボックスとかで決めればいいと思いまーす

602 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 13:56:47.61 ID:FaMyVn9Z0]
>>598
そうなんだ
ありがとう

603 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 21:58:25.06 ID:+66fUhHT0]
OpenCLで盛り上がっているところにCPUのみの結果を報告。

【GPU】Quadro FX 3800
【CPU】Xeon X5680@3.33GHz x2CPU
【OS】MS Windows 7 Pro 64bit
【バージョン】0.07 Alpha 3 CUI64
【トリップの種類】12桁
【Display Driver】307.32

【その他】HT on
【その他のオプション】-c -t 24
【60時間の平均速度】80.51M TPS

【その他】HT off
【その他のオプション】-c -t 12
【2時間の平均速度】79.04M TPS

CPUだけで実行してもHTは殆ど効きません。NehalemとSandy Bridgeでは全然違うのかな?
ちなみにHT on の状態で、"-c -t 12"と指定すると、2CPU12コアに割り当てられずに、1CPU6コア12スレッドに割り当てられてスピードが出ません。

604 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 21:59:57.08 ID:+66fUhHT0]
Alpha 6に上げて再度実行してみましたが、NVIDIAコントロールパネルの"3D設定"→"3D設定の管理"で"CUDA-GPU"を"なし"に設定すると、CUI64で"-c"オプションをつけても下記エラーが出て落ちます。
MERIKENsTripcodeFinderCUI: OPENCL FUNCTION FALL FAILED: Unknown (file 'Source Files\MTF_CUI_Main.cpp', line 715)

605 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 23:26:48.48 ID:ODHrB/Fw0]
NVIDIA,第2世代Kepler「GK110」搭載の「Tesla K20」を正式発表。CUDA Core数は最大2688基に
www.4gamer.net/games/121/G012181/20121110004/

606 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/12(月) 23:34:15.80 ID:cklfqCrp0]
X5680はOCすりゃいいじゃん

607 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 02:39:21.60 ID:FPgsAJYQ0]
DualCPUにQuadro突っ込んでるようなガチWS機でOCとかあり得んでしょ

608 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 02:50:45.59 ID:l+bGYcyn0]
倍率ロックフリーだろ?

609 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:21:00.78 ID:FpPqufE20]
今気づいたんですけど「1CUあたりのワークグループの数」じゃなくて
「1CUあたりのワークアイテムの数」ですね、これ。
こりゃ当分の間安定版は出せないな…

610 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:26:29.04 ID:FpPqufE20]
>>603-604
報告ありがとうございます。CPU検索ももうちょっと何とかしたいですね〜
"Unknown"のエラーが出ているのは謎ですが、そこのエラーは無視するように
直しておきます。



611 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 06:38:08.95 ID:FpPqufE20]
予想通りというべきか、10桁トリップ検索はなかなかスピードが出てくれません。
まじめにプロファイラを使わないと駄目ですね、こりゃ。
まあCUDAのときもそうだったので、のんびり時間をかけて取り組むことにします。

612 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 07:26:06.97 ID:FpPqufE20]
>>605
GK110も試してみたいんですけどね〜
Amazon Cluster GPU Instancesで使えるようにならないかしらん。

613 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 09:29:27.60 ID:FpPqufE20]
Bitslice DES用の一時変数をどのメモリ空間に置けばいいのかいまいち
よくわからないので、とりあえず#ifdefで切り替えられるようにしておきます。
あと、一回のBitslice DESを複数のスレッドで同時に処理するかどうかも
CPU側で設定できるようにする予定です。こういうところは実行時にカーネルを
ビルドできるOpenCLはいいですねえ。

614 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 09:34:06.33 ID:ATY55mX00]
【GPU】HD7970 CFX 2GUPs
【CPU】FX-8350
【OS】Win7 64bit
【バージョン】MERIKEN's Tripcode Finder 0.07 Alpha 6
【トリップの種類】12桁
【1CUあたりのワークグループの数】5120
【1WGあたりのワークアイテムの数】40
【その他のオプション】-c -g -t 6 -a 8 (-aオプションは有効なのか?)
【Display Driver】Catalyst 12.10
【10分間の平均速度】2614.21tripcodes/s
【GPUの平均速度】2575.40tripcodes/s
【CPUの平均速度】38.31tripcodes/s
【GPU使用率】95%
【その他】7完1タゲ

いろいろ調整したら瞬間最大風速では3000M程度出るようにはなりました
ラデはCPU負荷高いですね
フルにCPU8スレッドで回すと却って速度が出ないです
CPU単体でなら50M程出るんですが

それと、CFXの有効無効では速度は変わらないですよ

www.rupan.net/uploader/download/1352766539.png

615 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 14:32:35.77 ID:1xHvqvP20]
ついにデュアルTahitiカードがAMDから登場。エーキューブ,サーバー向けグラフィックスカード「FirePro S10000」を国内発売
www.4gamer.net/games/133/G013322/20121113023/

616 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 14:34:05.53 ID:1xHvqvP20]
XeonPhiってどうなんですかねえ

617 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 15:01:20.15 ID:PlVYlKIA0]
負荷で思い出したけど、同じGPU使用率でもmtyのGPU版は95℃までいくけどMERIKENは89℃までしか上がらないね。

618 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 17:19:59.24 ID:VU2bD6Zz0]
>>615
サーバ向けのFireProだし、3599ドルらしい。

>>616
OpenMPが使えて既存アプリの移植が楽らしいけど、既にOpenCLになっている場合はメリット薄そう。

619 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:10:11.95 ID:FpPqufE20]
>>614
なかなか良い感じに仕上がってますね。それだけOCした7970なら単体で1500M TPS近く
いくはずなので、単純に2枚で2倍の速度という訳にはいかないみたいですが…
Alpha 6では-aオプションは有効なはずです。CFXの話は別のところで見かけたんですが、
関係無かったみたいですね。

620 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:22:18.89 ID:FpPqufE20]
>>617
Bitslice DESはSHA-1の処理に比べてメモリへのアクセスの量が段違いですからねえ。



621 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:30:43.61 ID:FpPqufE20]
>>615
いいですね〜 いつかこういうのをたくさんラックマウントサーバーに乗っけて
Tripcode Finderを動かしてみたいですw

622 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 19:59:41.68 ID:FpPqufE20]
Southern Islandsだとコンスタントメモリは場合によってはグローバルメモリと
同じぐらい遅くなるそうで…こりゃCUDAと同じコードじゃ遅くなるわけだわ。
頻繁に使うのは最初にローカルメモリに移しておいたほうがいいな。

> 3. Varying Index
> More sophisticated addressing patterns, including the case where each work- item
> accesses different indices, are not hardware accelerated and deliver the same
> performance as a global memory read.

623 名前: ◆MERIKEN4.k mailto:sage [2012/11/13(火) 20:10:06.56 ID:FpPqufE20]
あとローカルメモリにアクセスする際はuint2を使うといいみたいです。

> Currently, the native format of LDS is a 32-bit word. The theoretical
> LDS peak bandwidth is achieved when each thread operates on a
> two-vector of 32-bit words (16 threads per clock operate on 32 banks).

vector data typesの使い方はここに書いてありました。

Programming with OpenCL C
www.informit.com/articles/article.aspx?p=1732873&seqNum=3

624 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 20:28:02.76 ID:ES3128Qj0]
>>614
壁紙についてkwsk
MERIKENさんの公式記録が越される日も近いか……

625 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 23:12:02.50 ID:ATY55mX00]
>>624
この辺で拾ってます
これがいつのものだったかは忘れましたw

www.smashingmagazine.com/tag/wallpapers/

626 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/13(火) 23:43:31.28 ID:ES3128Qj0]
>>625
そのまま2012/11の記事を見ても出てこないorz
www.smashingmagazine.com/2012/10/31/desktop-wallpaper-calendar-november-2012/
よろしければ画像アップローダに上げてくれませんか?

627 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 00:24:53.55 ID:mDY3eRDW0]
>>624
それはどうでしょうね… ( ̄ー ̄)ニヤリ

628 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:35:11.76 ID:E/rQ2cMp0]
>>626
ほい

www.rupan.net/uploader/download/1352820886.jpg

629 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:38:28.17 ID:eHqSRvz80]
>>621
どうせならHD7970 X2に行きませんか?
消費電力が凄まじいのと、スロット占有が問題ですけどw
なんかリンクが貼れないので詳細は検索してください

デスクトップ向けにHD7950のデュアルが出てくれれば一番ですけどね。
HD7950のCFはグラフィックでも割りと良いというレビューもあったので、需要もある程度ありそうですし。

630 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 00:50:05.56 ID:eHqSRvz80]
>>622-623
OpenCLは以前よりは情報も増えたようですが、まだ茨の道なのでしょうかね・・・



631 名前:626 mailto:sage [2012/11/14(水) 01:34:12.64 ID:vuLXlPiG0]
>>628
ありがとうございます!

632 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:39:17.60 ID:mDY3eRDW0]
>>630
>>622-623はJohn the Ripperのメーリングリストを見てて気づきました。

www.openwall.com/lists/john-dev/2012/08/13/8
www.openwall.com/lists/john-dev/2012/09/10/5

このAlexanderという方はJohn the RipperとBitslice DESの偉い人です。
流石です。

www.openwall.com/lists/john-users/2011/06/22/1

633 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:40:56.22 ID:mDY3eRDW0]
>>630
まあGPGPUの不条理な制約にはCUDAで慣れっこになっているので
どうということはありませんw

634 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 01:45:30.91 ID:mDY3eRDW0]
>>629
うちの検索用マシンにはGTX 580が2枚と590が1枚載っているので、
7970 2枚は余裕ですw 今590を売っぱらって6990を買おうかどうか
考えているところです。

635 名前: ◆supernova.rT mailto:sage [2012/11/14(水) 02:04:56.65 ID:Bf0HEkX10 BE:1020114162-DIA(123421)]
僕はもうラデ2枚構成にしたのでゲフォ売ります
10桁検索対応が楽しみですよー

636 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 02:16:09.00 ID:eHqSRvz80]
>>633
頼もしいです、頑張ってください。

>>634
HD7970を1ボードに2基載せたもので8ピンx3で3スロット占有という
モンスターというかクレイジーな代物が出るらしいですw
それの複数枚挿しは電源だけでなくマザボもかなり選びそうです。

HD7950のデュアルで8ピンx2で2スロットであればまだマシなのですけどねえ。

637 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 03:47:50.59 ID:peEcrqnb0]
やっぱりさよならゲフォの流れになったね

638 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 06:49:17.05 ID:AbSbupmCP]
RADEONは普及用チップでも倍精度が高速なのがいい

639 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 07:58:59.38 ID:vuLXlPiG0]
mtyGPUがRadeonしか対応してないから、むしろゲフォ対応検索は(10桁では)貴重なんだが

640 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 13:24:08.27 ID:85Ooiiep0]
>>638
マジレスすると倍精度演算が速いのは7970だけだしトリップ検索に倍精度演算の出番は無いぞ



641 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 14:42:36.69 ID:mDY3eRDW0]
>>635
10桁トリップ検索は12桁よりかなり難しいので、実際どこまで速度を出せるかは
わかりませんけどね〜 というか12桁検索の移植は正直うまくいきすぎでしたw
地道に取り組む予定なので、のんびり待っていて下さい。

642 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 15:16:17.63 ID:mDY3eRDW0]
で、あれから色々試してみて、Bitslice DES用の一時変数はローカルメモリに
おかないと全く速度が出ないことが分かりました。ローカルメモリは
ワークグループ内で共有されるので、Bitslice DESを8個のスレッドで
並列処理するように書き換えてやりました。

その後、さらに性能を上げるためにAMD APP Profilerで解析してみました。
あんまり期待してなかったwのですが、非常に使いやすいです。
で、気になっていたOccupancy Analysisを行なってみたら、
案の定ローカルメモリ(LDS)の使い過ぎであることが判明しました。

www.meriken2ch.com/files/2012-11-13-AMD-APP-profiler.jpg

643 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 15:31:41.20 ID:AbSbupmCP]
>>642
へぇ〜
人目でボトルネックがLDSにあることが示されてる
凄いな

644 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 15:51:16.97 ID:mDY3eRDW0]
同じ問題はCUDA版でも起きていたので思わず頭を抱えてしまったのですが、
ソースを眺めていたら解決方法を思いつきました。Bitslice DESの
一時変数は次の構造体にまとめられています。

> typedef struct {
> DES_Vector keys[56]; // 224 bytes
> DES_Vector dataBlocks[64]; // 256 bytes
> unsigned int dummy[1];
> } DESContext;

で、56bitのDESのキーが32個keys[]に収められているのですが、
これらのキーは実際にはほとんど同じです。
というわけで、キーの生成の方法を工夫してやれば、32個のキーの共通部分
51bitだけを保持して、残りは5bitのインデックス(0〜31)から生成して
やればいいことに気づきました。

645 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 16:01:44.57 ID:mDY3eRDW0]
これで使用するメモリの量は半分近くに減って、うまくいけば
CUDA版ともども10桁検索の速度が倍になることになります。
アルゴリズムはかなり複雑になりますが、試してみる価値は十分にあります。
hip2の話を聞いて、キーの生成方法にかなりの工夫の余地があることに
気づいたのは僥倖でしたw

646 名前: ◆MERIKEN4.k mailto:sage [2012/11/14(水) 16:04:10.35 ID:mDY3eRDW0]
>>643
実際かなり便利です。CUDAのときはなんせExcelのスプレッドシートを
使わないとOccupancyのグラフが見れませんでしたからねw

647 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 19:07:46.29 ID:vuLXlPiG0]
>>645
>速度が倍
うおおおおお!?頑張って下さい!

648 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/14(水) 19:20:22.61 ID:dspeEFEK0]
GTX670では470Mt/sくらいしか出ません。倍精度を使うわけでもないのになんでだろう。

649 名前:前スレ927 ◆JouJaku.HzIz mailto:sage [2012/11/14(水) 20:16:05.54 ID:HHBBdob70]
ゲフォはさよならですかそうですか。
GTX480が何とか復活したので速度計測。

【GPU】GeForce GTX 480
【CPU】Xeon X5680@3.33GHz x2CPU
【OS】Win7Pro 64 SP1
【バージョン】0.07a6 CUI64
【トリップの種類】12桁
【1CUあたりのワークグループの数】N/A
【1WGあたりのワークアイテムの数】N/A
【その他のオプション】-c -g -x 128
【Display Driver】306.97
【10分間の平均速度】648.27M TPS
【GPUの平均速度】578.39M TPS
【CPUの平均速度】69.89M TPS
【GPU使用率】100%
【その他】"TEST/", HT off, GPU 92℃

Quadroをぶっちぎっているのですが・・・うるさい。とにかくうるさい。
常用は無理です。

650 名前:名無しさん@お腹いっぱい。 mailto:sage [2012/11/15(木) 00:03:05.86 ID:Gr7998EA0]
>>642
これは便利そうですね。

>>644
DESは歴史もあり奥が深いですね。

>>648
レジスタ数がネックになって演算ユニットを使いきれていないのだと思います。



651 名前:648 mailto:sage [2012/11/15(木) 02:21:08.90 ID:aNTlQCIF0]
レジスタの仕様が違うのか。最適化しなおさないといけないわけね。

652 名前: ◆MERIKEN4.k mailto:sage [2012/11/15(木) 03:09:09.94 ID:dQ9rq2KX0]
>>648
>>651
トリップ検索の速度は整数演算の性能に大きく影響されるんですけど、
GTX 600シリーズで使われているKeplerコアは残念ながら整数演算が
かなり遅いのです。この点は次の記事の「命令別スループット」の
項目で詳しく解説されています。

GTX680のグラフィック・GPGPU性能を調べる ≪ dokumaru
dokumaru.wordpress.com/2012/03/27/gtx680-spec/

Keplerではゲームで使われる単精度演算以外はほとんど無視して
性能を稼いでいるので、GPGPU的にはかなり残念なことになっています。






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](;´∀`)<321KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef