【トリップ検索】MERIKEN's Tripcode Finder その5

[表示 : 全て最新50 1-99 101- 201- 301- 401- 2chのread.cgiへ]
Update time : 10/14 09:31 / Filesize : 149 KB / Number-of Response : 411
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前： ◆Meriken//XXX [2013/09/15(日) 12:32:11.22 ID:yp7r3EBt0]: こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。

Meriken's Tripcode Finderは2013年8月現在で最速の12桁トリップ検索ツールです
(最高速の記録は11112.48M tripcodes/s)。CUDA対応のNVIDIAのビデオカード、
もしくはHD 5xxx以降のAMD Radeonシリーズのビデオカード等のOpenCL対応デバイスを
使用すれば非常に高速に検索を行うことができます。特徴は以下の通りです。

・ビデオカードのGPUによる超高速検索。
・CPUによる高速検索。
・GUIとCUIの両方に対応した柔軟なユーザーインターフェース。
・強力な正規表現による検索パターンの指定。
・漢字等のShift-JIS文字を含むキーの探索。
・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。
・検索パターンの数の制限の撤廃。
・10桁トリップ検索への対応。
・検索速度の実行時の最適化。
・配布パッケージに同梱された検索ルーチンのソースコード。

■入手先
◆MERIKEN4.kのウェブサイト
www.meriken2ch.com/programming/merikens-tripcode-finder

■前スレ
【トリップ検索】MERIKEN's Tripcode Finder その4
anago.2ch.net/test/read.cgi/software/1373110438/
131 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/24(火) 12:09:59.10 ID:aK0ZMOZo0]: Yggdrasilで検索中のPC一覧で見ることの出来る「名前」の項目のデータは編集できますか？
132 名前：94 mailto:sage [2013/09/24(火) 12:11:45.67 ID:XhDzCs6d0]: お疲れ様です
>>126を試してみました
条件は>>94です

【10分間の平均速度】 370.88M tripcode/s
【GPU検索の平均速度】 340.61M tripcode/s
【CPU検索の平均速度】 30.27M tripcode/s

診断ではCPUの効率向上
実測でもCPU24.54→27.47Mt/sという結果でした
133 名前： ◆Meriken//XXX [2013/09/24(火) 12:29:58.12 ID:SuYpLKhoP]: >>132
ｷﾀ━━━━(ﾟ∀ﾟ)━━━━!! やっぱりmovapsが原因だったんですね。

他のCPUだとSSE2でmovapsを使ったほうが速いのに、
Nehalemだけmovdqaを使ったほうが速いようです。
こんなの普通わからないっちゅうねん。
なんにせよ助かりました。次の開発版に取り込んでおきます。
134 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 13:55:53.22 ID:yDbtGzZA0]: >>126でα5からの性能向上を確認
Before
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5
【10分間のCPU検索の平均速度】 84.98M tripcode/s
After
【Meriken's Tripcode Finderのバージョン】>>126 のNehalem用
【10分間のCPU検索の平均速度】 97.66M tripcode/s
135 名前： ◆Meriken//XXX [2013/09/24(火) 14:22:53.52 ID:SuYpLKhoP]: >>131
MTFの「分散処理」タグで編集できますよ。次からはゆぐちゃんスレでお願いします。

【分散トリップ検索】Meriken's Tripcode Yggdrasil
(p)toro.2ch.net/test/read.cgi/esite/1379214816/
136 名前： ◆Meriken//XXX [2013/09/24(火) 14:24:13.91 ID:SuYpLKhoP]: >>134
ありがとうございます。ようやくこれで安心して寝られますｗ
137 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/24(火) 15:36:32.45 ID:hElffOfN0]: 電気料金の関係で当分稼働できそうにない…
すみません…
138 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 16:26:07.84 ID:yDbtGzZA0]: On some (but not all) micro-architectures, there are timing differences due to "domain crossing penalties".
For this reason, one should generally use movdqa when the data is being used with integer SSE instructions,
and movaps when the data is being used with floating-point
instructions. For more information on this subject,
consult the Intel Optimization Manual,
or Agner Fog's excellent microarchitecture guide.
Note that these delays are most often associated with register-register moves instead of loads or stores.

だそうな、integerだったらmovqdnなんだと。マニアックすぐるw
139 名前： ◆Meriken//XXX [2013/09/24(火) 16:37:03.17 ID:SuYpLKhoP]: >>138
ところがNehalem以外だとintegerでもmovapsのほうが
movdqaよりも速いんですよねえ…
VC++ 2010はマニュアル通りにmovdqaを使ってましたけど、
それだとうまくいかないようです。
140 名前： ◆Meriken//XXX [2013/09/24(火) 16:39:21.48 ID:SuYpLKhoP]: >>137
電気料金は大きな壁ですよねえ…
今までお疲れ様でした。またいつでもお越しください。
141 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/24(火) 19:22:40.85 ID:HJd6RTmw0]: >>139
何となくですが、
2chnull.info/r/jisaku/1326108518/338-354
これの347辺りからの話が、ヒントになりそうな？
これ以上は、各アーキ毎の最適化マニュアルの比較と、
マイクロアーキテクチャ自体の変更情報を全部追わないと、どこがネックになってるのかは
分からない気がするｗ

ちなみに>>107の環境で>>126を回した結果
【10分間のCPU検索の平均速度】 146.58M tripcode/s

あれ・・・あまり変わってない・・・なんでだろ。
142 名前： ◆Meriken//XXX [2013/09/25(水) 15:05:37.51 ID:Q0OWgfvvP]: >>141
> これ以上は、各アーキ毎の最適化マニュアルの比較と、
> マイクロアーキテクチャ自体の変更情報を全部追わないと、
> どこがネックになってるのかは分からない気がするｗ

リンク先の話は非常に興味深いですねえ。なかなか奥が深いです。

> あれ・・・あまり変わってない・・・なんでだろ。

同じNehalem系でもGulftown(Westmere-EP)は違うのかな?
難しすぎですねｗ
143 名前： ◆Meriken//XXX [2013/09/25(水) 16:18:00.34 ID:Q0OWgfvvP]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 7
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 6からの主な変更点は以下の通りです。

・Nehalem系のCPUでの12桁トリップのCPU検索の高速化。
・10桁トリップのCPU検索の高速化。

>>126の成果を取り込んだついでに、10桁トリップ検索でもmovapsを使うように
しました。AVXに対応していない、Nehalem系以外のCPUでは、10桁トリップの
CPU検索は少し速くなっているはずです。
前のバージョンとの速度の比較を報告していただけると助かりますです。
144 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/25(水) 16:21:29.38 ID:HNdGVGJA0]: >>143は私(x64+SSE2/AVX、Ivy Bridge)でも10桁が高速化するのでしょうか？
145 名前： ◆Meriken//XXX [2013/09/25(水) 16:23:53.73 ID:Q0OWgfvvP]: この週末に彼女が日本から遊びに来るので、開発はしばらくお休みです。
次の更新はHaswell購入後のAVX2対応になる予定です。
146 名前： ◆Meriken//XXX [2013/09/25(水) 16:26:41.10 ID:Q0OWgfvvP]: >>144
Ivy BridgeはAVXに対応しているので今回は速くなりません。
AVX版はまた今度書きなおす予定です。
147 名前： ◆e7m8FSZy3U mailto:sage [2013/09/25(水) 19:34:02.12 ID:CggXwBge0]: /.Jから飛んできました。
ちょっと面白そうなのでしばらく回してるかもです・・・
148 名前： ◆e7m8FSZy3U mailto:sage [2013/09/25(水) 19:58:17.69 ID:CggXwBge0]: あぁこれって何か。分散のみに参加するって出来ないのね
それはつまらんなぁ。
149 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:04:12.63 ID:Q0OWgfvvP]: 9文字ぐらいの適当な長いパターンをローカルで1つだけ指定してやれば、
分散のみに参加しているのと変わりないですよ。
150 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:42:15.70 ID:Q0OWgfvvP]: Linux版を作っていた◆znjnB.IJwZLUさん、最近見かけないなあ。
忙しいのかしらん。AVXに最適化されたS-Boxをぜひ見せてもらいたかったんだけど、
自分でやったほうが早いのかな。

まあやることといったら全部レジスタで回すようにして、なるべく2バイトのVEX Prefixを
使うようにするだけだからなあ。でも言うのは簡単だけど、実際にやるのは大変そうだorz
151 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:56:27.53 ID:Q0OWgfvvP]: 定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。

mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS

大分速くなったけど、もうちょっといけそうなんだよなあ…
152 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:59:08.78 ID:Q0OWgfvvP]: 6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 22:23:57.84 ID:Q0OWgfvvP]: vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154 名前： ◆LoveNico9g mailto:sage [2013/09/26(木) 02:43:02.74 ID:sJOvmiPd0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】10桁
【キーに使用する文字】ASCII
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 11.49M tripcode/s -> 11.68M tripcode/s
【GPU検索の平均速度】 9.20M tripcode/s -> 9.24M tripcode/s
【CPU検索の平均速度】 2.29M tripcode/s -> 2.44M tripcode/s
155 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 04:07:26.63 ID:6FvOHAWcP]: >>154
報告有り難うございます。やっぱりちょこっとだけ速くなっていますね。
動的書き換えを行っているコードをいじるのに結構神経を使ったんですが、
6.5%の速度向上だから上出来なのかな?
156 名前： ◆HwAeH9HsBC.d mailto:sage [2013/09/26(木) 04:34:59.26 ID:b6mTXvYaP]: 中間ステートを利用したら受け渡し所がなくても2ch上だけで安全にキーの交換ができるのか

80文字くらいのキーのテスト
157 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 06:00:51.07 ID:6FvOHAWcP]: なかなか面白い発想ですけど、キーの一部が依頼ごとに違ってくると
複数の依頼を同時に検索することが出来ないので、ちと現実的ではないですねえ。
158 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 06:35:44.10 ID:b6mTXvYaP]: たしかに個人に依頼する場合はやっぱり一度に一人からの依頼しか処理できなくなりますが、Yggdrasilを使うなら大丈夫ですよね？
Yggdrasilに参加しながら自分の設定した文字列も検索する場合それの結果のキーまで64文字以上になっちゃいますが
あと自分のPCで発見した場合でもサーバから64文字を受け取らないといけなくなります

このときサーバが全クライアントに同じ64文字を使ってたら困るのは
サーバはクライアントごとにキーの最初の64文字を別のにして探索してもらえばよさそうです

あと依頼を1個解決した場合最初の64文字を切り替えないと次に他の依頼を解決したときに2人の別の人に同じ64文字が流出するので
依頼を解決するごとにサーバから新しい最初の64文字を受け取る必要があります

で、OpenCLの1回のワークのまとまりに全部同じ中間状態を最初に渡すことになりそうですが、
1回のワークで複数の依頼を解決しちゃった場合どれか1個しか使えなくなります（同じ最初の64文字が2人以上に使われることになるので）
これの解決法は思いつきませんでした
159 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 06:36:45.74 ID:b6mTXvYaP]: 最初の64文字を依頼人が指定するんじゃなくてYggdrasilがランダムに生成するって方式です
160 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:06:01.86 ID:6FvOHAWcP]: >>158
2ちゃんねる受け渡しを行うのはちょっと無理がありますが、ゆぐちゃんでは
ありでしょう。あ、あと私は最初に間違えてしまっていたのですが、
SHA-1のブロックの長さは64バイトですがメッセージの長さを格納するのに
8バイト必要なので、キーの長さは56文字が最適になります。

実装する際にはW[12]までの途中経過(A, B, C, D, E)を検索開始時に
クライアントに渡してやればいいだけです。最初の依頼を解決した時点で
検索をやり直すようにしてやればセキュリティ上の問題もないでしょう。
161 名前：累計 ◆wop.8OO8.qow mailto:sage [2013/09/26(木) 09:10:52.97 ID:BeI6EFic0]: 条件は>>99と変わらず、1.1FEα7のみ検索速度(1パターン)を診断

【10分間のNehalem系のCPU検索の平均速度(TPS)】

　　　1.1FEα7　 1.1FEα6 　1.1FEα5 　 1.1FEα4　 1.0.1(安定版)
---------------------------------------------------------
1)　　31.47M　　　31.89M　　　27.84M　　　30.51M　　　31.67M
2)　　31.49M　　　31.88M　　　27.80M　　　30.50M　　　31.77M
3)　　31.50M　　　31.97M　　　27.69M　　　30.58M　　　31.67M
4)　　31.48M　　　31.88M　　　27.85M　　　30.54M　　　31.68M
5)　　31.51M　　　31.89M　　　27.83M　　　30.54M　　　31.64M
162 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:28:13.49 ID:6FvOHAWcP]: >>161
Nehalem系でも新しいルーチンの効果に結構差がでますね。
1.0.1に比べて微減なのでまあここらへんが落とし所ですね。
報告していただいて本当に助かりました。
163 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:34:36.24 ID:6FvOHAWcP]: VEX Prefixの謎はstackoverflowで怒られながらヒントを貰って
ある程度解決することが出来ました。

Which AVX registers should I use to avoid 3-byte VEX prefixes?
stackoverflow.com/questions/19016174

なるべくソースオペランドにxmm0～xmm7を使ってやればいいようですが、
それだけではないみたいですね…

----

176 %line 611+1 Source Files\CPU10_x64_AVX.asm
177 000000F0 C5F96FFC vmovdqa xmm7, xmm4
178 %line 611+0 Source Files\CPU10_x64_AVX.asm
179 000000F4 C5D9DFE0 vpandn xmm4, xmm0
180 000000F8 C551EBD2 vpor xmm10, xmm5, xmm2
181 000000FC C569EFE8 vpxor xmm13, xmm2, xmm0
182 00000100 C551EFDF vpxor xmm11, xmm5, xmm7
183 00000104 C559EFF3 vpxor xmm14, xmm4, xmm3
184 00000108 C44111DFE3 vpandn xmm12, xmm13, xmm11
185 0000010D C44111DBEA vpand xmm13, xmm10
186 00000112 C521EFFA vpxor xmm15, xmm11, xmm2
187 00000116 C511EFC3 vpxor xmm8, xmm13, xmm3
188 0000011A C44109DFC8 vpandn xmm9, xmm14, xmm8
189 0000011F C511EBED vpor xmm13, xmm5
190 00000123 C5D1EBE8 vpor xmm5, xmm0
191 00000127 C539DFC7 vpandn xmm8, xmm7
192 0000012B C44101DFFE vpandn xmm15, xmm14
193 00000130 C44111EFEF vpxor xmm13, xmm15
194 00000135 C4C151EBF5 vpor xmm6, xmm5, xmm13
195 0000013A C5D1DFEB vpandn xmm5, xmm3
164 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/26(木) 09:42:28.26 ID:rTRwfDJk0]: コードの動的書き換えまでやってるんだ。頑張るなぁ
165 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 10:03:07.79 ID:6FvOHAWcP]: >>164
速くするためにできることは全部やるつもりですｗ
10桁トリップのCPU検索だと2～3M TPS違ってくるので、かなり大きいです。
166 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 10:21:16.12 ID:6FvOHAWcP]: 3オペランドの命令を2-byte VEX Prefixになるように
書き換えたら遅くなったぞ。なぜだ…
167 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 11:03:10.06 ID:6FvOHAWcP]: うーん、やっぱりわからん…
まあいいや、また今度にしよっと。
168 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 12:42:38.98 ID:6FvOHAWcP]: 290Xが噂通りの性能なら、検索君1号の6990をリプレースしたいところですが、
どうなんでしょうねえ～

AMD，新世代GPUシリーズ「Radeon R9」「Radeon R7」を発表
www.4gamer.net/games/234/G023455/20130926001/
169 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/26(木) 21:45:53.97 ID:dy4WW+LZ0]: >>168
絶対に値段がヤバそう、かと思いましたがそれほどでもないのかな＞R9 280X(のメーカー想定売価)は299ドル
170 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 22:52:10.88 ID:K0nbDP0R0]: AMDがMantleとかいう新しいLow Level APIも発表したが
使えるのグラフィック用途だけなのかな
171 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/26(木) 23:28:01.94 ID:6DsB6fP10]: >>151
お久しぶりです。
日々の仕事をこなしつつトリップ検索のための正規表現エンジンのためのJITコンパイラを作るという作業にエタってました。

DESのS-Boxですがmovdqaが２個あるくらいなら速度差は出ないでしょう。
AVXでターゲットをSandy以降とする場合、ベクタ整数Logicは3op/cycleです。
従って速度を稼ぐには常に3命令を供給できるようにコードを書かなければなりません。
命令フェッチが16Byte/cycle、デコードが4op/cycleなので2ByteVEX（レジスタ間で4Byte）、3ByteVEX（レジスタ間で5Byte）
のどちらでも達成可能ですし、数個のメモリオペレーションはOoOのキューで隠蔽されます。
ただし、メモリオペレーションを含む場合はLodeポートが2本、Storeポートが１本で命令長が多くの場合4Byteほど長くなることを意識する必要があります。
これはメモリオペレーションを含む論理演算は2ByteVEXの場合で2op/cycle、3ByteVEXの場合は1op/cycleしか命令を供給できないということですので、
間にレジスタ間演算を入れて供給命令数を維持するかループにしてuOPキャッシュを当て込むか、そういうものだと諦めるかしなければなりません。

2ByteVEXにすること自体は簡単で、VEX prefixのフォーマットを見るとわかりますが
AVXop　dist，src1，src2
という場合src2をxmm0～xmm7に制限するだけです。
distとsrc1にはxmm0～xmm15までの全てのレジスタを指定可能です。
まあ、レジスタ割付は面倒になります。
172 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:05:59.70 ID:8wnFvcpWP]: >>171
なるほど、そういう頭が必要なんですね。道理でなかなか速くならなかったわけだ。
実に勉強になりますです。

> 日々の仕事をこなしつつトリップ検索のための正規表現エンジンのための
> JITコンパイラを作るという作業にエタってました。

MTFの正規表現のルーチンもC#で綺麗に書きなおそうと考えてたんですけど、
この発想は斬新ですねｗ流石です。
173 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:11:08.04 ID:8wnFvcpWP]: >>170
Mantleからだと直接GCNを叩けるみたいですね。
オープンソースになるという噂もあるみたいです。
GCNは性能的に化物としか言い様がないので、ｗｋｔｋが止まらないですｗ
174 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/27(金) 01:17:32.97 ID:lkqItC0o0]: >>172
maleで拙作のavxDESを送ったので時間があれば見てみてください。
あまり参考にならないかもしれませんが
175 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/27(金) 01:18:39.25 ID:lkqItC0o0]: >>174
トリわすれてました
176 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:42:29.83 ID:8wnFvcpWP]: >>174-175
わざわざ有り難うございます。さっきまで送っていただいた
S-BoxをMTFに実際に組み込んで動かしていたんですが、確かに速くなっていますね。
素晴らしい出来です。
177 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/27(金) 01:59:44.23 ID:3xFrfLPD0]: 　｀¨ －　､　　　　　＿_　　　　　 _,. -‐' ¨´
　　　　　　| ｀Tｰて＿,＿｀　`ー<^ヽ
Meriken　.|　 !　　　　　　｀ヽ　　ヽヽ znjnB
　　　　　 r　/　　　　　　ヽ　ヽ　　_Lj
　､　　　 /´ ＼　　　　＼　＼_j／ヽ
　　｀ー　　　ヽｲ⌒r-､ヽヽ__j´　　　｀¨´
　　　　　　　　　￣ー┴'^´
178 名前：名無しさん＠お腹いっぱい。 [2013/09/27(金) 02:20:44.90 ID:0ZtIGcs50]: maleで送ったとか・・・

ｱｯｰ!!!
179 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/27(金) 02:35:31.94 ID:lkqItC0o0]: >>176
何の説明もなく失礼しました。
cryptのつくりが全く違うのにすんなり対応されて流石です。

拙作ではS-Boxの最適化は>>171で述べた通りですが、cryptに関しては
キャッシュの最適化を目論んだつくりになっています。
MTFではkey[56]をexpandedKeySchedule[0x300]に展開していますが、
expandedKeySchedule[0x300]で12kBのL1Dキャッシュを占有します。
これはハイパースレッディングで2スレッド走らせる場合、L2キャッシュへのアクセスが生じると
大きなペナルティになりえます。
それでなくても12kB分のstoreはコストが高いのです。
というわけでkeySchedulは命令のほうに展開しています。

最終転置とblock初期化もcrypt関数内に隠蔽してあります。
従ってcrypt関数にはblock[64]をわたして、帰ってきたのをそのまま使えます。

saltはMTFと同じ手法で0x7FFFFFFFがシグネチャになっているのでここを変えればそのまま使えると思います。

>>187
mailだった
180 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 06:52:13.34 ID:8wnFvcpWP]: >>179
> これはハイパースレッディングで2スレッド走らせる場合、
> L2キャッシュへのアクセスが生じると大きなペナルティになりえます。

ああなるほど、それでL1Dキャッシュが潰れて遅くなっていたんですね。
前スレでスレッドの数ごとに速度の比較を行われていたのにも合点がいきました。

KSを命令のほうで展開するやり方はOpenCL版では使っていたんですが、
CPUでは試していませんでした。ただ、STFの展開の仕方は随分独特で
スッキリしているように見えます。できることはまだまだたくさんありますねえ。
明日から1週間ほど家を空けるので、AVX2版の実装と一緒に試してみます。
いや～、楽しみだなあ。
181 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/09/28(土) 19:26:50.26 ID:3+QdwiIO0]: よくわかっていないのですが、MTFでの検索パターンとのマッチング処理ってどういう風になっているのかな
１トリップ生成する毎にマッチング処理ですか？
182 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 19:57:56.89 ID:puciZRd6P]: MERIKENさんの彼女って美人さんかな
183 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 20:29:14.46 ID:Er9GkfO70]: 400年生きてるけど容姿は14歳くらいの
押しかけ女房という設定でよろしくお願いします
184 名前： ◆AAAAAIgElTYM mailto:sage [2013/09/29(日) 21:09:53.00 ID:puciZRd6P]: MERIKENさんのOpenCLのカーネルを参考に作ったら

MTFで900MHash/s出るGPUで590MHash/s出せた

900M目指す
185 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:30:42.42 ID:puciZRd6P]: と思ったら900Mは簡単に出せた

ただしキーの判定がA,B,C,D,EのAが0かどうか、だけですが
186 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:32:17.66 ID:puciZRd6P]: MERIKENさんのカーネルすごいなー
187 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:33:58.75 ID:UQDnvd/B0]: >>183
ロリババアじゃねえか……最高だな
188 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 09:12:18.65 ID:c9bt88M30]: 質問です
自分が見つけたトリップのキーが既に割れているかどうか調べる方法ってあります?
トリップでググってみたけど出てこなかった

◆WWmMMmWmmM
◆mmmmMMWmmM
189 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 12:12:15.95 ID:RmatBROi0]: ぐぐって出てこないなら割れてないんじゃないかな
キーが割れてるか調べるならキーでぐぐれば良いかと
別キー同トリは酉でぐぐってみるしかないですねぇ

あとはデータベース調べるくらい？
ttp://trip2ch.net/
190 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/02(水) 12:29:57.48 ID:rovLnW6/0]: 例の流出騒動で割れた(けどネット上でまだ使われていない)人もいるしなぁ……
俺のように
191 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 12:38:17.05 ID:HrAyM4RZ0]: 自分が見つけた、ということなので未使用前提のレスなのら
自分が使ってないなら誰かが先に見つけて、晒したり使用したりしていない限り
割れていることはないからね
192 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/02(水) 13:54:06.66 ID:V6M1LhCI0]: 別キー同トリって、ハッシュの衝突ということだよね？
SHA-1ってそんなに衝突起きてたっけ？
193 名前： ◆MONEY///WQoK mailto:sage [2013/10/02(水) 13:58:55.21 ID:c9bt88M30]: >>189-191
個人で使うこんな感じで↑一般的なものなら神経質にはなりませんが、
最長や最短のように変わったトリップは他にも使っている可能性もあるので、
調べてみようと思いました
データベースとグーグルを活用したいと思います

ありがとうです　m(_　_)m

12Mt/s程度のPCには8完9完はきついです
見つかる気がしませんw
194 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 14:06:57.14 ID:ntU3OB+00]: >>193
8完程度なら他の人が見つけてくれることもあるよ
それがクラスターの良いところ

＃今日は気温が上がってしまったので落ちまくりｗ
195 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 16:30:36.74 ID:J0NS89z00]: >>192
SHA-1をBASE64にした先頭12文字らしいから、
160bitのうち6bit×12文字で72bitしか使わない計算だからねぇ…
有効空間で309485009821345068724781056分の1、かな。
誕生日のパラドックスで衝突率を求めると…どうなるんだ？
196 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 19:41:47.15 ID:c9bt88M30]: >>194
なるほど
確かに分散処理が出来ましたね
197 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/02(水) 19:46:03.89 ID:7dIRUU6o0]: 金さえあれば3Way CFXしてブン回せるのに…うぐぐ
198 名前： ◆LoveNico9g mailto:sage [2013/10/02(水) 21:39:36.99 ID:ElaEz5OR0]: あなたは10桁トリップを発見しました。プラチナ貨8192枚が支払われます。 (19時間前)

文字数がないということは特殊なトリップかな？

あなたは8文字一致の10桁トリップを発見しました。プラチナ貨4096枚が支払われます。 (3ヶ月前)
あなたは9文字一致の10桁トリップを発見しました。プラチナ貨262144枚が支払われます。 (3ヶ月前)

8文字超、9文字未満の報酬ね
199 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/03(木) 00:57:15.45 ID:5JFild+E0]: 妙な質問ですが、
tripcode.net/yggdrasil/screensaver.php
って1920x1200に最適化しているんですか？
HTML Screensaverで表示させると12桁トリップのグラフと上位数名のリストしか表示されませんorz
(1366x768のノートパソコンでの話)
200 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 01:01:16.51 ID:6er0tSp20]: >>199
893 ： ◆Meriken//XXX ：2013/09/08(日) 07:55:22.82 ID:9LBqP7z/0 (2/2)
スクリーンセーバー用のページを新しいグラフに合わせて変更してみました。
これでPCの台数が増えてもしばらくは安心です。相変わらず1920x1080専用です。

tripcode.net/yggdrasil/screensaver.php

スクリーンセーバーはこちらがお勧めです。

HTML Screensaver
myweb.tiscali.co.uk/djmclean/htmlscreensaver.html
201 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 01:27:20.09 ID:JxzZIhR00]: >>198
過去ログにも出てるけどそれは準10連を見つけた場合の報酬
純10連だと6815744枚もらえるらしい

ところで昨日10/2の11:00頃に12桁のmaxが66.3G TPSになってるのは一体…
202 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 05:39:39.07 ID:FzkRfayB0]: どっかの大学か専門学校あたり教室から誰か遊んだのかなｗ
203 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/03(木) 08:54:27.00 ID:5JFild+E0]: >>202
まあでもグラフを見る限りでは50GTPSは上がってるしな……
一台あたり100MTPSでも500台は牛耳らないとああはならないはず

バグである可能性もあるが
204 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 09:58:21.96 ID:vduEdb0k0]: >>203
そういうところだとPXEブートしてたりする。
PXEサーバへの線を切って起動後即アプリ起動するイメージ持ったPXEサーバを設置すれば、
後は片っ端から電源入れるだけで利用できるから、100台くらいは案外乗っ取れるかと。
あとはGPUの相性次第？
205 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 10:19:02.54 ID:FzkRfayB0]: >>204
参加者の中でばかっ速いのはほんの数人、実質Merikenさんだけで半分以上稼いでるようなもんだけどｗ
うちの１年くらい前の普及価格帯GTX660ですら、開発版MTFならGPUのみ単体でも400Mtpsくらいでるから
ちょっといいグラボ乗せていそうなところだったら教室1つで行けそうな気がするよｗ
206 名前：shirawa@mmo ◆GTExxuWcjk/9 mailto:sage [2013/10/03(木) 12:18:13.19 ID:1mbRumHzP]: 1人で数百台所有してる方も見かけますし、あながち団体とも言い切れないのがおそろしいところｗ
案外、海外の方とかもありえる？
207 名前： ◆LoveNico9g mailto:sage [2013/10/03(木) 20:04:17.29 ID:2EEzR2Fi0]: >>201
なるほどなるほどー
使うためには将来実装されるフリマ？バザー？で買い戻すしかないのかな？
しかし見つけたトリップが何かわからないからそれもかなわないのだけど…

そういえば有償版は"参加しない"設定はあるけど"参加するけどトリップは提供しない"設定は無理なのかしら？
依頼と手元の検索対象が被った場合に、手元を優先して提供しないみたいな
208 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 21:21:24.21 ID:FzkRfayB0]: 今は丁度留守だけど
ユグドラの機能絡みの話はあっちのスレでやった方が話題を共有できるしMerikenさんもノリやすいと思うよーｗ
209 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 22:55:31.53 ID:PVFODAuA0]: AMD Catalyst? Display Driver for Windows Vista 32-bit って、最新版は 13.4 なんですか？
検索しても、13.10 が見つからない・・・
210 名前： ◆Meriken//XXX mailto:sage [2013/10/03(木) 23:48:31.78 ID:hGyYsSenP]: ようやくアリゾナへの小旅行から戻ってきました。
セドナっていうインディアンの古い聖地に行ってきたんですけど、
岩山が並ぶ景観が素晴らしかったです。
地元の人達も面白い方が多かったので、またぜひ行ってみたいですねえ。

>>183-184
彼女はころっとしてて愛嬌のある感じです。
無事に日本に辿り着ければいいんですが…
211 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 23:54:23.91 ID:yymlo581P]: MERIKENさんおかえり！！
212 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/03(木) 23:57:23.45 ID:Z2ZCk0070]: おかえりー!行ってみたいなぁ…
213 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 01:03:55.19 ID:9T4g2abG0]: >>210
> 無事に日本に辿り着ければいいんですが…
ヒッチハイクで帰国したとか？？
214 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 04:41:05.93 ID:iHUDZBAdP]: どもどもｗ

>>213
彼女、ロスの空港で1人で乗り継ぎだったんですけど、
英語が殆どできないんですよね… まあ大丈夫だとは思いますが。
215 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 04:54:13.15 ID:iHUDZBAdP]: >>184
検索エンジンのソースコードはGPLで公開されているので、
じゃんじゃん使ってやって下さいｗ
216 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:01:23.10 ID:iHUDZBAdP]: >>197
電気代は盲点でしたね～
私ももうちょっとお金があったら専用電源を備えたPC専用の部屋が
欲しいところですけど、先は長いですねえ。
217 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:08:24.51 ID:iHUDZBAdP]: >>207
これどうしようかかなり迷ったんですけど、
参加していただく以上は条件を揃えておきたかったので
こんな風になっています。
218 名前：名無しさん＠お腹いっぱい。 [2013/10/04(金) 05:39:22.35 ID:OK0SaK/c0]: 誰も怒らねえからまんどくさいのでと正直に言えよw
219 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/04(金) 05:44:19.39 ID:mM382Oj10]: 60A契約だと不足気味になるから、75Aにしようかと思ったりしたり。
220 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:48:05.07 ID:iHUDZBAdP]: R9 290Xがもう少しで発売ですね。いや～、楽しみだなあ。

しかし旅行から帰ってきたら2chの規制が更に厳しくなっていますね。
忍法帳のレベルを上げないとリンクも貼れないとか、どうかしてます。
海外規制は相変わらずだし、流出事件以降VPNも規制されて、
●で規制を回避できなくなっちゃったし…
これで公式p2も海外規制されたらどうしようかしらん。
221 名前：忍法帖【Lv=40,xxxPT】(1+0：8) 【東電 59.6 %】 mailto:sage [2013/10/04(金) 06:05:56.81 ID:rrTSneEoP]: てすと
222 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 06:07:02.04 ID:iHUDZBAdP]: >>218
実装自体は判定の処理の順番を入れ替えるだけなので、
そんなにめんどくさくないですｗ
経験値は非常に重要な指標なので、
を獲得するための条件は同じにしておきたいんですよね。
223 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 06:17:55.03 ID:iHUDZBAdP]: >>219
いいですね～ほんとに検索速度の限界は電気の供給によって決まってきますね。
224 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 06:22:44.72 ID:rrTSneEoP]: 半導体プロセスが28nmから20nmになったら同じ電力で倍の速度出せるようになるかな
225 名前：忍法帖【Lv=2,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 07:07:47.87 ID:iHUDZBAdP]: さすがにそこまではいかないでしょうけど、
確実にワットあたりの性能は上がるでしょうね。
R9 290Xが7970と比べてどれぐらい性能が上がっているのか、
非常に気になるところです。
226 名前：忍法帖【Lv=2,xxxP】(2+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 07:43:28.35 ID:iHUDZBAdP]: >>180の続きですが、STFのS-Boxを使わせていただいた結果、
速度は26.05M TPSまで上がりました。>>151の数字より確実に
良くなっていますが、key scheduleを命令のほうに展開してやれば
更に速くなりそうです。取りあえずMTFのルーチンで展開を試してみてから
送っていただいたSTFのルーチンを移植してみることにします。
227 名前：忍法帖【Lv=2,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 14:49:48.68 ID:iHUDZBAdP]: 現在せっせAVXのルーチンを書き換え中。
動的書き換えを行っているルーチンを修正するのは結構大変です。
うまくいくかな～
228 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 18:27:11.06 ID:rrTSneEoP]: ttp://www.fileformat.info/tool/hash.htm?hex=1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498

ビットコインのクライアントのRPCを使ってブロックのハッシュ値を列挙して連続する0のビットが一番多いハッシュを探した後、

ビットコインのハッシュはSHA256(SHA256(key))なのでブロックのヘッダをblockexplorerで持ってきて
SHA256(header)を計算して　1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498　を出して

これをHEX表示としたバイナリのSHA256ハッシュが実際に00が連続することを確認した

ちなみに73ビット0が連続する　もし2chのトリップのSHA1で72ビット以上0が連続したら12連の"AAAAAAAAAAAA"になる
229 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 18:30:52.37 ID:rrTSneEoP]: でもBitcoinは先頭と末尾が逆だった(連続する0ビットの位置の）
230 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 19:41:03.52 ID:QT5wWxXa0]: 特にエラーも出てないのに、GPU 検索が止まってる事があるけど、
エラーが出ないので情報を提供出来ない・・・
231 名前： ◆MOYASHI/Go mailto:sage [2013/10/04(金) 21:14:55.45 ID:Ohb6dumk0 BE:4454085877-2BP(7)]: お、Merikenさんおかえりなさい。

>>220
2ch書き込み規制等の場合は、したらばのMerikenさんの掲示板の辺りへ移動かな？
でも、したらばって12桁トリップ使えないんでしたっけ？う～ん…

>>230
環境や状況等を詳しく書いた方がいいかも。

[ 続きを読む ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef