【トリップ検索】MERIKEN's Tripcode Finder その5

[表示 : 全て最新50 1-99 101- 201- 301- 401- 2chのread.cgiへ]
Update time : 10/14 09:31 / Filesize : 149 KB / Number-of Response : 411
[このスレッドの書き込みを削除する]
[＋板最近立ったスレ＆熱いスレ一覧 : ＋板最近立ったスレ／記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

1 名前： ◆Meriken//XXX [2013/09/15(日) 12:32:11.22 ID:yp7r3EBt0]: こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。

Meriken's Tripcode Finderは2013年8月現在で最速の12桁トリップ検索ツールです
(最高速の記録は11112.48M tripcodes/s)。CUDA対応のNVIDIAのビデオカード、
もしくはHD 5xxx以降のAMD Radeonシリーズのビデオカード等のOpenCL対応デバイスを
使用すれば非常に高速に検索を行うことができます。特徴は以下の通りです。

・ビデオカードのGPUによる超高速検索。
・CPUによる高速検索。
・GUIとCUIの両方に対応した柔軟なユーザーインターフェース。
・強力な正規表現による検索パターンの指定。
・漢字等のShift-JIS文字を含むキーの探索。
・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。
・検索パターンの数の制限の撤廃。
・10桁トリップ検索への対応。
・検索速度の実行時の最適化。
・配布パッケージに同梱された検索ルーチンのソースコード。

■入手先
◆MERIKEN4.kのウェブサイト
www.meriken2ch.com/programming/merikens-tripcode-finder

■前スレ
【トリップ検索】MERIKEN's Tripcode Finder その4
anago.2ch.net/test/read.cgi/software/1373110438/
2 名前： ◆Meriken//XXX [2013/09/15(日) 12:33:10.50 ID:yp7r3EBt0]: ■関連リンク
トリップ総合ウェブサイト「tripcode.net」
tripcode.net/

分散トリップ検索サービス「MERIKEN's Tripcode Ygdrasil」
tripcode.net/yggdrasil

■関連スレ
【分散トリップ検索】Meriken's Tripcode Yggdrasil
toro.2ch.net/test/read.cgi/esite/1379214816/

■過去スレ
初代 anago.2ch.net/test/read.cgi/software/1311428038/
無印 anago.2ch.net/test/read.cgi/software/1348565078/
その2 anago.2ch.net/test/read.cgi/software/1358640741/
その3 anago.2ch.net/test/read.cgi/software/1362648003/
その4 anago.2ch.net/test/read.cgi/software/1373110438/

■過去スレのログ
初代 unkar.org/r/software/1311428038
無印 unkar.org/r/software/1348565078
その2 unkar.org/r/software/1358640741
その3 unkar.org/r/software/1362648003
その4 unkar.org/r/software/1373110438
3 名前： ◆Meriken//XXX [2013/09/15(日) 12:35:55.96 ID:yp7r3EBt0]: ■最高速の記録
> 139 ： ◆MERIKEN4.k ：sage ：2013/07/20(土) 13:00:49.05 ID:FlwZiche0!
> 5ヶ月振りの新記録ｷﾀ━━━━(ﾟ∀ﾟ)━━━━!!
> 【診断の種類】検索速度(1パターン)
> 【Meriken's Tripcode Finderのバージョン】0.10
> 【OS】Microsoft Windows 7 64bit SP1
> 【ディスプレイドライバ】Catalyst 13.5 Beta2
> 【検索デバイス】GPUのみ
> 【使用するGPU】すべて使用
> 【GPU0】DIAMOND 6990PE54G Radeon HD 6990 4GB @ 910MHz (OC)
> 【GPU1】Gigabyte GV-R799D5-6GD-B Radeon HD 7970 @ 1130MHz (OC)
> 【GPU2】VisionTek Radeon HD 7990 @ 1100MHz (OC)
> 【CPU】AMD Phenom II X6 1100T (定格)
> 【1CUあたりのワークアイテムの数(OpenCL)】自動
> 【1WGあたりのワークアイテムの数(OpenCL)】自動
> 【1GPUあたりの検索プロセスの数(OpenCL)】1
> 【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
> 【検索プロセスの優先度】通常
> 【GUIフロントエンドの優先度】通常
> 【トリップの種類】12桁
> 【キーに使用する文字】すべて
> 【検索パターン】 10文字完全前方一致1個
> 【10分間のGPU検索の平均速度】11112.48M tripcode/s
> 【GPUの使用率】93～99%
> 【GPUの温度】80～97℃
> 【その他】Power Limit (6990): +15%, Power Limit (7990): +5%, Fan Speed: 100%
anago.2ch.net/test/read.cgi/software/1373110438/139n
4 名前： ◆Meriken//XXX [2013/09/15(日) 12:37:42.95 ID:yp7r3EBt0]: テンプレは以上です。このスレでもよろしくお願いします。
5 名前： ◆Meriken//XXX [2013/09/16(月) 10:55:31.85 ID:qZcMxCLl0]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 3
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 2からの主な変更点は以下の通りです。

・全角文字をキーに使用したときのヒット率の向上。
・キーに使用する文字の種類の追加。
・12桁トリップのCPU検索の速度向上。
・10桁トリップのOpenCL版のGPU検索の速度向上。
6 名前： ◆Meriken//XXX [2013/09/16(月) 11:15:29.67 ID:qZcMxCLl0]: あ、あとこれを>>5にたしとくのをわすれてましたｗ

・破損した設定ファイルを自動的に修復する機能の追加。
7 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/16(月) 11:56:10.30 ID:p7PA/eiR0]: おお、お疲れさまです。試してみますね。
8 名前： ◆Meriken//XXX [2013/09/16(月) 15:53:52.35 ID:qZcMxCLl0]: さっそくAlpha 3にバグがorz
Radeonを使っててGPUが複数あると、検索がいつまでたっても始まりません。
原因はわかっているのですが、これどうやって修正しようかな…
9 名前： ◆Meriken//XXX [2013/09/16(月) 17:09:07.51 ID:qZcMxCLl0]: 一応修正は出来ました。これから配布パッケージを用意します。
10 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/16(月) 17:09:42.52 ID:okVXgfDbP]: この前α1とα2で速度に差が出ると言っていた者です

α3はα1のときの速度になりました
(21MT/sです)
11 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/16(月) 17:10:54.81 ID:okVXgfDbP]: 12桁の方も戻ってました

85MT/sです
12 名前： ◆Meriken//XXX [2013/09/16(月) 17:34:07.90 ID:qZcMxCLl0]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 4
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 3からの主な変更点は以下の通りです。

・Radeonのビデオカードを使用していてGPUが複数あると検索できない
　不具合の修正。
13 名前： ◆Meriken//XXX [2013/09/16(月) 17:35:12.77 ID:qZcMxCLl0]: >>10-11
摩訶不思議ですね～
いずれにせよ戻ってて安心しました。
14 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/16(月) 17:44:07.15 ID:okVXgfDbP]: 修正おつかれさまです

α4も大丈夫でした
15 名前： ◆JouJaku.IYSv mailto:sage [2013/09/16(月) 18:26:02.56 ID:E6LpH9zS0]: >>8

バグでしたか。モロそのバグに引っかかって悩んでました。
今Alpha 4で動作を確認しました。
16 名前： ◆Meriken//XXX [2013/09/16(月) 18:40:29.99 ID:qZcMxCLl0]: >>15
いや～申し訳ないです… そろそろプロセス間通信周りを綺麗に書き直したいんですが、
デバッグの手間を考えるとなかなか踏ん切りがつきません。
17 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/16(月) 23:59:46.48 ID:Hbh3MH0b0]: 質問すみませんが
Alpha 4の「キーに使用する文字」の
「半角と全角」と「すべて」の違いは何でしょうか？
Alpha 4のデフォルトですと「すべて」ではなく「半角と全角」が選択されるようですが
Alpha 2以前の「すべて」に相当するのは
Alpha 4の場合は「半角と全角」になるのでしょうか？
18 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/17(火) 01:08:10.52 ID:cQ7VTAce0]: 上で質問した者ですが
各種診断を使ってみましたところ
1.1FE Alpha 4で「キーに使用する文字」が「半角と全角」の場合は

> 【キーに使用する文字】1バイト文字のみ

になって「すべて」の場合は

> 【キーに使用する文字】すべて

になっているようですので
1.1FE Alpha 2以前の「すべて」と同じ設定にするには
1.1FE Alpha 4でも「すべて」にしないといけないということでしょうか

実はこちらで12桁検索に使っているPCが
Core2 Duo E7600＋Radeon HD6850の古いPCなのですが
1.1FE Alpha 2→1.1FE Alpha 4に入れ替えましたところ
12桁の検索速度が落ちてしまいましたので
「キーに使用する文字」が原因がどうかを知りたかったのです
長くなりますが以下診断の結果を張っておきます
OSはWin7 x64＋Catalyst 13.5beta2です

※こちらの環境ではCatalyst 13.6beta以降（～13.10betaまで）を使うと
MTFのバージョンに関係なく12桁のGPU検索速度が落ちてしまうので13.5beta2を使っています
19 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/17(火) 01:09:10.52 ID:cQ7VTAce0]: ・1.1FE Alpha 2で「キーに使用する文字」が「すべて」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 2

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 819.11M tripcode/s
【GPU検索の平均速度】 805.41M tripcode/s
【CPU検索の平均速度】 13.70M tripcode/s
20 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/17(火) 01:10:13.06 ID:cQ7VTAce0]: ・1.1FE Alpha 4で「キーに使用する文字」が「半角と全角」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 817.08M tripcode/s
【GPU検索の平均速度】 802.93M tripcode/s
【CPU検索の平均速度】 14.16M tripcode/s
21 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/17(火) 01:11:01.48 ID:cQ7VTAce0]: ・1.1FE Alpha 4で「キーに使用する文字」が「すべて」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 814.97M tripcode/s
【GPU検索の平均速度】 800.87M tripcode/s
【CPU検索の平均速度】 14.11M tripcode/s
22 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/17(火) 01:12:47.88 ID:cQ7VTAce0]: ということで1.1FE Alpha 4で確かに12桁のCPU検索速度は上がっているのですが
逆にGPU検索速度が落ちてしまっていて
全体としては1.1FE Alpha 2の方が検索速度が上になります
検索デバイスをGPUのみにしても傾向は変わりません

あと診断ですと差はわずかですので無視してもよかったのですが
実際にYggdrasilに参加した状態では

・1.1FE Alpha 2での場合GPU検索速度が約675MTPS～約700MTPSの間で変動（約700MTPSの場合が優勢）
CPU検索速度は約13MTPSでほぼ一定

・1.1FE Alpha 4の場合は「キーに使用する文字」が「半角と全角」の場合でも「すべて」の場合でも
GPU検索速度が約650MTPS～約675MTPSの間で変動（ほぼ均等）
CPU検索速度は約13MTPS～約13.1MTPSの間で変動

となって平均検索速度で言えば1.1FE Alpha 2の方が30MTPS程度上になります

まあこれでも誤差の範囲と言われればそうなると思いますが
Free Editionが出て以降ほぼ変わっていなかった12桁の検索速度が1.1FE Alpha 4で落ちてしまいましたので
一応ご報告しておきます
23 名前： ◆Meriken//XXX [2013/09/17(火) 04:36:22.46 ID:7sJN/t4X0]: >>17
> 「半角と全角」と「すべて」の違いは何でしょうか？

「半角と全角」の場合は全角文字の一部は使用されませんが、
「すべて」の場合は全部使用されます。
その代わり、「すべて」を選ぶとヒット率が3%ほど落ちます。

> Alpha 2以前の「すべて」に相当するのは
> Alpha 4の場合は「半角と全角」になるのでしょうか？

Alpha 2以前の「すべて」は、Alpha 4の「すべて」と同じです。
24 名前： ◆Meriken//XXX [2013/09/17(火) 04:55:34.82 ID:7sJN/t4X0]: >>18
あ～診断の表示を変更するのを忘れてましたorz 診断の結果は正しいはずです。

>>19-22
詳しい報告有り難うございます。HD 5xxx/6xxxだとOpenCLコンパイラのバックエンドが
あまり賢くないせいか、ちょっとコードを変更するだけですぐに速度が落ちちゃうんですよね。
速度を戻すことが出来ないか試してみますが、難しいかもしれません。
25 名前： ◆Meriken//XXX [2013/09/17(火) 11:23:18.74 ID:7sJN/t4X0]: >>18
5770ではほぼ元の速度を出せるようになりました。
6850と5770のアーキテクチャは同じVLIW5なので、多分大丈夫でしょう。
26 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/17(火) 11:31:20.26 ID:VA97SuCR0]: TITANでalpha4を試したところ、
1500M tripcode/s
いきました。
27 名前： ◆Meriken//XXX [2013/09/17(火) 20:30:57.15 ID:7sJN/t4X0]: >>26
お、こっちは速くなってますね。
しかしTITANももっと速くてもいいぐらいなんですけどね～
自分でいじれないのがちと歯がゆいです。
28 名前： ◆Meriken//XXX mailto:sage [2013/09/17(火) 21:13:17.75 ID:7sJN/t4X0]: 12桁トリップのCPU検索をアセンブラを使って書き直せないか現在思案中。
多分SSE2だけでも数割速くなるだろうし、AVX/AVX2ならさらにそこから
上乗せ出来そうなんですけど、どうかなあ。

というわけでちょっと調べたら、VecTripperに再利用出来るアセンブラのコードが
あったので、これを使うことにしました。ライセンス的にも問題ないようです。
1から書くのはなかなかしんどそうなので、ありがたいことです。
29 名前： ◆Meriken//XXX mailto:sage [2013/09/17(火) 21:24:16.96 ID:7sJN/t4X0]: そういやSHA-1のルーチンはかなり最適化してたから、
このままじゃ使えないんだよなあ。どうしたものか。
30 名前： ◆Meriken//XXX mailto:sage [2013/09/17(火) 21:40:56.67 ID:7sJN/t4X0]: SHA-1のルーチンをじっと眺めていたら、
キーの長さをSHA-1のブロックのサイズにあわせて64文字に
することによって、更に最適化出来そうなことに気づいてしまいましたｗ
今のままでも工夫してやればラウンドを2つループの外に追い出せそうです。
31 名前： ◆Meriken//XXX mailto:sage [2013/09/17(火) 22:16:20.98 ID:7sJN/t4X0]: あ、448bitだから64文字じゃなくて54文字か。
で、最大で最初の13個のラウンドを追い出せるわけね。
80個のラウンドのうちの13個ってかなり大きいよな。
単純に考えれば2割ほど高速化できる計算です。
だけど2chで56文字のキーなんて使えるのかしらんｗ
32 名前： ◆Meriken//XXX mailto:sage [2013/09/17(火) 22:40:57.21 ID:7sJN/t4X0]: 54文字じゃなくて56文字だった。
56文字のキーは2chで普通に使えました。
でもMTFを56文字のキーに対応させるのは
さすがに手間が大きすぎるような…
まあこのネタは取っておいて、とりあえずアセンブラで書き直そうっと。
33 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/18(水) 07:15:46.99 ID:OzF80bCr0]: >>23-25
どうもありがとうございます

アーキテクチャの違うハードを
それぞれ最適な性能が出るようにサポートするというのは
ものすごく手間のかかることと思います
お手数をおかけして申し訳ありませんでした
34 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/18(水) 08:38:51.53 ID:mB6Net9h0]: >>27
どうもです。余分なグラフィックを切ってなかったり、
TITANのくせにPCI-Express2.0接続だったりするので、
TITANとしては遅いかもしれません。
GPGPUコンピューティンの時にはPCI-Expressバスの問題は
どうせCudaMemcopyなどは最小限にしてるでしょうから
関係ない気もしますが。
35 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/18(水) 17:03:41.23 ID:5Sc3kbYV0]: MERIKENsTripcodeFinder_1.1_FE_Alpha_2 だと全く問題ないのに、
MERIKENsTripcodeFinder_1.1_FE_Alpha_4 だとエラーで動かないのは
何が原因と考えられますか？
36 名前： ◆Meriken//XXX mailto:sage [2013/09/18(水) 17:16:42.94 ID:0UI9u6yeP]: >>35
エラーの種類とか、出現条件とか、もうちょっと詳しくおながいします。

■ バグ報告用のテンプレ

バグを報告する際には下のテンプレを使ってなるべく詳しく
具体的に報告して下さい。

【症状】
【バージョン】MERIKEN's Tripcode Finder x.xx
【トリップの種類】12桁・10桁
【GPU】
【CPU】
【OS】
【Display Driver】
【その他】
37 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/18(水) 18:01:45.41 ID:VtUincUUP]: 12桁のトリップのYggdrasilでの分散探索についてですが

2chは64文字より長いトリップキーが使えるということは

SHA1で1ブロック目の計算はサーバーでやって

1ブロック目で使われる最初の64文字のキーはクライアントに送らずに
2ブロック目以降で必要になる1ブロック目から計算される情報だけをクライアントに送り

クライアントは2ブロック目以降をランダムに生成してトリップを探索する

こうすれば1ブロック目のキーはサーバしか分からないからリバースエンジニアリングされてもクライアントに漏洩されずに済む

こんなのを考えたんですがどうでしょうか
38 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/18(水) 18:03:53.95 ID:VtUincUUP]: 発見されるトリップのキーが常に64文字以上になるのが欠点ですが
39 名前： ◆Meriken//XXX mailto:sage [2013/09/18(水) 18:50:04.20 ID:0UI9u6yeP]: >>33
いや～これ気づかずに放置するところでした。ありがとうございました。
MTFはトリップ検索ツールの決定版を目指しているので、
まだまだこれからですｗちょっとまとまったお金が入りそうなので、
物欲に任せてi7-4770Kとマザボを買おうかどうか迷っているところです。
40 名前： ◆Meriken//XXX mailto:sage [2013/09/18(水) 19:07:56.67 ID:0UI9u6yeP]: >>37-38
これは非常に面白いですねえ。キーの漏洩が原理的に不可能というのは
かなり美味しいです。キーの長さは実際どうなんでしょうねえ。
試しに遊びで56文字モードを付けてみようかしらん。
41 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/18(水) 20:07:49.89 ID:f7vVWxxs0]: >>40
非常に面白いけど、メッセージの途中までを依頼側が制御できてしまうってのは色々アレですね。
SHA-1で署名されてるメッセージのラスト以外を捏造したSHA-1中間状態で依頼して…みたいな。
MD5で衝突させた実験はいくつかあったけどSHA1でやれるとちょっと面白い(では済まない？)かも。
42 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 02:49:03.85 ID:sTJqqQfeP]: >>41
私はクラッキングには興味が無いですけど、クラッキングに分散処理を利用するというのは
ありなのかもしれませんねえ。Bitcoinマイナーみたいなのにそういうコードを
入れといてもわからないでしょうからね。
43 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 03:23:02.42 ID:sTJqqQfeP]: 一応>>30-32をまとめておきます。

・トリップのキーの長さをSHA-1のブロックの大きさに合わせて56文字にすることで、
　12桁トリップ検索をさらに2割ほど高速化出来る。

・ループの内部ではW[13]に対応するキーの53文字目から56文字目のみを変化させる。

・SHA-1の最初の13個のラウンドはW[13]に依存しないので、
　あらかじめループの外で計算しておく。

・この方法はJens Steube氏のSHA-1ハッシュ値生成の最適化の手法と
　組み合わせることも可能。その際はW[0]ではなくW[13]を中心にして計算を行う。
　passwords12.at.ifi.uio.no/Jens_Steube/Jens_Steube_Passwords12.pdf

鳥屋氏はこのことに気づいていたみたいですが、なかなかにコロンブスの卵的な発想です。
44 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 04:55:49.99 ID:sTJqqQfeP]: これ、こちらにも貼っておきますね。

> 24 : ◆Meriken//XXX : sage : 2013/09/19(木) 04:54:27.08
> そうそう、そろそろYggdrasilのAPIを新鯖に一本化したいので、バージョン1.0 (FE)以前の
> MTFをお使いな方はバージョン1.0.1 (FE)以降に更新をお願いします。
45 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/19(木) 07:23:10.54 ID:Ywt2cZ170]: 次のα版に乗り換えるかな…
46 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 07:46:53.91 ID:sTJqqQfeP]: >>45
結構いろいろ改善されているのでぜひどうぞｗ
>>43の実装がいつになるのかはちょっと分かりませんが…
47 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 07:56:24.04 ID:sTJqqQfeP]: 現在VecTripperのSHA-1のアセンブラのコードをせっせとMTFに移植中です。
とりあえずAVXで最初の14個のラウンドが動作することを確認しましたが、
かなり速いです。さすがです。これはかなり期待できそうです。
48 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 09:55:12.24 ID:sTJqqQfeP]: 20回目のラウンドまで変換出来ました。
かなり最適化されたコードみたいで期待大ですが、
気を使う作業なのでとにかく疲れます。
続きは明日以降にしておきます。
49 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/19(木) 13:04:17.26 ID:yhS2wnZ30]: アセンブラまで手を出していたのですね。おつかれさまです。
50 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 14:09:31.68 ID:sTJqqQfeP]: アセンブラでないと限界まで速度を出せないですからね～
10桁は書き換えたので次は12桁というわけです。
51 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 15:17:00.67 ID:sTJqqQfeP]: ご飯を食べて元気が出たので、素のSHA-1のルーチンを一気にAVXで書き換えてしまいました。
結果は上々で、2割ほど速度が上がっています。もうちょっといじれば3割まで行きそうな
感じです。

ここまではわりとすんなりと行きましたが問題はこれからで、今度は特殊な最適化を施してある
SHA-1のルーチンを書き換えなければなりません。これは1から書くしかないので、
少しづつ進めていくことにします。
52 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 18:40:13.43 ID:sTJqqQfeP]: あれから素のSHA-1のルーチンの関数呼び出しのオーバーヘッドを
削って、合わせて27%の速度向上となりました。
VecTripperのルーチンは命令を削れるだけ削ってあるという印象です。
素晴らしいです。

最適化済みのルーチンもこんなふうに自分で書き直せればいいけど、
どうでしょうねえ～
53 名前： ◆JouJaku.IYSv mailto:sage [2013/09/19(木) 19:10:47.14 ID:SvlqUu4y0]: >>39
AVX2対応キターーー! ヽ(´Д｀)ノ

AVX2が目的でHaswellを選ぶなら、高いK付きを選ぶ必要は無いと思います。
HaswellはAVXを使うと極端にOC耐性が落ちます。更に殻割り+液体金属必須です。
K無しを定格で使うのが良い、とK付きで殻割りOCまで試した私は思います。
54 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 19:52:17.36 ID:sTJqqQfeP]: >>53
確かにK付きはいらないですねえ。開発機の3770KもOC切っちゃったし…
その代わりにマザボを奮発してQuad CrossFireが出来るのにしようかな。
AVX-512がコンシューマー市場に下りてくるのは当分先でしょうしね。
55 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 19:53:29.45 ID:sTJqqQfeP]: 最適化されたルーチンをじっと眺めてたらなんだか出来そうな気がしてきたぞ。
56 名前： ◆Meriken//XXX mailto:sage [2013/09/19(木) 22:14:58.88 ID:sTJqqQfeP]: おもむろに少し書き換えてみたらうまくいきましたｗ
こりゃ思ったよりずっと簡単かも。
57 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/19(木) 22:45:49.09 ID:Ywt2cZ170]: 開発が進んでいるようで何よりです
自分はPCの計算力を提供するぐらいしかできませんけど…
58 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 04:43:57.64 ID:PXGklweqP]: いやいや、それだけで十分すぎですｗ
うろつきさん、めちゃ速いですしね。
59 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 04:50:36.76 ID:PXGklweqP]: 最適化済みのSHA-1のルーチンのアセンブラでの書き換えは
半分終わりました。既に元のSSE2 Intrinsicsでの実装より大分速くなっています。
思い切って手を付けてみて正解でした。
60 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 11:51:06.76 ID:PXGklweqP]: x64版のAVXでの書き換えは一応終了。
最適化されたルーチンは15%ほど速くなりました。
もうちょっと命令を削れそうな感じです。
61 名前：名無しさん＠お腹いっぱい。 [2013/09/20(金) 12:28:27.30 ID:rdeXteVM0]: >>54
Z87のマザーだと、ASUS MAXIMUS VI EXTREMEがPCIe 3.0(x8/x16/x8/x8)駆動で最大だからQuad CrossFireするには勿体無さそうに思うけどな。
ttp://www.asus.com/jp/Motherboards/MAXIMUS_VI_EXTREME/#specifications

Quad CrossFireがPCIe 3.0(x16/x16/x16/x16)で動作保障してくれるマザーってあるんだっけ？
62 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 12:39:25.81 ID:PXGklweqP]: >>61
MTFでつかうぶんにはPCIeの帯域はほとんど関係ないので問題なしです。
買うとしたら検索君1号用なので他の用途には使わないですしね。
もうちょっと安いのでもいいんですけど、スロットの配置がいいのが
ないんですよね～
63 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 12:52:41.54 ID:PXGklweqP]: 命令を2つばかり削ってちょびっと速くなりました。
さすがに疲れたのこのへんにしときます。
後はこれをSSE2に移植して、32bit版を作らなきゃいけないんだよなあ。
まあのんびりやろうっと。

とりあえずAVX2対応の準備はできたので十分でしょう。
CPUだけで250M TPS出せるかもしれません。ぐへへへへ…
64 名前： ◆Meriken//XXX mailto:sage [2013/09/20(金) 17:44:03.41 ID:PXGklweqP]: SSE2版を作って命令を2オペランド化してみたらかえって元のより遅くなったぞorz
たくさん作ってもメンテするの大変だし、アセンブラのルーチンは
64bit AVX/AVX2専用にしちゃおうかなあ。

…と、ここまで考えてから試しにVecTripperの真似をしてvmovdqaをmovaps に
変えたら、それだけでもとより速くなりましたｗ　なぜだ…
65 名前： ◆JouJaku.IYSv mailto:sage [2013/09/20(金) 20:53:24.14 ID:BxgeVqsj0]: >>61
ブリッジ挟んだなんちゃって仕様ならコレ。Haswellではありませんが。
ttp://www.asus.com/jp/Motherboards/P9X79E_WS/
なんちゃってなので、グラフィック用です。
大量のデータ転送を同時に行うGPGPU用途には使えません。

Nativeならこれくらい逝かないと無理です。
ttp://www.supermicro.com/products/motherboard/Xeon/C600/X9DRG-QF.cfm
66 名前： ◆Meriken//XXX mailto:sage [2013/09/21(土) 01:51:06.93 ID:axiLYME3P]: >>65
今回の購入のメインはHaswellなので、やっぱりASUSのM6Eですかね～
いやあ、楽しみだなあ。
67 名前： ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:05:15.56 ID:axiLYME3P]: 最適化されたルーチンのSSE2への移植は完了しました。かなり速いです。
今まで58M TPSしか出ていなかったPhenom II X6で92M TPSでました。
Visual C++、効率が悪すぎだろう…
68 名前： ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:41:57.42 ID:axiLYME3P]: というわけで、64bit版は最適化されたルーチンに
一本化することにしました。これで大分すっきりとしました。
あと32bitだとxmmレジスタの数が足りなさすぎなので、
アセンブラで書きなおすのはやめにしました。
これで後は念の為にもう一回テストするだけです。
69 名前： ◆Meriken//XXX mailto:sage [2013/09/21(土) 02:55:33.92 ID:axiLYME3P]: あ、でも最適化されたルーチンだけならレジスタ周りはそんなに厳しくないのか。
せっかくだから32bit版も書きなおそうかな。そうすれば大分すっきりするし…
70 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/21(土) 10:51:27.68 ID:oxIT9/ma0]: >>67
>Visual C++
iclですらない……そりゃ徹底的にアセンブラしたら速いでしょうねｗ
これで私もCPUのみで15MTPS逝きそうですな……
71 名前： ◆Meriken//XXX mailto:sage [2013/09/21(土) 14:05:50.24 ID:axiLYME3P]: >>70
お、お久しぶりです。
Intelのも一応試してみたけどほとんど速度は変わりませんでしたよ。
まあそんなにうまい話は転がってないですね。
限界まで性能を出したいならコンパイラに頼らずに自分でやるしかないですね。
72 名前：最近アマガミをオールクリアしました ◆Ayatsuji/uFC mailto:sage [2013/09/21(土) 18:39:07.87 ID:oxIT9/ma0]: >>71
>お久しぶりです
すみません、実は久しぶりというわけでもないのです。
うろつき ◆Urotsuki/1Caさんに見つけてもらったこの酉で最近はレスしてました。
諸事情により最近はノーパソをぶん回したまま放置ということができなかったので、レベルが上がりようがないという悲しみ……

ところで、複数PCで同じアカウントでログインしてゆぐちゃんに参加するとポイント(ﾟдﾟ)ｳﾏｰなんですよね？
73 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 01:22:54.37 ID:PJsMgXLsP]: >>72
そういえばそうだったｗそのトリップを見たのが久しぶりだったのでうっかりしてしまいました。
経験値はちゃんと加算されますよ。
74 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 05:48:35.29 ID:PJsMgXLsP]: 新しい12桁トリップのCPU検索のルーチンの32bit版も出来ました。
手元のCore 2 Duoで試したら4割近く速度が上がっています。
やっぱコンパイラの最適化は当てにならないなあ。
とにかく検索ルーチンのアセンブラでの書き直しは終わったので、
明日あたりにGUIの修正と最終テストを行って、新しい開発版をうｐします。
75 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/22(日) 06:06:23.54 ID:RUJc3/SX0]: wktk
76 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 07:42:38.57 ID:B2mxp/B40]: wktkですねこれは
しかし相変わらずの化け物じみた速度…
自分は契約Aの問題でこれ以上速度あげられないんだよなぁ
77 名前： ◆shiexn/ngc mailto:sage [2013/09/22(日) 07:50:16.88 ID:XeDsKN+sP]: 同一トリップ　別キー　なんてのもちゃんと出てくるんですな
78 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 09:52:31.01 ID:PJsMgXLsP]: TITANより速いとか、これはもう買うしかないのではなかろうか。
発表は25日か～

wccftech.com/amd-hawaii-r9290x-gpu-volcanic-islands-benchmark-results-exposed-fastest-gpu-planet-1020-mhz-clock-speed/=
79 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 10:39:11.32 ID:PJsMgXLsP]: >>76
7970 CFにしては抑え気味だなと思ってたんですけど、
そういうことだったんですね。私もこれで結構ギリギリで、
しょっちゅうブレーカーを飛ばしていますｗ
80 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 10:41:44.63 ID:PJsMgXLsP]: >>78のリンクが壊れてました。

wccftech.com/amd-hawaii-r9290x-gpu-volcanic-islands-benchmark-results-exposed-fastest-gpu-planet-1020-mhz-clock-speed/
81 名前： ◆Meriken//XXX mailto:sage [2013/09/22(日) 11:16:46.05 ID:PJsMgXLsP]: >>72
あ、そうそう。私はアマガミはモジャ子で挫折しましたｗ
梨穂子ちゃんと先輩はなかなか良かったです。
82 名前： ◆Meriken//XXX [2013/09/22(日) 13:39:01.91 ID:PJsMgXLsP]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 5
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 4からの主な変更点は以下の通りです。

・12桁トリップのCPU検索のAVXへの対応。
・12桁トリップのCPU検索の高速化。

CPUによってはかなり速くなっているようです。
診断の結果や前のバージョンとの比較を報告していただけると助かります。
83 名前： ◆Meriken//XXX [2013/09/22(日) 17:15:27.23 ID:PJsMgXLsP]: 現在Meriken's Tripcode Engineの英語版を作成中。
プログラムに変更はすぐに終わったけど、
ドキュメントの翻訳が超めんどくさいです。
84 名前： ◆MOYASIMaXI mailto:sage [2013/09/22(日) 17:54:35.42 ID:B1RUuJ9x0]: >>82
お疲れ様です。
12桁検索（CPUのみ）の速度を見てみました。
検索パターンは、先頭一致6完一つと特殊の純8連です。

【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【CPU検索スレッドの数】4

検索開始10分後の平均速度
MTF 1.1 FE Alpha4 74.21M tripcode/s
MTF 1.1 FE Alpha5 91.94M tripcode/s

めっちゃ高速化してます。
85 名前： ◆Meriken//XXX [2013/09/22(日) 18:58:57.07 ID:PJsMgXLsP]: >>84
いい感じに速度が上がっていますね～
AVXがかなり効いてるのかな?
i7-3770Kより差が大きいのはおいしすぎですね。
86 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 19:02:33.93 ID:B2mxp/B40]: おー新しいのきましたか
CPU関連の効率化だけかなー?
GPUメインにはあまり縁がないかなー…
取り敢えず測定してみようっと
87 名前： ◆Meriken//XXX [2013/09/22(日) 19:14:24.81 ID:PJsMgXLsP]: ぜひお願いします。CPUによってほんとに速度の変化がバラバラなんですよね。
88 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/22(日) 19:24:33.69 ID:B2mxp/B40]: CPUの冷却が不安なので長い時間ぶん回せませんね…
取り敢えず結果です

【OS】Windows7 Pro 64bit SP1
【CPU】Intel Core i7-3930K(自動的に3.9GHzまでOC)
【CPU検索スレッドの数】12
【検索中の温度】　46～59度(簡易水冷)
【検索パターン】先頭一致10完　1つ

検索開始5分後の平均速度
MTF 1.1 FE Alpha4 129.19M tripcode/s
MTF 1.1 FE Alpha5 160.65M tripcode/s

速度がかなり上がりました
OCしているので定格だとどうなるかわかりませんが上がり幅は同じだと思います
89 名前： ◆JouJaku.HzIz mailto:sage [2013/09/22(日) 20:09:04.92 ID:vk+5V6ZE0]: 【診断の種類】検索速度(1パターン)
【MERIKEN's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4, 5
【OS】Microsoft Windows 7 Ultimate 64bit SP1
【検索デバイス】CPUのみ
【CPU】Intel Core i7 4770K@3.7GHz
【CPU検索スレッドの数】8 (HTon)
【検索プロセスの優先度】通常
【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個
【10分間のCPU検索の平均速度】104.66(a4) → 122.57(a5) M tripcode/s
【その他】MTEngine64 -c -t 8 -l 12

2割近く速度が上がってますね。AVX2対応が楽しみです。
90 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 20:28:27.32 ID:Nb3CcrYX0]: Win7 x64 / C2Q Q9650定格（3GHz）CPUのみ / 4スレッドでの
1.1FEα2 / 1.1FEα4 / 1.1FEα5の各バージョンの12桁検索の「各種診断」の実行結果です
共通
【診断の種類】検索速度(1パターン)
【検索デバイス】CPUのみ
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動　※4スレッド
【SHA-1ハッシュ値生成の最適化(CPU)】最大　※1.1FEα2 / 1.1FEα4のみ
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【トリップの種類】12桁
【検索パターン】 10文字完全前方一致1個

1.1FEα2
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 53.94M tripcode/s

1.1FEα4
【キーに使用する文字】1バイト文字のみ　※半角と全角
【10分間のCPU検索の平均速度】 55.22M tripcode/s
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 55.17M tripcode/s

1.1FEα5
【キーに使用する文字】半角と全角
【10分間のCPU検索の平均速度】 62.22M tripcode/s
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 62.20M tripcode/s

結果
・1.1FEα4 / 1.1FEα5の【キーに使用する文字】の「半角と全角」と「すべて」の検索速度の違いはわずか
・1.1FEα2→1.1FEα4：約2.5%UP　1.1FEα2→1.1FEα5：約15.3%UP　1.1FEα4→1.1FEα5：約12.7%UP
91 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 20:32:12.34 ID:K2dEp/NJ0]: すいません、MTF1.1FEのalpha2～4はどこかでDL出来ますでしょうか？
手違いで消してしまいましたｗ
92 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 20:34:35.19 ID:TkU21XXd0]: リンク先のファイル名を変えるだけで落とせたと思う。
93 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 20:36:50.06 ID:K2dEp/NJ0]: あ、なるほど気が付きませんでした
無事落とせました
94 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 22:59:02.04 ID:K2dEp/NJ0]: 【検索デバイス】GPUとCPU
【OS】 windows7 HP 64bit SP1
【使用するGPU】AMD Radeon HD 5570/5670 (OpenCL)
【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個
α2
【10分間の平均速度】 366.70M tripcode/s
【GPU検索の平均速度】 340.43M tripcode/s
【CPU検索の平均速度】 26.27M tripcode/s
α4
【10分間の平均速度】 366.74M tripcode/s
【GPU検索の平均速度】 340.08M tripcode/s
【CPU検索の平均速度】 26.66M tripcode/s
α5
【10分間の平均速度】 364.47M tripcode/s
【GPU検索の平均速度】 340.61M tripcode/s
【CPU検索の平均速度】 23.86M tripcode/s

計測報告は初めてですがこんな感じでいいのでしょうか？
因みにα3はバグがあるとスレの初めに話題になってたようなので除外しました
95 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 23:11:48.99 ID:K2dEp/NJ0]: 診断ではα5のCPU効率が若干低下してますが
検索実測でもα5はα2、4に比べてGPUCPU共
似たような効率低下傾向があるようです
96 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/22(日) 23:14:16.64 ID:K2dEp/NJ0]: あ、これだとCPUが載ってないですね
CPUは intel core i5-750 2.66GHz定格使用です
97 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 00:19:21.07 ID:s2zOHAYz0]: >>17-22を書いた者ですが
1.1FE Alpha 5で1.1FE Alpha 2と同等以上の検索速度になりました
どうもありがとうございました

・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「半角と全角」の場合
【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 820.98M tripcode/s
【GPU検索の平均速度】 805.08M tripcode/s
【CPU検索の平均速度】 15.90M tripcode/s

・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「すべて」の場合
【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 820.92M tripcode/s
【GPU検索の平均速度】 805.02M tripcode/s
【CPU検索の平均速度】 15.90M tripcode/s

・Yggdrasilに参加して検索開始10分後の平均検索速度
1.1FE Alpha 2: 694.95MTPS (GPU: 681.99M, CPU: 12.96M)
1.1FE Alpha 4: 665.13MTPS (GPU: 652.14M, CPU: 12.99M)
1.1FE Alpha 5: 695.23MTPS (GPU: 680.68M, CPU: 14.56M)
98 名前：shirawa@mmo ◆GTExxuWcjk/9 mailto:sage [2013/09/23(月) 05:07:53.88 ID:jhI3+7LxP]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4　→　Alpha 5

【検索デバイス】GPUとCPU
【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz
【使用するGPU】NVIDIA GeForce GTX 660 (CUDA)

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 622.09M tripcode/s　→　635.74M tripcode/s
【GPU検索の平均速度】 535.55M tripcode/s　→　534.50M tripcode/s
【CPU検索の平均速度】 86.54M tripcode/s　→　101.25M tripcode/s
99 名前：累計 ◆wop.8OO8.qow mailto:sage [2013/09/23(月) 05:25:17.49 ID:J8box9ZP0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1FEα5/1.1FEα4/1.0.1(安定版)

【検索デバイス】CPUのみ (i7 M620 @2.67GHz)

【CPUの命令セット】x64 + SSE2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】12桁
【キーに使用する文字】半角(※1バイト文字のみ)
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度(TPS)】

　　1.1FEα5 　1.1FEα4　 1.0.1(安定版)
------------------------------------
1) 　27.84M　　　30.51M　　　31.67M
2) 　27.80M　　　30.50M　　　31.77M
3) 　27.69M　　　30.58M　　　31.67M
4) 　27.85M　　　30.54M　　　31.68M
5) 　27.83M　　　30.54M　　　31.64M
100 名前： ◆Meriken//XXX [2013/09/23(月) 05:48:41.37 ID:PDVnzk32P]: 皆さん詳しい報告を有り難うございます。
どうもNehalemだけ遅くなっているようですね。難しスギィ！
101 名前： ◆LoveNico9g mailto:sage [2013/09/23(月) 06:02:36.35 ID:f6HE7yZK0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 3 -> 1.1 Free Edition Alpha 5
【OS】Windows 7 Professional SP1

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 215.90M tripcode/s -> 221.77M tripcode/s
【GPU検索の平均速度】 205.58M tripcode/s -> 207.19M tripcode/s
【CPU検索の平均速度】 10.32M tripcode/s -> 14.58M tripcode/s

すごい改善率
102 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 06:25:27.19 ID:PDVnzk32P]: >>101
こりゃ凄いですねw 結構さがでるもんですね～
103 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 06:38:01.05 ID:PDVnzk32P]: ■Alpha 3/4とAlpha5の12桁トリップのCPU検索の速度の比較

>>67 +58% Phenom II X6 AMD K10
>>101 +41% i3-3220 Ivy Bridge
>>84 +24% i5-3570 Ivy Bridge
>>88 +24% i7-3930K Sandy Bridge
>>89 +17% i7-4770K Haswell
>>98 +17% i7-3770 Ivy Bridge
>>90 +13% C2Q Q9650 Core
>>97 +12% C2D E7600 Core
>>99 -9% i7-M620 Nehalem
>>94 -11% i5-750 Nehalem

やっぱNehalemだけ遅くなってますねえ。残念…
VC++ 2010はNehalemに合わせて最適化されていたのかしらん。
まあでも他のアーキテクチャでは順当に速度が上がっていますね。
Hyper Threadingはないほうが効果がはっきり出るみたいです。
104 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 09:20:51.29 ID:PDVnzk32P]: 英語版を作って本家Slashdotにストーリーを投稿してみました。
ぜひVote Upをよろしくお願いいたしますｗ

Meriken's Tripcode Engine English 0.01 Released
slashdot.org/submission/2986003/merikens-tripcode-engine-english-001-released

Meriken's Tripcode Engine English
www.meriken2ch.com/programming/merikens-tripcode-engine-english/index.html
105 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 09:21:02.61 ID:X4S3sHdy0]: 1.1FEα5の鯖との定期通信の間隔は
・検索開始3分後までが10秒ごと
・以降3分ごと
でよろしいでしょうか？
106 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 09:25:06.77 ID:PDVnzk32P]: >>105
そうで～す。このパラメーターはサーバー側で調整できるので、
サーバーが重くなってきたら増やすかもしれません。
107 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 09:40:34.70 ID:rVyLE6uw0]: 【診断の種類】検索速度(1パターン)

【検索デバイス】CPUのみ
【CPU】Ibtel Core i7-980X CPU @ 4Ghz

【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4
【10分間のCPU検索の平均速度】 148.51M tripcode/s

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5
【10分間のCPU検索の平均速度】 129.78M tripcode/s

結構落ちますね。 -15%弱ってところでしょうか。
108 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 10:18:13.77 ID:PDVnzk32P]: >>107
これもWestmere-EPだからNehalemの仲間ですね。
うまい具合にNehalemだけ検出できないかなあ。
109 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 10:42:19.95 ID:PDVnzk32P]: WikipediaにCPUIDが載ってたけど、これほんとに当てになるのかな～

> 0x0206e6, 0x0106a4, 0x0106a5, 0x0106e4, 0x0106e5
en.wikipedia.org/wiki/Nehalem_(microarchitecture)

> 0x0206f2, 0x0206c2, 0x020652, 0x020655
en.wikipedia.org/wiki/Westmere_(microarchitecture)

> 0x0206c0, 0x0206c1, 0x0206c2, 0x0206c3, 0x0206c4,
> 0x0206c5, 0x0206c6, 0x0206c7, 0x0206c8, 0x0206c9,
en.wikipedia.org/wiki/Gulftown
110 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/23(月) 11:16:32.76 ID:R2WGY9Wb0]: >>81
棚町(と七咲)は☆獲得に会話イベントでアタック成功させないと駄目な娘なので……
順番を見るに、WikiのFAQを読みながらやったパターンですかね？
>>82
乙です。早速ベンチしてみますね。
>>108
前に「GPU毎に処理方法変える為にデータベース作るか」と言われていたことを思い出しました……
111 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 11:25:52.53 ID:FllI0LcA0]: こんな情報がありました

Intel Architecture and Processor Identification With CPUID Model and Family Numbers
ttp://software.intel.com/en-us/articles/intel-architecture-and-processor-identification-with-cpuid-model-and-family-numbers

Nehalem / Westmere世代は

[45nm]
Bloomfield / Nehalem-EP : 0x106Ax
Lynnfield / Clarksfield / Jasper Forest : 0x106Ex
Nehalem-EX : 0x206Ex

[32nm]
Clarkdale / Arrandale : 0x2065x
Gulftown / Westmere-EP : 0x206Cx
Westmere-EX : 0x206Fx

あたりでしょうか
112 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/23(月) 11:37:42.83 ID:BVWtjWSi0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5

【検索デバイス】CPUのみ
【CPU】Intel Xeon W5590 ×2 (3.33GHz)

【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度】 84.98M tripcode/s
113 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 12:30:59.59 ID:PDVnzk32P]: >>112
やっぱりNehalemだと駄目ですね～

>>111
これで正解ですね。助かります。
Nehalemを検出したら元のルーチンを使うように修正しておきました。
時間のあるときに次の開発版をうｐします。
114 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/23(月) 13:28:13.13 ID:R2WGY9Wb0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4→5

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】256
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】4
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【 5分間の平均速度】 96.97→102.79M tripcode/s
【GPU検索の平均速度】 64.32→64.30M tripcode/s
【CPU検索の平均速度】 32.64→38.49M tripcode/s

※CPUのみだと36.95→42.76M tripcode/s。ちなみに当方はi5-3210M＝Ivy Bridge。
115 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 14:06:20.22 ID:C6NktFR4P]: core i7 2700K 定格 HTオン 8スレッド

84Mから105Mに上がりました
116 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 16:21:00.62 ID:L5Ap3lnA0]: >>104
> 英語版を作って本家Slashdotにストーリーを投稿してみました。
って事は、これからは外人さんも参加してくれる？
一気に人数が増えるといいな。
117 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 19:43:23.12 ID:dFD9pehG0]: >>106
ご回答ありがとうございました
118 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:09:33.41 ID:PDVnzk32P]: >>114
>>115
やっぱりNehalem以外では速くなってるんですよねえ…
コンパイラの吐いたコードを調べてみようっと。
119 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:12:23.78 ID:PDVnzk32P]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 6
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 5からの主な変更点は以下の通りです。

・Nehalem系のCPUで12桁トリップのCPU検索が遅くなる不具合の修正。

引き続き前のバージョンとの速度の比較を報告していただけると助かります。
120 名前： ◆Meriken//XXX mailto:sage [2013/09/23(月) 20:36:25.71 ID:PDVnzk32P]: コンパイラの吐いた無駄だらけのコードを見てたら、movapsの代わりに
movdqaを使っていました。まさかこれが原因じゃあるまいな…
121 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/23(月) 21:10:26.07 ID:zKQ1y1q50]: 古いバージョンもあると比較しやすいのかな？
122 名前：107 mailto:sage [2013/09/23(月) 21:39:06.57 ID:rVyLE6uw0]: 【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 6
【10分間のCPU検索の平均速度】 148.50M tripcode/s

とりあえず、戻ったようです。
123 名前：94 mailto:sage [2013/09/23(月) 21:52:01.56 ID:AdWli9Lo0]: α6試してみました
条件は>>94と同一です

【10分間の平均速度】 366.80M tripcode/s
【GPU検索の平均速度】 340.25M tripcode/s
【CPU検索の平均速度】 26.55M tripcode/s

α4の水準に戻ったようです
中身的には暫定的にNehalemを検出してα4のプログラムで
処理してる感じでしょうか？
共通プログラムで全CPUを網羅するのは
なかなか難しいのですね
124 名前：累計 ◆wop.8OO8.qow mailto:sage [2013/09/23(月) 23:33:54.95 ID:J8box9ZP0]: 条件は>>99と変わらず、1.1FEα6のみ検索速度(1パターン)を診断

【10分間のCPU検索の平均速度(TPS)】

　　 1.1FEα6 　1.1FEα5 　 1.1FEα4　 1.0.1(安定版)
----------------------------------------------
1)　　31.89M　　　27.84M　　　30.51M　　　31.67M
2)　　31.88M　　　27.80M　　　30.50M　　　31.77M
3)　　31.97M　　　27.69M　　　30.58M　　　31.67M
4)　　31.88M　　　27.85M　　　30.54M　　　31.68M
5)　　31.89M　　　27.83M　　　30.54M　　　31.64M

よかったよかったｗ
125 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/23(月) 23:47:40.78 ID:fLgQz4cK0]: 修正お疲れ様ですー
明日以降入れとこう…

そろそろ本気だす
126 名前： ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:05:07.93 ID:SuYpLKhoP]: ちゃんとNehalemを検出できているようですね。かったよかった。

Nehalemを使っている人(Alpha 5で遅くなった人)は
ぜひこちらも試してみてください。

www.meriken2ch.com/files/2013-09-23-Nehalem.zip

元のファイルに上書きすれば使えます。
あくまでも実験なので、元のファイルは取っておいてください
127 名前： ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:06:37.34 ID:SuYpLKhoP]: >>125
> そろそろ本気だす

おお、期待してますよｗ
128 名前： ◆Meriken//XXX mailto:sage [2013/09/24(火) 03:12:46.79 ID:SuYpLKhoP]: と書いたあとでゆぐちゃんの速度見たら凄いことになってたｗ
うろつきさんもさすがですし、◆QZshizo.ptHさんもおひさしぶりですね～
129 名前： ◆Meriken//XXX [2013/09/24(火) 06:44:32.39 ID:SuYpLKhoP]: これ、こっちにも貼っておこうっと。

> 43 ：◆Meriken//XXX ：sage ：2013/09/24(火) 06:42:26.23
> ゆぐちゃんの紹介のために、今度は日本語版のSlashdotにストーリーを
> 投稿してみました。採用されるように、是非評価を上げてやってくださいｗ
>
> slashdot.jp/recent
>
> GPGPUによる分散トリップ検索サービス「Meriken's Tripcode Yggdrasil」
> slashdot.jp/submission/52745
toro.2ch.net/test/read.cgi/esite/1379214816/43n
130 名前： ◆Meriken//XXX [2013/09/24(火) 08:00:59.39 ID:SuYpLKhoP]: >>123
> 中身的には暫定的にNehalemを検出してα4のプログラムで
> 処理してる感じでしょうか？

その通りです。

> 共通プログラムで全CPUを網羅するのは
> なかなか難しいのですね

実際かなり難しいですね。試せる環境が手元にないのが大きいです。
>>126のバージョンでは新しいルーチンに手を入れてるので、
Nehalemでも高速化できるかもしれません。
131 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/24(火) 12:09:59.10 ID:aK0ZMOZo0]: Yggdrasilで検索中のPC一覧で見ることの出来る「名前」の項目のデータは編集できますか？
132 名前：94 mailto:sage [2013/09/24(火) 12:11:45.67 ID:XhDzCs6d0]: お疲れ様です
>>126を試してみました
条件は>>94です

【10分間の平均速度】 370.88M tripcode/s
【GPU検索の平均速度】 340.61M tripcode/s
【CPU検索の平均速度】 30.27M tripcode/s

診断ではCPUの効率向上
実測でもCPU24.54→27.47Mt/sという結果でした
133 名前： ◆Meriken//XXX [2013/09/24(火) 12:29:58.12 ID:SuYpLKhoP]: >>132
ｷﾀ━━━━(ﾟ∀ﾟ)━━━━!! やっぱりmovapsが原因だったんですね。

他のCPUだとSSE2でmovapsを使ったほうが速いのに、
Nehalemだけmovdqaを使ったほうが速いようです。
こんなの普通わからないっちゅうねん。
なんにせよ助かりました。次の開発版に取り込んでおきます。
134 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 13:55:53.22 ID:yDbtGzZA0]: >>126でα5からの性能向上を確認
Before
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5
【10分間のCPU検索の平均速度】 84.98M tripcode/s
After
【Meriken's Tripcode Finderのバージョン】>>126 のNehalem用
【10分間のCPU検索の平均速度】 97.66M tripcode/s
135 名前： ◆Meriken//XXX [2013/09/24(火) 14:22:53.52 ID:SuYpLKhoP]: >>131
MTFの「分散処理」タグで編集できますよ。次からはゆぐちゃんスレでお願いします。

【分散トリップ検索】Meriken's Tripcode Yggdrasil
(p)toro.2ch.net/test/read.cgi/esite/1379214816/
136 名前： ◆Meriken//XXX [2013/09/24(火) 14:24:13.91 ID:SuYpLKhoP]: >>134
ありがとうございます。ようやくこれで安心して寝られますｗ
137 名前： ◆Urotsuki/1Ca mailto:sage [2013/09/24(火) 15:36:32.45 ID:hElffOfN0]: 電気料金の関係で当分稼働できそうにない…
すみません…
138 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/24(火) 16:26:07.84 ID:yDbtGzZA0]: On some (but not all) micro-architectures, there are timing differences due to "domain crossing penalties".
For this reason, one should generally use movdqa when the data is being used with integer SSE instructions,
and movaps when the data is being used with floating-point
instructions. For more information on this subject,
consult the Intel Optimization Manual,
or Agner Fog's excellent microarchitecture guide.
Note that these delays are most often associated with register-register moves instead of loads or stores.

だそうな、integerだったらmovqdnなんだと。マニアックすぐるw
139 名前： ◆Meriken//XXX [2013/09/24(火) 16:37:03.17 ID:SuYpLKhoP]: >>138
ところがNehalem以外だとintegerでもmovapsのほうが
movdqaよりも速いんですよねえ…
VC++ 2010はマニュアル通りにmovdqaを使ってましたけど、
それだとうまくいかないようです。
140 名前： ◆Meriken//XXX [2013/09/24(火) 16:39:21.48 ID:SuYpLKhoP]: >>137
電気料金は大きな壁ですよねえ…
今までお疲れ様でした。またいつでもお越しください。
141 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/24(火) 19:22:40.85 ID:HJd6RTmw0]: >>139
何となくですが、
2chnull.info/r/jisaku/1326108518/338-354
これの347辺りからの話が、ヒントになりそうな？
これ以上は、各アーキ毎の最適化マニュアルの比較と、
マイクロアーキテクチャ自体の変更情報を全部追わないと、どこがネックになってるのかは
分からない気がするｗ

ちなみに>>107の環境で>>126を回した結果
【10分間のCPU検索の平均速度】 146.58M tripcode/s

あれ・・・あまり変わってない・・・なんでだろ。
142 名前： ◆Meriken//XXX [2013/09/25(水) 15:05:37.51 ID:Q0OWgfvvP]: >>141
> これ以上は、各アーキ毎の最適化マニュアルの比較と、
> マイクロアーキテクチャ自体の変更情報を全部追わないと、
> どこがネックになってるのかは分からない気がするｗ

リンク先の話は非常に興味深いですねえ。なかなか奥が深いです。

> あれ・・・あまり変わってない・・・なんでだろ。

同じNehalem系でもGulftown(Westmere-EP)は違うのかな?
難しすぎですねｗ
143 名前： ◆Meriken//XXX [2013/09/25(水) 16:18:00.34 ID:Q0OWgfvvP]: 新しい開発版をうｐしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 7
www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 6からの主な変更点は以下の通りです。

・Nehalem系のCPUでの12桁トリップのCPU検索の高速化。
・10桁トリップのCPU検索の高速化。

>>126の成果を取り込んだついでに、10桁トリップ検索でもmovapsを使うように
しました。AVXに対応していない、Nehalem系以外のCPUでは、10桁トリップの
CPU検索は少し速くなっているはずです。
前のバージョンとの速度の比較を報告していただけると助かりますです。
144 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/25(水) 16:21:29.38 ID:HNdGVGJA0]: >>143は私(x64+SSE2/AVX、Ivy Bridge)でも10桁が高速化するのでしょうか？
145 名前： ◆Meriken//XXX [2013/09/25(水) 16:23:53.73 ID:Q0OWgfvvP]: この週末に彼女が日本から遊びに来るので、開発はしばらくお休みです。
次の更新はHaswell購入後のAVX2対応になる予定です。
146 名前： ◆Meriken//XXX [2013/09/25(水) 16:26:41.10 ID:Q0OWgfvvP]: >>144
Ivy BridgeはAVXに対応しているので今回は速くなりません。
AVX版はまた今度書きなおす予定です。
147 名前： ◆e7m8FSZy3U mailto:sage [2013/09/25(水) 19:34:02.12 ID:CggXwBge0]: /.Jから飛んできました。
ちょっと面白そうなのでしばらく回してるかもです・・・
148 名前： ◆e7m8FSZy3U mailto:sage [2013/09/25(水) 19:58:17.69 ID:CggXwBge0]: あぁこれって何か。分散のみに参加するって出来ないのね
それはつまらんなぁ。
149 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:04:12.63 ID:Q0OWgfvvP]: 9文字ぐらいの適当な長いパターンをローカルで1つだけ指定してやれば、
分散のみに参加しているのと変わりないですよ。
150 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:42:15.70 ID:Q0OWgfvvP]: Linux版を作っていた◆znjnB.IJwZLUさん、最近見かけないなあ。
忙しいのかしらん。AVXに最適化されたS-Boxをぜひ見せてもらいたかったんだけど、
自分でやったほうが早いのかな。

まあやることといったら全部レジスタで回すようにして、なるべく2バイトのVEX Prefixを
使うようにするだけだからなあ。でも言うのは簡単だけど、実際にやるのは大変そうだorz
151 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:56:27.53 ID:Q0OWgfvvP]: 定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。

mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS

大分速くなったけど、もうちょっといけそうなんだよなあ…
152 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 20:59:08.78 ID:Q0OWgfvvP]: 6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153 名前： ◆Meriken//XXX mailto:sage [2013/09/25(水) 22:23:57.84 ID:Q0OWgfvvP]: vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154 名前： ◆LoveNico9g mailto:sage [2013/09/26(木) 02:43:02.74 ID:sJOvmiPd0]: 【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】10桁
【キーに使用する文字】ASCII
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 11.49M tripcode/s -> 11.68M tripcode/s
【GPU検索の平均速度】 9.20M tripcode/s -> 9.24M tripcode/s
【CPU検索の平均速度】 2.29M tripcode/s -> 2.44M tripcode/s
155 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 04:07:26.63 ID:6FvOHAWcP]: >>154
報告有り難うございます。やっぱりちょこっとだけ速くなっていますね。
動的書き換えを行っているコードをいじるのに結構神経を使ったんですが、
6.5%の速度向上だから上出来なのかな?
156 名前： ◆HwAeH9HsBC.d mailto:sage [2013/09/26(木) 04:34:59.26 ID:b6mTXvYaP]: 中間ステートを利用したら受け渡し所がなくても2ch上だけで安全にキーの交換ができるのか

80文字くらいのキーのテスト
157 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 06:00:51.07 ID:6FvOHAWcP]: なかなか面白い発想ですけど、キーの一部が依頼ごとに違ってくると
複数の依頼を同時に検索することが出来ないので、ちと現実的ではないですねえ。
158 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 06:35:44.10 ID:b6mTXvYaP]: たしかに個人に依頼する場合はやっぱり一度に一人からの依頼しか処理できなくなりますが、Yggdrasilを使うなら大丈夫ですよね？
Yggdrasilに参加しながら自分の設定した文字列も検索する場合それの結果のキーまで64文字以上になっちゃいますが
あと自分のPCで発見した場合でもサーバから64文字を受け取らないといけなくなります

このときサーバが全クライアントに同じ64文字を使ってたら困るのは
サーバはクライアントごとにキーの最初の64文字を別のにして探索してもらえばよさそうです

あと依頼を1個解決した場合最初の64文字を切り替えないと次に他の依頼を解決したときに2人の別の人に同じ64文字が流出するので
依頼を解決するごとにサーバから新しい最初の64文字を受け取る必要があります

で、OpenCLの1回のワークのまとまりに全部同じ中間状態を最初に渡すことになりそうですが、
1回のワークで複数の依頼を解決しちゃった場合どれか1個しか使えなくなります（同じ最初の64文字が2人以上に使われることになるので）
これの解決法は思いつきませんでした
159 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 06:36:45.74 ID:b6mTXvYaP]: 最初の64文字を依頼人が指定するんじゃなくてYggdrasilがランダムに生成するって方式です
160 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:06:01.86 ID:6FvOHAWcP]: >>158
2ちゃんねる受け渡しを行うのはちょっと無理がありますが、ゆぐちゃんでは
ありでしょう。あ、あと私は最初に間違えてしまっていたのですが、
SHA-1のブロックの長さは64バイトですがメッセージの長さを格納するのに
8バイト必要なので、キーの長さは56文字が最適になります。

実装する際にはW[12]までの途中経過(A, B, C, D, E)を検索開始時に
クライアントに渡してやればいいだけです。最初の依頼を解決した時点で
検索をやり直すようにしてやればセキュリティ上の問題もないでしょう。
161 名前：累計 ◆wop.8OO8.qow mailto:sage [2013/09/26(木) 09:10:52.97 ID:BeI6EFic0]: 条件は>>99と変わらず、1.1FEα7のみ検索速度(1パターン)を診断

【10分間のNehalem系のCPU検索の平均速度(TPS)】

　　　1.1FEα7　 1.1FEα6 　1.1FEα5 　 1.1FEα4　 1.0.1(安定版)
---------------------------------------------------------
1)　　31.47M　　　31.89M　　　27.84M　　　30.51M　　　31.67M
2)　　31.49M　　　31.88M　　　27.80M　　　30.50M　　　31.77M
3)　　31.50M　　　31.97M　　　27.69M　　　30.58M　　　31.67M
4)　　31.48M　　　31.88M　　　27.85M　　　30.54M　　　31.68M
5)　　31.51M　　　31.89M　　　27.83M　　　30.54M　　　31.64M
162 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:28:13.49 ID:6FvOHAWcP]: >>161
Nehalem系でも新しいルーチンの効果に結構差がでますね。
1.0.1に比べて微減なのでまあここらへんが落とし所ですね。
報告していただいて本当に助かりました。
163 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 09:34:36.24 ID:6FvOHAWcP]: VEX Prefixの謎はstackoverflowで怒られながらヒントを貰って
ある程度解決することが出来ました。

Which AVX registers should I use to avoid 3-byte VEX prefixes?
stackoverflow.com/questions/19016174

なるべくソースオペランドにxmm0～xmm7を使ってやればいいようですが、
それだけではないみたいですね…

----

176 %line 611+1 Source Files\CPU10_x64_AVX.asm
177 000000F0 C5F96FFC vmovdqa xmm7, xmm4
178 %line 611+0 Source Files\CPU10_x64_AVX.asm
179 000000F4 C5D9DFE0 vpandn xmm4, xmm0
180 000000F8 C551EBD2 vpor xmm10, xmm5, xmm2
181 000000FC C569EFE8 vpxor xmm13, xmm2, xmm0
182 00000100 C551EFDF vpxor xmm11, xmm5, xmm7
183 00000104 C559EFF3 vpxor xmm14, xmm4, xmm3
184 00000108 C44111DFE3 vpandn xmm12, xmm13, xmm11
185 0000010D C44111DBEA vpand xmm13, xmm10
186 00000112 C521EFFA vpxor xmm15, xmm11, xmm2
187 00000116 C511EFC3 vpxor xmm8, xmm13, xmm3
188 0000011A C44109DFC8 vpandn xmm9, xmm14, xmm8
189 0000011F C511EBED vpor xmm13, xmm5
190 00000123 C5D1EBE8 vpor xmm5, xmm0
191 00000127 C539DFC7 vpandn xmm8, xmm7
192 0000012B C44101DFFE vpandn xmm15, xmm14
193 00000130 C44111EFEF vpxor xmm13, xmm15
194 00000135 C4C151EBF5 vpor xmm6, xmm5, xmm13
195 0000013A C5D1DFEB vpandn xmm5, xmm3
164 名前：やんやん ◆yanyan/Pails mailto:sage [2013/09/26(木) 09:42:28.26 ID:rTRwfDJk0]: コードの動的書き換えまでやってるんだ。頑張るなぁ
165 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 10:03:07.79 ID:6FvOHAWcP]: >>164
速くするためにできることは全部やるつもりですｗ
10桁トリップのCPU検索だと2～3M TPS違ってくるので、かなり大きいです。
166 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 10:21:16.12 ID:6FvOHAWcP]: 3オペランドの命令を2-byte VEX Prefixになるように
書き換えたら遅くなったぞ。なぜだ…
167 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 11:03:10.06 ID:6FvOHAWcP]: うーん、やっぱりわからん…
まあいいや、また今度にしよっと。
168 名前： ◆Meriken//XXX mailto:sage [2013/09/26(木) 12:42:38.98 ID:6FvOHAWcP]: 290Xが噂通りの性能なら、検索君1号の6990をリプレースしたいところですが、
どうなんでしょうねえ～

AMD，新世代GPUシリーズ「Radeon R9」「Radeon R7」を発表
www.4gamer.net/games/234/G023455/20130926001/
169 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/26(木) 21:45:53.97 ID:dy4WW+LZ0]: >>168
絶対に値段がヤバそう、かと思いましたがそれほどでもないのかな＞R9 280X(のメーカー想定売価)は299ドル
170 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/26(木) 22:52:10.88 ID:K0nbDP0R0]: AMDがMantleとかいう新しいLow Level APIも発表したが
使えるのグラフィック用途だけなのかな
171 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/26(木) 23:28:01.94 ID:6DsB6fP10]: >>151
お久しぶりです。
日々の仕事をこなしつつトリップ検索のための正規表現エンジンのためのJITコンパイラを作るという作業にエタってました。

DESのS-Boxですがmovdqaが２個あるくらいなら速度差は出ないでしょう。
AVXでターゲットをSandy以降とする場合、ベクタ整数Logicは3op/cycleです。
従って速度を稼ぐには常に3命令を供給できるようにコードを書かなければなりません。
命令フェッチが16Byte/cycle、デコードが4op/cycleなので2ByteVEX（レジスタ間で4Byte）、3ByteVEX（レジスタ間で5Byte）
のどちらでも達成可能ですし、数個のメモリオペレーションはOoOのキューで隠蔽されます。
ただし、メモリオペレーションを含む場合はLodeポートが2本、Storeポートが１本で命令長が多くの場合4Byteほど長くなることを意識する必要があります。
これはメモリオペレーションを含む論理演算は2ByteVEXの場合で2op/cycle、3ByteVEXの場合は1op/cycleしか命令を供給できないということですので、
間にレジスタ間演算を入れて供給命令数を維持するかループにしてuOPキャッシュを当て込むか、そういうものだと諦めるかしなければなりません。

2ByteVEXにすること自体は簡単で、VEX prefixのフォーマットを見るとわかりますが
AVXop　dist，src1，src2
という場合src2をxmm0～xmm7に制限するだけです。
distとsrc1にはxmm0～xmm15までの全てのレジスタを指定可能です。
まあ、レジスタ割付は面倒になります。
172 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:05:59.70 ID:8wnFvcpWP]: >>171
なるほど、そういう頭が必要なんですね。道理でなかなか速くならなかったわけだ。
実に勉強になりますです。

> 日々の仕事をこなしつつトリップ検索のための正規表現エンジンのための
> JITコンパイラを作るという作業にエタってました。

MTFの正規表現のルーチンもC#で綺麗に書きなおそうと考えてたんですけど、
この発想は斬新ですねｗ流石です。
173 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:11:08.04 ID:8wnFvcpWP]: >>170
Mantleからだと直接GCNを叩けるみたいですね。
オープンソースになるという噂もあるみたいです。
GCNは性能的に化物としか言い様がないので、ｗｋｔｋが止まらないですｗ
174 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/27(金) 01:17:32.97 ID:lkqItC0o0]: >>172
maleで拙作のavxDESを送ったので時間があれば見てみてください。
あまり参考にならないかもしれませんが
175 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/27(金) 01:18:39.25 ID:lkqItC0o0]: >>174
トリわすれてました
176 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 01:42:29.83 ID:8wnFvcpWP]: >>174-175
わざわざ有り難うございます。さっきまで送っていただいた
S-BoxをMTFに実際に組み込んで動かしていたんですが、確かに速くなっていますね。
素晴らしい出来です。
177 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/09/27(金) 01:59:44.23 ID:3xFrfLPD0]: 　｀¨ －　､　　　　　＿_　　　　　 _,. -‐' ¨´
　　　　　　| ｀Tｰて＿,＿｀　`ー<^ヽ
Meriken　.|　 !　　　　　　｀ヽ　　ヽヽ znjnB
　　　　　 r　/　　　　　　ヽ　ヽ　　_Lj
　､　　　 /´ ＼　　　　＼　＼_j／ヽ
　　｀ー　　　ヽｲ⌒r-､ヽヽ__j´　　　｀¨´
　　　　　　　　　￣ー┴'^´
178 名前：名無しさん＠お腹いっぱい。 [2013/09/27(金) 02:20:44.90 ID:0ZtIGcs50]: maleで送ったとか・・・

ｱｯｰ!!!
179 名前： ◆znjnB.IJwZLU mailto:sage [2013/09/27(金) 02:35:31.94 ID:lkqItC0o0]: >>176
何の説明もなく失礼しました。
cryptのつくりが全く違うのにすんなり対応されて流石です。

拙作ではS-Boxの最適化は>>171で述べた通りですが、cryptに関しては
キャッシュの最適化を目論んだつくりになっています。
MTFではkey[56]をexpandedKeySchedule[0x300]に展開していますが、
expandedKeySchedule[0x300]で12kBのL1Dキャッシュを占有します。
これはハイパースレッディングで2スレッド走らせる場合、L2キャッシュへのアクセスが生じると
大きなペナルティになりえます。
それでなくても12kB分のstoreはコストが高いのです。
というわけでkeySchedulは命令のほうに展開しています。

最終転置とblock初期化もcrypt関数内に隠蔽してあります。
従ってcrypt関数にはblock[64]をわたして、帰ってきたのをそのまま使えます。

saltはMTFと同じ手法で0x7FFFFFFFがシグネチャになっているのでここを変えればそのまま使えると思います。

>>187
mailだった
180 名前： ◆Meriken//XXX mailto:sage [2013/09/27(金) 06:52:13.34 ID:8wnFvcpWP]: >>179
> これはハイパースレッディングで2スレッド走らせる場合、
> L2キャッシュへのアクセスが生じると大きなペナルティになりえます。

ああなるほど、それでL1Dキャッシュが潰れて遅くなっていたんですね。
前スレでスレッドの数ごとに速度の比較を行われていたのにも合点がいきました。

KSを命令のほうで展開するやり方はOpenCL版では使っていたんですが、
CPUでは試していませんでした。ただ、STFの展開の仕方は随分独特で
スッキリしているように見えます。できることはまだまだたくさんありますねえ。
明日から1週間ほど家を空けるので、AVX2版の実装と一緒に試してみます。
いや～、楽しみだなあ。
181 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/09/28(土) 19:26:50.26 ID:3+QdwiIO0]: よくわかっていないのですが、MTFでの検索パターンとのマッチング処理ってどういう風になっているのかな
１トリップ生成する毎にマッチング処理ですか？
182 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 19:57:56.89 ID:puciZRd6P]: MERIKENさんの彼女って美人さんかな
183 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 20:29:14.46 ID:Er9GkfO70]: 400年生きてるけど容姿は14歳くらいの
押しかけ女房という設定でよろしくお願いします
184 名前： ◆AAAAAIgElTYM mailto:sage [2013/09/29(日) 21:09:53.00 ID:puciZRd6P]: MERIKENさんのOpenCLのカーネルを参考に作ったら

MTFで900MHash/s出るGPUで590MHash/s出せた

900M目指す
185 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:30:42.42 ID:puciZRd6P]: と思ったら900Mは簡単に出せた

ただしキーの判定がA,B,C,D,EのAが0かどうか、だけですが
186 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:32:17.66 ID:puciZRd6P]: MERIKENさんのカーネルすごいなー
187 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/09/29(日) 21:33:58.75 ID:UQDnvd/B0]: >>183
ロリババアじゃねえか……最高だな
188 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 09:12:18.65 ID:c9bt88M30]: 質問です
自分が見つけたトリップのキーが既に割れているかどうか調べる方法ってあります?
トリップでググってみたけど出てこなかった

◆WWmMMmWmmM
◆mmmmMMWmmM
189 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 12:12:15.95 ID:RmatBROi0]: ぐぐって出てこないなら割れてないんじゃないかな
キーが割れてるか調べるならキーでぐぐれば良いかと
別キー同トリは酉でぐぐってみるしかないですねぇ

あとはデータベース調べるくらい？
ttp://trip2ch.net/
190 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/02(水) 12:29:57.48 ID:rovLnW6/0]: 例の流出騒動で割れた(けどネット上でまだ使われていない)人もいるしなぁ……
俺のように
191 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 12:38:17.05 ID:HrAyM4RZ0]: 自分が見つけた、ということなので未使用前提のレスなのら
自分が使ってないなら誰かが先に見つけて、晒したり使用したりしていない限り
割れていることはないからね
192 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/02(水) 13:54:06.66 ID:V6M1LhCI0]: 別キー同トリって、ハッシュの衝突ということだよね？
SHA-1ってそんなに衝突起きてたっけ？
193 名前： ◆MONEY///WQoK mailto:sage [2013/10/02(水) 13:58:55.21 ID:c9bt88M30]: >>189-191
個人で使うこんな感じで↑一般的なものなら神経質にはなりませんが、
最長や最短のように変わったトリップは他にも使っている可能性もあるので、
調べてみようと思いました
データベースとグーグルを活用したいと思います

ありがとうです　m(_　_)m

12Mt/s程度のPCには8完9完はきついです
見つかる気がしませんw
194 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 14:06:57.14 ID:ntU3OB+00]: >>193
8完程度なら他の人が見つけてくれることもあるよ
それがクラスターの良いところ

＃今日は気温が上がってしまったので落ちまくりｗ
195 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 16:30:36.74 ID:J0NS89z00]: >>192
SHA-1をBASE64にした先頭12文字らしいから、
160bitのうち6bit×12文字で72bitしか使わない計算だからねぇ…
有効空間で309485009821345068724781056分の1、かな。
誕生日のパラドックスで衝突率を求めると…どうなるんだ？
196 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/02(水) 19:41:47.15 ID:c9bt88M30]: >>194
なるほど
確かに分散処理が出来ましたね
197 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/02(水) 19:46:03.89 ID:7dIRUU6o0]: 金さえあれば3Way CFXしてブン回せるのに…うぐぐ
198 名前： ◆LoveNico9g mailto:sage [2013/10/02(水) 21:39:36.99 ID:ElaEz5OR0]: あなたは10桁トリップを発見しました。プラチナ貨8192枚が支払われます。 (19時間前)

文字数がないということは特殊なトリップかな？

あなたは8文字一致の10桁トリップを発見しました。プラチナ貨4096枚が支払われます。 (3ヶ月前)
あなたは9文字一致の10桁トリップを発見しました。プラチナ貨262144枚が支払われます。 (3ヶ月前)

8文字超、9文字未満の報酬ね
199 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/03(木) 00:57:15.45 ID:5JFild+E0]: 妙な質問ですが、
tripcode.net/yggdrasil/screensaver.php
って1920x1200に最適化しているんですか？
HTML Screensaverで表示させると12桁トリップのグラフと上位数名のリストしか表示されませんorz
(1366x768のノートパソコンでの話)
200 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 01:01:16.51 ID:6er0tSp20]: >>199
893 ： ◆Meriken//XXX ：2013/09/08(日) 07:55:22.82 ID:9LBqP7z/0 (2/2)
スクリーンセーバー用のページを新しいグラフに合わせて変更してみました。
これでPCの台数が増えてもしばらくは安心です。相変わらず1920x1080専用です。

tripcode.net/yggdrasil/screensaver.php

スクリーンセーバーはこちらがお勧めです。

HTML Screensaver
myweb.tiscali.co.uk/djmclean/htmlscreensaver.html
201 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 01:27:20.09 ID:JxzZIhR00]: >>198
過去ログにも出てるけどそれは準10連を見つけた場合の報酬
純10連だと6815744枚もらえるらしい

ところで昨日10/2の11:00頃に12桁のmaxが66.3G TPSになってるのは一体…
202 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 05:39:39.07 ID:FzkRfayB0]: どっかの大学か専門学校あたり教室から誰か遊んだのかなｗ
203 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/03(木) 08:54:27.00 ID:5JFild+E0]: >>202
まあでもグラフを見る限りでは50GTPSは上がってるしな……
一台あたり100MTPSでも500台は牛耳らないとああはならないはず

バグである可能性もあるが
204 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 09:58:21.96 ID:vduEdb0k0]: >>203
そういうところだとPXEブートしてたりする。
PXEサーバへの線を切って起動後即アプリ起動するイメージ持ったPXEサーバを設置すれば、
後は片っ端から電源入れるだけで利用できるから、100台くらいは案外乗っ取れるかと。
あとはGPUの相性次第？
205 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 10:19:02.54 ID:FzkRfayB0]: >>204
参加者の中でばかっ速いのはほんの数人、実質Merikenさんだけで半分以上稼いでるようなもんだけどｗ
うちの１年くらい前の普及価格帯GTX660ですら、開発版MTFならGPUのみ単体でも400Mtpsくらいでるから
ちょっといいグラボ乗せていそうなところだったら教室1つで行けそうな気がするよｗ
206 名前：shirawa@mmo ◆GTExxuWcjk/9 mailto:sage [2013/10/03(木) 12:18:13.19 ID:1mbRumHzP]: 1人で数百台所有してる方も見かけますし、あながち団体とも言い切れないのがおそろしいところｗ
案外、海外の方とかもありえる？
207 名前： ◆LoveNico9g mailto:sage [2013/10/03(木) 20:04:17.29 ID:2EEzR2Fi0]: >>201
なるほどなるほどー
使うためには将来実装されるフリマ？バザー？で買い戻すしかないのかな？
しかし見つけたトリップが何かわからないからそれもかなわないのだけど…

そういえば有償版は"参加しない"設定はあるけど"参加するけどトリップは提供しない"設定は無理なのかしら？
依頼と手元の検索対象が被った場合に、手元を優先して提供しないみたいな
208 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/03(木) 21:21:24.21 ID:FzkRfayB0]: 今は丁度留守だけど
ユグドラの機能絡みの話はあっちのスレでやった方が話題を共有できるしMerikenさんもノリやすいと思うよーｗ
209 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 22:55:31.53 ID:PVFODAuA0]: AMD Catalyst? Display Driver for Windows Vista 32-bit って、最新版は 13.4 なんですか？
検索しても、13.10 が見つからない・・・
210 名前： ◆Meriken//XXX mailto:sage [2013/10/03(木) 23:48:31.78 ID:hGyYsSenP]: ようやくアリゾナへの小旅行から戻ってきました。
セドナっていうインディアンの古い聖地に行ってきたんですけど、
岩山が並ぶ景観が素晴らしかったです。
地元の人達も面白い方が多かったので、またぜひ行ってみたいですねえ。

>>183-184
彼女はころっとしてて愛嬌のある感じです。
無事に日本に辿り着ければいいんですが…
211 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/03(木) 23:54:23.91 ID:yymlo581P]: MERIKENさんおかえり！！
212 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/03(木) 23:57:23.45 ID:Z2ZCk0070]: おかえりー!行ってみたいなぁ…
213 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 01:03:55.19 ID:9T4g2abG0]: >>210
> 無事に日本に辿り着ければいいんですが…
ヒッチハイクで帰国したとか？？
214 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 04:41:05.93 ID:iHUDZBAdP]: どもどもｗ

>>213
彼女、ロスの空港で1人で乗り継ぎだったんですけど、
英語が殆どできないんですよね… まあ大丈夫だとは思いますが。
215 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 04:54:13.15 ID:iHUDZBAdP]: >>184
検索エンジンのソースコードはGPLで公開されているので、
じゃんじゃん使ってやって下さいｗ
216 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:01:23.10 ID:iHUDZBAdP]: >>197
電気代は盲点でしたね～
私ももうちょっとお金があったら専用電源を備えたPC専用の部屋が
欲しいところですけど、先は長いですねえ。
217 名前： ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:08:24.51 ID:iHUDZBAdP]: >>207
これどうしようかかなり迷ったんですけど、
参加していただく以上は条件を揃えておきたかったので
こんな風になっています。
218 名前：名無しさん＠お腹いっぱい。 [2013/10/04(金) 05:39:22.35 ID:OK0SaK/c0]: 誰も怒らねえからまんどくさいのでと正直に言えよw
219 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/04(金) 05:44:19.39 ID:mM382Oj10]: 60A契約だと不足気味になるから、75Aにしようかと思ったりしたり。
220 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 05:48:05.07 ID:iHUDZBAdP]: R9 290Xがもう少しで発売ですね。いや～、楽しみだなあ。

しかし旅行から帰ってきたら2chの規制が更に厳しくなっていますね。
忍法帳のレベルを上げないとリンクも貼れないとか、どうかしてます。
海外規制は相変わらずだし、流出事件以降VPNも規制されて、
●で規制を回避できなくなっちゃったし…
これで公式p2も海外規制されたらどうしようかしらん。
221 名前：忍法帖【Lv=40,xxxPT】(1+0：8) 【東電 59.6 %】 mailto:sage [2013/10/04(金) 06:05:56.81 ID:rrTSneEoP]: てすと
222 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 06:07:02.04 ID:iHUDZBAdP]: >>218
実装自体は判定の処理の順番を入れ替えるだけなので、
そんなにめんどくさくないですｗ
経験値は非常に重要な指標なので、
を獲得するための条件は同じにしておきたいんですよね。
223 名前：忍法帖【Lv=2,xxxP】(3+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 06:17:55.03 ID:iHUDZBAdP]: >>219
いいですね～ほんとに検索速度の限界は電気の供給によって決まってきますね。
224 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 06:22:44.72 ID:rrTSneEoP]: 半導体プロセスが28nmから20nmになったら同じ電力で倍の速度出せるようになるかな
225 名前：忍法帖【Lv=2,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 07:07:47.87 ID:iHUDZBAdP]: さすがにそこまではいかないでしょうけど、
確実にワットあたりの性能は上がるでしょうね。
R9 290Xが7970と比べてどれぐらい性能が上がっているのか、
非常に気になるところです。
226 名前：忍法帖【Lv=2,xxxP】(2+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 07:43:28.35 ID:iHUDZBAdP]: >>180の続きですが、STFのS-Boxを使わせていただいた結果、
速度は26.05M TPSまで上がりました。>>151の数字より確実に
良くなっていますが、key scheduleを命令のほうに展開してやれば
更に速くなりそうです。取りあえずMTFのルーチンで展開を試してみてから
送っていただいたSTFのルーチンを移植してみることにします。
227 名前：忍法帖【Lv=2,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/04(金) 14:49:48.68 ID:iHUDZBAdP]: 現在せっせAVXのルーチンを書き換え中。
動的書き換えを行っているルーチンを修正するのは結構大変です。
うまくいくかな～
228 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 18:27:11.06 ID:rrTSneEoP]: ttp://www.fileformat.info/tool/hash.htm?hex=1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498

ビットコインのクライアントのRPCを使ってブロックのハッシュ値を列挙して連続する0のビットが一番多いハッシュを探した後、

ビットコインのハッシュはSHA256(SHA256(key))なのでブロックのヘッダをblockexplorerで持ってきて
SHA256(header)を計算して　1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498　を出して

これをHEX表示としたバイナリのSHA256ハッシュが実際に00が連続することを確認した

ちなみに73ビット0が連続する　もし2chのトリップのSHA1で72ビット以上0が連続したら12連の"AAAAAAAAAAAA"になる
229 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 18:30:52.37 ID:rrTSneEoP]: でもBitcoinは先頭と末尾が逆だった(連続する0ビットの位置の）
230 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/04(金) 19:41:03.52 ID:QT5wWxXa0]: 特にエラーも出てないのに、GPU 検索が止まってる事があるけど、
エラーが出ないので情報を提供出来ない・・・
231 名前： ◆MOYASHI/Go mailto:sage [2013/10/04(金) 21:14:55.45 ID:Ohb6dumk0 BE:4454085877-2BP(7)]: お、Merikenさんおかえりなさい。

>>220
2ch書き込み規制等の場合は、したらばのMerikenさんの掲示板の辺りへ移動かな？
でも、したらばって12桁トリップ使えないんでしたっけ？う～ん…

>>230
環境や状況等を詳しく書いた方がいいかも。
232 名前：忍法帖【Lv=3,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/05(土) 01:03:32.26 ID:V671iDXLP]: >>230
こういう場合はまずハードウェアがらみなんですけど、
エラー処理を見なおしたほうがいいかもしれませんね。
ハードウェアの構成を教えていただけると助かります。
233 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/05(土) 01:07:57.88 ID:R6g1pM6d0]: 7970の場合だと90℃を超えた辺りで不安定領域
95℃まで行ったらまずGPUが脱落する
保護回路かな？
動作保証のあるメーカー品でも強烈な連続負荷が掛かるので油断出来ない
234 名前：忍法帖【Lv=3,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/05(土) 01:39:01.21 ID:V671iDXLP]: >>231
緊急時にはとりあえずしたらばに移動ですね。
2ちゃんねるVPNを使えば海外規制は回避できるんですが、
有料だし不便なのでできれば避けたいところです。
235 名前：忍法帖【Lv=3,xxxP】(1+0：8) ◆Meriken//XXX mailto:sage [2013/10/05(土) 03:21:44.19 ID:V671iDXLP]: とうとう4770とM6Eをポチってしまいました。
これで思う存分AVX2をいじれます。ぐへへへへ…
236 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/05(土) 04:34:59.02 ID:R6g1pM6d0]: 私はFX-9370をポチってしまいました
TDP200Wゴクリｗ
237 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 04:55:00.35 ID:V671iDXLP]: AMDのCPUもきちんと書いてやれば>>67のようにちゃんと速度が出ますしね。
何より独立したコアが8個あるのは魅力的です。楽しみですね～
238 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 09:10:12.59 ID:V671iDXLP]: 1日かけてAVXのルーチンのkey scheduleをコードに展開してみました。
で、うまく動いたのは良かったのですが、速度はかえって落ちてしまいましたorz
やはりSTFみたいにDES crypt(3)の二種類のラウンドを畳み込んでやらないと
今度はコードがキャッシュから溢れてしまうようです。
239 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/05(土) 09:29:04.34 ID:V9+sfTd+0]: 最近のCPUは投機的実行したりパイプライン深かったりだから、
アセンブラレベルでの高速化って大変そうだな。
240 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 11:05:48.38 ID:V671iDXLP]: 確かにかなり難しいですねえ。畳み込みも試してみましたが、それでも書き換え前の
速度には届きませんでした。アセンブラのルーチンはほとんどSTFと
おなじになってしまったので、>>179で教えていただいたとおりに
やってるはずなのに速くならないのはかなり謎です。
241 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 11:17:38.50 ID:V671iDXLP]: まあいいや、また今度STFのルーチンを試してみようっと。
そうすれば少なくとも問題の切り分けはできるはず…
242 名前： ◆JouJaku.IYSv mailto:sage [2013/10/05(土) 15:26:49.76 ID:TQdt57zm0]: >>235
おぉ、遂にですね。
アマゾンで購入する時には極力ゆぐ経由で注文していたのですが、少しは足しになりましたかね?

M6Eの一番下のPCIeに、2若しくは1.5スロット幅のカードが刺さるかどうか教えて下さい。
Z87 Extreme 9を使っているのですが、一番下のPCIeはスイッチケーブル等が干渉して水枕付きの7990が刺さらないのです。
243 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 18:24:43.38 ID:V671iDXLP]: >>242
確実に足しになっていますよ。ありがとうございます。
写真を見る限りでは干渉するようですが、一応届いたら確認してみます。
検索君1号でも干渉しているのですが、R.O.G.シリーズのマザボは
電源ボタンが別に付いているので私は普段はそれを使っています。
244 名前： ◆Meriken//XXX mailto:sage [2013/10/05(土) 18:46:04.08 ID:V671iDXLP]: あれからいろいろ実験してみたのですが、>>179のようにL1Dキャッシュを
有効活用するためにはキー生成とヒット判定のルーチンに相当手を入れないことが
いけないことが分かりました。◆znjnB.IJwZLUさんはかなり色々工夫されているようです。

まあでも原因がわかったので、取りあえずこの件は置いておくことにして、
AVX2対応の準備を勧めることにします。
245 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/06(日) 22:27:59.59 ID:on3hVRef0]: 着々と高速化されていて期待する日々
ちょっとだけぶん回す
246 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/06(日) 22:59:18.76 ID:vgIX48Ma0]: 熱と電気代の壁を乗り越えて頑張ってください
247 名前： ◆QZaw55cn4c mailto:sage [2013/10/06(日) 23:07:39.77 ID:tfHzXDW00]: 熱はこれからの季節ではともかく電気代の壁には参っております，いつ脱落してもおかしくない‥‥
248 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/07(月) 00:02:30.75 ID:jF8JVd0Q0]: 電気代のほうが深刻です
1～2時間フル稼働が限界かも
249 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 00:24:06.99 ID:dlpjmzEs0]: ラスボス：電気代
250 名前： ◆Meriken//XXX mailto:sage [2013/10/07(月) 02:29:43.10 ID:kkyn89W/P]: ハイエンドのグラボを2枚使って24時間稼働させると
電気代は月10000円前後なのでたしかに痛い出費ですねえ。
長い目で見たら1枚だけ使って電気代を抑えたほうがいいのかもしれません。
7970 1枚だけでも現在のゆぐちゃんでは十分トップクラスですしね。
私としては無理の無い範囲で長く続けていただきたいところです。
251 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 17:32:57.57 ID:/IUR/xz60]: 嫌な感じだな。

そこまでして・・
252 名前： ◆Meriken//XXX mailto:sage [2013/10/07(月) 19:16:23.56 ID:kkyn89W/P]: まあもともと本格的なトリップ検索にはお金がかかりますしね。
他にもっとお金のかかる趣味なんていくらでもあるし、
人の趣味にケチを付けるのは無粋というものです。
253 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 19:49:49.65 ID:T8R7cFdS0]: GPU を使う場合はともかく、最近の CPU は一杯コアがあるし、
PC の電源が入っている間は、一部のコアでずーっと検索させてても
全く何の問題もないよね。
２つ位コア開けておけば、通常の使用に影響出ないし。
254 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/07(月) 19:51:37.30 ID:YIb5KFv+0]: まあだからこその、分散処理なんですよね。
自分一人で1垓のトリップの中から好きなトリップ1個を探し出すのにかかる電気代と、
50人で1垓のトリップの中から好きなトリップをそれぞれ探し出すのにかかる電気代では、
単純計算で前者の50分の1の電気代で済むわけですからね。
皆で協力する事で必要経費も人数分の一に分散出来て、それでいて人数分の一の時間で必要なものも見つけられる。
お互いが得する大変良い仕組みだと思います。
開発頑張って下さい。
255 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 19:58:08.91 ID:T8R7cFdS0]: ところで、検索は完全にランダムにやってるんだと思うけど、何故か、頻繁に見つかるトリップと、
全く、一切、全然、ちっとも見つからないトリップがあって、かなり偏るんだよね。不思議だ。
256 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/07(月) 22:05:18.86 ID:XMrah83C0]: >>255
短い回数だと乱数が偏ったように見えることはよくあること

ところで、前にも聞きましたが、この状態だと検索時間が16倍速なんですよね？
ttp://up3.viploader.net/net/src/vlnet016276.png
257 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 22:17:15.13 ID:ruVVZ61g0]: 16・倍・速！ 16・倍・速！
258 名前： ◆Meriken//XXX mailto:sage [2013/10/07(月) 22:28:15.09 ID:kkyn89W/P]: >>256
なんか妙に台数が増えてた時間があったのはYSRKENさんだったんですねｗ

> この状態だと検索時間が16倍速なんですよね？

違います。同時に何台稼働しても検索時間は一緒です。
259 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/07(月) 22:32:53.07 ID:XMrah83C0]: >>258
なん、だと……！？

まあこのキャプ撮りたいがために16台を一時的に乗っ取ったのですがｗ
260 名前： ◆Meriken//XXX mailto:sage [2013/10/07(月) 22:35:08.34 ID:kkyn89W/P]: >>254
分散トリップ検索は長い間あたためてきたアイディアなので、
実現できて結構嬉しいですｗトリップ検索はパターンの数が増えても
速度は急に落ちないので、実に分散処理向きといえます。
261 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/07(月) 22:44:56.42 ID:8uRwwq3r0]: 17時前後の青グラフと"max: 31"があなたの仕業ですかー！
ttp://up3.viploader.net/net/src/vlnet016277.png
262 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/07(月) 22:55:15.52 ID:XMrah83C0]: >>261
そうでーすｗ

トライして気がついたのですが、これってWeb上では同じ「4MTPS」でも、
ソートする際は小数点以下も含めているんですか？
263 名前： ◆Meriken//XXX mailto:sage [2013/10/08(火) 02:44:29.87 ID:Be50s5DTP]: >>262
そうですよ。
264 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/08(火) 02:59:16.21 ID:hGdMdaDn0]: >>263
良かったです。このソフトでは小数点以下を切り捨てているわけじゃなかったんだね！
265 名前： ◆Meriken//XXX mailto:sage [2013/10/08(火) 06:16:31.85 ID:Be50s5DTP]: 今日あたりHaswellが届いているはずだけど、ちょっと見に行ってみるか。
266 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/08(火) 08:12:07.30 ID:uiAIodMh0]: >>256
> 短い回数だと乱数が偏ったように見えることはよくあること
いや２４時間３６５日検索してるんだけど・・・
267 名前：ねこ ◆TheWorld.o [2013/10/08(火) 08:59:54.97 ID:wwRsWuFO0]: ロト7を毎週1年買っても当たらないようなものです
268 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/08(火) 11:37:45.44 ID:ruHOMK/b0]: >>266
トリップってA-Za-zの26*2文字＋0-9の10文字＋./の2文字＝64文字で構成されているんだろ？
12桁ならそれが64＾12のパターン数、64^12=(2^6)^12=2＾72=(2^10)^7.2≒(10＾3）^7.2=10^21.6
10垓(ガイ)=Z(ゼタ)の単位の数の中から、ちょっと取り出した程度で偏りが無くなるわけないじゃないか。
例え1京(ケイ)=10P(ペタ)パターンのトリップを発見したとしても、それは全体の万分の一以下の数でしかない。
269 名前： ◆Meriken//XXX mailto:sage [2013/10/08(火) 14:50:47.22 ID:Be50s5DTP]: >>255
もうちょっと具体的に書いてもらえれば詳しいことがわかると思いますよ。
MTFのバグという可能性もありますしね。
270 名前：名無しさん＠お腹いっぱい。 mailto:Sage [2013/10/08(火) 15:54:01.93 ID:U2rkGsnVO]: 例えば9桁完全一致トリップが欲しいとして、
12桁で検索するのと10桁で検索するのでは、
どちらが確率が高いのでしょうか？
271 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/08(火) 19:37:18.73 ID:hGdMdaDn0]: >>270
確率は同じだが普通は前者の方が高速に検索できるからお勧め
ユーYggdrasil に依頼しちゃいなYO
272 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 00:11:52.59 ID:qMpebiGr0]: ゆぐちゃんの実績から言っても12桁ですよねー

ttp://tripcode.net/yggdrasil/
平均検索時間(12桁):13.9日(9文字)
平均検索時間(10桁):1.4ヶ月(9文字)
273 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 01:07:35.35 ID:lCvxi2JOP]: YSRKENさん、ときどき名無しで書き込んでますね。
274 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 01:18:50.00 ID:lCvxi2JOP]: Haswellが届いたことは確認済みなので、これから取ってきます。
今日はちょっと用事があるので組み立ては明日あたりかな。
275 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/09(水) 01:31:41.77 ID:hjmT6Azw0]: >>273
えっと、はいそうです。とは言っても、
「専ブラでコテハン記憶しているはずなのになぜか消えてて面倒になった」
というのが主な理由ですが。
>>274
遂にMerikenさんがHaswellに挑戦するんですね……ﾄﾞｷﾄﾞｷ
276 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 01:47:33.39 ID:lCvxi2JOP]: >>275
そうですか。まあ何事もほどほどに、ね。
277 名前： ◆QZschizo.ptH mailto:sage [2013/10/09(水) 03:59:47.55 ID:lS/PIDax0]: >>270
12桁の方がトリップ生成速度が格段にはやいし（環境によるけど）、なんだか12桁ってあんまり「安全」じゃないような気がしてきた‥‥
278 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 04:35:29.68 ID:wuthnGWj0]: >>277
前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれないけれど、
完全一致なら空間的にも時間的にも12桁の方が安全性は高いと思うよ。
検索速度が何倍で、トリップ数が何倍か計算してみよう。
トリップ数ではなく使用可能な鍵空間で計算してみても良い。

あーでも捻ってないからレインボーテーブル的なアプローチには弱いかも。
279 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 04:37:19.41 ID:lCvxi2JOP]: 検索速度は12桁のほうが数倍速いですけど、10桁トリップのキー空間の狭さを考えたら
12桁トリップのほうがはるかに安全ですよ。12桁トリップの数は2^72個ですけど、
10桁トリップはキーが56bitだから最大で2^56個しかありません。
キーがShift-JISの場合はさらに少なくなります。
280 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 04:55:24.64 ID:lCvxi2JOP]: >>378
2^34TPS (≒16G TPS)で検索しても12桁トリップをすべて出すには
最低で2^38秒(≒87世紀)かかるのでまあ大丈夫でしょう。
281 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 04:56:51.56 ID:lCvxi2JOP]: >>280は>>278さん宛でした。
282 名前： ◆QZschizo.ptH mailto:sage [2013/10/09(水) 04:57:40.03 ID:lS/PIDax0]: 確かに鍵空間的に2^16 違うのであれば、不安がる根拠はありませんね、いろいろ教えていただきありがとうございます
283 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 08:12:00.69 ID:c6EX+6rR0]: 時代は12桁
284 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/09(水) 08:15:12.78 ID:hjmT6Azw0]: >>278
>前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれない
前に「いや先頭合ってるだけで誤解されかねないからそれはそれでマズい」って声があったような……
でもまあ完全一致や全桁対象の酉（例：全数、二構）だと10桁の方が断然見つけやすいんですけどね
285 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 08:51:52.85 ID:lCvxi2JOP]: >>283
そのかわりきれいなトリップは10桁のほうが断然出しやすいですけどね。
一長一短といったところです。
286 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 09:19:45.48 ID:P0BLzLC00]: >>285
10桁酉の場合、最後に使える文字が16種類しかないってのが
きれいな酉を探すにはネックになるかもしれないですけどねｗ
287 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 12:06:51.46 ID:lCvxi2JOP]: >>286
でも12桁で最後まで揃っているトリップを出すのは至難の業ですからねえ。
もうちょっと速度を向上させたいところです。
288 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 13:19:42.59 ID:lCvxi2JOP]: Haswellちゃんが届いたのでさっさと検索君1号にインストールしてしまうことに
しました。マザボとCPUを交換してから試しに立ち上げてみたら平然と動いていますw
OSを再インストールしなくていいのには助かりました。うまく行けば今日中に終わるかな。
289 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 15:06:43.48 ID:lCvxi2JOP]: 試しにi7-4770で10桁トリップのCPU検索を動かしてみましたが、
定格の3770Kよりちょびっと遅いぐらいです。
しかしなぜか3枚目の7970が認識されません。むぐぐ…
290 名前： ◆Meriken//XXX mailto:sage [2013/10/09(水) 15:13:29.70 ID:lCvxi2JOP]: システムもイマイチ安定しなかったので結局OSを再インストール
することにしました。やっぱりサボろうとするといけませんねえ。
291 名前： ◆QZschizo.ptH mailto:sage [2013/10/09(水) 18:33:25.41 ID:lS/PIDax0]: >>251
keyword: 浪漫
292 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 18:44:03.56 ID:rG8iFpjW0]: 男のマロン
293 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 19:00:49.17 ID:gUimoTt50]: 中々
ttp://www.youtube.com/watch?v=_rzNFvJIF28
良い歌だよね。
294 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 19:37:13.05 ID:P0BLzLC00]: 8bit機が現役でどんどん新作でていた頃　はっきりしないけど25年も昔だろうか・・ｗ
HDDが20Mで20万とかした記憶があるｗ
1Tあたりに換算すると100億くらいか・・

今のHDDは1Tあたり4000円程度
容量単価で250万分の1くらいｗ

12桁トリップ全保存計画を実行しようとすると
2^72の空間でキーとトリップのペアが24バイト
2^72*24

2^40が1Tで、その1000億倍くらいｗ　4,000,000,000,000,000 ＝4000兆円
日本の国家予算の10倍くらいかなｗ
でも容量単価が250万分の1になれば・・・

2^40 * 2^32 * 24
100,000,000,000 / 2,500,000 = 1,000,000/25 = 40,000 今の1Tハードディスク4万個分くらいの予算
4000*40000=1億6千万円

25年後　1億6千万円分のHDD容量で12桁のキーとトリップのペアを全部保存できる？
計算合ってるかな？
どこかの自治体のプロジェクト予算って感じか・・・ｗ

さらに25年後　250万分の1の値段になると
160,000,000 / 2,500,000 = 1600 / 25 = 64円　ｗｗｗ

２ちゃんねるが出来てから、既に14年たっているんだよねー
月日が立つのは速いｗ
295 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 19:38:14.38 ID:sMw4vpEq0]: リアルではかなえられないような夢や冒険に憧れる気持ちを込めて、
「男のロマン」などということもあります
296 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 20:29:50.05 ID:P0BLzLC00]: >>294

＞2^40が1Tで、その1000億倍くらいｗ　4,000,000,000,000,000 ＝4000兆円

ここで桁間違えているな　400兆円だな
そうすると、25年後は1600万円か

物好きな小金持ちの年寄りでも出来ないことはない感じか・・・ｗ
297 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/09(水) 20:50:39.62 ID:hjmT6Azw0]: でも、保存しようにも計算が追っつかない気が……真面目に計算してないからよく分からないけど
298 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 21:05:58.94 ID:LbcdLs8/0]: ずっと前にどこかで似たような話を見たと思ったら
anago.2ch.net/test/read.cgi/software/1205766220/529
だった
299 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 21:22:42.31 ID:P0BLzLC00]: >>297
現状では、検索パターンに指定したパターン以外は全て捨てて
新たにパターンを探す時は最初から検索しなおしているわけだけど
保存計画は、計算済みのトリップをかたっぱしから保存していくので
計算済みのトリップならばデーターベースに検索命令入れるだけで1発で取り出せることｗ

とはいえ、高速ループで生成し続けるトリップを、生成する速度で未保存トリップか否かをチェックして未保存なら保存していく処理はスタンドアロンでは難しそう
こういうことにこそ、分散処理が威力を発揮しそうですよね

分散処理でトリップ範囲を分担し
ループで計算しながら、挿入ソートでメモリ展開しつつ、担当範囲の分担PCに計算済みトリップを分配していく

>>298
既出の話題でしたか＾＾；
300 名前： ◆Urotsuki/1Ca mailto:sage [2013/10/09(水) 21:26:31.44 ID:NxgWXisV0]: 結構夢があっていいですねー
SSDがもっと早くなってかつ低価格化すれば実現可能性は十分あります
現状のネックである消費電力と速度を打開してくれるのがSSDですから　価格面ならHDDですけど
301 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 21:30:18.36 ID:wuthnGWj0]: >>294 >>296
そこでレインボーテーブルのアプローチですよ。
始点トリップ+終点トリップで72*2/8=18byte
長さ2^20(1MTrip)で(2^72/2^20)*18=72PiB
トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセットとして読めば
始点トリップ=9byteで9*2^(72-20)=36PiB
1Tあたり4000円で計算するなら1億4745万6000円
20MTPSくらいは出てるようだし平均1分の1GTPSを目標にすれば
始点トリップ=9byteで9*2^(72-30)=36TiB
1Tあたり4000円で計算するなら144万4000円……うん、中々現実的な範囲じゃない？

テーブル作成に掛かる時間は普通に全トリップ計算に掛かる時間(…を超える？)なので、そっちで死にますがｗｗ
302 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 21:54:48.06 ID:P0BLzLC00]: >>301
む～ん、レインボーテーブルが理解できない＞＜
ウィキペディアみてみたけどちんぷんかんぷんでした＞＜

1回総当りでテーブル作るって事はわかるんだけど
なんでその時作ったテーブルが、別のハッシュから結果を取り出すことに使えるのか想像できないｗ

そこでつまづくから、その先の容量削減とかチェイン化とかちんぷんかんぷん
（っていうか、微積とか行列とかの記号出てくると、そっちでお手上げｗ）
303 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/09(水) 22:21:49.95 ID:K2oUYBuJ0]: トリップと遂になるハッシュ値を保存して行く時に、トリップ12桁全部をDBに保存せずにトリップ最初4文字でソート＋ハッシュで保存していくとか？
残り8文字はDBから取り出したハッシュ群から計算して探す。12桁の残り8文字一致だけなら結構速く計算出来ると思う。
そうすると1トリップに付き8文字分データを減らせる。
304 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 22:26:10.85 ID:P0BLzLC00]: >>303
あーーっｗ
言われてみれば、トリップは保存しないでもアドレスから一意に決まる事に出来ますね
ディスクは半分で済みそうです

トリップから一意に決まるアドレス位置に　そのトリップを計算するのに使ったキーを保存していけばいいのね
305 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/09(水) 22:32:50.29 ID:K2oUYBuJ0]: ああ、更に削る方法もあるかな？
例えば最初1文字までにして、2文字目は大文字か小文字か数字か記号で4パターン(00：01：10：11の2ビット)に分ける。
更に3文字目も同じく分ける。更に4文字目も…
そうやってトリップを区分分けする事で、残りの文字列のパターンを分類し、探すハッシュの数を絞っていくとか？
306 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/09(水) 22:42:47.54 ID:P0BLzLC00]: >>305
トリップ　◆AAAAAAAAAAAA のトリップキーはアドレス0に保存
トリップ　◆AAAAAAAAAAAB のトリップキーはアドレス1に

こんな感じで、トリップから一意に決まる保存アドレスにキーだけを保存していく感じで良さそうｗ
307 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 22:46:57.59 ID:wuthnGWj0]: >>302
自分も全容や応用までは把握はできてないのですが…
まずH(key)→hashなハッシュ関数(SHA-1関数の先頭72bit)と、C(hash)→keyな変換関数(仮にBASE64関数)を準備。
適当な始点hashから「H(C(hash))→hash」を複数回チェインして終点hashを得るってのを沢山やって終点hash→始点hashのテーブルを作って保存しておく。
検索時は「H(C(hash))→hash」な処理を延々繰り返して、記録済みの終点hashと一致するまで検索を続ける。
一致する終点hashを見つけたら対応する始点hashから「H(C(hash))→hash」を繰り返して、H(C(hash))が目標と一致したらそのときのC(hash)が目的の値。
…ってのがレインボーテーブルの概要だったはずです。終点hash→始点hashのペア情報だけでチェイン回数分のハッシュを代用できるのが利点ですね。

C(H())チェインがキレイに全ハッシュ空間が一周するC()を組めれば繰り返し長を固定して探索時間の保障が出来ますが、
H(C())の鎖が短い繰り返しで一周してしまう部分とかをテーブルに含ませる(または検索時にループを発見する)必要もあり、
C()の出力鍵空間内でH()が衝突すると鍵空間＜ハッシュ空間になって全てのハッシュを網羅できなくなる問題もあり、
その辺の工夫とかが多分レインボーテーブルのキモになるところだった筈です。
ハッシュ衝突とかは…異なるC()を使ったテーブルで補完するとかでしたっけ。

>>304
ちな301で書いた「トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセット」ってのもそれです。
↑に書いてるC(H())チェインが短くて頭20bit=0等が出ないと悲しい事になりますorz…ケチらず72TiB使うべきか。
>>305
単純にハッシュの頭nbitを削るだけでも行けそうですね。
308 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/09(水) 23:36:27.79 ID:MTyJscGe0]: >>306
似たようなことコンテストの重複チェックルーチンでやったー懐い
FDDの物理アドレスだからエラーになったらおしまいという綱渡り・・・若かった
脇からすまそ
309 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/10(木) 00:25:16.04 ID:2gxQn/T50]: >>308
まぁ何もOSのFAT管理を無視してトラックセクタ直指定するわけでも
ましてやトラックのギャップにデーター入れるわけでも（笑）ないので
単に、巨大なデータファイル（別に単一ファイルじゃなく適当な大きさのファイル郡でいいのですが）に
先頭からのオフセットで位置を決定するっていうだけなのでｗ
トリップ文字列からキーの保存オフセットに変換する関数を１つ用意するだけで
知りたいトリップのキーを保存するオフセットアドレスをトリップから直接得ることが出来るですよｗ
310 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 03:26:47.92 ID:1qnGPo+xP]: 盛り上がってますね～
私はいまだに検索君1号の調整中です。
これ、ちゃんと使えるようになるのかな…
311 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 06:11:07.20 ID:1qnGPo+xP]: MTFを起動しようとするとatimpag.sysでBSOD(0x00000116)が発生。
やっぱGPUが5個もあるのがいけないのかなあ。弱った弱った。
312 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 06:36:09.28 ID:1qnGPo+xP]: いろいろいじってたらいつの間にか動くようになりましたｗ
後は微調整だけど、取りあえず動作確認は出来たので一安心です。
313 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 06:43:37.09 ID:wd4utxMC0]: 何て贅沢で羨ましい悩み。ｗ
314 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 07:05:19.03 ID:1qnGPo+xP]: さすがにちょっとやり過ぎかもしれませんｗ
あれからまた安定しなくなったのでもっと調整が必要なようです。
実に難しいですねえ。
315 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/10(木) 07:38:15.24 ID:2gxQn/T50]: おはようございます
いい感じに設定作業が進んでいそうですねー
316 名前：やんやん ◆yanyan/Pails mailto:sage [2013/10/10(木) 08:18:22.69 ID:9IgIyU1y0]: Linux版の予定ってありますか？
317 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 08:42:56.48 ID:1qnGPo+xP]: >>315
いやあ、それが結局あれから全然安定しなくて、とりあえず
7970をはずしちゃいました。残念なことにM6Eだと5GPU以上だと
安定しないようです。これまで使ってたCrosshair V Formula-Zが
特別だったのかもしれません。

ちょうどAVX2の次はGCNのアセンブラに取り組もうと考えてたので、
7970は開発機に移してしまうことにします。GCN版はかなりの長丁場になりそうなので、
まあ妥当なところでしょう。
318 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 08:43:40.37 ID:1qnGPo+xP]: >>316
私自身がLinux版を作ることはないで～す。
319 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 10:14:48.60 ID:1qnGPo+xP]: 7970を外してもまだ調子が悪いので、今度は7990だけにしてみました。
6990が原因だとまだ助かるんだけど、マザボの初期不良というのだけは勘弁して欲しいなあ。
320 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 12:08:33.38 ID:LHshhmTP0]: 皆様お疲れ様です

すいませんが質問させて頂きます
トリップの回文と双連の違いは何でしょうか？

宜しくお願いします。
321 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 12:37:06.54 ID:jg8QWjDo0]: 回文 abcdeffedcba
双連 aabbccddeeff
322 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/10(木) 12:48:04.01 ID:2gxQn/T50]: 現時点で12桁トリップ全てを保存するのは非現実的ってのはわかったけれど
現実問題として、計算しながら、計算した分をどんどん保存していくということを考えた場合どうなるのか・・・

現時点でユグが調子いい時で20GTpsくらいかな
1年スパンで考えた場合

20G=2^30*20
1年＝311万秒≒2^20*3
(2^30*20)*(2^20*3) = 2^50*60

とりあえず計算しやすいってことと、速度増加見込みってことで4倍の速度　80GTpsを見込めると仮定して
2^50*2^6 = 2^56

80GTpsで1年間ぶん回すと2^16 T = 65536Tのトリップを生成

うーん、分散処理で実現するには容量以外にもネットワーク負荷の事や
>>294の用に全空間分容量のHDDに記録していくわけじゃないので
ハッシュインデックス化する必要があり、それを記録分担する仕組みを考えるとか
色々課題はあるものの
1年で65536T*12 のトリップキー容量とハッシュインデックス化に必要なインデックス容量考えただけで
現時点ではまだ厳しそうですね・・・ｗ
323 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 13:02:30.82 ID:hf+1FSU2P]: HDDに1か所保存とか分散だと失われる可能性高そう

1キーでも失われたらそれを再びみつけるのはものすごく大変だろうなー
324 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 13:14:55.98 ID:LHshhmTP0]: >>321
分かりやすい説明
ありがとうございますm(_ _)m
325 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 14:43:28.90 ID:1qnGPo+xP]: せっかく買ったM6Eですが、カードの選り好みが非常に激しく
なかなか性能を出せません。とりあえずうまく動いた7990と7970の
組み合わせで10桁トリップ検索専用にしておきました。
まあもともと種類の違うグラボを挿すこと自体かなり特殊なのですが、
この展開は完全に予想外です。やっぱり実際にやってみないとわかりませんねえ。
326 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 14:55:16.83 ID:1qnGPo+xP]: まあいいや。今後どうするかはAVX2版の開発が終わってから考えようっと。
327 名前： ◆JouJaku.IYSv mailto:sage [2013/10/10(木) 19:09:27.72 ID:56mjdoXX0]: >>325
ご愁傷様です。
私も同じZ87チップセットですが、7990とTITANx2の混在で何も問題無くさくっと動きました。
謎ですねぇ。グラボと配線が干渉するので、これ以上追加して試すことは出来ません。

しかし、7990+TITANx2より7990+7970の方が速いって・・・。
328 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/10(木) 19:25:36.93 ID:QtlpUHtc0]: Maxwell世代でMTFでもGeForceがRadeonに逆転したりしなんですかね
329 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 22:08:10.37 ID:1qnGPo+xP]: >>327
7990を一番上のスロットに挿さないとまともに動かないし、
これまで使っていたPCIeの延長ケーブルとM6Eの相性も良くないようです。
AMDのドライバも最新のものでないと動きませんでした。不思議なもんです。
330 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 22:31:07.18 ID:1qnGPo+xP]: そうか、M6Eは開発機にまわして、検索君1号はこれまで通りでもいいのか。
時間かかるけどそうしよっかな。
331 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 23:42:11.44 ID:1qnGPo+xP]: 今調べたら電源のPCie用のケーブルの端子の先が少し溶けてました。
どうも不安定だった原因の一部はこれにあるようです。
やっぱり無茶させすぎですね。新しいのを注文することにします。
これでうまく行けばかなりおいしいけどどうかな～
332 名前： ◆Meriken//XXX mailto:sage [2013/10/10(木) 23:47:34.88 ID:1qnGPo+xP]: >>327
>>328
現在CUDA版の10桁トリップ検索のボトルネックになっているのは共有メモリの量なので、
これが増えない限りは速度は上がらないはずです。TITAN用に書き直せば
もちろん話は別ですが…
333 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 01:40:41.48 ID:oMuOOsM+P]: 電源のPCIe用のケーブルを開発機から持ってきて取り付けたら
ようやく検索君1号が12桁トリップ検索でも安定して動くようになりました。
7990を一番上に乗っけているので見た目は前よりさらにやばくなりましたが、
前より冷えるようになったので速度は上がっています。
これで心置きなくAVX2対応の作業を始められます。
334 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 06:38:50.63 ID:oMuOOsM+P]: あれからまた不安定になったので、今度は7990+6990+6990の組み合わせを
試してみましたが、今までで一番安定して動いています。
M6Eはなるべくビデオカードの種類を揃えてやると安定して動作するようです。
すんなり動かなくてエライ目に遭いましたが、もう大丈夫でしょう。
335 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/11(金) 07:00:31.48 ID:kG6nG+a40]: コネクタが溶けるとかどんだけｗ
336 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 10:16:34.06 ID:7L8VTn8Q0]: www.eurogamer.net/articles/digitalfoundry-radeon-hd-7990-review

凶器ですねｗ
337 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 15:01:05.83 ID:oMuOOsM+P]: 7990は化物ですｗ空冷だと12桁トリップ検索で本気を出しきれないのが
残念ですが…
338 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 15:14:10.87 ID:oMuOOsM+P]: AVX2対応のためにコードを見直してたのですが、
12桁トリップ検索はすぐに対応できそうです。楽しみだな～
339 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 15:31:38.11 ID:7L8VTn8Q0]: 自作なんてしたのも、もう遥か昔のことで最近のPC事情とか、全然ついていけない話になっているのですがｗ
「グラボ」にメモリ６Gってなんじゃそりゃｗｗｗ　って感じですよｗ
340 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/11(金) 16:20:48.16 ID:vXaPX/w40]: Powercolor HD 7990 Devil 13 6 GB
ttp://www.techpowerup.com/reviews/Powercolor/HD_7990_Devil_13/25.html
ttp://tpucdn.com/reviews/Powercolor/HD_7990_Devil_13/images/power_maximum.gif
最大消費電力551W　(；･`д･´)…ｺﾞｸﾘ
341 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/11(金) 16:37:10.98 ID:kAO/Va9a0]: もはや電子レンジクラス
342 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/11(金) 16:45:35.62 ID:vXaPX/w40]: >>341
なるほど、つまり電子レンジで中のものを温めながら、同時にファンで中のものが熱くならないよう冷やしているのがHD7990なんだね。
拷問の域だな…(;´д`)
343 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 17:08:53.79 ID:7L8VTn8Q0]: 暖めながら冷やすって言ったって
空冷だろうと水冷だろうとたとえ油冷であってもｗ
換気するか冷房でもしない限り、冷ました熱は全て部屋にたまるわけでして・・・

1年中強力ハロゲンヒーター部屋の中で動かしてるようなものですよねｗ
344 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/11(金) 17:19:47.06 ID:21WqkArR0]: 液体窒素の中に沈めて冷却する選択肢
345 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/11(金) 17:29:51.23 ID:kAO/Va9a0]: >>342
自分で言っててアレだが、レンジとかオーブンって1000W↑が普通だからちょっと違うかも
(ハロゲンヒーターとか電気ポットとかの方が近い)

その辺の冷蔵庫で250kWhぐらい(一日700Wh)だからそれより断然金が掛かるって……
346 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 17:30:20.53 ID:oMuOOsM+P]: >>343
6990も2枚あるから、ヒーターは3台ですｗ
7990はともかく、6990のうるさいのなんのって…
347 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 17:30:31.68 ID:7L8VTn8Q0]: いや、だから同じですってｗ
クーラーだって、室外機を部屋に持ち込めば、コンプレッサ動かしている分立派な暖房ですしｗ
冷蔵庫が部屋の中にあれば、冷蔵庫の中身は冷えても部屋の温度は上がるしｗ
液体窒素だって、液体窒素自体を冷やす装置が室内にあったら、冷やしたい部分を効果的に冷やす事はできても
部屋全体の温度はどんどんあがって・・・ｗ
348 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 17:31:34.76 ID:oMuOOsM+P]: >>345
検索君1号だけで1300W超えてますｗ
349 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 17:32:03.99 ID:7L8VTn8Q0]: あｗ　>>347は　>>344にですｗ
350 名前： ◆Meriken//XXX mailto:sage [2013/10/11(金) 17:35:32.84 ID:oMuOOsM+P]: とりあえずAVX2を検知するルーチンを追加しました。
まあ時間はたっぷりあるのでのんびりやることにします。
351 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/11(金) 17:52:36.25 ID:zZdEZh+x0]: 冷蔵庫inで、検索。
352 名前：SilentPC ◆SilentPCIePC mailto:sage [2013/10/11(金) 17:59:12.22 ID:vXaPX/w40]: もういっそ、豪快にアメリカらしくガレージに検索君を置いて、水冷モーターは排水ポンプ用のを使って、ラジエーターは自宅のプールに沈めるのが良いのかもね…
日本なら逆にエコを意識して、発熱で発電をしてその電気で冷却をする装置を開発し、電気代を節約とか。
普通のPCの発熱程度じゃ無理でも、それぐらいの消費電力になれば流石にいくらか還元は出来ないものか？
何か良い発電装置のアイデア無いですか？
353 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/11(金) 18:37:11.10 ID:7L8VTn8Q0]: 冷蔵庫in、検索してみたら想像してたのと全然違ったｗ

冷蔵庫搭載PC
weekly.ascii.jp/elem/000/000/093/93313/
weekly.ascii.jp/elem/000/000/093/93292/120610_com_omoshirocaseimg09_cs1e1_1000x.jpg

とか
冷蔵庫の中にマザー入れちゃって冷やすやつとか

そーいうのを想像してたのに、最近流行りのアレだったのね・・・ｗ
354 名前：名無しさん＠お腹いっぱい。 [2013/10/11(金) 19:00:32.74 ID:fckT3S+N0]: 新生検索君1号大勝利！！！！！
355 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/11(金) 23:27:37.53 ID:r5Pqdip00]: >>347
とりあえず最終的な廃熱を室内空気じゃなくて外気に捨てるところからですね。
>>352
温度差で発電すると発電機が熱抵抗になっちゃいますからねぇ…
温度差発電による稼動効率補助つきDCの噂は聞いたことありますが、
発電電力による冷媒循環での効率上昇が発電の熱抵抗を上回れるかどうか。
>>353
冷蔵庫/冷凍庫は温度差が稼げるだけで熱交換速度が遅いから、
断熱性のお陰で逆に蒸し風呂になるってアレですねｗｗ
356 名前：名無しさん＠お腹いっぱい。 [2013/10/12(土) 05:04:23.90 ID:BCrjFCBd0]: 664 ：名無しさん？ [↓] ：2013/10/11(金) 23:58:53.30 ID:???
AMD Catalyst 13.11 Beta Driver for Windows
support.amd.com/en-us/kb-articles/Pages/latest-catalyst-windows-beta.aspx
357 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 10:00:12.64 ID:Oyi47z8vP]: >>356
15日に発表のR9 290Xは対応カードの一覧には入っていませんね。
発表の日が楽しみです。
358 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 10:17:44.74 ID:Oyi47z8vP]: とりあえずAVX2で12桁トリップ検索を動かしてみました。
CPU(i7-4770)だけで209M TPS出てます。

www.meriken2ch.com/files/2013-10-11-AVX2-1.png

ただ、リテールクーラーでは冷却が追いつかないようで、
しばらくしたらCPUがスロットルダウンして速度が下がってしまいました。

www.meriken2ch.com/files/2013-10-11-AVX2-2.png

まあでも実際に倍近い速度が出せたのでまずまずの成果と言っていいでしょう。
359 名前： ◆YSRKEN.ceVZZ mailto:sage [2013/10/12(土) 10:29:55.29 ID:RMpLDz7l0]: >>358
CUI画面がすごく懐かしく感じる……あれ、
無料版でもCUI実行で検索できましたっけ？
360 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 10:32:37.37 ID:Oyi47z8vP]: >>359
出来ませんよ。開発用に有効にしてるだけです。
361 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 10:52:01.12 ID:Oyi47z8vP]: 32bit AVX2版も作ってみたのですが、こっちでは検索開始直後に
230M TPS出ています。かなり謎です。キャッシュの使い方とか、
OoO向けの最適化とか、工夫の余地はまだ大分ありそうです。
362 名前： ◆QZschizo.ptH mailto:sage [2013/10/12(土) 12:27:39.22 ID:zonN9MYx0]: 5970x2ですがやっぱりデバイス判定に時々失敗します．
再現性をみるのにどこから手をつけたらいいですか？
363 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 12:34:44.55 ID:Oyi47z8vP]: CPUのクロック周波数を3.5GHzまで落としたらようやく熱ダレを起こさなくなりました。
速度はこんなかんじです。

64bit版: 186.84M TPS
32bit版: 209.06M TPS

同じ条件でのDayトリッパーの速度は次になります。

DayTripper2101: 154M TPS

MTFはかなりの速度を出しているのですが、
64bit版のほうが32bit版より遅いことの説明がつきません。
やっぱりCで書いたルーチンを見なおした方がいいのかな…
364 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 12:41:52.14 ID:Oyi47z8vP]: >>362
それはおかしいですね。とりあえず開発版のMerikensTripcodeEngine.exeを
動かして、デバイス判定の失敗したときに"OPENCL DEVICE"の"Name"の部分に
何が表示されているか調べてみて下さい。ドライバのバグの可能性が高いので、
ドライバを変えてみるのもいいと思います。
365 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 13:50:51.64 ID:Oyi47z8vP]: 64bit版が遅くなっていた理由がわかりました。
yasmのビルトインマクロであるsave_xmm128が
vmovdqaではなくmovdqaを使っていました。
まったく、油断も隙もあったものではありませんｗ
これで速度差は妥当なものになりました。やれやれです。

64bit版: 211.96M TPS
32bit版: 209.06M TPS
366 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 15:02:59.99 ID:Oyi47z8vP]: キャッシュに乗りやすいようにテーブルの一部を関数ローカルにコピーしてやったら、
それだけで2～4M TPSほど速度が上がりました。結構まだ工夫の余地がありますねえ。

64bit版: 216.11M TPS
32bit版: 210.78M TPS
367 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/12(土) 15:12:32.49 ID:UKFSL8z80]: >>353
VAX Barで通った道なのに今更感が強いですね、これ
368 名前： ◆Meriken//XXX mailto:sage [2013/10/12(土) 15:42:11.41 ID:Oyi47z8vP]: >>352
一軒家に住んでたら間違いなく検索君1号はガレージ行きですねw
自室に置いているのは、我ながら正気の沙汰ではありません。
冬に暖房が全く必要ないのは助かりますが…
369 名前： ◆JouJaku.IYSv mailto:sage [2013/10/12(土) 15:59:07.38 ID:SgElHHWv0]: >>366
お疲れ様です。
同じCPUで定格(3.7GHz)だと約120MTPSなので、ほぼ倍のスピードが出ていますね。
水冷だとサーマルスロットリングは起きないだろうから、楽しみです。
370 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/12(土) 17:28:36.27 ID:+NNdeoDL0]: >>367
VAXを知らない畑にいたわけじゃないけど
直接端末に触れた事はほとんどない・・・
ただ、あいつがあるコンピュータルームってのは肌寒くてねぇ・・・ｗ

触れたこともほとんどないから、VAX Barなるものもはじめて聞いたんだけどググってみたよｗ
感想は、メリケン野郎の考えることはクレイジーだぜｗ　って感じｗ

メリケンさんに引っ掛けたけど、別に罵倒でも卑称でもないのであしからずですｗ
っていうか、メリケンさんの名前　ハンドルはその意味から取ってて、今住んでるのもソッチのほうなんだろうけど日本人ですよね？
371 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/12(土) 19:44:19.02 ID:XeWEbd3E0]: VAX って、VAX/VMS の事？？
それなら懐かしいな・・・
372 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/12(土) 20:41:37.86 ID:+NNdeoDL0]: >>371
ですですｗ
373 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 01:11:31.43 ID:KYI8bH6i0]: 今更なことですが、検索文字列がヒットしたら、該当する依頼を無効にする
(ゆぐちゃんではなくローカルでの話)機能って付けられますかね？
374 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 01:34:02.23 ID:xoBD38890]: グラボごとの速度をまとめたWikiとかってどっかにありますか？
375 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/13(日) 04:58:52.86 ID:fqcxyF9L0]: ローマ字っぽい４文字を適当に作ってみる正規表現の超適当版
^[KSTNHMRGZDBP][aiueo]([kstnhmrgbp][aiueo]){3}/
こんな感じで検索回してみたものの・・・

確かにローマ字なんだけど、まともな単語が出来る確率の低さにがっかりｗ
376 名前：磯の良い石 ◆ISONOIIISI mailto:sage [2013/10/13(日) 05:20:16.81 ID:KYI8bH6i0]: >>375
昔、ローマ字のみで意味が通るトリップを生成するための正規表現を自作したことがある
1文字の類(母音)、2文字の類(母音以外の1文字カナ)、3文字の類(拗音を含む類)を
長さが12桁(or10桁)になるように並べたデータをプログラム組んで用意して、
patterns.txtに書き込んで回したもんだ……展開が物凄いことになったがな！

で、上に出ている酉がその成果の一つだったり……
377 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 05:35:30.40 ID:KYI8bH6i0]: >>374
データの蓄積自体は相当量ありますが、なにせアップグレードでガンガン速度向上しますもので……
このスレだけ見ると、
「HD6990+HD7970+HD7990≒11.1GTPS」(>>3、Ver.0.10)
「HD6850≒805MTPS」(>>19,Ver.1.1FEα2)
「HD 5570/5670≒340MTPS」(>>94,Ver.1.1FEα5)
「GTX660≒536MTPS」(>>98,Ver1.1FEα4)
「GTX650≒207MTPS」(>>101,Ver1.1FEα5)
「GeForce610M≒64.3MTPS」(>>114,Ver1.1FEα5)←参考記録
「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←！？
といった感じですかね。他は前スレを当たることをお勧めします
378 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 05:44:41.91 ID:JeVY24vu0]: >>377
> 「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←！？
これは10桁ですよ
379 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 05:46:37.71 ID:KYI8bH6i0]: >>378
あ、本当だﾃﾍｯ
380 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 05:54:58.91 ID:+cbnuJwL0]: >>377
グラボ、ドライバ、バージョン、設定値・・・手集計はミスが怖いし、
ゆぐちゃんでグラボと速度の情報とって公開してくれたら面白そう
381 名前： ◆Meriken//XXX mailto:sage [2013/10/13(日) 09:04:25.37 ID:EU+GIsqgP]: >>370
日本人ですよ～
382 名前： ◆Meriken//XXX mailto:sage [2013/10/13(日) 11:34:03.90 ID:EU+GIsqgP]: 10桁トリップ検索のAVX2への対応がなかなかうまく行きません。
ぐぬぬぬぬ…
383 名前： ◆Meriken//XXX mailto:sage [2013/10/13(日) 13:53:21.35 ID:EU+GIsqgP]: 一応AVX2対応の10桁トリップ検索のルーチンは動くようになったのですが、
なかなか思ったような速度が出てくれません。

AVX(8スレッド): 23.95M TPS
AVX2(8スレッド): 37.98M TPS
AVX2(4スレッド): 35.09M TPS

まあそれなりに速くはなっているのですが、L1Dキャッシュが潰れているみたいで、
倍の速度にはなりませんでした。ちなみに8スレッドから4スレッドにても
あまり速度は落ちていません。やはりキャッシュの使い方を工夫するしかないですねえ。
384 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/13(日) 14:31:17.44 ID:fqcxyF9L0]: >>376
10桁の方はまだマシなんですが、12桁だと特に
ちょっと無茶なパターンを作ると、すぐに展開サイズがシャレにならない事になって
MTFで検索開始しても、パターンを展開中・・・　まではまだ何とか動いても
そのあとのパターンを処理中で帰ってこなくなってｗ
帰ってきても、なぜかその後のユグと通信に失敗して何分後に再通信しますとなって、その時間になると展開から再開になって繰り返すのよねｗ
なんかエラーのアラート窓が出た時もあったな・・ｗ　10秒くらいでその窓消えちゃったから内容確認できなかったけど・・ｗ

まぁそんな感じで、パターンは展開後のサイズがあんまりでかくなり過ぎないように気をつけているのと
パターン定義の入力欄、一応長い定義も書き込めるみたいだけど入力窓あんまり大きくないし、どうせ表示も表示窓の横幅までだから
あんまり複雑な定義もなーって思ってたけど
patterns.txtに直接かーｗ
patterns.txt　って、相当長くなってしまってもしっかり読み込んでくれるのかな（使用可能なメモリの上限チェックとかもろもろ、そういう処理コミコミで）
というか、上記のエラーとか不安定だったのはグラボのメモリの制限なのかなって、自分のグラボを今更ながらみてみたら2Gもメモリあるのね・・・ｗ
7990が6Gも積んでて信じられんとおもったけど、2Gでも十分に信じられないレベルだったｗ

閑話休題

古い人間なもので、「グラフィックシステム」でユーザープログラムを動かす　なんていうと
FM-7のグラフィックサブシステムにYAMAUCHIコマンドで数バイトの共有メモリを使ってプログラムを転送して・・・ｗ
なんてイメージが湧いてきちゃうのですよｗ（「YAMAUTIコマンド」はググると出てくるはずｗ）

とはいえ、今のグラボにユーザー処理させるってのも、やっぱり転送して走らせるとかするのでしょうね
動かすプログラムは・・・・・・・むむっ・・・ｗ　うーん、スレみてるとアセンブラに置き換える話がでてきてるのはわかるんだけど
GPUに対応したコード吐くコンパイラとかあるって事なのか・・

うーん、我ながら話が飛びまくったわけのわからんレスに・・・ｗ
385 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 14:58:50.97 ID:KYI8bH6i0]: >>384
昔書いた展開用コードを引っ張りだしてみました。
まず、ローマ字でカナを表現すると、
・アルファベット1文字　([aiueo]|n)
・アルファベット2文字　([kstnhmyrwgzjdbp][aiueo]|sh[aiuo]|ts[aiuo]|ch[aiuo]|fu|oh)
・アルファベット3文字　([kstnhmrwgzjdbp]y[aiueo]|kwa|gwa)
となります。流石にこのままだとハズレ率が半端なくなるので、実際には
[aiueon]と([kstnhmr][aiueo]|y[auo])と[kstnhmr]y[auo]に限定していましたが。
後は「3322」「13231」など長さ「のみ」記述したデータをループ回しで全生成し、
数字部分を上記正規表現文字列に置換すれは完成です。
ちなみに今適当に回したら10桁用で1760行ありました……。

まあこれですらハズレまくるのは目に見えている(感覚としては砂金採りに近い)ので、
あらかじめ豚辞書(フリーの単語リスト)データから「文字の組み合わせ」情報を抽出し、
それに当てはまらないような文字列(日本語っぽくならなさそうなもの)を弾くコードを別に書いて篩に掛けました。
最終的には、ヒットした結果の文字列ファイルを用意すると、
ワンクリックでかな変換→篩に掛けて出力までしてくれるようなものまで作った思い出があります。

結論：HSP様々。なんならお手軽検索キットでも送りましょうか？ｗ
386 名前： ◆Meriken//XXX mailto:sage [2013/10/13(日) 15:24:46.07 ID:EU+GIsqgP]: 皆さん私が考えてもみなかったような使い方をされてますね。
かなり新鮮ですｗ
387 名前： ◆Meriken//XXX mailto:sage [2013/10/13(日) 15:27:45.22 ID:EU+GIsqgP]: キャッシュを潰さないためにお蔵入りになったルーチンを引っ張り出してきました。
AVXだけだと微妙に遅くなるのですが、このさい文句はいってられません。
これをAVX2で書き直せばそれなりの性能が出るはずです。
388 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/13(日) 15:51:14.32 ID:fqcxyF9L0]: >>385
ローマ字じゃなく
英文生成もどきみたいなのも、ちょっと考えてみようとしたんですけどねｗ

(名詞A|名詞B|名詞C)(動詞A|動詞B|動詞C)(名詞D|名詞E|名詞F) とか
適当な構文と品詞の組み合わせで・・・ｗ

そんな風に考えたんだけど、既に検索中の正規表現だけでも
たとえば
^i[il][il][iIl][iIl][iIl][iIl][iIl][iIl][il][il]i$　とか
^[.]*[vwW]+[.]*$　　とか
これでもあんまりサイズがでかくなり過ぎないようにセーブしながら作ってはいるんだけど
それでも地味に容量食うパターンが大量にあって気軽にパターンを増やせない状況になってて英作文正規表現はおあずけ中ですｗ
389 名前： ◆znjnB.IJwZLU mailto:sage [2013/10/13(日) 17:43:41.60 ID:J8269aFW0]: >>387
Haswell導入おめでとうございます。

DESですが私のほうではあのcryptをそのまま256bit化して素直に倍の50MTPS出てます。
まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

それよりもSHA-1で躓いてます。
アセンブラで書いてみたのはいいんですがハイパースレッディングがある状況ではあまり恩恵がありません。
イントリで書いてコンパイラに投げても同じ速度が出ます。
まあ、HT切るとスレッドあたり3MTPS差が付くんですが、HTがあると実行ポートを埋めきってしまえるみたで
107MTPSあたりで頭打ちになります。

アセンブラのほうは一週間かけてバイトコードと睨めっこしながら手動パイプライン化までしたのに・・・泣。
390 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 20:07:00.46 ID:2IRlbwYd0]: >>372
> ですですｗ
あれって、何かバッチファイル的な言語があったよね。
あれで擬似ログアウト画面を作って、色んな人のユーザ名とパスワードを集めまくった思い出が・・・
VAX/VMS 上でのクロス開発はかなりやったので、本当に懐かしいわ。
391 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 20:25:28.75 ID:KYI8bH6i0]: :::::::::::.:　.:. . ∧＿∧ . . . .: :::::::: 　　引っ張りだしたコードを元に、自動生成した
:::::::: :.: . .　/彡ミ゛ヽ;)ヽ、. ::: : ::　　　patterns.txtを食わせてみたらメモリ不足で落ちた……
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.　　ttp://up3.viploader.net/desktop/src/vldesk007817.jpg
￣￣￣（_,ノ￣￣ヽ､_ノ￣.　　　　　左のタイマは検索実行と同時な。4GBほどメモリ食ってから
　　　　　　　　　　　　　　　　落ちたことからして、よほど工夫しないと検索不可能かもorz

参考までにpatterns.txtをば：www1.axfc.net/u/3057287.txt
392 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/13(日) 20:49:06.63 ID:fqcxyF9L0]: >>390
フィッシング詐欺の手法のハシリみたいなかんじですなｗ
今となっては、セキュリティとかパスワードとか、色々そういう考え方が社会的に認知されてきたりしているけど
そもそも一般の人は銀行の暗証番号以外、パスワードで何かを守るなんてこと自体がなかったような時代だし
根本的に考え方が違ってた気がしますねぇｗ
393 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 22:44:36.72 ID:r9Dbzyno0]: >>391
いろいろと酷い
394 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/13(日) 23:00:40.77 ID:fqcxyF9L0]: >>391
展開後のパターンじゃなく、途中まで展開した正規表現群みたいな感じですねｗ
12桁でこれを全パターンやったら、そりゃキますわｗ
[AIUEO]{12} これだけでも　約2^28 ですよｗ
これに加えて、1文字目から12文字目まで母音が入るパターンまで加えたらそりゃ大変なことにｗ
395 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 23:26:46.46 ID:2IRlbwYd0]: >>391
壁紙が気になる・・・
396 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 23:29:37.53 ID:KYI8bH6i0]: >>394
>[AIUEO]{12} これだけでも　約2^28 ですよｗ
一応、元々のコードでは「母音か拗音組が三連続したら弾く」というルーチンが
含まれていたので、そいつを組み込んだら行数が半分以下に。ただ、それでも
メモリ食い過ぎで検索できないのは変わらず。念のため、

[aiueo][aiueon][kstnhmr][aiueo][aiueon][aiueon][kstnhmr][aiueo][kstnhmr][aiueo]

だけ書き込んで回してみると、展開に4分ほど掛かった末にメモリを720MBほど消費しましたｗ
そりゃ無理ゲーだわ、と言うか確か最初に作った時(今年の1月始め)は待て屋で回してたような……
397 名前：名無しさん＠お腹いっぱい。 [2013/10/13(日) 23:29:47.39 ID:oUFnliXQ0]: 「ロリ・義母
ンデレ・孕ま
398 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 23:34:55.01 ID:KYI8bH6i0]: >>395
www.pixiv.net/member_illust.php?mode=medium&illust_id=12189369
ですね。
>>397
勘違いしないでよね！　全体のフォルダ名は
「ロリ・義母・ツンデレ・孕ませ・寝取られ･･･すべての萌えは源氏物語が産んだ！」
blog.livedoor.jp/geek/archives/50949346.html
なんだから！！
399 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 23:46:02.97 ID:KYI8bH6i0]: :::::::::::.:　.:. . ∧＿∧ . . . .: :::::::: 　　ちなみに、>>396で書いたパターンを待て屋で回したら
:::::::: :.: . .　/彡ミ゛ヽ;)ヽ、. ::: : ::　　　メモリ消費量僅か5MB……現実は非情である
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.
￣￣￣（_,ノ￣￣ヽ､_ノ￣
400 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/13(日) 23:47:17.62 ID:B/E+227R0]: 待て屋ってソース公開されてたっけ？
それなら、メモリ消費の少ないその方法を採用してみるとか。
401 名前：混沌 ◆Chaos/geeeIV mailto:sage [2013/10/14(月) 00:06:18.79 ID:HNICMWPj0]: >>400
自分は　ずっと前のトリッパーをちょこちょこ使っていた程度で、待てやとかも使ったことはないんですが
ただ、展開するから高速にマッチ出来るんじゃないかと思うｗ
このスレの過去ログとかほとんど見てないけど、初期はパターン数制限あったのがある時期に制限がなくなったってのが

たぶんその時に、パターンを展開して（おそらくはマッチする法のトリップも相当数メモリに展開してからまとめて）
アルゴリズム検索（２分検索みたいな？）を取り入れたんじゃないかと予想

メモリ展開して最適化するからこその、大量検索パターンを高速にマッチできてるんだと思いますよｗ
402 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/14(月) 02:51:29.17 ID:Ehj1Nv8O0]: 一応、パターン作成＋結果からトリップ抽出＋ローマ字変換＋篩い掛けできるセットを配布しておきます。
ソースコードも添付しますので、参考までにどうぞ。

ttp://www1.axfc.net/u/3057797.zip
403 名前： ◆ISONOIIISI mailto:sage [2013/10/14(月) 02:52:29.66 ID:Ehj1Nv8O0]: あ、私はID:KYI8bH6i0です。
404 名前：名無しさん＠お腹いっぱい。 mailto:sage [2013/10/14(月) 03:17:32.75 ID:a2gerbx00]: >>391
>>> 正規表現の場合、展開数で制限を設ける方式ですか？
>> おおまかに言えばそうですね。
>> 厳密に言えばハッシュ値の数で決まります。
> toro.2ch.net/test/read.cgi/esite/1379214816/100-101
なんかもう全部展開しちゃってる感じ？

>>401
先にメモリに展開する場合、展開したテーブルがキャッシュやメモリから溢れると思いっきりロスしそう。
展開数が一定範囲を超えたら正規表現とのマッチ処理をJITするのが最速なのかな・・・
405 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 04:18:18.49 ID:cHLdpSNUP]: MTFではパターンの一部(5文字)からハッシュ値を作成していて、
ハッシュ値の生成に必要な分は最初に全て展開しています。
この方法だと非常に強力な正規表現が使える代わりに
メモリの消費量は大きいです。

正規表現の部分は2年前に作ってからほとんどいじっていないので
改善の余地がかなりあります。待て屋のマッチングのアルゴリズムは
かなり特殊なのですが、これについては鳥屋氏にいろいろ教えて
いただいたので、ぜひMTFに取り込みたいところです。
406 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 04:22:38.64 ID:cHLdpSNUP]: >>369
どもども。10桁トリップ検索のAVX2対応の作業がおわったら新しい開発版を
うｐするのでお楽しみに。
407 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 04:34:56.58 ID:cHLdpSNUP]: >>389
> まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

なるほど、そういうことだったんですね。流石です。

> 107MTPSあたりで頭打ちになります。

これはおかしいですねえ。ちょっとMTFがどうなってるか調べてみます。
408 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 05:17:58.05 ID:cHLdpSNUP]: 10桁トリップのAVX2対応のルーチンがようやく動きました。

AVX(8スレッド): 23.65M TPS
AVX2(8スレッド): 43.44M TPS
AVX2(4スレッド): 39.04M TPS

>>383よりだいぶましになりました。
CPUを定格に戻せば48.40M TPS出る計算です。
HTの効きは今ひとつなので、まだキャッシュの使い方に
改善の余地がありそうです。
あとは最終転置やキー生成の処理の見直しですね。
409 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 05:39:05.79 ID:cHLdpSNUP]: >>389
12桁トリップ検索はこんな感じです。速度が出ないのはなかなか謎ですねえ。

AVX(8スレッド): 117.31M TPS
AVX2(8スレッド): 215.71M TPS
AVX2(4スレッド): 184.12M TPS
410 名前： ◆Meriken//XXX mailto:sage [2013/10/14(月) 08:45:16.44 ID:cHLdpSNUP]: キー生成のルーチンを見なおして、10桁トリップ検索の速度が
少し上がりました。

AVX2(8スレッド): 43.44M TPS -> 46.02M TPS

定格で51.28M TPS相当なので、まずまずといったところでしょう。
もうちょっと搾り取れそうな気もしますが、かなり疲れたので
取りあえず休憩することにします。

[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef