【トリップ検索】MERI ..
219:やんやん ◆yanyan/Pails
13/10/04 05:44:19.39 mM382Oj10
60A契約だと不足気味になるから、75Aにしようかと思ったりしたり。
220: 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX
13/10/04 05:48:05.07 iHUDZBAdP
R9 290Xがもう少しで発売ですね。いや〜、楽しみだなあ。
しかし旅行から帰ってきたら2chの規制が更に厳しくなっていますね。
忍法帳のレベルを上げないとリンクも貼れないとか、どうかしてます。
海外規制は相変わらずだし、流出事件以降VPNも規制されて、
●で規制を回避できなくなっちゃったし…
これで公式p2も海外規制されたらどうしようかしらん。
221: 忍法帖【Lv=40,xxxPT】(1+0:8) 【東電 59.6 %】
13/10/04 06:05:56.81 rrTSneEoP
てすと
222: 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX
13/10/04 06:07:02.04 iHUDZBAdP
>>218
実装自体は判定の処理の順番を入れ替えるだけなので、
そんなにめんどくさくないですw
経験値は非常に重要な指標なので、
を獲得するための条件は同じにしておきたいんですよね。
223: 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX
13/10/04 06:17:55.03 iHUDZBAdP
>>219
いいですね〜 ほんとに検索速度の限界は電気の供給によって決まってきますね。
224:名無しさん@お腹いっぱい。
13/10/04 06:22:44.72 rrTSneEoP
半導体プロセスが28nmから20nmになったら同じ電力で倍の速度出せるようになるかな
225: 忍法帖【Lv=2,xxxP】(1+0:8) ◆Meriken//XXX
13/10/04 07:07:47.87 iHUDZBAdP
さすがにそこまではいかないでしょうけど、
確実にワットあたりの性能は上がるでしょうね。
R9 290Xが7970と比べてどれぐらい性能が上がっているのか、
非常に気になるところです。
226: 忍法帖【Lv=2,xxxP】(2+0:8) ◆Meriken//XXX
13/10/04 07:43:28.35 iHUDZBAdP
>>180の続きですが、STFのS-Boxを使わせていただいた結果、
速度は26.05M TPSまで上がりました。>>151の数字より確実に
良くなっていますが、key scheduleを命令のほうに展開してやれば
更に速くなりそうです。取りあえずMTFのルーチンで展開を試してみてから
送っていただいたSTFのルーチンを移植してみることにします。
227: 忍法帖【Lv=2,xxxP】(1+0:8) ◆Meriken//XXX
13/10/04 14:49:48.68 iHUDZBAdP
現在せっせAVXのルーチンを書き換え中。
動的書き換えを行っているルーチンを修正するのは結構大変です。
うまくいくかな〜
228:名無しさん@お腹いっぱい。
13/10/04 18:27:11.06 rrTSneEoP
URLリンク(www.fileformat.info)
ビットコインのクライアントのRPCを使ってブロックのハッシュ値を列挙して連続する0のビットが一番多いハッシュを探した後、
ビットコインのハッシュはSHA256(SHA256(key))なのでブロックのヘッダをblockexplorerで持ってきて
SHA256(header)を計算して 1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498 を出して
これをHEX表示としたバイナリのSHA256ハッシュが実際に00が連続することを確認した
ちなみに73ビット0が連続する もし2chのトリップのSHA1で72ビット以上0が連続したら12連の"AAAAAAAAAAAA"になる
229:名無しさん@お腹いっぱい。
13/10/04 18:30:52.37 rrTSneEoP
でもBitcoinは先頭と末尾が逆だった(連続する0ビットの位置の)
230:名無しさん@お腹いっぱい。
13/10/04 19:41:03.52 QT5wWxXa0
特にエラーも出てないのに、GPU 検索が止まってる事があるけど、
エラーが出ないので情報を提供出来ない・・・
231: ◆MOYASHI/Go
13/10/04 21:14:55.45 Ohb6dumk0 BE:4454085877-2BP(7)
お、Merikenさんおかえりなさい。
>>220
2ch書き込み規制等の場合は、したらばのMerikenさんの掲示板の辺りへ移動かな?
でも、したらばって12桁トリップ使えないんでしたっけ?う〜ん…
>>230
環境や状況等を詳しく書いた方がいいかも。
232: 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX
13/10/05 01:03:32.26 V671iDXLP
>>230
こういう場合はまずハードウェアがらみなんですけど、
エラー処理を見なおしたほうがいいかもしれませんね。
ハードウェアの構成を教えていただけると助かります。
233:名無しさん@お腹いっぱい。
13/10/05 01:07:57.88 R6g1pM6d0
7970の場合だと90℃を超えた辺りで不安定領域
95℃まで行ったらまずGPUが脱落する
保護回路かな?
動作保証のあるメーカー品でも強烈な連続負荷が掛かるので油断出来ない
234: 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX
13/10/05 01:39:01.21 V671iDXLP
>>231
緊急時にはとりあえずしたらばに移動ですね。
2ちゃんねるVPNを使えば海外規制は回避できるんですが、
有料だし不便なのでできれば避けたいところです。
235: 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX
13/10/05 03:21:44.19 V671iDXLP
とうとう4770とM6Eをポチってしまいました。
これで思う存分AVX2をいじれます。ぐへへへへ…
236:名無しさん@お腹いっぱい。
13/10/05 04:34:59.02 R6g1pM6d0
私はFX-9370をポチってしまいました
TDP200Wゴクリw
237: ◆Meriken//XXX
13/10/05 04:55:00.35 V671iDXLP
AMDのCPUもきちんと書いてやれば>>67のようにちゃんと速度が出ますしね。
何より独立したコアが8個あるのは魅力的です。楽しみですね〜
238: ◆Meriken//XXX
13/10/05 09:10:12.59 V671iDXLP
1日かけてAVXのルーチンのkey scheduleをコードに展開してみました。
で、うまく動いたのは良かったのですが、速度はかえって落ちてしまいましたorz
やはりSTFみたいにDES crypt(3)の二種類のラウンドを畳み込んでやらないと
今度はコードがキャッシュから溢れてしまうようです。
239:やんやん ◆yanyan/Pails
13/10/05 09:29:04.34 V9+sfTd+0
最近のCPUは投機的実行したりパイプライン深かったりだから、
アセンブラレベルでの高速化って大変そうだな。
240: ◆Meriken//XXX
13/10/05 11:05:48.38 V671iDXLP
確かにかなり難しいですねえ。畳み込みも試してみましたが、それでも書き換え前の
速度には届きませんでした。アセンブラのルーチンはほとんどSTFと
おなじになってしまったので、>>179で教えていただいたとおりに
やってるはずなのに速くならないのはかなり謎です。
241: ◆Meriken//XXX
13/10/05 11:17:38.50 V671iDXLP
まあいいや、また今度STFのルーチンを試してみようっと。
そうすれば少なくとも問題の切り分けはできるはず…
242: ◆JouJaku.IYSv
13/10/05 15:26:49.76 TQdt57zm0
>>235
おぉ、遂にですね。
アマゾンで購入する時には極力ゆぐ経由で注文していたのですが、少しは足しになりましたかね?
M6Eの一番下のPCIeに、2若しくは1.5スロット幅のカードが刺さるかどうか教えて下さい。
Z87 Extreme 9を使っているのですが、一番下のPCIeはスイッチケーブル等が干渉して水枕付きの7990が刺さらないのです。
243: ◆Meriken//XXX
13/10/05 18:24:43.38 V671iDXLP
>>242
確実に足しになっていますよ。ありがとうございます。
写真を見る限りでは干渉するようですが、一応届いたら確認してみます。
検索君1号でも干渉しているのですが、R.O.G.シリーズのマザボは
電源ボタンが別に付いているので私は普段はそれを使っています。
244: ◆Meriken//XXX
13/10/05 18:46:04.08 V671iDXLP
あれからいろいろ実験してみたのですが、>>179のようにL1Dキャッシュを
有効活用するためにはキー生成とヒット判定のルーチンに相当手を入れないことが
いけないことが分かりました。◆znjnB.IJwZLUさんはかなり色々工夫されているようです。
まあでも原因がわかったので、取りあえずこの件は置いておくことにして、
AVX2対応の準備を勧めることにします。
245: ◆Urotsuki/1Ca
13/10/06 22:27:59.59 on3hVRef0
着々と高速化されていて期待する日々
ちょっとだけぶん回す
246:名無しさん@お腹いっぱい。
13/10/06 22:59:18.76 vgIX48Ma0
熱と電気代の壁を乗り越えて頑張ってください
247: ◆QZaw55cn4c
13/10/06 23:07:39.77 tfHzXDW00
熱はこれからの季節ではともかく電気代の壁には参っております,いつ脱落してもおかしくない‥‥
248: ◆Urotsuki/1Ca
13/10/07 00:02:30.75 jF8JVd0Q0
電気代のほうが深刻です
1〜2時間フル稼働が限界かも
249:名無しさん@お腹いっぱい。
13/10/07 00:24:06.99 dlpjmzEs0
ラスボス:電気代
250: ◆Meriken//XXX
13/10/07 02:29:43.10 kkyn89W/P
ハイエンドのグラボを2枚使って24時間稼働させると
電気代は月10000円前後なのでたしかに痛い出費ですねえ。
長い目で見たら1枚だけ使って電気代を抑えたほうがいいのかもしれません。
7970 1枚だけでも現在のゆぐちゃんでは十分トップクラスですしね。
私としては無理の無い範囲で長く続けていただきたいところです。
251:名無しさん@お腹いっぱい。
13/10/07 17:32:57.57 /IUR/xz60
嫌な感じだな。
そこまでして・・
252: ◆Meriken//XXX
13/10/07 19:16:23.56 kkyn89W/P
まあもともと本格的なトリップ検索にはお金がかかりますしね。
他にもっとお金のかかる趣味なんていくらでもあるし、
人の趣味にケチを付けるのは無粋というものです。
253:名無しさん@お腹いっぱい。
13/10/07 19:49:49.65 T8R7cFdS0
GPU を使う場合はともかく、最近の CPU は一杯コアがあるし、
PC の電源が入っている間は、一部のコアでずーっと検索させてても
全く何の問題もないよね。
2つ位コア開けておけば、通常の使用に影響出ないし。
254:SilentPC ◆SilentPCIePC
13/10/07 19:51:37.30 YIb5KFv+0
まあだからこその、分散処理なんですよね。
自分一人で1垓のトリップの中から好きなトリップ1個を探し出すのにかかる電気代と、
50人で1垓のトリップの中から好きなトリップをそれぞれ探し出すのにかかる電気代では、
単純計算で前者の50分の1の電気代で済むわけですからね。
皆で協力する事で必要経費も人数分の一に分散出来て、それでいて人数分の一の時間で必要なものも見つけられる。
お互いが得する大変良い仕組みだと思います。
開発頑張って下さい。
255:名無しさん@お腹いっぱい。
13/10/07 19:58:08.91 T8R7cFdS0
ところで、検索は完全にランダムにやってるんだと思うけど、何故か、頻繁に見つかるトリップと、
全く、一切、全然、ちっとも見つからないトリップがあって、かなり偏るんだよね。不思議だ。
256: ◆YSRKEN.ceVZZ
13/10/07 22:05:18.86 XMrah83C0
>>255
短い回数だと乱数が偏ったように見えることはよくあること
ところで、前にも聞きましたが、この状態だと検索時間が16倍速なんですよね?
URLリンク(up3.viploader.net)
257:名無しさん@お腹いっぱい。
13/10/07 22:17:15.13 ruVVZ61g0
16・倍・速! 16・倍・速!
258: ◆Meriken//XXX
13/10/07 22:28:15.09 kkyn89W/P
>>256
なんか妙に台数が増えてた時間があったのはYSRKENさんだったんですねw
> この状態だと検索時間が16倍速なんですよね?
違います。同時に何台稼働しても検索時間は一緒です。
259: ◆YSRKEN.ceVZZ
13/10/07 22:32:53.07 XMrah83C0
>>258
なん、だと……!?
まあこのキャプ撮りたいがために16台を一時的に乗っ取ったのですがw
260: ◆Meriken//XXX
13/10/07 22:35:08.34 kkyn89W/P
>>254
分散トリップ検索は長い間あたためてきたアイディアなので、
実現できて結構嬉しいですw トリップ検索はパターンの数が増えても
速度は急に落ちないので、実に分散処理向きといえます。
261:名無しさん@お腹いっぱい。
13/10/07 22:44:56.42 8uRwwq3r0
17時前後の青グラフと"max: 31"があなたの仕業ですかー!
URLリンク(up3.viploader.net)
262: ◆YSRKEN.ceVZZ
13/10/07 22:55:15.52 XMrah83C0
>>261
そうでーすw
トライして気がついたのですが、これってWeb上では同じ「4MTPS」でも、
ソートする際は小数点以下も含めているんですか?
263: ◆Meriken//XXX
13/10/08 02:44:29.87 Be50s5DTP
>>262
そうですよ。
264: ◆YSRKEN.ceVZZ
13/10/08 02:59:16.21 hGdMdaDn0
>>263
良かったです。このソフトでは小数点以下を切り捨てているわけじゃなかったんだね!
265: ◆Meriken//XXX
13/10/08 06:16:31.85 Be50s5DTP
今日あたりHaswellが届いているはずだけど、ちょっと見に行ってみるか。
266:名無しさん@お腹いっぱい。
13/10/08 08:12:07.30 uiAIodMh0
>>256
> 短い回数だと乱数が偏ったように見えることはよくあること
いや24時間365日検索してるんだけど・・・
267:ねこ ◆TheWorld.o
13/10/08 08:59:54.97 wwRsWuFO0
ロト7を毎週1年買っても当たらないようなものです
268:SilentPC ◆SilentPCIePC
13/10/08 11:37:45.44 ruHOMK/b0
>>266
トリップってA-Za-zの26*2文字+0-9の10文字+./の2文字=64文字で構成されているんだろ?
12桁ならそれが64^12のパターン数、64^12=(2^6)^12=2^72=(2^10)^7.2≒(10^3)^7.2=10^21.6
10垓(ガイ)=Z(ゼタ)の単位の数の中から、ちょっと取り出した程度で偏りが無くなるわけないじゃないか。
例え1京(ケイ)=10P(ペタ)パターンのトリップを発見したとしても、それは全体の万分の一以下の数でしかない。
269: ◆Meriken//XXX
13/10/08 14:50:47.22 Be50s5DTP
>>255
もうちょっと具体的に書いてもらえれば詳しいことがわかると思いますよ。
MTFのバグという可能性もありますしね。
270:名無しさん@お腹いっぱい。
13/10/08 15:54:01.93 U2rkGsnVO
例えば9桁完全一致トリップが欲しいとして、
12桁で検索するのと10桁で検索するのでは、
どちらが確率が高いのでしょうか?
271: ◆YSRKEN.ceVZZ
13/10/08 19:37:18.73 hGdMdaDn0
>>270
確率は同じだが普通は前者の方が高速に検索できるからお勧め
ユーYggdrasil に依頼しちゃいなYO
272:名無しさん@お腹いっぱい。
13/10/09 00:11:52.59 qMpebiGr0
ゆぐちゃんの実績から言っても12桁ですよねー
URLリンク(tripcode.net)
平均検索時間(12桁):13.9日(9文字)
平均検索時間(10桁):1.4ヶ月(9文字)
273: ◆Meriken//XXX
13/10/09 01:07:35.35 lCvxi2JOP
YSRKENさん、ときどき名無しで書き込んでますね。
274: ◆Meriken//XXX
13/10/09 01:18:50.00 lCvxi2JOP
Haswellが届いたことは確認済みなので、これから取ってきます。
今日はちょっと用事があるので組み立ては明日あたりかな。
275: ◆YSRKEN.ceVZZ
13/10/09 01:31:41.77 hjmT6Azw0
>>273
えっと、はいそうです。とは言っても、
「専ブラでコテハン記憶しているはずなのになぜか消えてて面倒になった」
というのが主な理由ですが。
>>274
遂にMerikenさんがHaswellに挑戦するんですね……ドキドキ
276: ◆Meriken//XXX
13/10/09 01:47:33.39 lCvxi2JOP
>>275
そうですか。まあ何事もほどほどに、ね。
277: ◆QZschizo.ptH
13/10/09 03:59:47.55 lS/PIDax0
>>270
12桁の方がトリップ生成速度が格段にはやいし(環境によるけど)、なんだか12桁ってあんまり「安全」じゃないような気がしてきた‥‥
278:名無しさん@お腹いっぱい。
13/10/09 04:35:29.68 wuthnGWj0
>>277
前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれないけれど、
完全一致なら空間的にも時間的にも12桁の方が安全性は高いと思うよ。
検索速度が何倍で、トリップ数が何倍か計算してみよう。
トリップ数ではなく使用可能な鍵空間で計算してみても良い。
あーでも捻ってないからレインボーテーブル的なアプローチには弱いかも。
279: ◆Meriken//XXX
13/10/09 04:37:19.41 lCvxi2JOP
検索速度は12桁のほうが数倍速いですけど、10桁トリップのキー空間の狭さを考えたら
12桁トリップのほうがはるかに安全ですよ。12桁トリップの数は2^72個ですけど、
10桁トリップはキーが56bitだから最大で2^56個しかありません。
キーがShift-JISの場合はさらに少なくなります。
280: ◆Meriken//XXX
13/10/09 04:55:24.64 lCvxi2JOP
>>378
2^34TPS (≒16G TPS)で検索しても12桁トリップをすべて出すには
最低で2^38秒(≒87世紀)かかるのでまあ大丈夫でしょう。
281: ◆Meriken//XXX
13/10/09 04:56:51.56 lCvxi2JOP
>>280は>>278さん宛でした。
282: ◆QZschizo.ptH
13/10/09 04:57:40.03 lS/PIDax0
確かに鍵空間的に2^16 違うのであれば、不安がる根拠はありませんね、いろいろ教えていただきありがとうございます
283:名無しさん@お腹いっぱい。
13/10/09 08:12:00.69 c6EX+6rR0
時代は12桁
284: ◆YSRKEN.ceVZZ
13/10/09 08:15:12.78 hjmT6Azw0
>>278
>前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれない
前に「いや先頭合ってるだけで誤解されかねないからそれはそれでマズい」って声があったような……
でもまあ完全一致や全桁対象の酉(例:全数、二構)だと10桁の方が断然見つけやすいんですけどね
285: ◆Meriken//XXX
13/10/09 08:51:52.85 lCvxi2JOP
>>283
そのかわりきれいなトリップは10桁のほうが断然出しやすいですけどね。
一長一短といったところです。
286:混沌 ◆Chaos/geeeIV
13/10/09 09:19:45.48 P0BLzLC00
>>285
10桁酉の場合、最後に使える文字が16種類しかないってのが
きれいな酉を探すにはネックになるかもしれないですけどねw
287: ◆Meriken//XXX
13/10/09 12:06:51.46 lCvxi2JOP
>>286
でも12桁で最後まで揃っているトリップを出すのは至難の業ですからねえ。
もうちょっと速度を向上させたいところです。
288: ◆Meriken//XXX
13/10/09 13:19:42.59 lCvxi2JOP
Haswellちゃんが届いたのでさっさと検索君1号にインストールしてしまうことに
しました。マザボとCPUを交換してから試しに立ち上げてみたら平然と動いていますw
OSを再インストールしなくていいのには助かりました。うまく行けば今日中に終わるかな。
289: ◆Meriken//XXX
13/10/09 15:06:43.48 lCvxi2JOP
試しにi7-4770で10桁トリップのCPU検索を動かしてみましたが、
定格の3770Kよりちょびっと遅いぐらいです。
しかしなぜか3枚目の7970が認識されません。むぐぐ…
290: ◆Meriken//XXX
13/10/09 15:13:29.70 lCvxi2JOP
システムもイマイチ安定しなかったので結局OSを再インストール
することにしました。やっぱりサボろうとするといけませんねえ。
291: ◆QZschizo.ptH
13/10/09 18:33:25.41 lS/PIDax0
>>251
keyword: 浪漫
292:名無しさん@お腹いっぱい。
13/10/09 18:44:03.56 rG8iFpjW0
男のマロン
293:名無しさん@お腹いっぱい。
13/10/09 19:00:49.17 gUimoTt50
中々
URLリンク(www.youtube.com)
良い歌だよね。
294:混沌 ◆Chaos/geeeIV
13/10/09 19:37:13.05 P0BLzLC00
8bit機が現役でどんどん新作でていた頃 はっきりしないけど25年も昔だろうか・・w
HDDが20Mで20万とかした記憶があるw
1Tあたりに換算すると100億くらいか・・
今のHDDは1Tあたり4000円程度
容量単価で250万分の1くらいw
12桁トリップ全保存計画を実行しようとすると
2^72の空間でキーとトリップのペアが24バイト
2^72*24
2^40が1Tで、その1000億倍くらいw 4,000,000,000,000,000 =4000兆円
日本の国家予算の10倍くらいかなw
でも容量単価が250万分の1になれば・・・
2^40 * 2^32 * 24
100,000,000,000 / 2,500,000 = 1,000,000/25 = 40,000 今の1Tハードディスク4万個分くらいの予算
4000*40000=1億6千万円
25年後 1億6千万円分のHDD容量で12桁のキーとトリップのペアを全部保存できる?
計算合ってるかな?
どこかの自治体のプロジェクト予算って感じか・・・w
さらに25年後 250万分の1の値段になると
160,000,000 / 2,500,000 = 1600 / 25 = 64円 www
2ちゃんねるが出来てから、既に14年たっているんだよねー
月日が立つのは速いw
295:名無しさん@お腹いっぱい。
13/10/09 19:38:14.38 sMw4vpEq0
リアルではかなえられないような夢や冒険に憧れる気持ちを込めて、
「男のロマン」などということもあります
296:混沌 ◆Chaos/geeeIV
13/10/09 20:29:50.05 P0BLzLC00
>>294
>2^40が1Tで、その1000億倍くらいw 4,000,000,000,000,000 =4000兆円
ここで桁間違えているな 400兆円だな
そうすると、25年後は1600万円か
物好きな小金持ちの年寄りでも出来ないことはない感じか・・・w
297: ◆YSRKEN.ceVZZ
13/10/09 20:50:39.62 hjmT6Azw0
でも、保存しようにも計算が追っつかない気が……真面目に計算してないからよく分からないけど
298:名無しさん@お腹いっぱい。
13/10/09 21:05:58.94 LbcdLs8/0
ずっと前にどこかで似たような話を見たと思ったら
スレリンク(software板:529番)
だった
299:混沌 ◆Chaos/geeeIV
13/10/09 21:22:42.31 P0BLzLC00
>>297
現状では、検索パターンに指定したパターン以外は全て捨てて
新たにパターンを探す時は最初から検索しなおしているわけだけど
保存計画は、計算済みのトリップをかたっぱしから保存していくので
計算済みのトリップならばデーターベースに検索命令入れるだけで1発で取り出せることw
とはいえ、高速ループで生成し続けるトリップを、生成する速度で未保存トリップか否かをチェックして未保存なら保存していく処理はスタンドアロンでは難しそう
こういうことにこそ、分散処理が威力を発揮しそうですよね
分散処理でトリップ範囲を分担し
ループで計算しながら、挿入ソートでメモリ展開しつつ、担当範囲の分担PCに計算済みトリップを分配していく
>>298
既出の話題でしたか^^;
300: ◆Urotsuki/1Ca
13/10/09 21:26:31.44 NxgWXisV0
結構夢があっていいですねー
SSDがもっと早くなってかつ低価格化すれば実現可能性は十分あります
現状のネックである消費電力と速度を打開してくれるのがSSDですから 価格面ならHDDですけど
301:名無しさん@お腹いっぱい。
13/10/09 21:30:18.36 wuthnGWj0
>>294>>296
そこでレインボーテーブルのアプローチですよ。
始点トリップ+終点トリップで72*2/8=18byte
長さ2^20(1MTrip)で(2^72/2^20)*18=72PiB
トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセットとして読めば
始点トリップ=9byteで9*2^(72-20)=36PiB
1Tあたり4000円で計算するなら1億4745万6000円
20MTPSくらいは出てるようだし平均1分の1GTPSを目標にすれば
始点トリップ=9byteで9*2^(72-30)=36TiB
1Tあたり4000円で計算するなら144万4000円……うん、中々現実的な範囲じゃない?
テーブル作成に掛かる時間は普通に全トリップ計算に掛かる時間(…を超える?)なので、そっちで死にますがww
302:混沌 ◆Chaos/geeeIV
13/10/09 21:54:48.06 P0BLzLC00
>>301
む〜ん、レインボーテーブルが理解できない><
ウィキペディアみてみたけどちんぷんかんぷんでした><
1回総当りでテーブル作るって事はわかるんだけど
なんでその時作ったテーブルが、別のハッシュから結果を取り出すことに使えるのか想像できないw
そこでつまづくから、その先の容量削減とかチェイン化とかちんぷんかんぷん
(っていうか、微積とか行列とかの記号出てくると、そっちでお手上げw)
303:SilentPC ◆SilentPCIePC
13/10/09 22:21:49.95 K2oUYBuJ0
トリップと遂になるハッシュ値を保存して行く時に、トリップ12桁全部をDBに保存せずにトリップ最初4文字でソート+ハッシュで保存していくとか?
残り8文字はDBから取り出したハッシュ群から計算して探す。12桁の残り8文字一致だけなら結構速く計算出来ると思う。
そうすると1トリップに付き8文字分データを減らせる。
304:混沌 ◆Chaos/geeeIV
13/10/09 22:26:10.85 P0BLzLC00
>>303
あーーっw
言われてみれば、トリップは保存しないでもアドレスから一意に決まる事に出来ますね
ディスクは半分で済みそうです
トリップから一意に決まるアドレス位置に そのトリップを計算するのに使ったキーを保存していけばいいのね
305:SilentPC ◆SilentPCIePC
13/10/09 22:32:50.29 K2oUYBuJ0
ああ、更に削る方法もあるかな?
例えば最初1文字までにして、2文字目は大文字か小文字か数字か記号で4パターン(00:01:10:11の2ビット)に分ける。
更に3文字目も同じく分ける。更に4文字目も…
そうやってトリップを区分分けする事で、残りの文字列のパターンを分類し、探すハッシュの数を絞っていくとか?
306:混沌 ◆Chaos/geeeIV
13/10/09 22:42:47.54 P0BLzLC00
>>305
トリップ ◆AAAAAAAAAAAA のトリップキーはアドレス0に保存
トリップ ◆AAAAAAAAAAAB のトリップキーはアドレス1に
こんな感じで、トリップから一意に決まる保存アドレスにキーだけを保存していく感じで良さそうw
307:名無しさん@お腹いっぱい。
13/10/09 22:46:57.59 wuthnGWj0
>>302
自分も全容や応用までは把握はできてないのですが…
まずH(key)→hashなハッシュ関数(SHA-1関数の先頭72bit)と、C(hash)→keyな変換関数(仮にBASE64関数)を準備。
適当な始点hashから「H(C(hash))→hash」を複数回チェインして終点hashを得るってのを沢山やって終点hash→始点hashのテーブルを作って保存しておく。
検索時は「H(C(hash))→hash」な処理を延々繰り返して、記録済みの終点hashと一致するまで検索を続ける。
一致する終点hashを見つけたら対応する始点hashから「H(C(hash))→hash」を繰り返して、H(C(hash))が目標と一致したらそのときのC(hash)が目的の値。
…ってのがレインボーテーブルの概要だったはずです。終点hash→始点hashのペア情報だけでチェイン回数分のハッシュを代用できるのが利点ですね。
C(H())チェインがキレイに全ハッシュ空間が一周するC()を組めれば繰り返し長を固定して探索時間の保障が出来ますが、
H(C())の鎖が短い繰り返しで一周してしまう部分とかをテーブルに含ませる(または検索時にループを発見する)必要もあり、
C()の出力鍵空間内でH()が衝突すると鍵空間<ハッシュ空間になって全てのハッシュを網羅できなくなる問題もあり、
その辺の工夫とかが多分レインボーテーブルのキモになるところだった筈です。
ハッシュ衝突とかは…異なるC()を使ったテーブルで補完するとかでしたっけ。
>>304
ちな301で書いた「トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセット」ってのもそれです。
↑に書いてるC(H())チェインが短くて頭20bit=0等が出ないと悲しい事になりますorz…ケチらず72TiB使うべきか。
>>305
単純にハッシュの頭nbitを削るだけでも行けそうですね。
308:名無しさん@お腹いっぱい。
13/10/09 23:36:27.79 MTyJscGe0
>>306
似たようなことコンテストの重複チェックルーチンでやったー懐い
FDDの物理アドレスだからエラーになったらおしまいという綱渡り・・・若かった
脇からすまそ
309:混沌 ◆Chaos/geeeIV
13/10/10 00:25:16.04 2gxQn/T50
>>308
まぁ何もOSのFAT管理を無視してトラックセクタ直指定するわけでも
ましてやトラックのギャップにデーター入れるわけでも(笑)ないので
単に、巨大なデータファイル(別に単一ファイルじゃなく適当な大きさのファイル郡でいいのですが)に
先頭からのオフセットで位置を決定するっていうだけなのでw
トリップ文字列からキーの保存オフセットに変換する関数を1つ用意するだけで
知りたいトリップのキーを保存するオフセットアドレスをトリップから直接得ることが出来るですよw
310: ◆Meriken//XXX
13/10/10 03:26:47.92 1qnGPo+xP
盛り上がってますね〜
私はいまだに検索君1号の調整中です。
これ、ちゃんと使えるようになるのかな…
311: ◆Meriken//XXX
13/10/10 06:11:07.20 1qnGPo+xP
MTFを起動しようとするとatimpag.sysでBSOD(0x00000116)が発生。
やっぱGPUが5個もあるのがいけないのかなあ。弱った弱った。
312: ◆Meriken//XXX
13/10/10 06:36:09.28 1qnGPo+xP
いろいろいじってたらいつの間にか動くようになりましたw
後は微調整だけど、取りあえず動作確認は出来たので一安心です。
313:名無しさん@お腹いっぱい。
13/10/10 06:43:37.09 wd4utxMC0
何て贅沢で羨ましい悩み。w
314: ◆Meriken//XXX
13/10/10 07:05:19.03 1qnGPo+xP
さすがにちょっとやり過ぎかもしれませんw
あれからまた安定しなくなったのでもっと調整が必要なようです。
実に難しいですねえ。
315:混沌 ◆Chaos/geeeIV
13/10/10 07:38:15.24 2gxQn/T50
おはようございます
いい感じに設定作業が進んでいそうですねー
316:やんやん ◆yanyan/Pails
13/10/10 08:18:22.69 9IgIyU1y0
Linux版の予定ってありますか?
317: ◆Meriken//XXX
13/10/10 08:42:56.48 1qnGPo+xP
>>315
いやあ、それが結局あれから全然安定しなくて、とりあえず
7970をはずしちゃいました。残念なことにM6Eだと5GPU以上だと
安定しないようです。これまで使ってたCrosshair V Formula-Zが
特別だったのかもしれません。
ちょうどAVX2の次はGCNのアセンブラに取り組もうと考えてたので、
7970は開発機に移してしまうことにします。GCN版はかなりの長丁場になりそうなので、
まあ妥当なところでしょう。
318: ◆Meriken//XXX
13/10/10 08:43:40.37 1qnGPo+xP
>>316
私自身がLinux版を作ることはないで〜す。
319: ◆Meriken//XXX
13/10/10 10:14:48.60 1qnGPo+xP
7970を外してもまだ調子が悪いので、今度は7990だけにしてみました。
6990が原因だとまだ助かるんだけど、マザボの初期不良というのだけは勘弁して欲しいなあ。
320:名無しさん@お腹いっぱい。
13/10/10 12:08:33.38 LHshhmTP0
皆様お疲れ様です
すいませんが質問させて頂きます
トリップの回文と双連の違いは何でしょうか?
宜しくお願いします。
321:名無しさん@お腹いっぱい。
13/10/10 12:37:06.54 jg8QWjDo0
回文 abcdeffedcba
双連 aabbccddeeff
322:混沌 ◆Chaos/geeeIV
13/10/10 12:48:04.01 2gxQn/T50
現時点で12桁トリップ全てを保存するのは非現実的ってのはわかったけれど
現実問題として、計算しながら、計算した分をどんどん保存していくということを考えた場合どうなるのか・・・
現時点でユグが調子いい時で20GTpsくらいかな
1年スパンで考えた場合
20G=2^30*20
1年=311万秒≒2^20*3
(2^30*20)*(2^20*3) = 2^50*60
とりあえず計算しやすいってことと、速度増加見込みってことで4倍の速度 80GTpsを見込めると仮定して
2^50*2^6 = 2^56
80GTpsで1年間ぶん回すと2^16 T = 65536Tのトリップを生成
うーん、分散処理で実現するには容量以外にもネットワーク負荷の事や
>>294の用に全空間分容量のHDDに記録していくわけじゃないので
ハッシュインデックス化する必要があり、それを記録分担する仕組みを考えるとか
色々課題はあるものの
1年で65536T*12 のトリップキー容量とハッシュインデックス化に必要なインデックス容量考えただけで
現時点ではまだ厳しそうですね・・・w
323:名無しさん@お腹いっぱい。
13/10/10 13:02:30.82 hf+1FSU2P
HDDに1か所保存とか分散だと失われる可能性高そう
1キーでも失われたらそれを再びみつけるのはものすごく大変だろうなー
324:名無しさん@お腹いっぱい。
13/10/10 13:14:55.98 LHshhmTP0
>>321
分かりやすい説明
ありがとうございますm(_ _)m
325: ◆Meriken//XXX
13/10/10 14:43:28.90 1qnGPo+xP
せっかく買ったM6Eですが、カードの選り好みが非常に激しく
なかなか性能を出せません。とりあえずうまく動いた7990と7970の
組み合わせで10桁トリップ検索専用にしておきました。
まあもともと種類の違うグラボを挿すこと自体かなり特殊なのですが、
この展開は完全に予想外です。やっぱり実際にやってみないとわかりませんねえ。
326: ◆Meriken//XXX
13/10/10 14:55:16.83 1qnGPo+xP
まあいいや。今後どうするかはAVX2版の開発が終わってから考えようっと。
327: ◆JouJaku.IYSv
13/10/10 19:09:27.72 56mjdoXX0
>>325
ご愁傷様です。
私も同じZ87チップセットですが、7990とTITANx2の混在で何も問題無くさくっと動きました。
謎ですねぇ。グラボと配線が干渉するので、これ以上追加して試すことは出来ません。
しかし、7990+TITANx2より7990+7970の方が速いって・・・。
328:名無しさん@お腹いっぱい。
13/10/10 19:25:36.93 QtlpUHtc0
Maxwell世代でMTFでもGeForceがRadeonに逆転したりしなんですかね
329: ◆Meriken//XXX
13/10/10 22:08:10.37 1qnGPo+xP
>>327
7990を一番上のスロットに挿さないとまともに動かないし、
これまで使っていたPCIeの延長ケーブルとM6Eの相性も良くないようです。
AMDのドライバも最新のものでないと動きませんでした。不思議なもんです。
330: ◆Meriken//XXX
13/10/10 22:31:07.18 1qnGPo+xP
そうか、M6Eは開発機にまわして、検索君1号はこれまで通りでもいいのか。
時間かかるけどそうしよっかな。
331: ◆Meriken//XXX
13/10/10 23:42:11.44 1qnGPo+xP
今調べたら電源のPCie用のケーブルの端子の先が少し溶けてました。
どうも不安定だった原因の一部はこれにあるようです。
やっぱり無茶させすぎですね。新しいのを注文することにします。
これでうまく行けばかなりおいしいけどどうかな〜
332: ◆Meriken//XXX
13/10/10 23:47:34.88 1qnGPo+xP
>>327
>>328
現在CUDA版の10桁トリップ検索のボトルネックになっているのは共有メモリの量なので、
これが増えない限りは速度は上がらないはずです。TITAN用に書き直せば
もちろん話は別ですが…
333: ◆Meriken//XXX
13/10/11 01:40:41.48 oMuOOsM+P
電源のPCIe用のケーブルを開発機から持ってきて取り付けたら
ようやく検索君1号が12桁トリップ検索でも安定して動くようになりました。
7990を一番上に乗っけているので見た目は前よりさらにやばくなりましたが、
前より冷えるようになったので速度は上がっています。
これで心置きなくAVX2対応の作業を始められます。
334: ◆Meriken//XXX
13/10/11 06:38:50.63 oMuOOsM+P
あれからまた不安定になったので、今度は7990+6990+6990の組み合わせを
試してみましたが、今までで一番安定して動いています。
M6Eはなるべくビデオカードの種類を揃えてやると安定して動作するようです。
すんなり動かなくてエライ目に遭いましたが、もう大丈夫でしょう。
335:名無しさん@お腹いっぱい。
13/10/11 07:00:31.48 kG6nG+a40
コネクタが溶けるとかどんだけw
336:混沌 ◆Chaos/geeeIV
13/10/11 10:16:34.06 7L8VTn8Q0
URLリンク(www.eurogamer.net)
凶器ですねw
337: ◆Meriken//XXX
13/10/11 15:01:05.83 oMuOOsM+P
7990は化物ですw 空冷だと12桁トリップ検索で本気を出しきれないのが
残念ですが…
338: ◆Meriken//XXX
13/10/11 15:14:10.87 oMuOOsM+P
AVX2対応のためにコードを見直してたのですが、
12桁トリップ検索はすぐに対応できそうです。楽しみだな〜
339:混沌 ◆Chaos/geeeIV
13/10/11 15:31:38.11 7L8VTn8Q0
自作なんてしたのも、もう遥か昔のことで最近のPC事情とか、全然ついていけない話になっているのですがw
「グラボ」にメモリ6Gってなんじゃそりゃwww って感じですよw
340:SilentPC ◆SilentPCIePC
13/10/11 16:20:48.16 vXaPX/w40
Powercolor HD 7990 Devil 13 6 GB
URLリンク(www.techpowerup.com)
URLリンク(tpucdn.com)
最大消費電力551W (; ・`д・´)…ゴクリ
341: ◆YSRKEN.ceVZZ
13/10/11 16:37:10.98 kAO/Va9a0
もはや電子レンジクラス
342:SilentPC ◆SilentPCIePC
13/10/11 16:45:35.62 vXaPX/w40
>>341
なるほど、つまり電子レンジで中のものを温めながら、同時にファンで中のものが熱くならないよう冷やしているのがHD7990なんだね。
拷問の域だな…(;´д`)
343:混沌 ◆Chaos/geeeIV
13/10/11 17:08:53.79 7L8VTn8Q0
暖めながら冷やすって言ったって
空冷だろうと水冷だろうとたとえ油冷であってもw
換気するか冷房でもしない限り、冷ました熱は全て部屋にたまるわけでして・・・
1年中強力ハロゲンヒーター部屋の中で動かしてるようなものですよねw
344:名無しさん@お腹いっぱい。
13/10/11 17:19:47.06 21WqkArR0
液体窒素の中に沈めて冷却する選択肢
345: ◆YSRKEN.ceVZZ
13/10/11 17:29:51.23 kAO/Va9a0
>>342
自分で言っててアレだが、レンジとかオーブンって1000W↑が普通だからちょっと違うかも
(ハロゲンヒーターとか電気ポットとかの方が近い)
その辺の冷蔵庫で250kWhぐらい(一日700Wh)だからそれより断然金が掛かるって……
346: ◆Meriken//XXX
13/10/11 17:30:20.53 oMuOOsM+P
>>343
6990も2枚あるから、ヒーターは3台ですw
7990はともかく、6990のうるさいのなんのって…
347:混沌 ◆Chaos/geeeIV
13/10/11 17:30:31.68 7L8VTn8Q0
いや、だから同じですってw
クーラーだって、室外機を部屋に持ち込めば、コンプレッサ動かしている分立派な暖房ですしw
冷蔵庫が部屋の中にあれば、冷蔵庫の中身は冷えても部屋の温度は上がるしw
液体窒素だって、液体窒素自体を冷やす装置が室内にあったら、冷やしたい部分を効果的に冷やす事はできても
部屋全体の温度はどんどんあがって・・・w
348: ◆Meriken//XXX
13/10/11 17:31:34.76 oMuOOsM+P
>>345
検索君1号だけで1300W超えてますw
349:混沌 ◆Chaos/geeeIV
13/10/11 17:32:03.99 7L8VTn8Q0
あw >>347は >>344にですw
350: ◆Meriken//XXX
13/10/11 17:35:32.84 oMuOOsM+P
とりあえずAVX2を検知するルーチンを追加しました。
まあ時間はたっぷりあるのでのんびりやることにします。
351:名無しさん@お腹いっぱい。
13/10/11 17:52:36.25 zZdEZh+x0
冷蔵庫inで、検索。
352:SilentPC ◆SilentPCIePC
13/10/11 17:59:12.22 vXaPX/w40
もういっそ、豪快にアメリカらしくガレージに検索君を置いて、水冷モーターは排水ポンプ用のを使って、ラジエーターは自宅のプールに沈めるのが良いのかもね…
日本なら逆にエコを意識して、発熱で発電をしてその電気で冷却をする装置を開発し、電気代を節約とか。
普通のPCの発熱程度じゃ無理でも、それぐらいの消費電力になれば流石にいくらか還元は出来ないものか?
何か良い発電装置のアイデア無いですか?
353:混沌 ◆Chaos/geeeIV
13/10/11 18:37:11.10 7L8VTn8Q0
冷蔵庫in、検索してみたら想像してたのと全然違ったw
冷蔵庫搭載PC
URLリンク(weekly.ascii.jp)
URLリンク(weekly.ascii.jp)
とか
冷蔵庫の中にマザー入れちゃって冷やすやつとか
そーいうのを想像してたのに、最近流行りのアレだったのね・・・w
354:名無しさん@お腹いっぱい。
13/10/11 19:00:32.74 fckT3S+N0
新生検索君1号大勝利!!!!!
355:名無しさん@お腹いっぱい。
13/10/11 23:27:37.53 r5Pqdip00
>>347
とりあえず最終的な廃熱を室内空気じゃなくて外気に捨てるところからですね。
>>352
温度差で発電すると発電機が熱抵抗になっちゃいますからねぇ…
温度差発電による稼動効率補助つきDCの噂は聞いたことありますが、
発電電力による冷媒循環での効率上昇が発電の熱抵抗を上回れるかどうか。
>>353
冷蔵庫/冷凍庫は温度差が稼げるだけで熱交換速度が遅いから、
断熱性のお陰で逆に蒸し風呂になるってアレですねww
356:名無しさん@お腹いっぱい。
13/10/12 05:04:23.90 BCrjFCBd0
664 :名無しさん? [↓] :2013/10/11(金) 23:58:53.30 ID:???
AMD Catalyst 13.11 Beta Driver for Windows
URLリンク(support.amd.com)
357: ◆Meriken//XXX
13/10/12 10:00:12.64 Oyi47z8vP
>>356
15日に発表のR9 290Xは対応カードの一覧には入っていませんね。
発表の日が楽しみです。
358: ◆Meriken//XXX
13/10/12 10:17:44.74 Oyi47z8vP
とりあえずAVX2で12桁トリップ検索を動かしてみました。
CPU(i7-4770)だけで209M TPS出てます。
URLリンク(www.meriken2ch.com)
ただ、リテールクーラーでは冷却が追いつかないようで、
しばらくしたらCPUがスロットルダウンして速度が下がってしまいました。
URLリンク(www.meriken2ch.com)
まあでも実際に倍近い速度が出せたのでまずまずの成果と言っていいでしょう。
359: ◆YSRKEN.ceVZZ
13/10/12 10:29:55.29 RMpLDz7l0
>>358
CUI画面がすごく懐かしく感じる……あれ、
無料版でもCUI実行で検索できましたっけ?
360: ◆Meriken//XXX
13/10/12 10:32:37.37 Oyi47z8vP
>>359
出来ませんよ。開発用に有効にしてるだけです。
361: ◆Meriken//XXX
13/10/12 10:52:01.12 Oyi47z8vP
32bit AVX2版も作ってみたのですが、こっちでは検索開始直後に
230M TPS出ています。かなり謎です。キャッシュの使い方とか、
OoO向けの最適化とか、工夫の余地はまだ大分ありそうです。
362: ◆QZschizo.ptH
13/10/12 12:27:39.22 zonN9MYx0
5970x2ですがやっぱりデバイス判定に時々失敗します.
再現性をみるのにどこから手をつけたらいいですか?
363: ◆Meriken//XXX
13/10/12 12:34:44.55 Oyi47z8vP
CPUのクロック周波数を3.5GHzまで落としたらようやく熱ダレを起こさなくなりました。
速度はこんなかんじです。
64bit版: 186.84M TPS
32bit版: 209.06M TPS
同じ条件でのDayトリッパーの速度は次になります。
DayTripper2101: 154M TPS
MTFはかなりの速度を出しているのですが、
64bit版のほうが32bit版より遅いことの説明がつきません。
やっぱりCで書いたルーチンを見なおした方がいいのかな…
364: ◆Meriken//XXX
13/10/12 12:41:52.14 Oyi47z8vP
>>362
それはおかしいですね。とりあえず開発版のMerikensTripcodeEngine.exeを
動かして、デバイス判定の失敗したときに"OPENCL DEVICE"の"Name"の部分に
何が表示されているか調べてみて下さい。ドライバのバグの可能性が高いので、
ドライバを変えてみるのもいいと思います。
365: ◆Meriken//XXX
13/10/12 13:50:51.64 Oyi47z8vP
64bit版が遅くなっていた理由がわかりました。
yasmのビルトインマクロであるsave_xmm128が
vmovdqaではなくmovdqaを使っていました。
まったく、油断も隙もあったものではありませんw
これで速度差は妥当なものになりました。やれやれです。
64bit版: 211.96M TPS
32bit版: 209.06M TPS
366: ◆Meriken//XXX
13/10/12 15:02:59.99 Oyi47z8vP
キャッシュに乗りやすいようにテーブルの一部を関数ローカルにコピーしてやったら、
それだけで2〜4M TPSほど速度が上がりました。結構まだ工夫の余地がありますねえ。
64bit版: 216.11M TPS
32bit版: 210.78M TPS
367:名無しさん@お腹いっぱい。
13/10/12 15:12:32.49 UKFSL8z80
>>353
VAX Barで通った道なのに今更感が強いですね、これ
368: ◆Meriken//XXX
13/10/12 15:42:11.41 Oyi47z8vP
>>352
一軒家に住んでたら間違いなく検索君1号はガレージ行きですねw
自室に置いているのは、我ながら正気の沙汰ではありません。
冬に暖房が全く必要ないのは助かりますが…
369: ◆JouJaku.IYSv
13/10/12 15:59:07.38 SgElHHWv0
>>366
お疲れ様です。
同じCPUで定格(3.7GHz)だと約120MTPSなので、ほぼ倍のスピードが出ていますね。
水冷だとサーマルスロットリングは起きないだろうから、楽しみです。
370:混沌 ◆Chaos/geeeIV
13/10/12 17:28:36.27 +NNdeoDL0
>>367
VAXを知らない畑にいたわけじゃないけど
直接端末に触れた事はほとんどない・・・
ただ、あいつがあるコンピュータルームってのは肌寒くてねぇ・・・w
触れたこともほとんどないから、VAX Barなるものもはじめて聞いたんだけどググってみたよw
感想は、メリケン野郎の考えることはクレイジーだぜw って感じw
メリケンさんに引っ掛けたけど、別に罵倒でも卑称でもないのであしからずですw
っていうか、メリケンさんの名前 ハンドルはその意味から取ってて、今住んでるのもソッチのほうなんだろうけど日本人ですよね?
371:名無しさん@お腹いっぱい。
13/10/12 19:44:19.02 XeWEbd3E0
VAX って、VAX/VMS の事??
それなら懐かしいな・・・
372:混沌 ◆Chaos/geeeIV
13/10/12 20:41:37.86 +NNdeoDL0
>>371
ですですw
373:名無しさん@お腹いっぱい。
13/10/13 01:11:31.43 KYI8bH6i0
今更なことですが、検索文字列がヒットしたら、該当する依頼を無効にする
(ゆぐちゃんではなくローカルでの話)機能って付けられますかね?
374:名無しさん@お腹いっぱい。
13/10/13 01:34:02.23 xoBD38890
グラボごとの速度をまとめたWikiとかってどっかにありますか?
375:混沌 ◆Chaos/geeeIV
13/10/13 04:58:52.86 fqcxyF9L0
ローマ字っぽい4文字を適当に作ってみる正規表現の超適当版
^[KSTNHMRGZDBP][aiueo]([kstnhmrgbp][aiueo]){3}/
こんな感じで検索回してみたものの・・・
確かにローマ字なんだけど、まともな単語が出来る確率の低さにがっかりw
376:磯の良い石 ◆ISONOIIISI
13/10/13 05:20:16.81 KYI8bH6i0
>>375
昔、ローマ字のみで意味が通るトリップを生成するための正規表現を自作したことがある
1文字の類(母音)、2文字の類(母音以外の1文字カナ)、3文字の類(拗音を含む類)を
長さが12桁(or10桁)になるように並べたデータをプログラム組んで用意して、
patterns.txtに書き込んで回したもんだ……展開が物凄いことになったがな!
で、上に出ている酉がその成果の一つだったり……
377:名無しさん@お腹いっぱい。
13/10/13 05:35:30.40 KYI8bH6i0
>>374
データの蓄積自体は相当量ありますが、なにせアップグレードでガンガン速度向上しますもので……
このスレだけ見ると、
「HD6990+HD7970+HD7990≒11.1GTPS」(>>3、Ver.0.10)
「HD6850≒805MTPS」(>>19,Ver.1.1FEα2)
「HD 5570/5670≒340MTPS」(>>94,Ver.1.1FEα5)
「GTX660≒536MTPS」(>>98,Ver1.1FEα4)
「GTX650≒207MTPS」(>>101,Ver1.1FEα5)
「GeForce610M≒64.3MTPS」(>>114,Ver1.1FEα5)←参考記録
「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
といった感じですかね。他は前スレを当たることをお勧めします
378:名無しさん@お腹いっぱい。
13/10/13 05:44:41.91 JeVY24vu0
>>377
> 「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
これは10桁ですよ
379:名無しさん@お腹いっぱい。
13/10/13 05:46:37.71 KYI8bH6i0
>>378
あ、本当だテヘッ
380:名無しさん@お腹いっぱい。
13/10/13 05:54:58.91 +cbnuJwL0
>>377
グラボ、ドライバ、バージョン、設定値・・・手集計はミスが怖いし、
ゆぐちゃんでグラボと速度の情報とって公開してくれたら面白そう
381: ◆Meriken//XXX
13/10/13 09:04:25.37 EU+GIsqgP
>>370
日本人ですよ〜
382: ◆Meriken//XXX
13/10/13 11:34:03.90 EU+GIsqgP
10桁トリップ検索のAVX2への対応がなかなかうまく行きません。
ぐぬぬぬぬ…
383: ◆Meriken//XXX
13/10/13 13:53:21.35 EU+GIsqgP
一応AVX2対応の10桁トリップ検索のルーチンは動くようになったのですが、
なかなか思ったような速度が出てくれません。
AVX(8スレッド): 23.95M TPS
AVX2(8スレッド): 37.98M TPS
AVX2(4スレッド): 35.09M TPS
まあそれなりに速くはなっているのですが、L1Dキャッシュが潰れているみたいで、
倍の速度にはなりませんでした。ちなみに8スレッドから4スレッドにても
あまり速度は落ちていません。やはりキャッシュの使い方を工夫するしかないですねえ。
384:混沌 ◆Chaos/geeeIV
13/10/13 14:31:17.44 fqcxyF9L0
>>376
10桁の方はまだマシなんですが、12桁だと特に
ちょっと無茶なパターンを作ると、すぐに展開サイズがシャレにならない事になって
MTFで検索開始しても、パターンを展開中・・・ まではまだ何とか動いても
そのあとのパターンを処理中で帰ってこなくなってw
帰ってきても、なぜかその後のユグと通信に失敗して何分後に再通信しますとなって、その時間になると展開から再開になって繰り返すのよねw
なんかエラーのアラート窓が出た時もあったな・・w 10秒くらいでその窓消えちゃったから内容確認できなかったけど・・w
まぁそんな感じで、パターンは展開後のサイズがあんまりでかくなり過ぎないように気をつけているのと
パターン定義の入力欄、一応長い定義も書き込めるみたいだけど入力窓あんまり大きくないし、どうせ表示も表示窓の横幅までだから
あんまり複雑な定義もなーって思ってたけど
patterns.txtに直接かーw
patterns.txt って、相当長くなってしまってもしっかり読み込んでくれるのかな(使用可能なメモリの上限チェックとかもろもろ、そういう処理コミコミで)
というか、上記のエラーとか不安定だったのはグラボのメモリの制限なのかなって、自分のグラボを今更ながらみてみたら2Gもメモリあるのね・・・w
7990が6Gも積んでて信じられんとおもったけど、2Gでも十分に信じられないレベルだったw
閑話休題
古い人間なもので、「グラフィックシステム」でユーザープログラムを動かす なんていうと
FM-7のグラフィックサブシステムにYAMAUCHIコマンドで数バイトの共有メモリを使ってプログラムを転送して・・・w
なんてイメージが湧いてきちゃうのですよw(「YAMAUTIコマンド」はググると出てくるはずw)
とはいえ、今のグラボにユーザー処理させるってのも、やっぱり転送して走らせるとかするのでしょうね
動かすプログラムは・・・・・・・むむっ・・・w うーん、スレみてるとアセンブラに置き換える話がでてきてるのはわかるんだけど
GPUに対応したコード吐くコンパイラとかあるって事なのか・・
うーん、我ながら話が飛びまくったわけのわからんレスに・・・w
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
4051日前に更新/149 KB
担当:undef