[表示 : 全て 最新50 1-99 101- 201- 301- 2chのread.cgiへ]
Update time : 05/09 09:46 / Filesize : 100 KB / Number-of Response : 353
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

2ちゃんねるスレッド全文検索・・・ThreadSearch



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:23:59 ID:LnN9ZP+r0]
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな

320 名前:cen ◆Am9xOgNMYE [2009/06/15(月) 00:19:22 ID:BJwfvxUK0]
こんばんは。

スレッド全文検索を更新しました。
Ver 2.02になりました。
www.geocities.jp/cen_hp/threadsearch.html

更新点になります

・「メール」「ID」が空欄のままでも、インデックス検索が動作する不具合を修正しました。
・インデックス作成速度が向上しました。(約2倍)
・インデックスサイズを削減しました。(約25%)


インデックス化のプロセスを見直して効率よく動作するようにしました。
それから、インデックスの無駄な部分を削減しました。

321 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 03:29:55 ID:L+SUd0B3P]
>>320
乙ですた!
作成速度と容量が削減されるとは>>317の泣いて笑う顔がみえますw

作り直して体感してみる?ww
今度は8,9時間、寝てる間か出かけてる間に終わってる(カモ)

322 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 19:06:20 ID:Q/ivs7gS0]
ちょっと要望があるのですが。

検索結果にスレッドURL、もしくはレスURLを表示(もしくはコピー機能)させることってできませんか?
ある単語で検索して、ヒットすればその周辺で関連の話がされていると思うのですが
ヒットしたレスを専ブラで開く方法がないように思えました。

# すでに実装されている機能でしたらごめんなさい。

323 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 21:15:41 ID:FL1LYjT9P]
ああそれ欲しかった。

324 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 22:19:37 ID:L+SUd0B3P]
>>322
欲しいなー
さらにに検索結果を本文ままにコピー出来たら鼻血でる

例えばこんな感じ
▲> 318 :名無しさん@お腹いっぱい。:2009/06/10(水) 13:10:22 ID:+wGlmcZn0
インデックス40GBwwww

2ちゃんねるスレッド全文検索・・・ThreadSearch
pc12.2ch.net/test/read.cgi/software/1204107839/
318 :名無しさん@お腹いっぱい。:2009/06/10(水) 13:10:22 ID:+wGlmcZn0
インデックス40GBwwww

置換すればいいんだけどまとめてメモっておきたいときに楽、視認性アップです

325 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 22:38:26 ID:L+SUd0B3P]
ついでに、2.02でインデックス作り直した結果です、、、
2.00時はうろ覚えで不正確

2.00 ログ約210MB index 約42MB
2.02 ログ236MB index 44.8MB

250MBになったらまた確認して正確な結果出します・・ん、2.00に置き換えて作り直せば完璧か!

326 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 22:43:54 ID:L+SUd0B3P]
あ、作成速度向上・サイズ削減の比較対象が1.00とかだったり?

327 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 23:10:13 ID:L+SUd0B3P]
失礼しますた、うろ覚えすぎたようです

>>325修正
2.00 ログ236MB index 50.5MB
2.02 ログ236MB index 44.8MB
時間は計ってませんが、約8.9%の削減率(・∀・)

328 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/15(月) 23:14:14 ID:L+SUd0B3P]
あれ連投お許しをwww
約11%の削減率ですた(ノ∀・)アチャー



329 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/16(火) 17:46:23 ID:C4eV3YqL0]
オレメモ
V2.02にて作成時間が呆けてしまった(01:30から始めたと思ったけど脳ボケが始まったぽい。
ファイルリスト作成が01:30で実際のINDEX作成が2:50なのかな?)
INDEXフォルダのファイル日時02:50最旧時間、最新時間13:47

windowsXPのNTFSフォーマットでフォルダのプロパティにてディスク上のサイズ。
D:\Program Files\Accessories\2ch\2chjanelog\Logsフォルダ内
(画像キャッシュは別フォルダだが、janeのログフォルダは.idx・.db・その他があるのでプロパティ役に立たず)
ファイル数933,931個フォルダ数1,528にて 87.6GB

E:\o2on\datフォルダ内
ファイル数717,165個フォルダ数109,044にて 76.7GB

F:\threadsearch\indexフォルダ内
ファイル数5,852個フォルダ数0にて 32.2GB(41.6GBから随分減った)

threadsearch.exe実行にて詳細設定画面
ファイル数1,496,442個との事



330 名前:cen ◆Am9xOgNMYE mailto:sage [2009/06/17(水) 00:47:29 ID:lzOTGmvO0]
>>322-324
その機能は無いです。
すみませんが、ログのフォルダからURLを特定できないのです。
ブラウザによって推測はできますが、特定できる情報が無いのです。
あると便利だと思いますが、推測のURLを表示したりすることになります。


>>324
なるほどです。
そういうメモがあると便利かもしれないですね。



331 名前:cen ◆Am9xOgNMYE mailto:sage [2009/06/17(水) 00:54:38 ID:lzOTGmvO0]
>>325-329
書き込みどうもです。
ログとインデックスのサイズの参考になりました。
>>320の比較対象は2.01です。
現状ではインデックスサイズが一番大きくなるのが2.01です。
(memory_index_xx.txt などを追加しているため)

332 名前:cen ◆Am9xOgNMYE mailto:sage [2009/06/17(水) 00:56:58 ID:lzOTGmvO0]
スレのURLをある程度手動で設定したら、
もしかしたらできるかも?

333 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/17(水) 18:24:35 ID:7yptC7kI0]
>>332
通常、URLからlogファイルパスを特定する時
ボード一覧からsrv+bbsに一致する部分があれば、そのカテゴリ、板名を取得するって感じだと思うのですが

逆にカテゴリ+板名から srv+bbsを取得するっていうのもできるんじゃないかなぁと。
専ブラのボード一覧とthreadsearchが取得したボード一覧が同じである必要性はありますが。

個人的には推測でもいいのでほしいところです。

334 名前:302 mailto:sage [2009/06/18(木) 22:44:27 ID:Twsk2Ff50]
2.02でまた一から再構築したら、45分に短縮された。
確かに早くなってますな。

335 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/21(日) 21:01:38 ID:ivShj4AhP]
要望です。

外部ツールから起動させるとDLLをロードしません。
カレントディレクトリをEXEフォルダに再設定する機能とかつけられませんか?

336 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/06/21(日) 21:28:05 ID:NnvP19Xz0]
外部ツールへの要望かよ。

337 名前:cen ◆Am9xOgNMYE mailto:sage [2009/06/26(金) 01:30:22 ID:TSvE8NlF0]
>>333
レスどうもです。
実際にするとなるとファイル名も「1204107839.dat」などで同じに
する必要がありますが、できなくはないかもですね。

>>334
どうもです。
もしかしたらCPUの種類で短縮できる時間が
違うかもしれないです。

>>335
指摘ありがとうです。
カレントディレクトリの設定は行っていないので、呼び出し元の
ディレクトリがカレントディレクトリになりますね。
考えて見ます。

>>336
こっちであっています

338 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/05(日) 05:25:20 ID:rCPgZ7Wd0]
>>324
>>322 俺もこの機能はほしす・・・
連携させたい。

同じ全文検索ソフトのdatEは2chブラウザ指定して連携できてその点は使いやすい
しかし、こちらはスレタイトルで絞込みとか全然できないw

>>330
> ブラウザによって推測はできますが、特定できる情報が無いのです。
あれ?そうなんだ…
datEはどうやってんだろ



339 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/05(日) 06:43:28 ID:rCPgZ7Wd0]
datE参考に適当にアルゴリズムでっちあげた

・thread_number = スレッド番号
・idx_txt = thread_number + ".idx" のファイル名のファイルから中身を読む
・board_uri = idx_txtの6行目を抽出
 ( board_urlの例:anchorage.2ch.net/livemarket2 )
・board_uriを以下のように分解
 ・uri_scheme: URIスキーマ(例:http)
 ・uri_host: ホスト名(例:anchorage.2ch.net)
 ・uri_path: パス(例:/livemarket2)
 ※C#なら Uriクラスのnewにboard_uriを渡して生成すれば一発で全部取れる
 Uri クラス (System): msdn.microsoft.com/ja-jp/library/system.uri(VS.80).aspx
・tread_uri = board_uriからスレッドURLを組み立てる
 例:tread_uri = sprintf("%s://%s/test/read.cgi%s/%d/", uri_scheme, uri_host, uri_path, thread_number)

あとは、この tread_uri を指定の2chブラウザに渡せばOKのはず

340 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/05(日) 06:45:02 ID:rCPgZ7Wd0]
>>339
はJane依存(.idxファイルが)かもしれないので注意してください

341 名前:cen ◆Am9xOgNMYE mailto:sage [2009/07/13(月) 01:24:02 ID:hCCvsHzo0]
>>339-340
情報をどうもです。
多分DatEはJane専用のソフト(HPより)なので、その方法で
してるかもしれないですね。
他のブラウザも使えるようにすると、別の方法が必要だと
思っています

342 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/13(月) 12:43:38 ID:6mSlkssX0]
せめて外部プログラムを指定してdatのパスとレス番を渡せれば
スクリプトでもかましてJaneで開くことは出来るんだけど

343 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/18(土) 08:17:27 ID:Buu+6+Io0]
実行ファイルをNAS上に移したらエラーが出て起動できないんですけど…

344 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/18(土) 17:32:56 ID:G73DfW4X0]
>>343
おかなきゃいい

345 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/18(土) 17:45:10 ID:Buu+6+Io0]
せめてインデックスだけでも別ドライブに置けませんかね…

346 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/18(土) 23:55:16 ID:Vpvt3MoN0]
>>343
>>297

347 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/20(月) 21:39:30 ID:7jwUlejL0]
やっぱりエラーが出るんですけど…

348 名前:cen ◆Am9xOgNMYE mailto:sage [2009/07/25(土) 16:54:26 ID:IL4qUKkr0]
NASで動かしたらどうなるのか、あまり調べてなかったので
調べてみました。NASは持ってないのでPCをNASのように使ってみました。

@XP PCにThreadsearchをインストール Vista PCで使用
 [Vista]→使用→[XP(Threadsearch)]

 →起動可能、検索できるが検索結果が正しく表示できない

AVista PCにThreadsearchをインストール XP PCで使用
 [XP]→使用→[Vista(Threadsearch)]

 →起動できない


今のところ、全てローカルでソフトを使用することを想定してます。



349 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/07/26(日) 01:50:26 ID:jYmGdGPe0]
了解しますた

350 名前:名無しさん@お腹いっぱい。 [2009/08/02(日) 17:57:25 ID:4xlwp7SfO]
あげ

351 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/08/08(土) 00:34:31 ID:RoO7dqsf0]
検索結果にスレ立て日とか最終書き込み日とかスレ数とか情報を出したり
それで並べ替えとかできるようにならないですかね

352 名前:302 mailto:sage [2009/08/09(日) 14:15:54 ID:jTRokZLo0]
なんか勘違いをしていて、>>334は2.00で計測していたぽいです。
先ほど2.02で再構築した結果(約32500スレ、4.5GB)、30分で終わりました。
インデックスの容量も931MB→836MBと結構圧縮されてますね。

毎度ながら参考まで。






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<100KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef