2ちゃんねるスレッド全文検索・・・ThreadSearch
at SOFTWARE
[前50を表示]
100:cen ◆Am9xOgNMYE
08/07/06 23:14:28 q9kMgqrU0
>>98
どうもです。
このソフトでは保存してる全てのログから、検索語を漏らすこと無く
検索するので他のものより遅いのではと思います。
ソフトの性能かもしれないです。
みみずん検索の仕組みがどういうものか知りませんが・・・
101:名無しさん@お腹いっぱい。
08/07/07 00:57:51 5BhNo3f50
>100
あ、そっか。
みみずん検索は検索板を指定しましたね。
長期使ってないから全板検索だと勘違いしてました orz
102:名無しさん@お腹いっぱい。
08/07/08 18:45:38 7pqwNnqn0
>>98
一般的なWebサーチエンジンは単語単位の検索結果をあらかじめ作ってる。
新しく見つけたページに「2ch」「モナー」という単語があったときは、2ch.txtとモナー.txtにそのページのアドレスを追加する。
「2ch モナー」で検索されたときは2ch.txtとモナー.txt両方に載っているアドレス一覧を表示するといった感じ。
ただし、ここでいう「単語」とはあらかじめリスト化されたものと機械的に認識されたものなので
でたらめな文字列で検索した場合は表示されない可能性もある。
103:名無しさん@お腹いっぱい。
08/07/09 00:47:48 cknHTRJD0
>102
なるほど。
そうしちゃうと今より高速化はしてもindexが肥大しそうですね。
今は8.5Gのログに対しindexが3.2Gです。
104:名無しさん@お腹いっぱい。
08/07/13 21:04:23 TYBbxl0u0
>>103
日本語対応の全文検索インデックスはでかいよー。
特に完全検索用のN-Gramインデックスは、たとえば「本日は晴天なり」って書いてあるテキストが
あったとすると
本日
日は
は晴
晴天
天な
なり
というそれぞれの文字列についてインデックスを作成する。
検索時には、たとえば「本日は」で検索されたら「本日」「日は」の両方にのっているファイルを
検索結果に表示する、という方式。
確実なんだけどでかい。
105:名無しさん@お腹いっぱい。
08/07/15 15:00:25 aKLBDNVH0
みみずん氏でこんなもんか。
URLリンク(mimizun.com)
106:名無しさん@お腹いっぱい。
08/07/20 02:22:48 AbTJvetU0
「Windows Vista の検索において、語句が検索されない場合がある」
URLリンク(support.microsoft.com)
「アクセスコントロールリスト」 があるのに "コントロール"を検索できません。
これは仕様です。日本人はfindとかfindstrを使いなされ。
107:名無しさん@お腹いっぱい。
08/07/21 01:11:23 ZxbJSK1r0
テキストのフィルタが駄目すぎだなあ
IMEの件といい、ほんとMSは日本語に弱くなったな
108:名無しさん@お腹いっぱい。
08/07/29 11:45:39 LDh0pw/C0
そんなんだからMS社員がATOK使いたいとか言い出すんだ。
109:名無しさん@お腹いっぱい。
08/07/29 18:21:33 DRzfVr9G0
中国優先だからな
110:名無しさん@お腹いっぱい。
08/07/29 19:00:16 CDdAnnOZ0
優先というか、メイドインチャイナ
111:cen ◆Am9xOgNMYE
08/07/31 01:33:49 Au4b/2RR0
こんばんは
>>104
このソフトのインデックス方法もそういう方法使ってますね。
112:名無しさん@お腹いっぱい。
08/08/02 23:36:16 fGnZ88+/0
屑HDにログ移行したんだけど、残り容量少なくてINDEX作りきれなかった orz
113:cen ◆Am9xOgNMYE
08/08/03 23:09:35 kqhImIQB0
今のところ、新しいindexの形式で、index作成と読み込みのテストが
できています。
更新部分を作る前に公開するかもしれません。
何時になるかは不明ですが。
>>112
実験では現在と比べて約40%のindex容量が削減できています。
今よりも多少はディスク容量を使わなくて済む予定です。
114:名無しさん@お腹いっぱい。
08/08/03 23:16:21 BhOIA6SJ0
>>113
乙です
四割もすか、わくわくしながら待っています。
115:名無しさん@お腹いっぱい。
08/08/05 00:44:24 WlBy3GoL0
∧_∧ URLリンク(www.geocities.jp)
( ・∀・) ドキドキ
( ∪ ∪
と__)__)
116:名無しさん@お腹いっぱい。
08/08/05 07:05:18 YBb9bfzK0
禁断の壷のDATが検索できないようですが未対応ですか?
117:名無しさん@お腹いっぱい。
08/08/05 19:08:19 tQ0LETlx0
∧_∧
( ・∀・)ワクワク
oノ∧つ⊂)
( ( ・∀・)ドキドキ
∪( ∪ ∪
と__)__)
118:名無しさん@お腹いっぱい。
08/08/08 17:59:32 /1wQ4+P70
∧_∧
( ・∀・) ドキドキ
oノ∧つ⊂)
( ( ・∀・) ワクワク
oノ∧つ⊂)
( ( ・∀・)
∪( ∪ ∪
と__)__)
119:名無しさん@お腹いっぱい。
08/08/09 06:06:28 oXes19LT0
,、ァ
,、 '";ィ'
________ /::::::/l:l
─- 、::::;;;;;;;;;`゙゙''‐ 、 __,,,,......,,,,_/:::::::::/: !|
. : : : : : : `゙'ヽ、:::゙ヾ´::::::::::::::::::::::`゙゙゙'''‐'、. l|
、、 . : : : : : : : : r'":::::::::::::::::::::::::,r':ぃ::::ヽ::::::::ヽ!
.ヽ:゙ヽ; : : : : : :ノ::::::::::::::::::::-=・=-、゙::: -=・=-:'、
. \::゙、: : : :./::::::::::::::;、-''":::::::::: ,...,:::,::., :::':、
ヽ:ヽ、 /::::::::::::::::::::::::: _ `゙''‐''" __,,',,,,___
`ヽ、:::::::::;;;、、--‐‐'''''',,iニ- _| 、-l、,},,  ̄""'''¬-
_,,,、-‐l'''"´:::::::' ,、-'" ,.X,_,,、-v'"''゙''yr-ヽ / ゙゙'ヽ、, ゴリゴリゴリ・・・
,、-''" .l:::::::::::;、-''" ,.-' ゙、"| / 冫、 ヽ、
l;、-'゙: ,/ `| /| | /. \
,、‐゙ ヽ:::::..,.r'゙ (( // | | / ヽ. マズッ・・・
,、‐'゙ ン;"::::::. U .U / >>118
' //::::::::: {.
/ ./::::::::::::: ',
. / /:::::::::::::::::. ',.
120:cen ◆Am9xOgNMYE
08/08/10 02:40:10 iURE0WpC0
>>116
どうもです。
検索できるのは、2chのサーバにあるそのままのdatファイル
のみになっています。
こんな感じのファイルです。
URLリンク(pc11.2ch.net)
121:名無しさん@お腹いっぱい。
08/08/10 02:51:18 3MKwS0Q50
壺のdatは少しだけ違うよな。生datではない
122:名無しさん@お腹いっぱい。
08/08/10 05:29:10 WVmYSL3q0
>>120
そうですか・・・
壷はファイルの先端に今取得した時間と前取得した時間とレス数追記して
生DATとは違うファイルになってるから対応するのは面倒そうですね・・・
123:名無しさん@お腹いっぱい。
08/08/10 05:36:29 WVmYSL3q0
壷のDAT見た限り0x88(136バイト)目まで壷DAT用のヘッダー?に上のレスで書いたやつを追記してるみたいですね。
124:名無しさん@お腹いっぱい。
08/08/10 05:56:58 WVmYSL3q0
今手元の壷用DATの先端0x88(136バイト)を削ってDATでThreadSearchを使用して検索できた事を報告しておきます。
使用する時はこれでいきます。
素晴らしいソフトありがとうございます。
125:名無しさん@お腹いっぱい。
08/08/10 22:06:13 yPWwed/n0
へぇ
Jane系だとメタ情報はidxファイルに分けるけどね
>>120
1行目の読み出し時に自動認識できそうな気がしますがいかがでしょうか?
126:cen ◆Am9xOgNMYE
08/08/11 18:37:08 cL7eaFC40
できそうな気もしますが、壷を入れてdatをいろいろ見てみないと
いけないので、ちょっとめんどうかも。
それに今作ってるのやつがあらかた出来上がっているので。
127:名無しさん@お腹いっぱい。
08/08/13 02:41:42 ZgCCI6gx0
乙です
>あらかた出来上がっているので
わくわく
128:cen ◆Am9xOgNMYE
08/08/13 19:08:16 dHKGFOYl0
スレッド全文検索を更新しました。
Ver 1.60になりました。
URLリンク(www.geocities.jp)
更新点は以下です。
インデックスを改良して高速に作成、検索できるようにしました。
ウインドウサイズを記憶するようにしました。
検索結果の下ペインに上ペインのリンクを追加しました。
インデックス化の方法を変えたので、今までのものより
約2〜3倍 高速に検索できます。
場合によりそうでない時もありますが。
あと、インデックス作成時間も短くなりました。
詳しくはこちらを
URLリンク(www.geocities.jp)
129:名無しさん@お腹いっぱい。
08/08/13 21:16:58 tyXgUR9P0
キタ━━ヽ(゚∀゚)ノ━( ゚∀)ノ━( ゚)ノ━ヽ( )ノ━ヽ(゚ )━ヽ(∀゚ )ノ━ヽ(゚∀゚)ノ━━!!
へ ) ( ノ ( )ノ ( ) へ ) へ ) へ )
> > < < < > >
130:名無しさん@お腹いっぱい。
08/08/13 21:25:48 tyXgUR9P0
えーすまん。
>詳しくは
と、readme.txtを見たけど、INDEXの追加作成は可能になったの?
131:cen ◆Am9xOgNMYE
08/08/13 22:55:06 dHKGFOYl0
>>130
すみません。
書いてなかったです。
今回のバージョンでは追加(更新)の機能は付いていないです。
次回で付ける予定です。
132:名無しさん@お腹いっぱい。
08/08/13 22:56:38 tyXgUR9P0
>131
ありゃ残念。
でも次回更新を楽しみに待ちながらVer1.6使わせていただきます。
133:名無しさん@お腹いっぱい。
08/08/17 17:23:51 6fFreaBo0
age
134:名無しさん@お腹いっぱい。
08/08/28 20:58:59 jxwyolAJO
sage
135:名無しさん@お腹いっぱい。
08/09/01 16:11:16 fWSvEAsU0
アイコンぐらい作って
136:cen ◆Am9xOgNMYE
08/09/02 00:34:17 acTGZjvR0
>>135
そういえば、誤反応スクリプト無効化ソフトはアイコン作ってましたが、
これは作って無かったですね。
とりあえず、ぼちぼち更新部分作ってます。
ちょっとトップの説明変えてみた。
URLリンク(www.geocities.jp)
137:名無しさん@お腹いっぱい。
08/09/07 19:48:17 bm0qvVYIP
>136
楽しみにしてます。
138:cen ◆Am9xOgNMYE
08/09/14 01:18:55 ZtimSfQL0
どうもです。
とりあえず、今のところこんな感じです。
URLリンク(sakuratan.ddo.jp)
139:名無しさん@お腹いっぱい。
08/09/14 08:47:05 ALOAkBNV0
ログの結果が、「日付+時間」のフォルダではなく、指定したフォルダに毎回上書きができるとありがたいです
140:名無しさん@お腹いっぱい。
08/09/14 09:29:58 ALOAkBNV0
要望追加で
検索日付範囲が固定されてしまうとバッチ処理には不便なので
今日のみ とか 何日前まで などができるとありがたいです
141:cen ◆Am9xOgNMYE
08/09/17 00:19:34 /BQyVYWF0
レスと意見をどうもです。
ちょっと考えて見ます。
142:名無しさん@お腹いっぱい。
08/09/17 13:20:48 5bqPFX5b0
あのねあのね
デスクトップにショートカット作って置いてるんだけど、
次のバージョンアップでアイコン付けて。
143:cen ◆Am9xOgNMYE
08/09/21 00:10:11 hfJlKawQ0
スレッド全文検索を更新しました。
Ver 1.70になりました。
URLリンク(www.geocities.jp)
更新点は以下です。
インデックスを更新できるようにしました。
板で絞込みができるようにしました。
検索結果を保存するフォルダ名を指定できるようにしました。
アイコンを付けました。
検索語句を半角スペースで区切ることでAND検索ができるようにしました。
→「AAA BBB」だとAAAかつBBBがあるレスを検索します。
144:cen ◆Am9xOgNMYE
08/09/21 00:15:00 hfJlKawQ0
インデックス方法は1.60と同じですので、検索速度はほぼ同じです。
多少インデックス作成時間が短くなりました。
あと、アイコンが下手なのはセンスがないからです。
145:名無しさん@お腹いっぱい。
08/09/21 02:17:22 z9hYJDWq0
乙
146:名無しさん@お腹いっぱい。
08/09/22 02:38:15 kpTt79bC0
ウヒョー
更新乙です。
147:名無しさん@お腹いっぱい。
08/09/22 23:51:55 z7yz22TN0
index作成中もしくはindex一覧?(最初にファイル一覧作るやつ)作成中に
janeで新たにログを取得しちゃっても問題無いのでしょうか?
index作り損ねたログは次回のindex更新に回るから平気?
作成開始から4時間で9%ほどなのでついついjane起動して2ちゃん
巡回始めちゃいました。
もちろん作成終了までソフト停止するつもりはないのですが。
148:cen ◆Am9xOgNMYE
08/09/23 13:02:36 KQ8g+RNV0
どうもです。
>>147
問題ないです。
インデックス作成では下の流れになります。
1.インデックス化するファイルリスト作成
2.インデックス作成(ファイルリスト使用)
1が終わってから取得したスレッドは2で反映されませんが、
次回のインデックス更新には反映されます。
149:名無しさん@お腹いっぱい。
08/09/23 13:53:13 D7MsH4va0
>148
了解しますた。
夕べ19時半から始めて現時刻92%
ハァハァあと少しだ。
150:名無しさん@お腹いっぱい。
08/09/23 14:12:45 Z7eZQJpB0
>>149
どんだけ時間かけてるんだww
がんばれー
151:名無しさん@お腹いっぱい。
08/09/23 16:29:19 D7MsH4va0
買い物から帰ってきたらおわってたー。
スレッド全文検索による計上でdatファイルが765,875個あった場合
24時間は掛からないと参考までに。
index作るのに掛かった時間をその回だけでいいから
どこかに記録残してくれると他者の参考になりそうなんだけどね。
152:cen ◆Am9xOgNMYE
08/09/23 22:53:10 KQ8g+RNV0
>>151
随分沢山ありましたね。
一応自分の分の結果は参考程度に小さく書いてみてます。
URLリンク(www.geocities.jp)
153:cen ◆Am9xOgNMYE
08/09/23 23:50:43 KQ8g+RNV0
一応ですが、インデックスを更新する時には、
現状のインデックスと同じくらいのディスク容量が必要です。
ちょっと気をつけてください。
154:名無しさん@お腹いっぱい。
08/09/24 13:54:08 J63SARa20
>153
テンポラリですかね?
CドライブにOS
DドライブにJaneログ
Dドライブにマウントした実質別ドライブにthreadsearch本体&INDEX
なんですが、どのドライブで空き容量が必要になりますか?
もっともCとマウントしたドライブにはINDEX以上の空き容量はあるのですが。
155:cen ◆Am9xOgNMYE
08/09/25 00:30:22 brnEV5SB0
>>154
そうです。
一時的に必要な領域です。
インデックスを参照するので、threadsearch.exe と同じディレクトリに
インデックスとほぼ同じ領域が必要です。
上ならDドライブです。
156:名無しさん@お腹いっぱい。
08/09/25 00:38:24 ga5LtC9z0
やっと規制解除。。。
とても、乙です
新バージョン1.70楽しみー
さぁ、寝てる間に動かそう
157:名無しさん@お腹いっぱい。
08/09/26 01:34:43 wK6+AhGE0
>155
了解っす。
158:名無しさん@お腹いっぱい。
08/09/29 19:17:01 mkGHu2sm0
うーむ、全板のINDEXが17.6GBあり、スレッド全文検索ver1.70内で
指定したターゲットの板ログが4.75GBでファイルが47,182個の中から
「IPv6」って単語を検索し始めて18時間位経ったけどまだ「インデックス読み込み中」
表示でバーがピロピロしてる orz
159:cen ◆Am9xOgNMYE
08/09/29 23:08:41 6WsFQZ0BO
>>158
どうもです
まだ検索中ですか?
量が多くてもそれは遅いと思います
他の10文字や20文字などの文字数が多い
言葉でも遅いですか?
そうならバグがあるかもしれないです。
それからインデックスを使うと、検索時に全ての
インデックスを流し読みします。
160:名無しさん@お腹いっぱい。
08/09/29 23:51:45 mkGHu2sm0
結局バーはピロピロ動いているのですが、検索が終了しないので中止しました。
IPv6を指定した板は見た記憶があった程度で本文をと思い検索させたのですが、
今回は一端あきらめて、今度は自作板を指定して必ず検索ワードがある「HighPoint Technologies」を
検索したところ検索終了されるまでは、23時25分52秒開始で23時50分00秒で「インデックス読み込み中」
あ、あれ?落ち着いて考えタスクマネージャを開いたところCPU使用率0%でメモリも32,296Kのまま何も動いて
ないです・・・
indexファイル・17.6GB・ファイル数2247個、自作板ログ・620MB・ファイル数5507個
161:cen ◆Am9xOgNMYE
08/09/29 23:57:45 503xbjDJ0
>>160
どうもです。
多分バグがあると思います。
インデックスの作成か読み込みにバグがあるのではと思います。
インデックス化する範囲を狭くするとうまくいくかもしれません
162:cen ◆Am9xOgNMYE
08/09/30 00:05:33 1GQ2M1Kk0
CPU100%で無限ルーうかと思いましたがちょっと意外です。
調べてみます。
>>160
threadsearch.exeのあるフォルダの中のindexのフォルダにある、
read_list.txtは検索時に出来ていますか?
あるなら最後の行は何になっていますか?
163:名無しさん@お腹いっぱい。
08/09/30 00:09:09 ODvUkBsR0
AOpenマザーi855GMEm-LFS
PentiumM 1.5G
windowsXP SP3
OSの入ってるHDはマザーIDEマスタに繋いだシーゲートST3320620A
janeログはマザーIDEセカンダリに繋いだシーゲートST3500630A
threadsearch.exeとindexフォルダにあるのはマザーオンボの
Promise PDC20579のSATAポートに繋いだMaxtorの6L200P0をSATA変換で
Dドライブ空きフォルダにマウントって環境です。
164:名無しさん@お腹いっぱい。
08/09/30 00:18:21 ODvUkBsR0
00時10分現在「HighPoint Technologies」も検索されなかったので中止。
で、ご指摘のread_list.txtを見ると、そのファイル無いです・・・
indexフォルダには
file_list_0.txt〜file_list_747.txt、file_time_0.txt〜file_time_747.txt、
maked_path.txt、memory_0.txt〜memory_747.txt、path.txt、search.txt
だけです orz
動作中にもread_list.txtは作成されていません。
(本文のみのチェック、本文と板指定にチェックのいずれも)
165:名無しさん@お腹いっぱい。
08/09/30 00:29:40 ODvUkBsR0
とと、みなさん何も言ってないのであくまで私の環境のみの現象
なんでしょうね。
どうぞごゆっくりお休みください。
当方もindexフォルダを消し再度index作成等やってみますので、何かプログラマ的に
気が付いたら又お願いします。
166:cen ◆Am9xOgNMYE
08/09/30 00:33:05 1GQ2M1Kk0
>>164
レスをありがとうございます。
read_list.txtはインデックスを読み込む際に作成されます。
正しくインデックスを読めていません。
プログラムのバグではないかと思います。
とりあえず、インデックス作成フォルダを別のフォルダにしてみて、
インデックスの容量を小さくしてみてください。
想定外のdatファイルをインデックス作成時に読んでいるかもしれません。
167:cen ◆Am9xOgNMYE
08/09/30 00:35:19 1GQ2M1Kk0
>>165
せっかく時間かけてプログラム動かして頂いたのに
すみません
168:名無しさん@お腹いっぱい。
08/10/01 15:02:00 YgQRkCXW0
つー事で、ログ容量はそのままにしてindex削除→再度indexを作成、
DドライブマウントをやめてFドライブレター割り当てでもっぺん自作板指定で
「HighPoint Technologies」を検索しながらindexフォルダを見てますが、
やはりread_list.txtというファイルは作成されませんです。
インデックス読み込み中・・・ すぐじゃ作られない?と思い、読み始め10分後に見ても
read_list.txtは作られてないです。
なので今度はINDEXフォルダから手作業で
file_list_0.txt〜file_list_299.txtまでを残し、以降file_list_748.txtまで削除。
file_time_0.txt〜file_time_299.txtまでを残し、以降file_time_748.txtまで削除。
memory_0.txt〜memory_299.txtまで残し、以降memory_748.txtまで削除。
で、再検索後フォルダを見ながら10分待って最新の情報に更新してもread_list.txtは
フォルダに出てこないので検索中止・・・
なので、各99.txtまで残し手作業で削除。
read_list.txt出来ない orz
やけっぱちで各09.txtまで残し以降削除。
read_list.txt出来たー
が削除した各10〜748までのリストの内容までは知らんかったので
read_list.txtの中身は真っ白のファイル。
各10.txtを戻してもread_list.txt出来る。
各50.txtまで戻す、read_list.txt出来る。
各70.txtまで戻す、read_list.txt出来ない&CPU使用率99%から0%になっても「インデックス読み込み中」
169:名無しさん@お腹いっぱい。
08/10/01 15:02:39 YgQRkCXW0
しょうがないので各.txtを70から一つずつ減らして確かめたところ
各52.txtまでread_list.txt出来ました。(各53.txtを戻したり消したりで2回確認)
各53.txtにするとCPU99%から25秒ほどで0%になりread_list.txtも出来ないまま「インデックス読み込み中」表示
PC搭載実搭載メモリ2GB、windowsxp sp3 NTFSオプションデフォルトフォーマット
file_list_0.txt〜52.txt=4,739,593(4,820,992)バイト、file_list_53.txt=89,455(90,112)バイト
file_time_0.txt〜52.txt=651,264(651,264)バイト、file_time_53.txt=12,288(12,288)バイト
memory_0.txt〜52.txt=1,409,772,627(1,409,880,064)バイト、memory_53.txt=20,298,710(20,299,776)バイト
括弧()内はエクスプローラでファイルのプロパティを見たときのディスク上のサイズって方です。
各52.txtまでで1.31GB、53.txtを増やしても1.33GB。
自分で書き出してみたけど搭載メモリ容量はread_list.txtが作られないのに関係無さそう。
古いDATは9桁とかjaneのログフォルダにあったりますが関係ないんでしょうね。
file_list_52.txt・53txtとfile_time_52.txt・53txtに9桁DATは出てきてないですし、
memory_52.txt・53txtは中見ても何々が書いてあるとは言えない暗号文ですね。
素人の書き出し&試しですが、何かの参考になれば幸いです。
170:名無しさん@お腹いっぱい。
08/10/01 15:20:26 YgQRkCXW0
私の環境では現状使えませんが、グーグルの個人情報取得利用などを
ようつべだったかな?にアップされてたのを見ちゃうと、ネットに繋がってる
検索バーでローカルディスクを検索するのはちょっと嫌なので、cenさんが作って
くれてるのはとてもありがたいです。>167
ま、ネット検索はグーグルを使ってますが^^;
171:cen ◆Am9xOgNMYE
08/10/01 22:41:35 3fA+V5Li0
>>168-170
調べて頂いてありがとうございます。
インデックス読み込み時のバグだと思います。
おそらくなのですが、以下の原因によりバグが出ています。
・インデックス読み込み時
「HighPoint Technologies」を検索語として分解すると次の19の部分に分解されます。
「Hi,ig,gh,hP,Po,oi,in,nt,Te,ec,ch,hn,no,ol,lo,og,gi,ie,es」
分解した検索語ごとにインデックスを読み、バッファに保存します。
バッファの必要数は以下の式で出ます。
必要なバッファ=バッファ「分解した検索語×インデックス数」
バッファの最大数は1024となっています。
これを超えるとバグになってしまいます。
この場合
分解した検索語=19
インデックス数=53(0〜52)
19×52=1007(1024以下なので正常に読み込み完了)
分解した検索語=19
インデックス数=54(0〜53)
19×53=1026(1024以上なのでバッファを超えてしまう)
バッファが不足している場合を考慮してなかったために、
正しく検索出来ていなかったと思います。
もしかしたら別の原因のバグもあるかもしれません。
次の更新時に修正しようと思います。
バッファは多分1024もあれば十分だと思ってました。すみません
172:cen ◆Am9xOgNMYE
08/10/01 22:44:50 3fA+V5Li0
必要なバッファ=バッファ「分解した検索語×インデックス数」
↓
必要なバッファ=「分解した検索語」×「インデックス数」
でした
173:cen ◆Am9xOgNMYE
08/10/02 22:02:21 vGRFbuOrO
なので上の場合だと、500近くインデックスがあるので、
検索語が一文字か二文字なら今のバージョンでも
うまくいくはずです
174:名無しさん@お腹いっぱい。
08/10/02 23:12:15 Qm1qh5xg0
ごみ箱から戻したつもりだった各○○.txtが全部戻ってなかったー・・・
いや、新バージョンが来たら再度最初からindex作成するつもりだったので
それは良いのですが。
>検索語が一文字か二文字なら今のバージョンでも
>うまくいくはずです
で、各99.txtまで戻っていたので「HighPoint Technologies」ではなく
「IP」と二文字検索させたらちゃんと検索終了しread_list.txt作成されました。
ご報告まで。
175:cen ◆Am9xOgNMYE
08/10/05 22:11:36 osxVL/Zq0
>>174
レスどうもです。
了解しました
176:cen ◆Am9xOgNMYE
08/10/12 21:07:43 Gg6KHDkF0
スレッド全文検索を更新しました。
Ver 1.80になりました。
URLリンク(www.geocities.jp)
更新点は以下です。
・インデックスの構成と検索語により、検索できない場合がある
不具合を修正しました。
・7日間以上インデックス更新をしなかった場合にメッセージを
表示するようにしました。
・指定したスレッドをHTML化して表示できるようにしました。
インデックス方法は1.60、1.70と同じです。
177:名無しさん@お腹いっぱい。
08/10/12 23:31:41 4jVJNXQJ0
>>176
乙です!
>・指定したスレッドをHTML化して表示できるようにしました
めちゃくちゃうれしいです
178:名無しさん@お腹いっぱい。
08/10/13 23:26:24 2QmGbgSJ0
>176
乙っす
179:名無しさん@お腹いっぱい。
08/10/20 22:18:49 Ri3tHyOuO
あげ
180:名無しさん@お腹いっぱい。
08/10/20 23:50:13 s862y4Rw0
使ってる人少ないんかね?
まぁオレもVer 1.80は即日落としたけど、PC作業中だったので
ついさっきからindex作成し始めたから出来上がりは明日の
19時くらいだな。
181:名無しさん@お腹いっぱい。
08/10/21 00:15:23 abpJw2PJ0
index生成時間がさすがに長すぎる・・・
便利そうなんだけどなぁ
182:名無しさん@お腹いっぱい。
08/10/21 18:53:28 XoK+PkIh0
馬鹿カキコだけど、誰かのindexファイルをフォルダごと貰って使ったらどうなんだろう?
indexをあげる人と貰う人の所持ログ次第だとは思うけど、巡回板がほぼ同じ趣味同士なら
index更新だけでうまくすれば短時間で生成?
183:名無しさん@お腹いっぱい。
08/10/21 21:38:20 10UbYQZ/0
>176
>インデックスの構成と検索語により
あー、その張本人っす。
今回は無事に検索出来ました。
が、indexの更新が出来ないような・・・
勿論当方のログフォルダ内容構成等の問題はあるかもしれませんが、
プログラマ的にindexが更新出来ない理由が有るかもしれないので
ご報告しておきます。
相変わらず素人の報告で申し訳ありませんが、下記のようになってます。
renewフォルダが作られ、中にfile_list.txt
中身
D:\Program Files\Accessories\2ch\2chjanelog\Logs\2ch\AA\AAサロン\1041132902.dat 1204642027 0
のようなテキストが766,859行ありfile_list.txt全容量79,437,535 バイト
index_file_list.txt
中身
D:\Program Files\Accessories\2ch\2chjanelog\Logs\2ch\AA\AAサロン\1041132902.dat 1204642027 0
のようなテキストが766,817行あり、766,818行目から766,976行目まで
NULL NULL 748
となりindex_file_list.txt全容量79,435,120 バイト
renewnow.txt中身
0
が一文字で
「インデックス更新中・・・0%」のままバーがピロピロしてますがCPU使用率0%のまま orz
indexフォルダ17.7 GB
indexフォルダがある単独Fドライブ空き容量94.2GB
184:名無しさん@お腹いっぱい。
08/10/29 00:00:20 jOU7D0aj0
質問なんですが
「ここ」と示されているリンクをクリックするとdatファイルが開くのですが
ここをクリックするとjaneが開くようにする方法はありますか?
URLリンク(vip.cmdap.com)
185:名無しさん@お腹いっぱい。
08/10/29 02:32:16 0NAML0KTO
>>184
今の最新バージョンだとスレをHTML化できるけど、それは?
186:uIJbfUPhSWCqkR
08/10/29 02:34:56 ALk674EB0
Get some bumper stickers made up and put them on your car, URLリンク(geocities.com) Netwitz
, hfqjf, URLリンク(geocities.com) Shinn Fu
, wmsoq, URLリンク(geocities.com) Fda Repackage Supplements Law
, 174, URLリンク(geocities.com) Triatholon
, 5165, URLリンク(geocities.com) Dubrows
, 788633, URLリンク(geocities.com) Hillspet
, oboji, URLリンク(geocities.com) Nicky Oneill
, :-[, URLリンク(geocities.com) Pinoyspy
, ezlcsg, URLリンク(geocities.com) Backaid
, apna, URLリンク(geocities.com) 1949 Studebaker Truck For Sale
, 7683, URLリンク(geocities.com) Lazer Range Finder
, sizgi, URLリンク(geocities.com) Prairie Ragwort
, 5423, URLリンク(geocities.com) Beautitudes
, kdo, URLリンク(geocities.com) Ai In Computer Game Dodgem
, :[[, URLリンク(geocities.com) Norelco 7845xl
, 4498, URLリンク(geocities.com) Castle Rock Refractive Surgery
, 8PP, URLリンク(geocities.com) Bed And Breakfast In Hana Maui
, =(, URLリンク(geocities.com) Austrailian Flag
, 28741, URLリンク(geocities.com) If Children Live With Criticism Aristotle
, 8OOO,
187:LyFkieLUiVQBKOtrceh
08/10/29 02:39:02 1o3huGqz0
Your email software will have a place to format your digital signature, URLリンク(geocities.com) Brad Buffum
, 1520, URLリンク(geocities.com) Gail Engvall
, fpgjq, URLリンク(geocities.com) Doug Waugh Iss
, 8628, URLリンク(geocities.com) Marites Vitug
, 8))), URLリンク(geocities.com) Hersheys Kisses Fondue
, %OO, URLリンク(geocities.com) Culinaria Receita De Bolo Floresta Negra
, 229, URLリンク(geocities.com) Entourage 405 Torrent
, 197, URLリンク(geocities.com) Amy Pickerill
, 075406, URLリンク(geocities.com) Westjet Flights
, %DDD, URLリンク(geocities.com) Remington Spr310
, fxaqa, URLリンク(geocities.com) Daisy Dux
, =-DDD,
188:MZrAwKodlsV
08/10/29 02:42:29 hQkOjAGm0
5mm range is appropriate, URLリンク(geocities.com) Ruhter Auction
, :-[, URLリンク(geocities.com) Your4state
, 4147, URLリンク(geocities.com) Kything
, >:-OO, URLリンク(geocities.com) Ujiko Search Engine Customization D
, pbgnqk, URLリンク(geocities.com) Godinger Silver
, 8-))), URLリンク(geocities.com) Yamaha Warrior Atv Trailer Hitch
, 8O, URLリンク(geocities.com) Tin Dendritic Electro Migration
, jqkrnf, URLリンク(geocities.com) Deurkrukken
, :-]], URLリンク(geocities.com) Beggars Statistics Tanzania
, >:DD, URLリンク(geocities.com) Mothers Day Scrap Book Sayings
, 39896, URLリンク(geocities.com) 2004 Sierra Duramax Crewcab
, 70456,
189:London
08/10/29 02:43:51 SnI9jMWS0
LR96TG <a href="URLリンク(nagaijdojsvp.com)">nagaijdojsvp</a>, [url=URLリンク(gqrusmyjkato.com) [link=URLリンク(yvimpabntkdc.com) URLリンク(ylwxnscqpeqg.com)
190:名無しさん@お腹いっぱい。
08/10/29 18:58:24 oAL0BM6u0
>>185
レスthx
その機能で代用します
今後janeで簡単に開く機能を搭載することができたらお願いしたいです
191:cen ◆Am9xOgNMYE
08/10/31 23:28:10 DkW/3c/9O
>>181
どうもです。
長いと思いますか。
自分もたまに思います。
マルチコアで作成できるなら、速くなるかと思ってます。
できるかは分からないですが。
192:cen ◆Am9xOgNMYE
08/10/31 23:35:00 DkW/3c/9O
>>182
インデックスをあげる人と貰う人が
インデックス化したdatと同じものを持っていればできます。
その場合、datのパスも同一でないといけないので、
他の人から貰うのは難しいと思います
193:cen ◆Am9xOgNMYE
08/10/31 23:46:09 DkW/3c/9O
>>183
教えて頂いてありがとうです
その現象は更新時に、インデックスのファイルと
現在のファイルを比較する時に起きているバグだと思います。
想定外のファイル数だったので、メモり確保できなかったのだと思います。
datファイルが1万個程度で考えていました。
多分10〜20万個のdatなら更新できるのではと思います。
バグなのでプログラムを見直します。
194:cen ◆Am9xOgNMYE
08/11/01 17:35:24 Sijvbq5LO
インデックス作成のアルゴリズムを見直そうかな。
195:名無しさん@お腹いっぱい。
08/11/02 00:45:58 y8TwVFGm0
製作者が想定してない&動作実験出来ない環境でインネンつけてごめんなさい。
196:cen ◆Am9xOgNMYE
08/11/02 01:03:20 0nk6US460
>>195
いえいえ
このくらいは想定すべきでした
197:名無しさん@お腹いっぱい。
08/11/16 17:48:57 wkGFP0DJO
ほ
198:名無しさん@お腹いっぱい。
08/11/16 23:31:53 OtHYeLjh0
も
199:名無しさん@お腹いっぱい。
08/11/18 06:56:35 aNkvGs0z0
さ
200:名無しさん@お腹いっぱい。
08/11/18 14:34:17 2N4Gxhhu0
ぴ
201:名無しさん@お腹いっぱい。
08/11/18 20:03:38 Gv5VxIeF0
え
202:名無しさん@お腹いっぱい。
08/11/19 00:22:46 BDjVbGsw0
び
203:名無しさん@お腹いっぱい。
08/11/19 04:12:08 x94T903S0
どんなエビだよ
204:名無しさん@お腹いっぱい。
08/11/23 21:23:27 LDQQjvni0
更新マダ?
205:名無しさん@お腹いっぱい。
08/11/30 23:23:29 LIqb7dPb0
マ
206:cen ◆Am9xOgNMYE
08/12/01 01:16:23 pwoPkeky0
どうもです
今はMonoViewの方を更新中ですので、こちらは少し待っててください。
207:名無しさん@お腹いっぱい。
08/12/01 15:36:00 RQaXTtbJ0
∧_∧
( ・∀・)
( ∪ ∪
と__)__)
208:名無しさん@お腹いっぱい。
08/12/01 18:11:46 WmfEXcs70
スレタイだけで検索すると、キーワードに該当するスレのすべてのレスをリストアップしようとするんだけど
スレ(もしくはスレの>>1)だけリストアップするようにならないかな
内容検索のソフトだからお門違いだとは思うんだけど…
209:名無しさん@お腹いっぱい。
08/12/04 11:14:51 xMPsx2/k0
URLリンク(poiu.jp)
スレタイ検索しかできないけど、こういうので全文できるようになったらよさそう。
210:名無しさん@お腹いっぱい。
08/12/08 00:06:37 JqVgxbf90
>151以降のインネン付けてるバカ本人ですが、当時ペンM1.5G で24時間ちょい切る
程度だったのがQ6600だと多少ログ増えてるにも関わらず8時間程でindex新規再作成終了。
(当環境だとver1.8でindex更新出来なかった為新規作成)
>193の件はまったりverアプ街ん子
211:名無しさん@お腹いっぱい。
08/12/15 20:01:41 FJ8695fzO
ほしゅ
212:名無しさん@お腹いっぱい。
08/12/25 23:26:47 QZjrfIKY0
ログ容量とか検索ワード数とか、しょーもない制限しないで。
213:名無しさん@お腹いっぱい。
08/12/27 17:49:06 /rgZ8uEw0
無制限て項目は必須だよな
214:名無しさん@お腹いっぱい。
08/12/31 21:10:09 8S23SduM0
正規表現を使っての検索があったらすごくうれしいです
215:名無しさん@お腹いっぱい。
09/01/08 13:28:44 OE8ba5QD0
このスレが落ちたら更新されなくなる?
216:名無しさん@お腹いっぱい。
09/01/09 18:50:04 b3gUxU1D0
落ちたらここ
スレリンク(esite板)
217:vCunucBaZEIINywiR
09/01/09 18:54:12 lxRu2JV30
URLリンク(piqvelikoborodova.pochta.ru) 韜 肄 齏
URLリンク(piqvelikoborodova.pochta.ru) 褪 肄 齏 砒瑣
URLリンク(piqvelikoborodova.pochta.ru) 裲 韭 肄裘
URLリンク(piqvelikoborodova.pochta.ru) 肄 韭 newreply php
URLリンク(piqvelikoborodova.pochta.ru) 肄 齏 頌瑙韃
URLリンク(piqvelikoborodova.pochta.ru) 肄 韭 褪
URLリンク(piqvelikoborodova.pochta.ru) 璞瑣 砒瑣 肄 齏
URLリンク(piqvelikoborodova.pochta.ru) 璞瑣 砒瑣 肄 蒡趺粢 齏
URLリンク(piqvelikoborodova.pochta.ru) 肄 韭 褪 肄
URLリンク(piqvelikoborodova.pochta.ru) 砒瑣 肄 韭
URLリンク(piqvelikoborodova.pochta.ru) 璞瑣 砒瑣 齏 肄裘
URLリンク(piqvelikoborodova.pochta.ru) posting 肄 韭
URLリンク(piqvelikoborodova.pochta.ru) 頸 肄 齏 showthread php
URLリンク(piqvelikoborodova.pochta.ru) dvd 肄 齏
URLリンク(piqvelikoborodova.pochta.ru) 肄 韭 砒瑣
URLリンク(piqvelikoborodova.pochta.ru) 砒瑣 肄 韭
URLリンク(piqvelikoborodova.pochta.ru) 肄 粨蒟 韭
URLリンク(piqvelikoborodova.pochta.ru) 肄 韭
URLリンク(piqvelikoborodova.pochta.ru) 肄 齏 琺
URLリンク(piqvelikoborodova.pochta.ru) 韃 肄 齏 琺
218:cen ◆Am9xOgNMYE
09/01/10 00:00:51 OgC9SrqjO
保守どうもです。
すみませんが次のバージョンはまだ手がついて無いです。
一応、作るつもりではいます
219:名無しさん@お腹いっぱい。
09/01/12 06:05:48 mVZkDz/s0
気長に待ってます
220:名無しさん@お腹いっぱい。
09/01/16 03:41:34 gtKpfJN90
こんにちは。
数少ないインデックス検索型の過去ログ検索ソフトということで期待しております。
>>190でも出ているのですが、
Jane等2chブラウザに簡単にURLを渡す方法はないでしょうか?
221:名無しさん@お腹いっぱい。
09/01/16 08:17:09 l0TZ3C460
現時点での検索精度はいかほどでしょうか?
例えば"きりたんぽ"で検索した場合、
文中に"きりたんぽ"という語句を含むスレを
何%程度抽出可能ですか?
222:cen ◆Am9xOgNMYE
09/01/17 16:51:19 2cptVoHn0
どうもです。
>>220
今のところは無いですね。
代わりで>>185の方法があります。
>>221
100%抽出できます。
インデックス化したログのみ検索しますが、インデックス化すれば
検索語句を100%抽出できます。
223:cen ◆Am9xOgNMYE
09/01/18 01:18:37 Xs6+nDIUO
補足
インデックス化は全文に対して行います。
なので、検索は一瞬ではできませんが全部の文章から検索できます。
224:名無しさん@お腹いっぱい。
09/01/18 13:03:28 jabSOdqI0
>>222-223
ありがとうございます。
これではかどる
225:cen ◆Am9xOgNMYE
09/01/20 02:07:24 CflwDRV00
>>213
ファイル数の制限は付けると思います。
今のところ、ファイルパス+ファイル名が平均128文字なら100万ファイル
程度まで使えるようにしようかと思ってたり。
226:cen ◆Am9xOgNMYE
09/01/28 15:22:11 DS9BvVJr0
スレッド全文検索を更新しました。
Ver 1.81になりました。
URLリンク(www.geocities.jp)
更新点は以下です。
ファイル数が大量にある場合にインデックスを更新できない不具合を修正しました。
とりあえず、その1点だけです
他はまたぼちぼちやります
227:名無しさん@お腹いっぱい。
09/01/29 18:50:23 SkFfiAxk0
>226
更新乙です
ヒャホーイ
228:名無しさん@お腹いっぱい。
09/01/30 00:20:31 O5iIG6uIO
あげ
229:名無しさん@お腹いっぱい。
09/02/01 06:44:08 oq28V4p90
VistaUltimate x64なんだけどどうもインデックスが作成できない模様
path.txtのみ生成されファイルリスト作成中のまま
230:名無しさん@お腹いっぱい。
09/02/01 11:26:40 OspvKygr0
>>229
>>55
231:名無しさん@お腹いっぱい。
09/02/01 15:23:41 oq28V4p90
WebサイトとReadmeに64ビット環境では動作しないって明記しておいてくれよ
だいぶ前から分かってたみたいだけど作者は64ビットに対応する気はないの?
232:名無しさん@お腹いっぱい。
09/02/01 15:26:12 p1NlWDcw0
これってexeの設定がおかしいんじゃない?
dllが32bitモード専用なのに、
「64bitOSでも32bitモードで動かして下さい」
とせずに、
「64bitOSでは64bitモードで動かして下さい」
って設定になってる気がする。
233:名無しさん@お腹いっぱい。
09/02/02 14:57:39 HADa4KQ+0
索検文全ドッレス
234:cen ◆Am9xOgNMYE
09/02/05 00:11:45 tAlQs9si0
どうもです。
>>231
すみません。
対応する気というか忘れていました。
>>232
その通りです。
URLリンク(blogs.msdn.com)
235:151
09/02/11 17:27:12 7B6g7EAI0
とりあえず
当方の機器構成で不具合無しで使わせてもらってます。
236:名無しさん@お腹いっぱい。
09/02/12 10:56:26 +LwHQhjH0
インデックスを使用しない検索はどいうしくみなんだろう
何度か試したけど、janeやgrep系ツールで15分くらいで終わる検索が
1時間以上かかる・・・
237:名無しさん@お腹いっぱい。
09/02/13 21:17:35 qrfSQQO00
ramdiskに置くとちょっぱやで終わるで
238:cen ◆Am9xOgNMYE
09/02/14 19:01:57 Ivymtmx10
>>236
1スレッド1レスごとに、名前や本文などに分解して検索します。
他のツールより遅いかもしれません
239:cen ◆Am9xOgNMYE
09/02/14 19:02:46 Ivymtmx10
それから、スレッド全文検索を更新しました。
Ver 1.811になりました。
URLリンク(www.geocities.jp)
更新点は以下です。
64bit Windowsで動作しない不具合を修正しました。
240:名無しさん@お腹いっぱい。
09/02/14 23:51:01 tZ4jeYrR0
乙
241:名無しさん@お腹いっぱい。
09/02/16 00:23:25 ROPuGsm90
64bitは使ってないけど 乙
242:名無しさん@お腹いっぱい。
09/02/23 17:42:48 9X3JfuyPO
あげる
243:名無しさん@お腹いっぱい。
09/02/24 06:13:36 vr2UZy6x0
教えて
他のスレから貼り付けてあるレスのIDから
その元のスレッドはどこで検索したらわかりますか?
244:cen ◆Am9xOgNMYE
09/02/26 02:31:04 mNxtTpWo0
>>243
探したいスレをログに持っていれば、ID欄にIDを入れればできます。
245:名無しさん@お腹いっぱい。
09/03/02 11:59:07 b+jiKsFh0
V2Cとか外部コマンドにも対応してほしい。
246:名無しさん@お腹いっぱい。
09/03/06 20:08:53 pY3L4RFj0
わけあって2ちゃんブラを2種類使用してます。2個以上の検索フォルダを作るようにできないでしょうか・・・
247:cen ◆Am9xOgNMYE
09/03/07 10:27:43 mBOlZIDB0
>>245
V2Cを見てみましたが、何か外部コマンドがいろいろあるようですね。
使えると面白いかもしれないです
>>246
ドライブが同じなら「C:\」とか設定してみてください。
2chのdatファイルのみを検索するようにしていますので、
C:\とかでも大丈夫だと思います。
248:246
09/03/08 05:30:53 hcTw0+mt0
>>247
ありがとうございます。
249:名無しさん@お腹いっぱい。
09/03/17 02:11:05 qzhV1XhY0
要望なのですが、
ネットワークパスへの対応をお願いできないでしょうか
検索フォルダが他のPCにあるもので。
今はネットワークドライブを割り当てれば大丈夫なようなのですが
できればネットワークパスのまま検索を行いたいです。
250:cen ◆Am9xOgNMYE
09/03/18 01:45:30 ygSKMO470
>>249
ネットワークごしで使うとは意外でした。
そういう要望があるとは。
あと、検索フォルダを2つ以上という要望が割と多いような気がします。
251:名無しさん@お腹いっぱい。
09/03/19 00:02:57 ubzPYAuk0
janeログがDドライブ
スレッド全文検索実行ファイル他&indexがEドライブ
o2onログもEドライブ
なので今はjaneのDドライブだけ検索。
252:cen ◆Am9xOgNMYE
09/03/28 00:24:10 E2BCRWio0
こんばんは
スレッド全文検索を更新しました。
Ver 1.82になりました。
URLリンク(www.geocities.jp)
・更新点は以下です。
・追加検索フォルダを指定できるようにしました。
・更新日が〜日前以降のみのファイルを検索できるようにしました。
・インデックス作成・更新の進捗表示を変更しました。
こんな感じです。
URLリンク(www.geocities.jp)
253:名無しさん@お腹いっぱい。
09/03/28 20:26:28 XdIQXp+30
更新乙です。
作業後に新しいのに入れ替えて4日ぶりにindex更新しようと思います。
254:cen ◆Am9xOgNMYE
09/03/30 00:21:51 AjuTSkCd0
どうもです。
そういえば、追加検索フォルダで長いフォルダ名だと
全部表示されないですね。
作るときに気がつかなかったです。
255:名無しさん@お腹いっぱい。
09/03/30 23:01:24 iNw9KL9q0
ちょっとお尋ねしたい事が。
index作成中及び更新中に待ちきれずにjane起動しログを追加取得しちゃった
場合ですが、threadsearch.exe実行中のピロピロ動いてるバー終了間際で
パソコンがリブートしちゃう気がするのですが、threadsearch的プログラムで
PCリブートなんてありえる事なんでしょうか?
Ver1.82ではindex更新中にログ取得は控えているのですが、
前のバージョンでは待ちきれずログ追加した場合に何度か
リブート食らったものでちょっと疑問に思いました。
もちろん更新中にログ取得しなければ今のところリブートしていないので
とっても愛用させていただいてます。
256:cen ◆Am9xOgNMYE
09/04/01 02:26:36 +A3IG6DE0
>>255
使って頂いてありがとうございます。
リブートですが、再起動するようには作っていません。
threadsearch.exeのせいかも知れないですが、原因は不明ですね。
更新中や作成中にログの追加削除をしても、こちらの環境では再起動する
ことはありませんでした。
そういう現象もあることを覚えておきます。
伝えて頂いてどうもです。
257:255
09/04/01 13:22:32 s/9cnb9p0
>256
承知しました。
次ページ最新レス表示スレッドの検索類似スレ一覧話題のニュースおまかせリスト▼オプションを表示暇つぶし2ch
5397日前に更新/100 KB
担当:undef