[表示 : 全て 最新50 1-99 101- 2chのread.cgiへ]
Update time : 05/09 09:46 / Filesize : 35 KB / Number-of Response : 137
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

2ちゃんねるスレッド全文検索・・・ThreadSearch



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:23:59 ID:LnN9ZP+r0]
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな

2 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:27:53 ID:1hEn6hQc0]
Styleの作者ならパクってくれると信じてる

3 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:37:05 ID:vjWd7/tI0]
取得してるdatから検索するだけじゃないか
つまりただのgrepソフトじゃないか
そうならそうと書いておけよファック!

4 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:38:24 ID:1hEn6hQc0]
よく見たらどの2chブラウザでもいいっぽいのかこれは

5 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 20:35:08 ID:FQ2KAFmK0]
cenのソフトか
本人もいることだし、ここでいいでしょ
MonoView Part1
pc11.2ch.net/test/read.cgi/software/1120578352/l50

6 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 21:39:02 ID:i+WKuLeL0]
JaneNidaの検索部分を抜き出したようなソフトだ

7 名前:cen ◆Am9xOgNMYE mailto:sage [2008/02/27(水) 21:43:09 ID:XGGqQQsX0]
おや、こんなスレが。。
>>3
そうです。
取得済みdatから検索します。

>>4
datファイルのあるフォルダならブラウザは何でもいいです。

8 名前:名無しさん@お腹いっぱい。 [2008/02/28(木) 10:42:47 ID:uqwne/o50]
>>5
あきらかに趣旨が違うから、ここでもいい気が。

9 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/28(木) 12:52:16 ID:uqwne/o50]
これ、まとめ屋さんに便利な気がする。
そういや、2chツール系はブラウザとかクライアントばっかでこういうのは少ないね
htmlに吐き出すことができればなおいいと思う。

10 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/28(木) 17:20:43 ID:Gggq9Nyh0]
地味に便利な予感



11 名前:名無しさん@お腹いっぱい。 [2008/02/28(木) 23:44:23 ID:L0/jQ3rB0]
>>9
>htmlに吐き出す
できたぞ

12 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/06(木) 16:17:15 ID:HcKfrMgv0]
“2ちゃんねる”専用ブラウザで閲覧したスレッドを全文検索できるソフト「スレッド全文検索」v1.00公開
namidame.2ch.net/test/read.cgi/news/1204783364/

ボロクソ言われてんぞ

13 名前:cen ◆Am9xOgNMYE mailto:sage [2008/03/07(金) 00:33:43 ID:PGe1vwef0]
>>12
どうもです
携帯で見てみましたが、.NET重いとか遅いとかありますね。
まあ確かにそうです。

こっちに記事がでてますね。
www.forest.impress.co.jp/article/2008/03/06/threadzenbun.html

14 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/07(金) 00:48:15 ID:zd9RAkN10]
まあ、2chブラウザ自体に検索機能あるしね

15 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/07(金) 17:38:16 ID:87XM4sqy0]
誰もマイクロソフトの.netに夢を見ていないから
独自で作ったほうがいいな

16 名前:名無しさん@お腹いっぱい。 [2008/03/07(金) 18:20:03 ID:87XM4sqy0]
言い忘れたけどこのソフト名前変えたほうがいいと思いますよ。
おそらく勘違いされるんじゃないでしょうか。

17 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 03:15:59 ID:kKmHjYKD0]
専ブラのボードデータ読んで欲しいものだ

18 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 11:46:41 ID:762Hpsy80]
似たようなソフトが二つあるけど、その違いは?

19 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 11:47:04 ID:D+lEa7FU0]
>>18
もう一つは?

20 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 16:19:56 ID:762Hpsy80]
スレッド全文検索
www.geocities.jp/cen_hp/threadsearch.html

datファイル全文検索ソフト
www.geocities.jp/cen_hp/program2.html



21 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 17:24:55 ID:TYy/Hfz20]
Googleデスクトップでdatが検索できればいいんだけどなぁ

22 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/08(土) 23:36:26 ID:D+lEa7FU0]
>>20
>>1のトップ見ると、スレッド全文検索は
datファイル全文検索ソフトの次のバージョンだって

23 名前:名無しさん@お腹いっぱい。 [2008/03/12(水) 22:39:18 ID:GO9/GYs2O]
age

24 名前:名無しさん@お腹いっぱい。 [2008/03/18(火) 16:58:40 ID:mxy1kdrV0]
板名の項目と正規表現が欲しい。
あと、スレタイ・日時を指定した場合、一致しないdatは検索しないようにして欲しい。

25 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 05:48:21 ID:t1CKTA7y0]
>>21
使えるかは知らんが

Jane Log Indexer
ttp://www.geocities.jp/hiko_bae/janelogindexer.html

26 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 12:44:05 ID:hbPh49eZ0]
>>25
おおー、これはすばらしい!

ついでに質問したいんだけど・・・
見つかったdatを簡易ブラウズするいい方法ってあるかな?
dat2htmlを内部的にやってくれて、サクっと表示してくれればうれしいんだけど

27 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 19:28:22 ID:qVTFsXtE0]
バッチ書けばなんとかなりそう。
やってみるべさ。こういうのはあまり得意ではないけど。

思いっきりスレ違いだけど、このスレあまり活動してなさそうだから別にいいか。

28 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 19:49:45 ID:qVTFsXtE0]
あっ、バッチじゃダメか…(^^;

29 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 19:56:23 ID:qVTFsXtE0]
レジストリか…さじ投げする。
すまない。NGしてくれい。

30 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/23(日) 22:39:39 ID:Q/s+q/fC0]
index作成型じゃないの?
すごくのろい。



31 名前:cen ◆Am9xOgNMYE mailto:sage [2008/03/23(日) 23:42:41 ID:Oti8oodi0]
>>24
板名で絞込みをどうしようかと思いましたが、ブラウザによって管理方法が
違うので迷いました。
今はどのフォルダでも同じように検索できるようになってます。

日時ではしてないですが、スレタイを指定して一致しない時は検索しない
ようになってます。

32 名前:cen ◆Am9xOgNMYE mailto:sage [2008/03/23(日) 23:44:03 ID:Oti8oodi0]
>>25
へえ。こういうのあるんですね。

>>30
なるほど。
index作れば速くなりそうですね。
あまり考えないで作ってました。

33 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/24(月) 16:48:56 ID:DoGMgzst0]
>32
最初のログ容量次第でindexの作成にバカ時間食いそうだけど、
その後がチマチマ増えたログのindex作成はたいして時間かからないだろうし
快適な気がしますです。

34 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/26(水) 00:32:25 ID:oQdgbeGv0]
NamazuとかPerlとかkakasiとか判らないので
マジindex作成型もお願いします。

35 名前:名無しさん@お腹いっぱい。 [2008/03/26(水) 10:35:29 ID:kUpi6chJ0]
そんな数検索するなよって話なんだろうけど
約15000個あるdatから全文検索かけたら凄い時間かかったから消した。

この機能は凄いありがたいんでどうにか高速化して欲しい

36 名前:名無しさん@お腹いっぱい。 [2008/03/31(月) 04:45:41 ID:ERjlVa+T0]
これ結構便利だ

37 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/01(火) 22:43:05 ID:h0Fp9KJ00]
cenさんありがとう、これ物凄い便利です

要望ってここで書いちゃっていいのかな?

追加を検討してほしい機能があります
検索後の結果でレスが読めますがやっぱり周辺のレスやら流れが読みたい事があります
そこで検索結果表示のスレタイをクリックしてそのスレ全部表示できたら良いなぁと

最近bbs2chreaderに乗り換えたのですが検索が無い、板フォルダ名がJaneと非互換なので
検索、後で読む、用にJaneにインポートさせるのも面倒だったりします
しかも現在bbs2chreaderは管理が変わり他専用ブラウザからのインポートもできません。。。

御一考頂ければなぁ、と思います

38 名前:cen ◆Am9xOgNMYE mailto:sage [2008/04/03(木) 00:51:35 ID:Cv07eAXJ0]
>>33-35
インデックス作るのには時間かかるかもしれないですが、
それがあると検索が速くなりそうですね。
考えてみます。

39 名前:cen ◆Am9xOgNMYE mailto:sage [2008/04/03(木) 00:53:32 ID:Cv07eAXJ0]
>>37
なるほどです。
結果の前後のレスも気になるといえば、なる時もありますね。
そういうのがあれば便利かもしれないですね

40 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 02:36:58 ID:EcJnLzvJ0]
>>39
レスありがとうございます
需要がありそうでしたら御一考くださいませ



41 名前:名無しさん@お腹いっぱい。 [2008/04/08(火) 17:41:43 ID:drLz8VQs0]
期待age

42 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/11(金) 01:39:36 ID:ECxOlQdf0]
index作成型 期待

ついでに各ブラウザから板リスト持ってきて、ドロップダウンリストっていうのかな?
検索する板も指定出来るといいな。
現行だと検索板を指定したくてフォルダ指定しようとすると大量ログがあるせいで
なかなかフォルダが開かないです。

まあindex作成型なら板指定なんかする必要は無いとも思いますが。

43 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/11(金) 09:45:28 ID:5aXvEh9K0]
index作成には特別興味ないけど、スレやレスのurlが分からないのは困る。
せっかく結果をファイルで保存できるのもったいない。

44 名前:cen ◆Am9xOgNMYE mailto:sage [2008/04/20(日) 23:26:55 ID:qLPJ64JY0]
>>42
インデックス方式は方法をぼちぼち考えて、テストのプログラム作っています。
板を選べるのもいいと最初思いましたが、ブラウザによってログの管理方法が
違うので対応をどうしようかと思い、結局はその機能はつけませんでした。

>>43
確かにそうですね。
後で見たときにその方がわかりやすいですね。

45 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/24(木) 14:17:31 ID:3g3UPg6D0]
>インデックス方式
楽しみーに待ってるです

46 名前:名無しさん@お腹いっぱい。 mailto:あげ [2008/04/26(土) 17:16:31 ID:nKn/rH3TO]
あげ

47 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/27(日) 09:23:11 ID:9Z0yo3eP0]
インデックスは独自?
それともnamazuとか使うの?

48 名前:cen ◆Am9xOgNMYE mailto:sage [2008/04/27(日) 22:42:01 ID:bblsSfITO]
>>47
独自の方法でする予定です。

49 名前:cen ◆Am9xOgNMYE [2008/05/04(日) 06:42:57 ID:BcpREFdy0]
おはようございます。

スレッド全文検索を更新しました。
Ver 1.50になりました。
www.geocities.jp/cen_hp

更新点は以下です。
・インデックス方式にしました。
・結果にログファイルのパスを表示しました。

50 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/04(日) 06:49:10 ID:BcpREFdy0]
インデックスを使うことで高速に検索できるようになりました。
www.geocities.jp/cen_hp/threadsearch.html#7

HPに載せている結果の場合、約3倍・約34倍 高速になっています。
検索語句によって速度がかなり変わります。
ユニークな言葉だと速く検索できます。



51 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/04(日) 07:01:09 ID:BcpREFdy0]
それから、検索結果はVer1.00と同様の結果が出ます。

52 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/04(日) 18:32:08 ID:IdG+Z9YvO]
あと、方法は独自と書きましたがほぼngram法です。

53 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/04(日) 19:57:44 ID:qNt4WyLm0]
Vista SP1(64bit)で動かしてみたんだけど、
ステータスバーに

「インデックス作成中・・・ファイルリスト作成中」

と表示されたまま、CPU使用率も上がらず、HDDアクセスも無いまま
インデックス作成が終わらない・・・

54 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/04(日) 21:21:24 ID:XlfbduW40]
>>53
どうもです。
一度終了して、インデックスを削除しても同じですか?
それと、検索フォルダにログのフォルダを指定して、作成していますか?
それでも出来ないならフォルダのパスを変えてみてください。

一応、動作確認として、Vista SP1(32bit)と、XP SP2(32bit)でしています。
あと、正常にインデックスが出来たら、「index」の名前のフォルダに
以下のファイルができます。
・file_list.txt
・index_0.txt 〜 index_xx.txt(xxは数字)
・path.txt

55 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/04(日) 22:35:21 ID:XlfbduW40]
>>53
さっき調べてみましたら、dllを作成するコンパイラが64bitに
対応していませんでした。
ですので、すみませんが64bitの環境では動作しません。

56 名前:名無しさん@お腹いっぱい。 [2008/05/05(月) 02:14:03 ID:a0XSAmtH0]
>>50
キタ━━━━━━(゚∀゚)━━━━━━ !!!!
とても乙です!

うちの非力2chノートでのレポ
CeleronM1.3G/Mem1.2G/XPSp2
DATフォルダサイズ 3.09G
DATファイル数 48902
INDEX作成時間 2時間
(↑他のそこそこ重い作業しながら、あんまり目安にもならないw)

検索はかなり速くなりました、ヌルヌルとヒットが出てくる感じ
検索結果からDATへのリンクですぐ該当DATにアクセスできるので相当便利です


57 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/05(月) 13:50:16 ID:ywlZf+w20]
>>55
.dat ファイルのパスをダブルクリックで「メモ帳」や>>nn 等の右クリックで 開く場合
「IE 」とキメウチされているようですが任意の(テキスト)ビュアーや
既定のブラウザーを使うか、各自指定できる様になると使いが手がより良いと思います。

58 名前:57 mailto:sage [2008/05/05(月) 14:37:31 ID:ywlZf+w20]
>>56
失礼「メモ帳」は Win の設定によるのでした...失礼しました。
ブラウザーに関しては「規定のブラウザー」を IE 以外にしていても
ヤハリ IE で開いてしまいます。

59 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/05(月) 23:34:43 ID:VS3MMtD80]
>>55
あと、ウインドウ・サイズも覚えておいて欲しい。

.NET Framework ソフトとしては軽いので結構期待してる。

60 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/06(火) 00:22:40 ID:bFXI3am60]
うほっ
index版 キテタ-
なにやらまだ不完全ぽいですが、さっそく使わせてもらいます。

祭日中にとっても乙



61 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/06(火) 00:25:19 ID:YR0md6ke0]
>>60
>不完全ぽい
kwsk

62 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/06(火) 01:24:52 ID:9EHtnBj90]
>>50
本文を含まない場合インデックスが利かないので一寸実用に耐えないなあl.

63 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/06(火) 23:28:52 ID:4jhZlQJu0]
index作成開始2時間半後で45%
まだまだ先は長いな。

64 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/07(水) 00:23:43 ID:ses9irbr0]
使って頂いてありがとうです。

>>58
検索結果の部分はIEコンポーネントなので、そこから開くものはIEになります。
結果を保存したときのHTMLは任意のブラウザで見れます。

>>59
それもいいかもしれないですね。

>>62
本文でしかインデックスは考えてませんでした。
そういえば、本文以外で名前とかメール欄とかは、スレでほとんど
一緒で、それで何かできそうな気もします。

65 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/07(水) 02:01:18 ID:/tgmzZhu0]
5万1千程のdatで4時間半かかった。

66 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/07(水) 23:27:54 ID:RBk6c+cP0]
初回indexを作ってからちゃんブラでログ取得して又indexを作らせて
みたら、初回と同じ位に時間が掛かっちゃいますね。

indexを作るってのはどのindex型でも、対象の追加があったらindexは
ゼロから作り直しになっちゃうのでしょうか?

67 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/07(水) 23:37:48 ID:ses9irbr0]
>>66
他の方法はそこまで詳しく知らないのです。
今のバージョンは、indexの作成と読み込みが出来ることを目指してたので、
更新まで力が及びませんでした。
なので、更新=作成になります。
次は更新も考えて見ます。

68 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/07(水) 23:48:26 ID:kAifuv6Y0]
乙です
確かにそれはちょっと欲しい、ぜひご一考を
そうすれば常に専ブラのフォルダダイレクト読める。。。

もっとわがまま書かせて頂くと複数フォルダパス設定をiniに書く形でも良いので欲しいです
一つのthreadseaerchから退避フォルダと現行専ブラフォルダを読めると最高です

69 名前:66 mailto:sage [2008/05/08(木) 00:23:43 ID:eGa6VFwL0]
>67
今でもハングアップしてんじゃないか?ほんとに検索してんのかよ?
って他の検索と比べたらとってもありがたいです。(-人-)

70 名前:58 mailto:sage [2008/05/08(木) 13:38:01 ID:CHC9JFTU0]
>>64
成る程、IE のメニューが出てるんですものね...
IE 側に別のブラウザでリンクを開くコンテクストメニューを追加する事で
>>XX を IE 以外で見れるようになりました。



71 名前:名無しさん@お腹いっぱい。 [2008/05/08(木) 21:44:59 ID:oX3p46BtO]
>>68
設定読み込みで、iniファイルを選べるからそれでしてみたら?

72 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/08(木) 23:26:19 ID:fy9YvlJe0]
どうもありがとうです

>>68
iniは任意の名前で保存できて、読み込めますが、そうではなくて、
一度の検索で2つのフォルダを設定したいということですか。

>>70
そういう方法もあるとは

73 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/08(木) 23:32:00 ID:fy9YvlJe0]
あと、窓の杜で記事が掲載されました。
www.forest.impress.co.jp/article/2008/05/08/threadzenbun150.html

74 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/09(金) 00:14:47 ID:54C7YKST0]
>>71
>>72
ありがとうございます、任意ini読み込みさえ気付いてなかった。。。
とりあえず、それで分けます

>一度の検索で2つのフォルダを設定
です、退避フォルダと現行専ブラのフォルダと記憶が曖昧だったりするときに
使いたいなと思いました、bbs2chreaderはgrepをかけるくらいしか全文検索が無いですんで。。。

>>73
窓の杜も細かく拾いますねw

75 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/09(金) 23:17:30 ID:9tPKF/2D0]
俺も3つの2chブラウザ使ってるから、順番に検索してくれたら助かるな

76 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/09(金) 23:39:32 ID:9tPKF/2D0]
ああ、よく考えたらログフォルダ作って全部その下に移動させればいいのか

77 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/11(日) 01:14:04 ID:rI+U6KpG0]
.NETじゃなくVCじゃ無理なの?
起動時、糞重くてしょうがないんだが

78 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/11(日) 02:16:35 ID:PFNSvUPe0]
VCは.NETに比べて手間が10倍くらいに増えるからな。

起動速度だけのためにそんな手間はかけてられないって感じじゃね?

79 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/11(日) 18:51:41 ID:gQon1txW0]
8.4ギガ程のログで3ギガ程のindexが出来ますた。

80 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/11(日) 19:14:25 ID:Znmvmy7U0]
DesktopHE
ttp://freemind.s57.xrea.com/desktophe/index.html
↑datはサポート外で、datファイルの表示は固まるかと思うほど遅いすが
探してくるのは速いしインデックスの作り方とか参考にならないでしょうか



81 名前:cen ◆Am9xOgNMYE mailto:sage [2008/05/18(日) 23:15:54 ID:+yfWcw6T0]
>>74>>75
ログフォルダが複数あるときですか。
それは思いつきませんでした。

>>77
大体>>78さんの通り、重いですが作るのが割と楽なので.NETを使っています。

>>80
そういうのもあるんですか。
ちょっと見てみます。

82 名前:名無しさん@お腹いっぱい。 [2008/05/23(金) 20:17:03 ID:UH4K7XDzO]
age

83 名前:名無しさん@お腹いっぱい。 [2008/06/01(日) 14:35:57 ID:iGifQDnZ0]
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   index追加型、急かしてないよ?        
 と__)__) +

84 名前:名無しさん@お腹いっぱい。 [2008/06/01(日) 23:46:08 ID:63eV6hEF0]
急がせてるwwwwwwwwwwww

85 名前:名無しさん@お腹いっぱい。 [2008/06/02(月) 22:00:16 ID:xloWUVFk0]
+   +   ワクワクテカテカ
  ∧_∧  +
 (0゜・∀・)
 (0゜∪ ∪ +   急かしてないよ、ホントだよ?        
 と__)__) +

86 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 14:01:04 ID:5GdvKxzv0]
Janeログをインデックス化して高速検索する「dat検索」 :教えて君.net
ttp://www.oshiete-kun.net/archives/2008/05/janedat.html
Datファイル全文検索ソフト DatE
ttp://frozenlib.net/DatE/

こっちが2.0ならむこうは3.5か…
誰かユーザーの事考えたC++製の全文検索ソフト作れよ


87 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 14:31:24 ID:i98vc4zJ0]
Jane系に限定するならJaneViewでも使ってりゃいいじゃない
インデックスサーチなら他の100倍は早い

88 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/03(火) 20:13:08 ID:NItC+Ua+0]
ずっとJane使ってたら、メモリ使用量が300Mになった…
V2Cくらいメモリ使用量決められたらいいんだけどなぁ

89 名前:名無しさん@お腹いっぱい。 [2008/06/07(土) 15:31:32 ID:6OP9T2Vu0]
週末きたけどそろそろバージョンくる?

90 名前:名無しさん@お腹いっぱい。 [2008/06/13(金) 22:02:47 ID:+0Vv0YEo0]
週末くるけどそろそろバージョンくる?



91 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/13(金) 22:13:22 ID:C4TWwqL/0]
「バージョンくる」の意味が分からなかったのでグッてみた

ver・sion

━━ n. 翻訳, 訳書; (時にV-) (聖書の)…訳[版]; 解釈; 異説; (個人的な観点からの)説明; 翻案, 編曲.


92 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/17(火) 00:56:18 ID:Xfg2HjBN0]
たぶん「そろそろバージョン」っていう新しいバージョンが来るんじゃマイカ?

93 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/21(土) 00:53:55 ID:yQj9zf0a0]
>86
バージョンこないから試してみようとしたけど起動しないや・・・

94 名前:名無しさん@お腹いっぱい。 [2008/06/22(日) 14:26:00 ID:pB/qsvyu0]
俺は白鴎院理人(はくおういんりひと)。 御茶ノ水に事務所を構える私立探偵だ。
俺は帝都を騒がす怪人物、蜘蛛男を追っている。 奴が目撃され始めたのは数週間前のこと。
はじめは酔客の間で交わされる噂話に過ぎなかった。 夜の帝都を飛び回る不気味な怪人物がいる。
路地裏で人を喰らっているところを見た。 こうした噂話は、帝都では珍しいものではない。
近代化を成し遂げ、震災から復興しても尚、 人々は夜の闇に怯え、怪しげな噂を作り出す。
だが、蜘蛛男の噂は一時に止まらず増え続けた。 それが低級雑誌で取り上げられるようになり、
最近では大新聞までもが蜘蛛男の記事を載せている。 こうなると警察も黙ってはいない。
多くの人員を割いて捜査に当たっているらしい。 しかし、今のところ蜘蛛男の逮捕には至っていない。
それどころか奴が何者で何の目的があるのかさえも、 未だ判明していないのだ。
奴が何者であったとしても、 帝都を騒がす怪人物を放っておくことはできまい。
そこで私立探偵である俺もまた、蜘蛛男を追っていた。 この俺が蜘蛛男を捕えてみせる。
\_____ _________________________________/
         ∨
           ___                _
       / ____ヽ           /  ̄   ̄ \
       |  | /, −、, -、l           /、          ヽ きみ頭だいじょうぶ?
       | _| -|○ | ○||         |・ |―-、       |
   , ―-、 (6  _ー っ-´、}         q -´ 二 ヽ      |
   | -⊂) \ ヽ_  ̄ ̄ノノ          ノ_ ー  |     |
    | ̄ ̄|/ (_ ∪ ̄ / 、 \        \. ̄`  |      /
    ヽ  ` ,.|     ̄  |  |         O===== |
      `− ´ |       | _|        /          |

【 南極堂...断罪アイアンメイデン 】  www42.atwiki.jp/ironmaiden/

95 名前:cen ◆Am9xOgNMYE mailto:sage [2008/06/24(火) 19:11:24 ID:E9lO0sbvO]
どうもです。

ちょっと忙しくてできていないですが、
今はインデックスの方式を考え直しているところです。

96 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/25(水) 00:16:50 ID:EIbNz7bk0]
待ってます

97 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/25(水) 00:18:37 ID:YlNT0tor0]
待っています。

98 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/06(日) 13:26:22 ID:eE09r6G00]
みみずん検索とかは一瞬に近い状態で検索結果が出るけど
これは意外と時間かかるよね?

これってハードウェア性能の違い?それともindexの方式違い?
どっちが原因として大きいんだろ。

indexをRAMディスクに置いて、DATをRAID0・5・6に置いても
とても一瞬じゃ表示出来なそうだけど。


あ、従来の検索と比べたら遥かに恩の字ですから
ケチ付けてるんじゃなく素朴な疑問です。

99 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/06(日) 19:54:39 ID:y2E+4QJQ0]
>>98
何言ってる

100 名前:cen ◆Am9xOgNMYE mailto:sage [2008/07/06(日) 23:14:28 ID:q9kMgqrU0]
>>98
どうもです。

このソフトでは保存してる全てのログから、検索語を漏らすこと無く
検索するので他のものより遅いのではと思います。
ソフトの性能かもしれないです。
みみずん検索の仕組みがどういうものか知りませんが・・・



101 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/07(月) 00:57:51 ID:5BhNo3f50]
>100
あ、そっか。
みみずん検索は検索板を指定しましたね。
長期使ってないから全板検索だと勘違いしてました orz

102 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/08(火) 18:45:38 ID:7pqwNnqn0]
>>98
一般的なWebサーチエンジンは単語単位の検索結果をあらかじめ作ってる。
新しく見つけたページに「2ch」「モナー」という単語があったときは、2ch.txtとモナー.txtにそのページのアドレスを追加する。
「2ch モナー」で検索されたときは2ch.txtとモナー.txt両方に載っているアドレス一覧を表示するといった感じ。
ただし、ここでいう「単語」とはあらかじめリスト化されたものと機械的に認識されたものなので
でたらめな文字列で検索した場合は表示されない可能性もある。

103 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/09(水) 00:47:48 ID:cknHTRJD0]
>102
なるほど。
そうしちゃうと今より高速化はしてもindexが肥大しそうですね。

今は8.5Gのログに対しindexが3.2Gです。

104 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/13(日) 21:04:23 ID:TYBbxl0u0]
>>103
日本語対応の全文検索インデックスはでかいよー。
特に完全検索用のN-Gramインデックスは、たとえば「本日は晴天なり」って書いてあるテキストが
あったとすると
 本日
 日は
 は晴
 晴天
 天な
 なり
というそれぞれの文字列についてインデックスを作成する。
検索時には、たとえば「本日は」で検索されたら「本日」「日は」の両方にのっているファイルを
検索結果に表示する、という方式。
確実なんだけどでかい。

105 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/15(火) 15:00:25 ID:aKLBDNVH0]
みみずん氏でこんなもんか。
ttp://mimizun.com/spec.html

106 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/20(日) 02:22:48 ID:AbTJvetU0]
「Windows Vista の検索において、語句が検索されない場合がある」
support.microsoft.com/kb/952003/ja

「アクセスコントロールリスト」 があるのに "コントロール"を検索できません。
これは仕様です。日本人はfindとかfindstrを使いなされ。
 

107 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/21(月) 01:11:23 ID:ZxbJSK1r0]
テキストのフィルタが駄目すぎだなあ
IMEの件といい、ほんとMSは日本語に弱くなったな

108 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 11:45:39 ID:LDh0pw/C0]
そんなんだからMS社員がATOK使いたいとか言い出すんだ。

109 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 18:21:33 ID:DRzfVr9G0]
中国優先だからな

110 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 19:00:16 ID:CDdAnnOZ0]
優先というか、メイドインチャイナ



111 名前:cen ◆Am9xOgNMYE mailto:sage [2008/07/31(木) 01:33:49 ID:Au4b/2RR0]
こんばんは

>>104
このソフトのインデックス方法もそういう方法使ってますね。


112 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/02(土) 23:36:16 ID:fGnZ88+/0]
屑HDにログ移行したんだけど、残り容量少なくてINDEX作りきれなかった orz

113 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/03(日) 23:09:35 ID:kqhImIQB0]
今のところ、新しいindexの形式で、index作成と読み込みのテストが
できています。
更新部分を作る前に公開するかもしれません。
何時になるかは不明ですが。

>>112
実験では現在と比べて約40%のindex容量が削減できています。
今よりも多少はディスク容量を使わなくて済む予定です。

114 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/03(日) 23:16:21 ID:BhOIA6SJ0]
>>113
乙です
四割もすか、わくわくしながら待っています。

115 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 00:44:24 ID:WlBy3GoL0]
  ∧_∧ ttp://www.geocities.jp/cen_hp/
 ( ・∀・) ドキドキ
 ( ∪ ∪
 と__)__)

116 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 07:05:18 ID:YBb9bfzK0]
禁断の壷のDATが検索できないようですが未対応ですか?

117 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 19:08:19 ID:tQ0LETlx0]
    ∧_∧
    ( ・∀・)ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)ドキドキ
  ∪( ∪ ∪
    と__)__)

118 名前:名無しさん@お腹いっぱい。 [2008/08/08(金) 17:59:32 ID:/1wQ4+P70]
    ∧_∧
    ( ・∀・) ドキドキ
  oノ∧つ⊂)
  ( ( ・∀・) ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)
  ∪( ∪ ∪
    と__)__)

119 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/09(土) 06:06:28 ID:oXes19LT0]
                        ,、ァ
                        ,、 '";ィ'
________              /::::::/l:l
─- 、::::;;;;;;;;;`゙゙''‐ 、    __,,,,......,,,,_/:::::::::/: !|
  . : : : : : : `゙'ヽ、:::゙ヾ´::::::::::::::::::::::`゙゙゙'''‐'、. l|
、、 . : : : : : : : : r'":::::::::::::::::::::::::,r':ぃ::::ヽ::::::::ヽ!
.ヽ:゙ヽ; : : : : : :ノ::::::::::::::::::::-=・=-、゙:::   -=・=-:'、
. \::゙、: : : :./::::::::::::::;、-''"::::::::::   ,...,:::,::., :::':、
   ヽ:ヽ、 /:::::::::::::::::::::::::     _  `゙''‐''"  __,,',,,,___
     `ヽ、:::::::::;;;、、--‐‐'''''',,iニ-    _|  、-l、,},,   ̄""'''¬-
   _,,,、-‐l'''"´:::::::'  ,、-'" ,.X,_,,、-v'"''゙''yr-ヽ / ゙゙'ヽ、, ゴリゴリゴリ・・・
,、-''"    .l:::::::::::;、-''"  ,.-'  ゙、"|    /  冫、     ヽ、
       l;、-'゙:   ,/      `| /| |   /. \
     ,、‐゙ ヽ:::::..,.r'゙       (( // | |  /    ヽ.  マズッ・・・
   ,、‐'゙     ン;"::::::.        U  .U  / >>118
  '     //:::::::::            {.
        / ./:::::::::::::            ',
.    /  /:::::::::::::::::.            ',.


120 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/10(日) 02:40:10 ID:iURE0WpC0]
>>116
どうもです。
検索できるのは、2chのサーバにあるそのままのdatファイル
のみになっています。
こんな感じのファイルです。
pc11.2ch.net/software/dat/1204107839.dat



121 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 02:51:18 ID:3MKwS0Q50]
壺のdatは少しだけ違うよな。生datではない

122 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:29:10 ID:WVmYSL3q0]
>>120
そうですか・・・
壷はファイルの先端に今取得した時間と前取得した時間とレス数追記して
生DATとは違うファイルになってるから対応するのは面倒そうですね・・・

123 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:36:29 ID:WVmYSL3q0]
壷のDAT見た限り0x88(136バイト)目まで壷DAT用のヘッダー?に上のレスで書いたやつを追記してるみたいですね。

124 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:56:58 ID:WVmYSL3q0]
今手元の壷用DATの先端0x88(136バイト)を削ってDATでThreadSearchを使用して検索できた事を報告しておきます。
使用する時はこれでいきます。
素晴らしいソフトありがとうございます。

125 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 22:06:13 ID:yPWwed/n0]
へぇ
Jane系だとメタ情報はidxファイルに分けるけどね

>>120
1行目の読み出し時に自動認識できそうな気がしますがいかがでしょうか?

126 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/11(月) 18:37:08 ID:cL7eaFC40]
できそうな気もしますが、壷を入れてdatをいろいろ見てみないと
いけないので、ちょっとめんどうかも。
それに今作ってるのやつがあらかた出来上がっているので。

127 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 02:41:42 ID:ZgCCI6gx0]
乙です
>あらかた出来上がっているので
わくわく

128 名前:cen ◆Am9xOgNMYE [2008/08/13(水) 19:08:16 ID:dHKGFOYl0]
スレッド全文検索を更新しました。
Ver 1.60になりました。
www.geocities.jp/cen_hp

更新点は以下です。
 インデックスを改良して高速に作成、検索できるようにしました。
 ウインドウサイズを記憶するようにしました。
 検索結果の下ペインに上ペインのリンクを追加しました。

インデックス化の方法を変えたので、今までのものより
約2〜3倍 高速に検索できます。
場合によりそうでない時もありますが。
あと、インデックス作成時間も短くなりました。

詳しくはこちらを
www.geocities.jp/cen_hp/threadsearch.html

129 名前:名無しさん@お腹いっぱい。 [2008/08/13(水) 21:16:58 ID:tyXgUR9P0]
キタ━━━ヽ(゚∀゚)ノ━( ゚∀)ノ━(  ゚)ノ━ヽ(  )ノ━ヽ(゚  )━ヽ(∀゚ )ノ━ヽ(゚∀゚)ノ━━━!!
        へ )   (  ノ  (  )ノ   (  )   へ  )   へ )    へ  )
          >    >    <      <       <      >      >

130 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 21:25:48 ID:tyXgUR9P0]
えーすまん。
>詳しくは
と、readme.txtを見たけど、INDEXの追加作成は可能になったの?



131 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/13(水) 22:55:06 ID:dHKGFOYl0]
>>130
すみません。
書いてなかったです。
今回のバージョンでは追加(更新)の機能は付いていないです。
次回で付ける予定です。

132 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 22:56:38 ID:tyXgUR9P0]
>131
ありゃ残念。
でも次回更新を楽しみに待ちながらVer1.6使わせていただきます。

133 名前:名無しさん@お腹いっぱい。 [2008/08/17(日) 17:23:51 ID:6fFreaBo0]
age

134 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/28(木) 20:58:59 ID:jxwyolAJO]
sage

135 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/09/01(月) 16:11:16 ID:fWSvEAsU0]
アイコンぐらい作って

136 名前:cen ◆Am9xOgNMYE mailto:sage [2008/09/02(火) 00:34:17 ID:acTGZjvR0]
>>135
そういえば、誤反応スクリプト無効化ソフトはアイコン作ってましたが、
これは作って無かったですね。

とりあえず、ぼちぼち更新部分作ってます。
ちょっとトップの説明変えてみた。
www.geocities.jp/cen_hp/threadsearch.html






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<35KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef