[表示 : 全て 最新50 1-99 101- 2chのread.cgiへ]
Update time : 05/09 09:46 / Filesize : 35 KB / Number-of Response : 137
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

2ちゃんねるスレッド全文検索・・・ThreadSearch



1 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 19:23:59 ID:LnN9ZP+r0]
ttp://www.geocities.jp/cen_hp
他の2chブラウザと連携できるといいな

102 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/08(火) 18:45:38 ID:7pqwNnqn0]
>>98
一般的なWebサーチエンジンは単語単位の検索結果をあらかじめ作ってる。
新しく見つけたページに「2ch」「モナー」という単語があったときは、2ch.txtとモナー.txtにそのページのアドレスを追加する。
「2ch モナー」で検索されたときは2ch.txtとモナー.txt両方に載っているアドレス一覧を表示するといった感じ。
ただし、ここでいう「単語」とはあらかじめリスト化されたものと機械的に認識されたものなので
でたらめな文字列で検索した場合は表示されない可能性もある。

103 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/09(水) 00:47:48 ID:cknHTRJD0]
>102
なるほど。
そうしちゃうと今より高速化はしてもindexが肥大しそうですね。

今は8.5Gのログに対しindexが3.2Gです。

104 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/13(日) 21:04:23 ID:TYBbxl0u0]
>>103
日本語対応の全文検索インデックスはでかいよー。
特に完全検索用のN-Gramインデックスは、たとえば「本日は晴天なり」って書いてあるテキストが
あったとすると
 本日
 日は
 は晴
 晴天
 天な
 なり
というそれぞれの文字列についてインデックスを作成する。
検索時には、たとえば「本日は」で検索されたら「本日」「日は」の両方にのっているファイルを
検索結果に表示する、という方式。
確実なんだけどでかい。

105 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/15(火) 15:00:25 ID:aKLBDNVH0]
みみずん氏でこんなもんか。
ttp://mimizun.com/spec.html

106 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/20(日) 02:22:48 ID:AbTJvetU0]
「Windows Vista の検索において、語句が検索されない場合がある」
support.microsoft.com/kb/952003/ja

「アクセスコントロールリスト」 があるのに "コントロール"を検索できません。
これは仕様です。日本人はfindとかfindstrを使いなされ。
 

107 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/21(月) 01:11:23 ID:ZxbJSK1r0]
テキストのフィルタが駄目すぎだなあ
IMEの件といい、ほんとMSは日本語に弱くなったな

108 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 11:45:39 ID:LDh0pw/C0]
そんなんだからMS社員がATOK使いたいとか言い出すんだ。

109 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 18:21:33 ID:DRzfVr9G0]
中国優先だからな

110 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/29(火) 19:00:16 ID:CDdAnnOZ0]
優先というか、メイドインチャイナ



111 名前:cen ◆Am9xOgNMYE mailto:sage [2008/07/31(木) 01:33:49 ID:Au4b/2RR0]
こんばんは

>>104
このソフトのインデックス方法もそういう方法使ってますね。


112 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/02(土) 23:36:16 ID:fGnZ88+/0]
屑HDにログ移行したんだけど、残り容量少なくてINDEX作りきれなかった orz

113 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/03(日) 23:09:35 ID:kqhImIQB0]
今のところ、新しいindexの形式で、index作成と読み込みのテストが
できています。
更新部分を作る前に公開するかもしれません。
何時になるかは不明ですが。

>>112
実験では現在と比べて約40%のindex容量が削減できています。
今よりも多少はディスク容量を使わなくて済む予定です。

114 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/03(日) 23:16:21 ID:BhOIA6SJ0]
>>113
乙です
四割もすか、わくわくしながら待っています。

115 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 00:44:24 ID:WlBy3GoL0]
  ∧_∧ ttp://www.geocities.jp/cen_hp/
 ( ・∀・) ドキドキ
 ( ∪ ∪
 と__)__)

116 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 07:05:18 ID:YBb9bfzK0]
禁断の壷のDATが検索できないようですが未対応ですか?

117 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/05(火) 19:08:19 ID:tQ0LETlx0]
    ∧_∧
    ( ・∀・)ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)ドキドキ
  ∪( ∪ ∪
    と__)__)

118 名前:名無しさん@お腹いっぱい。 [2008/08/08(金) 17:59:32 ID:/1wQ4+P70]
    ∧_∧
    ( ・∀・) ドキドキ
  oノ∧つ⊂)
  ( ( ・∀・) ワクワク
  oノ∧つ⊂)
  ( ( ・∀・)
  ∪( ∪ ∪
    と__)__)

119 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/09(土) 06:06:28 ID:oXes19LT0]
                        ,、ァ
                        ,、 '";ィ'
________              /::::::/l:l
─- 、::::;;;;;;;;;`゙゙''‐ 、    __,,,,......,,,,_/:::::::::/: !|
  . : : : : : : `゙'ヽ、:::゙ヾ´::::::::::::::::::::::`゙゙゙'''‐'、. l|
、、 . : : : : : : : : r'":::::::::::::::::::::::::,r':ぃ::::ヽ::::::::ヽ!
.ヽ:゙ヽ; : : : : : :ノ::::::::::::::::::::-=・=-、゙:::   -=・=-:'、
. \::゙、: : : :./::::::::::::::;、-''"::::::::::   ,...,:::,::., :::':、
   ヽ:ヽ、 /:::::::::::::::::::::::::     _  `゙''‐''"  __,,',,,,___
     `ヽ、:::::::::;;;、、--‐‐'''''',,iニ-    _|  、-l、,},,   ̄""'''¬-
   _,,,、-‐l'''"´:::::::'  ,、-'" ,.X,_,,、-v'"''゙''yr-ヽ / ゙゙'ヽ、, ゴリゴリゴリ・・・
,、-''"    .l:::::::::::;、-''"  ,.-'  ゙、"|    /  冫、     ヽ、
       l;、-'゙:   ,/      `| /| |   /. \
     ,、‐゙ ヽ:::::..,.r'゙       (( // | |  /    ヽ.  マズッ・・・
   ,、‐'゙     ン;"::::::.        U  .U  / >>118
  '     //:::::::::            {.
        / ./:::::::::::::            ',
.    /  /:::::::::::::::::.            ',.


120 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/10(日) 02:40:10 ID:iURE0WpC0]
>>116
どうもです。
検索できるのは、2chのサーバにあるそのままのdatファイル
のみになっています。
こんな感じのファイルです。
pc11.2ch.net/software/dat/1204107839.dat



121 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 02:51:18 ID:3MKwS0Q50]
壺のdatは少しだけ違うよな。生datではない

122 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:29:10 ID:WVmYSL3q0]
>>120
そうですか・・・
壷はファイルの先端に今取得した時間と前取得した時間とレス数追記して
生DATとは違うファイルになってるから対応するのは面倒そうですね・・・

123 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:36:29 ID:WVmYSL3q0]
壷のDAT見た限り0x88(136バイト)目まで壷DAT用のヘッダー?に上のレスで書いたやつを追記してるみたいですね。

124 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 05:56:58 ID:WVmYSL3q0]
今手元の壷用DATの先端0x88(136バイト)を削ってDATでThreadSearchを使用して検索できた事を報告しておきます。
使用する時はこれでいきます。
素晴らしいソフトありがとうございます。

125 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/10(日) 22:06:13 ID:yPWwed/n0]
へぇ
Jane系だとメタ情報はidxファイルに分けるけどね

>>120
1行目の読み出し時に自動認識できそうな気がしますがいかがでしょうか?

126 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/11(月) 18:37:08 ID:cL7eaFC40]
できそうな気もしますが、壷を入れてdatをいろいろ見てみないと
いけないので、ちょっとめんどうかも。
それに今作ってるのやつがあらかた出来上がっているので。

127 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 02:41:42 ID:ZgCCI6gx0]
乙です
>あらかた出来上がっているので
わくわく

128 名前:cen ◆Am9xOgNMYE [2008/08/13(水) 19:08:16 ID:dHKGFOYl0]
スレッド全文検索を更新しました。
Ver 1.60になりました。
www.geocities.jp/cen_hp

更新点は以下です。
 インデックスを改良して高速に作成、検索できるようにしました。
 ウインドウサイズを記憶するようにしました。
 検索結果の下ペインに上ペインのリンクを追加しました。

インデックス化の方法を変えたので、今までのものより
約2〜3倍 高速に検索できます。
場合によりそうでない時もありますが。
あと、インデックス作成時間も短くなりました。

詳しくはこちらを
www.geocities.jp/cen_hp/threadsearch.html

129 名前:名無しさん@お腹いっぱい。 [2008/08/13(水) 21:16:58 ID:tyXgUR9P0]
キタ━━━ヽ(゚∀゚)ノ━( ゚∀)ノ━(  ゚)ノ━ヽ(  )ノ━ヽ(゚  )━ヽ(∀゚ )ノ━ヽ(゚∀゚)ノ━━━!!
        へ )   (  ノ  (  )ノ   (  )   へ  )   へ )    へ  )
          >    >    <      <       <      >      >

130 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 21:25:48 ID:tyXgUR9P0]
えーすまん。
>詳しくは
と、readme.txtを見たけど、INDEXの追加作成は可能になったの?



131 名前:cen ◆Am9xOgNMYE mailto:sage [2008/08/13(水) 22:55:06 ID:dHKGFOYl0]
>>130
すみません。
書いてなかったです。
今回のバージョンでは追加(更新)の機能は付いていないです。
次回で付ける予定です。

132 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/13(水) 22:56:38 ID:tyXgUR9P0]
>131
ありゃ残念。
でも次回更新を楽しみに待ちながらVer1.6使わせていただきます。

133 名前:名無しさん@お腹いっぱい。 [2008/08/17(日) 17:23:51 ID:6fFreaBo0]
age

134 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/08/28(木) 20:58:59 ID:jxwyolAJO]
sage

135 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/09/01(月) 16:11:16 ID:fWSvEAsU0]
アイコンぐらい作って

136 名前:cen ◆Am9xOgNMYE mailto:sage [2008/09/02(火) 00:34:17 ID:acTGZjvR0]
>>135
そういえば、誤反応スクリプト無効化ソフトはアイコン作ってましたが、
これは作って無かったですね。

とりあえず、ぼちぼち更新部分作ってます。
ちょっとトップの説明変えてみた。
www.geocities.jp/cen_hp/threadsearch.html






[ 新着レスの取得/表示 (agate) ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<35KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef