[表示 : 全て 最新50 1-99 101- 201- 301- 2ch.scのread.cgiへ]
Update time : 01/10 17:51 / Filesize : 94 KB / Number-of Response : 333
[このスレッドの書き込みを削除する]
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧] [類似スレッド一覧]


↑キャッシュ検索、類似スレ動作を修正しました、ご迷惑をお掛けしました

全文検索エンジン Hyper Estraier 2



1 名前:名無しさん@お腹いっぱい。 [2007/04/17(火) 19:56:12 .net]

hyperestraier.sourceforge.net/index.ja.html



28 名前:名無しさん@お腹いっぱい。 [2007/08/26(日) 14:16:34 .net]
Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は
そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。


29 名前:28 mailto:sage [2007/08/26(日) 15:33:46 .net]
ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので
そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m

30 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/04(火) 21:14:26 .net]
ちかごろ良さげなパッチがMLに
流れてるが、作者はマージせんのか。
中華、作者はメンテしてんのか?

31 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/05(水) 02:18:45 .net]
確か1.4.9と1.4.10の間も長かったな。
mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス

32 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/05(水) 11:32:08 .net]
Tokyo Cabinet なんてのも作ってるしなあ。 QDBM ともども H.E. もこのまま放置されたりして。
tokyocabinet.sourceforge.net/

つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。


33 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/28(日) 19:54:12 .net]
>>32
開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…

34 名前:名無しさん@お腹いっぱい。 [2007/11/05(月) 14:51:27 .net]
100万レコードくらいのインデックスを作成したいのですが、
mysqlのエラーで止まります。何かいい方法ありますか?

35 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/06(火) 00:03:34 .net]
そもそもmysqlのエラーというのが発生する経緯がわからん
どういう使い方をしているのか、それを説明したまえ

36 名前:34 [2007/11/06(火) 19:34:03 .net]
>35

レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。

acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。

reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)

hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。

対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。

なにかアドバイスいただければ幸いです。
よろしくお願いします。











37 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/07(水) 11:56:45 .net]
そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの?
単にタイムアウトしているだけのような気が...


38 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 01:02:45 .net]
つーかMLとマルチ?やるなあおい

39 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 08:42:09 .net]
作者こないね



40 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 22:48:10 .net]
マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。
残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?

41 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/11(日) 18:28:54 .net]
いや、だからさ、作者はメンテする意思あんのか、と。

42 名前:名無しさん@お腹いっぱい。 [2007/11/12(月) 00:50:42 .net]
メンテナンスに関しては、開発者コミュニティが形成されていない
のがダメな点だな。

作者の手を煩わせてはいかんよ。

43 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 08:59:50 .net]
いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして
著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。


44 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 10:29:24 .net]
作者がmixiじゃなくgoogleに就職していれば…

45 名前:名無しさん@お腹いっぱい。 [2007/11/12(月) 10:59:56 .net]
googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣)



46 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 19:53:49 .net]
マイクロソフトはソース見たらフリーウェアに参加で着なくなるけどほかのも?



47 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 14:39:17 .net]
estseek.cgiで属性検索しても結果に出てこないのはなんで?
[UVSET]してるけどなー

48 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 14:44:41 .net]
あとgather -aa @uri STRで属性インデックスつけてるけど やっぱ遅いですね
属性検索で速く検索する方法ありますか

49 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 18:22:16 .net]
>>48
それ属性インデクス追加のオプションだっけ?
おれは
estcmd create -attr @uri str idx
とかやって属性インデクス付けたよ.

1000万件位のレコード数だったけど,URI検索は体感できるほど
速くなった.


50 名前:名無しさん@お腹いっぱい。 [2007/11/29(木) 10:43:00 .net]
>>39-45
で、いざ新バージョンが出たら沈黙ってなんだよ。

51 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/29(木) 13:26:34 .net]
hyperestraier.sourceforge.net/index.ja.html
> 最新のソースパッケージ(バージョン1.4.12)

あれ、いつの間に。
ML 入ってるけどリリース情報なかったぞ。
何にせよ復活age.

ただ、ChangeLog 見る限り、

2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c: code clean-up.
- Bugs related to type casting of perl binding were fixed.
- Release: 1.4.12

2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c (est_resmap_add): "method" argument was added.
* estraier.c (est_inode): a bug related to overflow was fixed.
* estraier.c (est_narrow_score): a bug related to attribute distinction was fixed.
* estraier.c (est_search_union): search accuracy with trailing uni-gram was improved.
* estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed.
* estscout.c (realmain): "union", "score", and "idsuffix" attributes were added.
* estsupt.c (realmain): "score" attribute was added.
* estsupt.c (procsearch): accuracy of hint was improved.
* estsupt.c (realmain): "logmsg" parameter was added.
* estscout.c (realmain): "distinct" parameter was added.
* estscout.c (showresult): cache clear at random was added.
- Release: 1.4.11

ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?

52 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/05(水) 19:46:42 .net]
pthreadsライブラリのないシステムで動かしたいんですが
なんとかならんですかね。

53 名前:名無しさん@お腹いっぱい。 [2007/12/06(木) 19:59:56 .net]
Chimera Search(キメラ・サーチ)
www.osstech.co.jp/product/chimera

> 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用
> しているため、安価に導入できるのに高性能・高機能を発揮します。
> * プログラム言語: Rubyおよび Ruby On Rails
> * 全文検索システム : Hyper Estraier


54 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 14:50:01 .net]
百度でやってるように
會→会
懷→懐
みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。

estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。

55 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 15:24:27 .net]
>>53
こういう製品って虚しいよね。
だって、導入60万、年12万だったらGoogle MINIの方が
安いし、ハードウェア込みの提供だからメンテフリーだし。
実際,うちの会社はWWW用はGoogleMINI にした。
部内サーバは自分でHyper Estraierをいれた。


56 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 17:12:45 .net]
>>55
それはそうなんだが、Google MINIってちっとも社内のニーズに合わせてくれなくて不満がでるんだよな。
ページの計算もなんか適当に丸められちゃうし。



57 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/24(月) 16:00:59 .net]
コレ使って、某サイトの1万件の記事の全文検索作ったが早いし良いね!!
acts_as_searchableの未完成具合に泣いたけどww

Rails系のエンジニアに聞くと皆使ってるし、
結構いろんなサービスでも使ってるみたい。

58 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/27(木) 04:43:21 .net]
最新版のWindows版のバイナリパッケージを配布して欲しい...

59 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/27(木) 21:52:28 .net]
ありゃ、SennaはともかくHEにもないんだ…

60 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/06(日) 02:53:55 .net]

(  ̄0 ̄)Ψ 誰かぁぁ PHP-nativ binding を作ってぇ〜

61 名前:名無しさん@お腹いっぱい。 [2008/01/29(火) 14:23:57 .net]
クローラー+ノードサーバーを使用した検索をシステムを動かし
*****:1978/node/***/search_ui の形式で検索には成功しました。

次ステップで
estraierpure.rb を PHP に移植したという 「EstraierPure for PHP 4.3」を使用し、ClassNodeを利用しましたが、検索結果に同じサイトばかり表示されてしまいます。

1:Pure版には 類似隠匿機能はないのでしょうか。
  Ruby、Javaにもないようですし..

2:Binding版(Perl等)には、類似隠匿機能(set_eclipse)があるのですが、classNode がありません。
  Binding版で、P2P(ノード)利用した検索をシステムって可能なのでしょうか。
  CPAN(Search-Estraier)を観ましたが、classNodeがあったのですが、set_eclipseがありませんでした
3:そもそもBinding版とPure版の違いってなんでしょうか。(汗


全く、的外れな質問でしたらお許しください
やりたいのは、「P2P+クローラーでの検索サーバーの構築」です。

62 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/29(火) 18:32:53 .net]
ノードAPIの場合、est_noderes_eclipse関数。 
Pureには、実装されてないようです。


>そりゃ俺がやるから使う側は楽なんだけどさ、面倒くせーことこの上ない。
 ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11306060711414945086

63 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 00:08:19 .net]
5年ぶりになまずを再インストールしたらすごくまともになってた。これでいいじゃん。

64 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 01:19:12 .net]
5年ぶりかよっ。


65 名前:名無しさん@お腹いっぱい。 [2008/01/30(水) 02:18:18 .net]
鰤と鯰

66 名前:61 mailto:sage [2008/01/30(水) 14:55:51 .net]
面倒くせーですか.... Cでやってみましょうか..15年ブリ(鬱



67 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 20:11:19 .net]
いくらなんでも鯰でいいはないだろ…
検索漏れ大杉でとても使う木になれん

68 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/31(木) 10:15:31 .net]
>検索漏れ大杉

 ヒント Mecab

69 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/31(木) 14:10:21 .net]
namazu+kakasi じゃなくて 鯰+和布蕪ってこと?


70 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/01(金) 10:36:19 .net]
>>66
Cで組むならQDBMの使いこなしが必要。
関数になれましょう

71 名前:名無しさん@お腹いっぱい。 [2008/02/07(木) 15:54:15 .net]
景気よくageます.
Windows版バイナリパッケージのverは1.4.10で止まったままなんでしょうか.
どなたかビルドしておられたらありがたいですが

72 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/09(土) 17:52:06 .net]
1.4.10 で困ることあるのか?



73 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/10(日) 09:18:20 .net]

辞書データ変換ツール一般についてと
(製品版のデータを全部持った)体験版のデータ変換についての話が
入り乱れてないか?


74 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/10(日) 09:19:50 .net]
すまん、誤爆した。

75 名前:名無しさん@お腹いっぱい。 [2008/02/20(水) 02:24:28 .net]
これ、データーベース(QDBM)が壊れまくり。
DBが開いた状態で、プロセスが落ちると100%ぶっ飛ぶ
速いらしいが、こんなん怖くて使えないわ。
どうでもいいような、無くなってもいいデータしか扱えないわ。

さてと、1000万件のデータ、ゼロから収集だわ(鬱

なんとかならんでしょうかね

76 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 02:34:44 .net]
なんとかしてみてよ。



77 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 08:56:25 .net]
俺もbsfilterでqdbm使ってたらすぐ壊れたんでsdbmに変えた・゚・(つД`)・゚・

78 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 10:37:59 .net]
qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11226165321819719571

79 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 15:07:56 .net]
>>77
よかったな! sdbmの方が圧倒的に速いぞ。


80 名前:名無しさん@お腹いっぱい。 [2008/02/21(木) 13:32:05 .net]
まぁ〜、トラック と
ノーヘルどころか、頭蓋骨すらない脳味噌丸出しのバイク便の差。

高速道路で同じ荷物を運んで どっちの運ちゃんが逝くかは明白。

シートベルト程度の防御は欲しいけど、速さと安全は成り立たないだろね。
RAMにカキコされたキャッシュ程度のモンよ



81 名前:名無しさん@お腹いっぱい。 [2008/02/21(木) 18:56:31 .net]
>>80
お前喩えのセンスあるな

82 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 11:56:39 .net]
HE+Tokyo Cabinet に変わるまで待てよ

83 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 13:45:46 .net]
TC ってさらに速さを追求したライブラリなんじゃネーの?
安全性上がるのか?

84 名前:83 mailto:sage [2008/02/23(土) 13:52:41 .net]
ああ、
alpha.mixi.co.jp/blog/?p=90
> 耐障害性の向上 : データベースファイルが壊れにくい
って書いてあるな。

速度だけでなく安全性も向上するのか。

85 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 14:11:07 .net]
alpha.mixi.co.jp/blog/?p=98
> QDBMにおいては、データベースを開いているアプリケーションが異常終了した場合、
> もしくはデータベースを適切に閉じずに終了した場合は、データベースが壊れるように
> していました。それらは明白なバグであり、アプリケーションの作者やそれを使うことを
> 選択したユーザに何らかの意識的な対処を求めることが適切であると考えたからです。
> (中略)
> しかし、上記のような理想主義と「上から目線」では現実の問題に対処できないことを
> 近ごろ感じはじめました。マナーを守らない/守れないユーザやユースケースも結構な
> 割合で存在するのが現実なのです。したがって、TCは、マナーを守らないアプリケー
> ションやそのユーザにも宥和する戦略に転換しました。

突然の停電とか当たり前に起こりうる事態なんだから、
バグとかマナーとかそういう問題じゃないと思うんだよな…
アプリにバグが無くても OS の不具合で落ちることなんかしょっちゅうだしな。

86 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 16:37:48 .net]
サバイバビリティの概念がないソフトウェア設計者がいるのか。
能力的に対処できないということはなさそうだから、
実世界の面倒くさいことから逃避するための言い訳か。

> アプリにバグが無くても OS の不具合で落ちることなんかしょっちゅうだしな。

そんな事がしょっちゅうあるようなOSは使わないのが普通。

開発者がアレだとユーザもアレなのが集まるというのを実感しないでもない。



87 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 16:53:57 .net]
>>86
おまえは Windows を使ったことがないのか?

88 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 05:10:28 .net]
●ノードマスタの異常終了(再起動シナイ)
 サーバールートdirの _pid と _stop の削除 

●DBの復旧
 estcmd repair index_path
 

89 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 14:10:33 .net]
共有鯖で、クローラーを動かしてますが、突然、
「out of memory」で止まってしまいました。( p_q)エ-ン

クローラールートディレクトリ(rootdir)内が飛んだようで
以後、
estwaver crawl rootdir  で 「could not open」となり起動できません。

メモリが少ないのはわかるのですが、先日までは正常に動作してました。
rootdirの復活方法など対処方法を教えてください (o*。_。)oペコッ

90 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 15:35:47 .net]
つ…釣り?

91 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 15:57:55 .net]
あるいは「一般人」かも

92 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 19:53:33 .net]
>>85,86
耐障害性の確保は上位層でやれってことだろ。
オーバーヘッドを減らすためには妥当な技術選択だ。
あんたらが考えてるくらいのことはとっくに考えてるはずだよ。

その例としてTokyo Tyrantでちゃんと耐障害性を確保しているしな。
alpha.mixi.co.jp/blog/?p=147

これベースでHEを作ってくれないかなぁ。


93 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 21:47:33 .net]
むしろ今後HEが放棄されそうで心配…。

94 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 22:47:01 .net]
mixi.jp 内で動いているエンジンを表に出して欲しい。


95 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/25(月) 06:44:00 .net]
>>92
中見てないけどtokyoestraierってのがそうじゃないの?



96 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 12:43:58 .net]
>>92
選択肢の一つではあるが、技術的に妥当な選択だとは思わないな。
用途が制約される(上位層やユーザがその要求を履行するのは難しい)という点で。



97 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 22:43:32 .net]
トレードオフのある技術選択において何が妥当かはユースケース次第だろう。
consistencyを真面目に考えたらそれこそスタンドアロンでは実現できないし。


98 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 17:41:29 .net]
HEはそのまま。

後継は、tokyoestraier(TE)でしょう。
hyperestraier.sourceforge.net/past/?M=A

99 名前:名無しさん@お腹いっぱい。 [2008/02/28(木) 13:12:04 .net]
DesktopHEでファイルサイズとテキストサイズの上限を調整する方法教えてくれよ。

100 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 04:12:02 .net]
ココもMLも過疎ってるし...

101 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 20:14:51 .net]
node配下のインデックスファイルって
別のHEシステムにインポートできないかな。

独立したサーバAで作ったインデックスを
別の独立したサーバBにrsyncで飛ばして してクローン作るとか・・・



102 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 21:54:36 .net]
rsyncでやってみれば
多分動くでしょ。AとBのアーキテクチャが同じなら


103 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 23:58:23 .net]
Q. ビッグエンディアンもしくはリトルエンディアンのマシン上で動きますか?
A. はい。どちらでも動作します。ただし、双方でインデックスを
共有することはできません。

そうでない場合は共有できるんじゃないの?


104 名前:名無しさん@お腹いっぱい。 [2008/04/04(金) 10:03:10 .net]
> 101
私やってますよ
サーバAでestwaverで集めて、サーバBにrsyncで飛ばして、検索はBで
ってシステム構築してます
AもBも同じPC同じOSですが

105 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/04(金) 11:20:55 .net]
>>101-102
レスd

バックアップとしても使えそうね


てか過疎で誰も居ないかと思ってたけど
人がまだ居て嬉しかった(´;ω;`)ブワッ

106 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/04(金) 11:21:29 .net]
安価ミスorz

>>102-104



107 名前:名無しさん@お腹いっぱい。 [2008/04/09(水) 23:28:58 .net]
tokyocabinetのwin32版って、どこ?

108 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/10(木) 07:40:41 .net]
ttp://tokyocabinet.sourceforge.net/spex-ja.html#faq
Q. : Windowsで利用できませんか?
A. : 残念ながらできません。今のところ対応予定もありません。


109 名前:名無しさん@お腹いっぱい。 [2008/04/10(木) 10:05:57 .net]
お、TCのドキュメントでたんだ。

期待age

110 名前:52 mailto:sage [2008/04/17(木) 18:25:17 .net]
>>52
>pthreadsライブラリのないシステムで動かしたいんですが

Hyper Estraierの前身の Estraierが pthreadsを必要としてなかったのでそっちを入れました。

111 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/17(木) 23:37:00 .net]
pthはだめなの?

112 名前:名無しさん@お腹いっぱい。 [2008/04/18(金) 10:46:20 .net]
Windowsで作成したデータベースをFreeBSDにコピーして使用しようと思い「P2Pガイド」の
「初期導入の効率化」を参考にデータベースを作成したのですが、検索が上手くいきません。

FreeBSD側に持っていっても、estsmdでは正常に検索できるのですが、サーバを立ち上げて
estcallを使うと、検索結果のヘッダ(ヒット数など)は表示される物の、それに続くはずの
文書一覧が表示されません。

どなたか原因分かる方見えませんか?

113 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/18(金) 17:38:32 .net]
>>111
GNU pth というのがあったとですか。勉強になりました。
でも本当の UNIX系OSではなくて UNIXエミュレーション環境なので pth では無理かも。
ともかく調べてみます。ありがとね。

114 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/24(木) 09:09:51 .net]
インデックス作成していたらout of memoryで止まるorz
物理メモリ1GB、仮想メモリ1.4GB使い切る・・・
-ftなんか使う物じゃないんだろうか
javaとかのソースコードも見たいんだけどなぁ・・・

115 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/24(木) 23:32:59 .net]
インデックス対象に Excel ファイルとか含まれてる?
Excel のせいでメモリ不足になってるならこういう話がある
pmakino.jp/tdiary/20070501.html#p01

116 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/25(金) 00:03:50 .net]
なるほど。参考になりました。

大学の研究室のファイルサーバ(約600GB)の検索用に導入しようと試みているんですが
実験のログやそれをとりまとめたxls、論文のdocやpdf、プレゼン用のppt(x)に
実験プログラムなどなど混沌としているため目的のファイルを探すのが容易になればと・・・

-ftじゃなくて.javaなどもテキストファイルとして認識するようにどこか変更すればいいんだろうか。

がんばっていろいろいじってみます



117 名前:名無しさん@お腹いっぱい。 [2008/05/05(月) 21:20:24 .net]
KaMailV3でH.E使っているんですが、mh形式のメールを登録したときに、メール内の添付ファイル名で検索することってできるんでしょうか。
H.E単体で、できないものであれば、あきらめようと思っていますが。

118 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/12(月) 02:11:46 .net]
Windowsバイナリ版1.4.9を数台のPCに設置&P2P連携し、
デフォルトの検索インターフェイスやコマンドラインからメタ検索をしているのですが、
似た内容のファイルが複数ヒットすると数件しかスニペット表示されません。
(例えば、5件のファイルがヒットしてもスニペット表示されるのは1件だけとか)

何かオプションを指定するなどしてヒットしたすべてのファイル、
あるいは上位何件かのファイルのスニペットを表示させる、
ということはできないのでしょうか?

119 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/15(日) 02:36:39 .net]
Tokyo Estraier hyperestraier.sourceforge.net/past/?M=A
てさ、0.0.1とかいうバージョン番号のせいで内容を見る気になってなかったんだけど、
実際見てみたら HE 1.4.13 で Tokyo Cabinet を使えるようにしたものなんだね。
今まではQDBMが壊れやすいせいでHEを敬遠してたのだけど、これは良いかも。
これで実運用してる人とかいるかな?

まあ本命は Tokyo Dystopia なんだけどさ。Rubyバインディングとかつくってほしいなあ。
tokyocabinet.sourceforge.net/dystopiadoc/


120 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/15(日) 18:21:12 .net]
壊れやすいよね。
問題なのは壊れたのに気づかないという・・・
リペアしてもリペア出来てないという・・・

121 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:24:46 .net]
検索結果をXMLで受け取りたいときはどうしたらいいの?

122 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:35:51 .net]
estcmd なら estcmd search に
 -vxを付けると、属性情報とスニペットをXML形式にして結果を出力します。
ってマニュアルに書いてあるよ。

それ以外は自分でAPI使ってXML返すプログラムを作るってのが
本来の使い方だろうね。


123 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:54:39 .net]
APIつくらないとダメかなぁ〜


124 名前:名無しさん@お腹いっぱい。 [2008/06/22(日) 17:24:43 .net]
256Mのバーチャルサーバーで動かしてます。
検索時はメモリオーバーになるらしく、プロセスがKILLされまくります。

どれくらいのメモリがあれば使えるものですか?

125 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/22(日) 23:17:58 .net]
128M の玄箱 HG でも動いているが…
なんか使い方おかしいんじゃね?

126 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/23(月) 00:00:57 .net]
>>124
バーチャルサーバのスワップはちゃんととってます?



127 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/23(月) 06:32:14 .net]
検索対象拡張子を追加するにはどこいじればいいんだろう?
.javaとかをテキストとして処理するようにしたいんだが・・・

128 名前:124 mailto:sage [2008/06/23(月) 16:57:29 .net]
バーチャルサーバのスワップ? 

どうやって取るんだろ。。( p_q)ワカンネっす PLASKサーバーです

_conf の設定が悪いのでしょうか。。P2P(estmaster)で使ってます。
_confにメモリ周辺の設定ってありましたっけ?






[ 続きを読む ] / [ 携帯版 ]

前100 次100 最新50 [ このスレをブックマーク! 携帯に送る ] 2chのread.cgiへ
[+板 最近立ったスレ&熱いスレ一覧 : +板 最近立ったスレ/記者別一覧](*・∀・)<94KB

read.cgi ver5.27 [feat.BBS2 +1.6] / e.0.2 (02/09/03) / eucaly.net products.
担当:undef