1 名前:名無しさん@お腹いっぱい。 [2007/04/17(火) 19:56:12 ] hyperestraier.sourceforge.net/index.ja.html
2 名前:名無しさん@お腹いっぱい。 [2007/04/17(火) 19:57:06 ] 前スレ pc11.2ch.net/test/read.cgi/unix/1100221699/
3 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/17(火) 21:59:35 ] 「はっ!はぁぁぁあんっ!ナ、ナマズは?ナマズは、こ、超えたの??」
4 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/17(火) 22:08:40 ] いいえ、タイにご執心の気違い次男がいる限り、なまずは不滅です。 もっとも最近は、もっとダイレクトにcockらしいですが。
5 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/18(水) 00:12:47 ] >>1 乙
6 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/18(水) 22:59:59 ] こんなところにエロゲーのスレが!??
7 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/19(木) 08:50:05 ] >>6 「イサキ 大漁」で検索
8 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/19(木) 17:49:02 ] インストール方法から検索方法までの詳細 ↓ ↓
9 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/19(木) 18:58:11 ] つGoogle
10 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/22(日) 17:16:55 ] いちいちhttpdなんか動かしてられるか! ってひとのため。 green.ribbon.to/~ikazuhiro/lookup/ndest.html
11 名前:名無しさん@お腹いっぱい。 [2007/04/22(日) 20:12:08 ] フロントエンド、統一してくれんかのぅ
12 名前:774 [2007/04/23(月) 01:14:13 ] 前スレとの二重カキコご免なさい。 athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8 こちらのサイトでtestを検索 athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order= すると関連キーワードとして Related terms: text, rowspan, style, align, center, color, background, key というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか?? いろいろ調べているんですが、方法が一向に分からず。 ご存知の方いらしたら改造のしかた教えて下さい。
13 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/04/24(火) 22:20:44 ] 複数のインデックスを作っておいて、同時に検索できるのでしょうか? estseek.confのindexname: 部分では複数の記述ができませんでした。
14 名前:13 mailto:sage [2007/04/24(火) 22:22:08 ] すみません。前スレに移動しました。
15 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/02(水) 19:49:28 ] relwords.qdb って何処で入手できるんでしょうか。
16 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/02(水) 20:50:02 ] ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11373623770980940568&focus=1
17 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/02(水) 21:16:15 ] >>16 athlon64.fsij.org:8080/wikipedia/relwords.tsv.bz2 は athlon64.fsij.org/wikipedia/relwords.tsv.bz2 のようですが、not found なのです。 wikipediaのデータを使っているようなので、GNU FDL に基づいて 作者に直接請求しなければならないのでしょうかね。
18 名前:16 mailto:sage [2007/05/02(水) 22:17:48 ] 俺なら作者に「お願い」するけどな。 ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
19 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/03(木) 13:45:41 ] ここで改変されたデータへのアクセスを提供してる。 athlon64.fsij.org/~mikio/wikipedia/relwords.cgi
20 名前:名無しさん@お腹いっぱい。 [2007/05/06(日) 11:58:48 ] これだろ athlon64.fsij.org/~mikio/wikipedia/relwords.qdb
21 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/05/07(月) 11:24:34 ] >>20 多謝です。
22 名前:名無しさん@お腹いっぱい。 [2007/06/12(火) 00:07:48 ] KaMailV3もここで良い?
23 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/12(火) 15:08:13 ] xyzzyのスレがあるべ。 作者さんはずっとあっちの人だ
24 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/06/20(水) 03:25:39 ] estcmd search -ord のあとに何をかけばいいのかわかんねー。 rubyの二つの bindingもどういう得失があるんだろう.. やっぱり purerubyだとちょっと遅いとか?? ちょっとソースに diveしてくる。
25 名前:名無しさん@お腹いっぱい。 [2007/07/02(月) 22:06:30 ] mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに:ニュース - CNET Japan japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm Hyper Estraier あげ
26 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/03(火) 09:54:12 ] mixy日記はコーパスとしておもしろそうだよねえ。
27 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/07/04(水) 20:56:32 ] namazu.el と同じようなフロントエンドおねがいしますー。 上にあったlookupじゃ使いにくいです。 リターン一発で編集したいです。
28 名前:名無しさん@お腹いっぱい。 [2007/08/26(日) 14:16:34 ] Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は そのままレン鯖にうpしても動かないですかね? 試用段階なのだけど、なにか違うんだろうか。
29 名前:28 mailto:sage [2007/08/26(日) 15:33:46 ] ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので そっちをテストしたらうまくいきました。 付属CGIが動かない理由はまだわからないけど、 自分でもいまいち整理できてないですし、 estseek.cgiは使わないので質問は取り下げます。 ごめりんこですm(_ _)m
30 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/04(火) 21:14:26 ] ちかごろ良さげなパッチがMLに 流れてるが、作者はマージせんのか。 中華、作者はメンテしてんのか?
31 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/05(水) 02:18:45 ] 確か1.4.9と1.4.10の間も長かったな。 mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス
32 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/09/05(水) 11:32:08 ] Tokyo Cabinet なんてのも作ってるしなあ。 QDBM ともども H.E. もこのまま放置されたりして。 tokyocabinet.sourceforge.net/ つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。
33 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/10/28(日) 19:54:12 ] >>32 開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。 Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
34 名前:名無しさん@お腹いっぱい。 [2007/11/05(月) 14:51:27 ] 100万レコードくらいのインデックスを作成したいのですが、 mysqlのエラーで止まります。何かいい方法ありますか?
35 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/06(火) 00:03:34 ] そもそもmysqlのエラーというのが発生する経緯がわからん どういう使い方をしているのか、それを説明したまえ
36 名前:34 [2007/11/06(火) 19:34:03 ] >35 レスありがとうございます。 hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。 acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、 これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。 reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、 そのあたりは負荷を減らすようなコードに修正して実行しています。 (このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411) hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、 インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。 対象レコード数は100万弱で、途中で止まってしまいましたが、 #docs => 22897、#words => 196666まではいけました。 なにかアドバイスいただければ幸いです。 よろしくお願いします。
37 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/07(水) 11:56:45 ] そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの? 単にタイムアウトしているだけのような気が...
38 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 01:02:45 ] つーかMLとマルチ?やるなあおい
39 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 08:42:09 ] 作者こないね
40 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/08(木) 22:48:10 ] マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。 残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。 つか普通 MySQL で全文検索するんだったら Senna じゃね?
41 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/11(日) 18:28:54 ] いや、だからさ、作者はメンテする意思あんのか、と。
42 名前:名無しさん@お腹いっぱい。 [2007/11/12(月) 00:50:42 ] メンテナンスに関しては、開発者コミュニティが形成されていない のがダメな点だな。 作者の手を煩わせてはいかんよ。
43 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 08:59:50 ] いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして 著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと 無理だよ。
44 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 10:29:24 ] 作者がmixiじゃなくgoogleに就職していれば…
45 名前:名無しさん@お腹いっぱい。 [2007/11/12(月) 10:59:56 ] googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣)
46 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/12(月) 19:53:49 ] マイクロソフトはソース見たらフリーウェアに参加で着なくなるけどほかのも?
47 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 14:39:17 ] estseek.cgiで属性検索しても結果に出てこないのはなんで? [UVSET]してるけどなー
48 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 14:44:41 ] あとgather -aa @uri STRで属性インデックスつけてるけど やっぱ遅いですね 属性検索で速く検索する方法ありますか
49 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/21(水) 18:22:16 ] >>48 それ属性インデクス追加のオプションだっけ? おれは estcmd create -attr @uri str idx とかやって属性インデクス付けたよ. 1000万件位のレコード数だったけど,URI検索は体感できるほど 速くなった.
50 名前:名無しさん@お腹いっぱい。 [2007/11/29(木) 10:43:00 ] >>39-45 で、いざ新バージョンが出たら沈黙ってなんだよ。
51 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/11/29(木) 13:26:34 ] hyperestraier.sourceforge.net/index.ja.html > 最新のソースパッケージ(バージョン1.4.12) あれ、いつの間に。 ML 入ってるけどリリース情報なかったぞ。 何にせよ復活age. ただ、ChangeLog 見る限り、 2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net> * estraier.c: code clean-up. - Bugs related to type casting of perl binding were fixed. - Release: 1.4.12 2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net> * estraier.c (est_resmap_add): "method" argument was added. * estraier.c (est_inode): a bug related to overflow was fixed. * estraier.c (est_narrow_score): a bug related to attribute distinction was fixed. * estraier.c (est_search_union): search accuracy with trailing uni-gram was improved. * estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed. * estscout.c (realmain): "union", "score", and "idsuffix" attributes were added. * estsupt.c (realmain): "score" attribute was added. * estsupt.c (procsearch): accuracy of hint was improved. * estsupt.c (realmain): "logmsg" parameter was added. * estscout.c (realmain): "distinct" parameter was added. * estscout.c (showresult): cache clear at random was added. - Release: 1.4.11 ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?
52 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/05(水) 19:46:42 ] pthreadsライブラリのないシステムで動かしたいんですが なんとかならんですかね。
53 名前:名無しさん@お腹いっぱい。 [2007/12/06(木) 19:59:56 ] Chimera Search(キメラ・サーチ) www.osstech.co.jp/product/chimera > 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用 > しているため、安価に導入できるのに高性能・高機能を発揮します。 > * プログラム言語: Rubyおよび Ruby On Rails > * 全文検索システム : Hyper Estraier
54 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 14:50:01 ] 百度でやってるように 會→会 懷→懐 みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。 estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。
55 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 15:24:27 ] >>53 こういう製品って虚しいよね。 だって、導入60万、年12万だったらGoogle MINIの方が 安いし、ハードウェア込みの提供だからメンテフリーだし。 実際,うちの会社はWWW用はGoogleMINI にした。 部内サーバは自分でHyper Estraierをいれた。
56 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/22(土) 17:12:45 ] >>55 それはそうなんだが、Google MINIってちっとも社内のニーズに合わせてくれなくて不満がでるんだよな。 ページの計算もなんか適当に丸められちゃうし。
57 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/24(月) 16:00:59 ] コレ使って、某サイトの1万件の記事の全文検索作ったが早いし良いね!! acts_as_searchableの未完成具合に泣いたけどww Rails系のエンジニアに聞くと皆使ってるし、 結構いろんなサービスでも使ってるみたい。
58 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/27(木) 04:43:21 ] 最新版のWindows版のバイナリパッケージを配布して欲しい...
59 名前:名無しさん@お腹いっぱい。 mailto:sage [2007/12/27(木) 21:52:28 ] ありゃ、SennaはともかくHEにもないんだ…
60 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/06(日) 02:53:55 ] (  ̄0 ̄)Ψ 誰かぁぁ PHP-nativ binding を作ってぇ〜
61 名前:名無しさん@お腹いっぱい。 [2008/01/29(火) 14:23:57 ] クローラー+ノードサーバーを使用した検索をシステムを動かし *****:1978/node/***/search_ui の形式で検索には成功しました。 次ステップで estraierpure.rb を PHP に移植したという 「EstraierPure for PHP 4.3」を使用し、ClassNodeを利用しましたが、検索結果に同じサイトばかり表示されてしまいます。 1:Pure版には 類似隠匿機能はないのでしょうか。 Ruby、Javaにもないようですし.. 2:Binding版(Perl等)には、類似隠匿機能(set_eclipse)があるのですが、classNode がありません。 Binding版で、P2P(ノード)利用した検索をシステムって可能なのでしょうか。 CPAN(Search-Estraier)を観ましたが、classNodeがあったのですが、set_eclipseがありませんでした 3:そもそもBinding版とPure版の違いってなんでしょうか。(汗 全く、的外れな質問でしたらお許しください やりたいのは、「P2P+クローラーでの検索サーバーの構築」です。
62 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/29(火) 18:32:53 ] ノードAPIの場合、est_noderes_eclipse関数。 Pureには、実装されてないようです。 >そりゃ俺がやるから使う側は楽なんだけどさ、面倒くせーことこの上ない。 ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11306060711414945086
63 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 00:08:19 ] 5年ぶりになまずを再インストールしたらすごくまともになってた。これでいいじゃん。
64 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 01:19:12 ] 5年ぶりかよっ。
65 名前:名無しさん@お腹いっぱい。 [2008/01/30(水) 02:18:18 ] 鰤と鯰
66 名前:61 mailto:sage [2008/01/30(水) 14:55:51 ] 面倒くせーですか.... Cでやってみましょうか..15年ブリ(鬱
67 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/30(水) 20:11:19 ] いくらなんでも鯰でいいはないだろ… 検索漏れ大杉でとても使う木になれん
68 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/31(木) 10:15:31 ] >検索漏れ大杉 ヒント Mecab
69 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/01/31(木) 14:10:21 ] namazu+kakasi じゃなくて 鯰+和布蕪ってこと?
70 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/01(金) 10:36:19 ] >>66 Cで組むならQDBMの使いこなしが必要。 関数になれましょう
71 名前:名無しさん@お腹いっぱい。 [2008/02/07(木) 15:54:15 ] 景気よくageます. Windows版バイナリパッケージのverは1.4.10で止まったままなんでしょうか. どなたかビルドしておられたらありがたいですが
72 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/09(土) 17:52:06 ] 1.4.10 で困ることあるのか?
73 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/10(日) 09:18:20 ] 辞書データ変換ツール一般についてと (製品版のデータを全部持った)体験版のデータ変換についての話が 入り乱れてないか?
74 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/10(日) 09:19:50 ] すまん、誤爆した。
75 名前:名無しさん@お腹いっぱい。 [2008/02/20(水) 02:24:28 ] これ、データーベース(QDBM)が壊れまくり。 DBが開いた状態で、プロセスが落ちると100%ぶっ飛ぶ 速いらしいが、こんなん怖くて使えないわ。 どうでもいいような、無くなってもいいデータしか扱えないわ。 さてと、1000万件のデータ、ゼロから収集だわ(鬱 なんとかならんでしょうかね
76 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 02:34:44 ] なんとかしてみてよ。
77 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 08:56:25 ] 俺もbsfilterでqdbm使ってたらすぐ壊れたんでsdbmに変えた・゚・(つД`)・゚・
78 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 10:37:59 ] qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11226165321819719571
79 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/20(水) 15:07:56 ] >>77 よかったな! sdbmの方が圧倒的に速いぞ。
80 名前:名無しさん@お腹いっぱい。 [2008/02/21(木) 13:32:05 ] まぁ〜、トラック と ノーヘルどころか、頭蓋骨すらない脳味噌丸出しのバイク便の差。 高速道路で同じ荷物を運んで どっちの運ちゃんが逝くかは明白。 シートベルト程度の防御は欲しいけど、速さと安全は成り立たないだろね。 RAMにカキコされたキャッシュ程度のモンよ
81 名前:名無しさん@お腹いっぱい。 [2008/02/21(木) 18:56:31 ] >>80 お前喩えのセンスあるな
82 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 11:56:39 ] HE+Tokyo Cabinet に変わるまで待てよ
83 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 13:45:46 ] TC ってさらに速さを追求したライブラリなんじゃネーの? 安全性上がるのか?
84 名前:83 mailto:sage [2008/02/23(土) 13:52:41 ] ああ、 alpha.mixi.co.jp/blog/?p=90 > 耐障害性の向上 : データベースファイルが壊れにくい って書いてあるな。 速度だけでなく安全性も向上するのか。
85 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 14:11:07 ] alpha.mixi.co.jp/blog/?p=98 > QDBMにおいては、データベースを開いているアプリケーションが異常終了した場合、 > もしくはデータベースを適切に閉じずに終了した場合は、データベースが壊れるように > していました。それらは明白なバグであり、アプリケーションの作者やそれを使うことを > 選択したユーザに何らかの意識的な対処を求めることが適切であると考えたからです。 > (中略) > しかし、上記のような理想主義と「上から目線」では現実の問題に対処できないことを > 近ごろ感じはじめました。マナーを守らない/守れないユーザやユースケースも結構な > 割合で存在するのが現実なのです。したがって、TCは、マナーを守らないアプリケー > ションやそのユーザにも宥和する戦略に転換しました。 突然の停電とか当たり前に起こりうる事態なんだから、 バグとかマナーとかそういう問題じゃないと思うんだよな… アプリにバグが無くても OS の不具合で落ちることなんかしょっちゅうだしな。
86 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 16:37:48 ] サバイバビリティの概念がないソフトウェア設計者がいるのか。 能力的に対処できないということはなさそうだから、 実世界の面倒くさいことから逃避するための言い訳か。 > アプリにバグが無くても OS の不具合で落ちることなんかしょっちゅうだしな。 そんな事がしょっちゅうあるようなOSは使わないのが普通。 開発者がアレだとユーザもアレなのが集まるというのを実感しないでもない。
87 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/23(土) 16:53:57 ] >>86 おまえは Windows を使ったことがないのか?
88 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 05:10:28 ] ●ノードマスタの異常終了(再起動シナイ) サーバールートdirの _pid と _stop の削除 ●DBの復旧 estcmd repair index_path
89 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 14:10:33 ] 共有鯖で、クローラーを動かしてますが、突然、 「out of memory」で止まってしまいました。( p_q)エ-ン クローラールートディレクトリ(rootdir)内が飛んだようで 以後、 estwaver crawl rootdir で 「could not open」となり起動できません。 メモリが少ないのはわかるのですが、先日までは正常に動作してました。 rootdirの復活方法など対処方法を教えてください (o*。_。)oペコッ
90 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 15:35:47 ] つ…釣り?
91 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 15:57:55 ] あるいは「一般人」かも
92 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 19:53:33 ] >>85 ,86 耐障害性の確保は上位層でやれってことだろ。 オーバーヘッドを減らすためには妥当な技術選択だ。 あんたらが考えてるくらいのことはとっくに考えてるはずだよ。 その例としてTokyo Tyrantでちゃんと耐障害性を確保しているしな。 alpha.mixi.co.jp/blog/?p=147 これベースでHEを作ってくれないかなぁ。
93 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 21:47:33 ] むしろ今後HEが放棄されそうで心配…。
94 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/24(日) 22:47:01 ] mixi.jp 内で動いているエンジンを表に出して欲しい。
95 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/25(月) 06:44:00 ] >>92 中見てないけどtokyoestraierってのがそうじゃないの?
96 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 12:43:58 ] >>92 選択肢の一つではあるが、技術的に妥当な選択だとは思わないな。 用途が制約される(上位層やユーザがその要求を履行するのは難しい)という点で。
97 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/26(火) 22:43:32 ] トレードオフのある技術選択において何が妥当かはユースケース次第だろう。 consistencyを真面目に考えたらそれこそスタンドアロンでは実現できないし。
98 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/02/27(水) 17:41:29 ] HEはそのまま。 後継は、tokyoestraier(TE)でしょう。 hyperestraier.sourceforge.net/past/?M=A
99 名前:名無しさん@お腹いっぱい。 [2008/02/28(木) 13:12:04 ] DesktopHEでファイルサイズとテキストサイズの上限を調整する方法教えてくれよ。
100 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/03/21(金) 04:12:02 ] ココもMLも過疎ってるし...
101 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 20:14:51 ] node配下のインデックスファイルって 別のHEシステムにインポートできないかな。 独立したサーバAで作ったインデックスを 別の独立したサーバBにrsyncで飛ばして してクローン作るとか・・・
102 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 21:54:36 ] rsyncでやってみれば 多分動くでしょ。AとBのアーキテクチャが同じなら
103 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/03(木) 23:58:23 ] Q. ビッグエンディアンもしくはリトルエンディアンのマシン上で動きますか? A. はい。どちらでも動作します。ただし、双方でインデックスを 共有することはできません。 そうでない場合は共有できるんじゃないの?
104 名前:名無しさん@お腹いっぱい。 [2008/04/04(金) 10:03:10 ] > 101 私やってますよ サーバAでestwaverで集めて、サーバBにrsyncで飛ばして、検索はBで ってシステム構築してます AもBも同じPC同じOSですが
105 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/04(金) 11:20:55 ] >>101-102 レスd バックアップとしても使えそうね てか過疎で誰も居ないかと思ってたけど 人がまだ居て嬉しかった(´;ω;`)ブワッ
106 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/04(金) 11:21:29 ] 安価ミスorz >>102-104
107 名前:名無しさん@お腹いっぱい。 [2008/04/09(水) 23:28:58 ] tokyocabinetのwin32版って、どこ?
108 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/10(木) 07:40:41 ] ttp://tokyocabinet.sourceforge.net/spex-ja.html#faq Q. : Windowsで利用できませんか? A. : 残念ながらできません。今のところ対応予定もありません。
109 名前:名無しさん@お腹いっぱい。 [2008/04/10(木) 10:05:57 ] お、TCのドキュメントでたんだ。 期待age
110 名前:52 mailto:sage [2008/04/17(木) 18:25:17 ] >>52 >pthreadsライブラリのないシステムで動かしたいんですが Hyper Estraierの前身の Estraierが pthreadsを必要としてなかったのでそっちを入れました。
111 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/17(木) 23:37:00 ] pthはだめなの?
112 名前:名無しさん@お腹いっぱい。 [2008/04/18(金) 10:46:20 ] Windowsで作成したデータベースをFreeBSDにコピーして使用しようと思い「P2Pガイド」の 「初期導入の効率化」を参考にデータベースを作成したのですが、検索が上手くいきません。 FreeBSD側に持っていっても、estsmdでは正常に検索できるのですが、サーバを立ち上げて estcallを使うと、検索結果のヘッダ(ヒット数など)は表示される物の、それに続くはずの 文書一覧が表示されません。 どなたか原因分かる方見えませんか?
113 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/18(金) 17:38:32 ] >>111 GNU pth というのがあったとですか。勉強になりました。 でも本当の UNIX系OSではなくて UNIXエミュレーション環境なので pth では無理かも。 ともかく調べてみます。ありがとね。
114 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/24(木) 09:09:51 ] インデックス作成していたらout of memoryで止まるorz 物理メモリ1GB、仮想メモリ1.4GB使い切る・・・ -ftなんか使う物じゃないんだろうか javaとかのソースコードも見たいんだけどなぁ・・・
115 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/24(木) 23:32:59 ] インデックス対象に Excel ファイルとか含まれてる? Excel のせいでメモリ不足になってるならこういう話がある pmakino.jp/tdiary/20070501.html#p01
116 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/04/25(金) 00:03:50 ] なるほど。参考になりました。 大学の研究室のファイルサーバ(約600GB)の検索用に導入しようと試みているんですが 実験のログやそれをとりまとめたxls、論文のdocやpdf、プレゼン用のppt(x)に 実験プログラムなどなど混沌としているため目的のファイルを探すのが容易になればと・・・ -ftじゃなくて.javaなどもテキストファイルとして認識するようにどこか変更すればいいんだろうか。 がんばっていろいろいじってみます
117 名前:名無しさん@お腹いっぱい。 [2008/05/05(月) 21:20:24 ] KaMailV3でH.E使っているんですが、mh形式のメールを登録したときに、メール内の添付ファイル名で検索することってできるんでしょうか。 H.E単体で、できないものであれば、あきらめようと思っていますが。
118 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/05/12(月) 02:11:46 ] Windowsバイナリ版1.4.9を数台のPCに設置&P2P連携し、 デフォルトの検索インターフェイスやコマンドラインからメタ検索をしているのですが、 似た内容のファイルが複数ヒットすると数件しかスニペット表示されません。 (例えば、5件のファイルがヒットしてもスニペット表示されるのは1件だけとか) 何かオプションを指定するなどしてヒットしたすべてのファイル、 あるいは上位何件かのファイルのスニペットを表示させる、 ということはできないのでしょうか?
119 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/15(日) 02:36:39 ] Tokyo Estraier hyperestraier.sourceforge.net/past/?M=A てさ、0.0.1とかいうバージョン番号のせいで内容を見る気になってなかったんだけど、 実際見てみたら HE 1.4.13 で Tokyo Cabinet を使えるようにしたものなんだね。 今まではQDBMが壊れやすいせいでHEを敬遠してたのだけど、これは良いかも。 これで実運用してる人とかいるかな? まあ本命は Tokyo Dystopia なんだけどさ。Rubyバインディングとかつくってほしいなあ。 tokyocabinet.sourceforge.net/dystopiadoc/
120 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/15(日) 18:21:12 ] 壊れやすいよね。 問題なのは壊れたのに気づかないという・・・ リペアしてもリペア出来てないという・・・
121 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:24:46 ] 検索結果をXMLで受け取りたいときはどうしたらいいの?
122 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:35:51 ] estcmd なら estcmd search に -vxを付けると、属性情報とスニペットをXML形式にして結果を出力します。 ってマニュアルに書いてあるよ。 それ以外は自分でAPI使ってXML返すプログラムを作るってのが 本来の使い方だろうね。
123 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/16(月) 18:54:39 ] APIつくらないとダメかなぁ〜
124 名前:名無しさん@お腹いっぱい。 [2008/06/22(日) 17:24:43 ] 256Mのバーチャルサーバーで動かしてます。 検索時はメモリオーバーになるらしく、プロセスがKILLされまくります。 どれくらいのメモリがあれば使えるものですか?
125 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/22(日) 23:17:58 ] 128M の玄箱 HG でも動いているが… なんか使い方おかしいんじゃね?
126 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/23(月) 00:00:57 ] >>124 バーチャルサーバのスワップはちゃんととってます?
127 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/23(月) 06:32:14 ] 検索対象拡張子を追加するにはどこいじればいいんだろう? .javaとかをテキストとして処理するようにしたいんだが・・・
128 名前:124 mailto:sage [2008/06/23(月) 16:57:29 ] バーチャルサーバのスワップ? どうやって取るんだろ。。( p_q)ワカンネっす PLASKサーバーです _conf の設定が悪いのでしょうか。。P2P(estmaster)で使ってます。 _confにメモリ周辺の設定ってありましたっけ?
129 名前:名無しさん@お腹いっぱい。 [2008/06/24(火) 02:03:12 ] .netからDLLを利用しようと思ってます。 が、検索のAPIがDLL内でmallocしたものを返す仕様になっており、 メモリ解放ができません。 内部で完結するよう関数追加してビルドしなおししかないでしょうか?
130 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/24(火) 21:40:22 ] DTDって変更したいときは任意の場所に出来るのかな? デフォルトのファイルを書き換えるだけ?
131 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/24(火) 22:14:59 ] >>129 どうしたいのか分からんが、間にラッパーを かませればいいんじゃないの?
132 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/24(火) 23:50:56 ] >>131 はい、ラッパー作った方がいいと思います。 ラッパーのビルドもcygwin入れて本体と同じライプラリつかってやるんですよね。きっと。 UNIX系はさっぱりで、makeファイルすらよくわからず、相当時間がかかりそうです。 とり急ぎ直近はSearch系だけestcmdでやっちまおうと思います。 ギャザラはDLL使うのでなんとも不格好なんですが。
133 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/25(水) 10:35:07 ] freeをcrtからインポートすればいいだけじゃないの?
134 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/06/26(木) 01:02:03 ] makeの設定とdllの中身見たらmsvcrt.dllでいいみたいですね どうもありがとうございました。
135 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/08(火) 20:51:02 ] 質問です。 windows環境でRailsの開発をしててHyper Estraierを使いたいんですが、 配布されているバイナリパッケージにRubyバインディングが見当たりません。 Cygwinでソースをmakeしても、Hyper Estraier本体は入るんですが、 Rubyバインディングのmakeでコケます。 windowsでは無理?
136 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/12(土) 09:15:52 ] どうコケのかを言わずに、どう答えて欲しいんだろう
137 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/12(土) 17:24:10 ] >>135 お前にゃ無理だ。
138 名前:名無しさん@お腹いっぱい。 [2008/07/24(木) 13:28:58 ] ショボ頭の自分助けて… pdfをインデックス化したいんですけど、30MB超えるpdfだと、 文章の途中までしかインデックス化してくれません。。 特にエラーとか出てないんですけどなんでだろ? $ estcmd gather -cl -fx ".pdf" "H@estfxpdftohtml" -fz -ic UTF-8 -il ja -lf -1 -lt -1 -sd -cm casket ./ 一応、-lf -1 -lt -1で、ファイルサイズ制限無しとかにしてみるんだけど、 マニュアルとかGoogle先生とか聞いても対処方法もわかんなくて、、 こんなバカ助かるかな?
139 名前:fumiyas [2008/07/25(金) 12:27:12 ] >>138 estfxpdftohtml スクリプト中に「ulimit -v 262144 -t 10 2> "/dev/null"」ってのがあるから 「262144」の部分を適当に多くしてみるとどう?
140 名前:fumiyas [2008/07/25(金) 12:55:11 ] >>114 うちの estmaster もインデックスにデータを投入するごとに肥大化しているような。 お客さんのところでメモリ使用量 1GB 越えも発生したので、調査する予定。(;_;) … その前に Tokyo Estraier を試してみようかしら?
141 名前:名無しさん@お腹いっぱい。 [2008/07/25(金) 15:21:53 ] >>139 うぅ、バカに救いの手をありがとうございます。orz 少しインデックス化できた文章が増えたので、イケルか!と思ったんですが、 値を倍位に変更しても、それ以上は増えなくて、やっぱり途中で切れちゃってる。_| ̄|○||| ( -t 10 => 500とかもしてみたけどダメだった…) なにげに、 $ pdftotext -enc UTF-8 -htmlmeta "pdfファイル" これでやってみると、きちんとオワリまで文章がテキスト化されているみたい。 新たに発覚したんだけど、どうもpdf文章の途中でたまたま出てくる「<<」の記号から、 「>>」の所まで、ごっそり文書がインデックス化されてないっぽい。(゚ロ゚;))((;゚ロ゚)オロオロ すまん、かえって混乱させてるかも。。 というか、自分混乱してる。
142 名前:fumiyas [2008/07/26(土) 02:26:06 ] >>141 ああ、わかった…。(たぶん) pdftotext のバグですね。 pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" | output の部分を: pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" \ |sed '/<pre>/,/<\/pre>/{s/&/\&/g;s/</\</g;s/>/\>/g}' \ | output とでも書き換えてみてください。(これだと「pre」が単語として登録されてしまうが…。) # sed 's/ -htmlmeta / -raw -nopgbrk /' /usr/bin/estfxpdftohtml > /usr/bin/estfxpdftotext # chmod 755 /usr/bin/estfxpdftotext とでもして、 $ estcmd gather -cl -fx ".pdf" "T@estfxpdftotext" -fz -ic UTF-8 -il ja -lf -1 -lt -1 -sd -cm casket ./ とするとか。
143 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/07/26(土) 11:00:18 ] >>142 あんただれ?
144 名前:名無しさん@お腹いっぱい。 [2008/07/28(月) 14:06:44 ] >>142 ホントすいません、付き合って頂いちゃってありがとうございます。 pdftotext のバグですか!? だとすると、こんなド素人に使いこなすのは難しくなっちゃうかも。。現状で満足せなあかんですかね(;´ー`) スクリプトありがとうございます(人-) ただかなり初歩的な部分で分からないところが…(滝汗) そもそも sed がイマイチ分かってないしょっぱい自分… > # sed 's/ -htmlmeta / -raw -nopgbrk /' /usr/bin/estfxpdftohtml > /usr/bin/estfxpdftotext > # chmod 755 /usr/bin/estfxpdftotext estfxpdftohtml や estfxpdftotextは /usr/local/share/hyperestraier/filter にあって /usr/bin には無かったりするんですが、その辺は読み替えろよこんちくしょう的な感じでしょうか…?(゚Д゚;)アワワ それともそのままやっちゃっても大丈夫的な感じでしょうか?
145 名前:fumiyas [2008/07/29(火) 13:53:59 ] >>144 まずは pdftotext のバグについて。 pdftotext は -htmlmeta オプションを付けると PDF に含まれる 本文のテキストを簡単な HTML にして、プラス文書情報 (Adobe Reader なら [File] - [Properties] で表示される情報) を HTML の <meta> に 含めてくれますが、PDF 本文のテキストは <pre> で囲まれるだけで その中に含まれる <, >, & を <, >, & に変換してくれません(バグ)。 なので PDF に「<HTMLのタグではない適当な文字列>」という文が含まれていると、 estcmd がそれを HTML のタグと認識してしまい、削除してしまいます。 sed がやっていることですが、<pre>〜</pre> の間の <, >, & を <, >, & に変換しているだけです。 最後に estfxpdftohtml(text) の置き場所ですが、私の手元の Debian の hyperestraier パッケージでは /usr/bin に置かれているというだけで、 そっちの環境で /usr/local/share/hyperestraier/filter なら、 そっちに合わせて ↑ に置くのがいいと思います。 # sed 's/ -htmlmeta / -raw -nopgbrk /' \ /usr/local/share/hyperestraier/filter/estfxpdftohtml \ >/usr/local/share/hyperestraier/filter/estfxpdftotext >>143 ハンドル(?)をググると出てくるので、そっちをどうぞ。:-)
146 名前:fumiyas [2008/07/29(火) 13:57:46 ] ありゃ? 「&lt;」(実際は半角)とかが「<」に変換されちまった…。 どうしたらいいの? ま、いいか。
147 名前:fumiyas [2008/07/29(火) 15:56:25 ] 初心者板で聞いてきました。「&amp;」って書くのね…。 pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" \ |sed '/<pre>/,/<\/pre>/{s/&/\&/g;s/</\</g;s/>/\>/g}' \ |output その中に含まれる <, >, & を <, >, & に変換してくれません(バグ)。
148 名前:名無しさん@お腹いっぱい。 [2008/07/30(水) 18:50:03 ] >>147 す・すすごい!!できたできました!!(・∀・∀・) ごっそり抜けちゃってた文章も、タグだと誤解されてしまってたんですね。 きちんとインデックスに戻ってきました、戻ってきましたよ!!щ(゜ロ゜щ) カモ-ン 天才ですかfumiyasさま… (シ_ _)シ ネ申 >>147 ほんにありがとうございます。 確かにインデックスの方には <pre> が単語化されているようですが、 これはもう、しょうがないですよ…ね…? はぁぁ、感動しちゃいました。(;∀; )
149 名前:fumiyas [2008/08/01(金) 01:35:58 ] >>148 解決されたようでなによりです。 「pre」が気になるようなら、上で書いたように estfxpdftohtml の代わりに estfxpdftotext でもどうぞ。estcmd の -fx オプションの 値を変更するのを忘れないように。
150 名前:HE@SHE [2008/09/27(土) 02:48:36 ] Hyper Estraierで、URI属性をフレーズ検索の対象とする方法はありますでしょうか。
151 名前:名無しさん@お腹いっぱい。 [2008/10/02(木) 13:47:11 ] すみません教えてください。 ファイルサーバ(Xとか入れてません)として使っているetchにHyper Estraierを入れてわりと経つのですが、 pdfの日本語がインデックスに入っていないことに気付きました。 いろいろ調べて、ひとまずpdftotextが日本語を変換してくれてないのだ、と分かりました。 degas@debian:~$ pdftotext 日本語入りのpdf.pdf Error: Unknown character collection 'Adobe-Japan1' : Error: Unknown character collection 'Adobe-Japan1' ってな状況ですorz。xpdfはapt-getでhyperestraierをインストールするときに 推奨パッケージでxpdf-utilsを入れたので、大丈夫だと思っているのですが…。 念のためいまxpdfも入れてみましたが、同じエラーが出ます。 指針が有ればお願いしますm(_ _)m。
152 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/02(木) 14:23:09 ] Unknown character collection 'Adobe-Japan1' でググっても解決しないの? xpdf-japanese とやらを入れてる?
153 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/02(木) 14:29:43 ] ttp://www.foolabs.com/xpdf/download.html にある xpdf-japanese.tar.gz は入れた?
154 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/02(木) 15:11:58 ] ありがとうございます。 xpdf-japaneseはapt-getだと入らないのですよ…何でか分からないけど。
155 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/02(木) 15:19:29 ] そうですか。私にも何でか分かりません。
156 名前:151,153 mailto:sage [2008/10/02(木) 16:59:34 ] 解決しました。 xpdf-commonをapt-getでインストール、 cmap-adobe-japan1を取ってきてdpkgでインストール、 さらに/etc/xpdf/xpdfrcに include /etc/xpdf/xpdfrc-japanese.dpkg-new を書き加えればOKでした。 apt-getしか使えない男にお付き合いいただきありがとうございました。 お邪魔しました。
157 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/02(木) 17:05:15 ] ファイルを指定ディレクトリに置くだけだからapt-getイラネですよ。 DLしてtar xvfzしてREADMEだかINSTALLだか読めば分かると思う。
158 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/20(月) 15:21:23 ] tokyo estraierはここ以外で存在が話題になっていないんだけど 商用、あるいは公用の検索システムに勝手に使っちゃっていいんだろうか
159 名前:fumiyas [2008/10/27(月) 11:44:33 ] >>158 GPL と LGPL だし、問題ないでしょ。(たぶん :-) で、tokyo estraier どんなくらい試しました?
160 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/28(火) 18:27:33 ] >>159 >>158 じゃないけれど 普通にインデックスして普通に検索出来て普通に遊べて… これ、本当にインデックス時にTokyoCabinet使ってるのか不安になってきた
161 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/28(火) 18:40:31 ] データベースファイルの先頭バイトを覗いたら、[depot]って書かれてたりして
162 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/28(火) 21:50:58 ] >>161 う…_attrフォルダの中に「depot」ファイルがあるんだが
163 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/29(水) 10:07:46 ] 過去のバージョンと、Windows版のバイナリパッケージのページが落ちてるようなんだが。 UNIX板でアレだけどWin版の1.4.10持ってる人だれか上げてくれないかな…
164 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/29(水) 11:16:02 ] >>163 ttp://www2.uploda.org/uporg1754116.zip.html
165 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/29(水) 11:38:31 ] ディレクトリ一覧がデフォルトでは表示されなくなっただけなので 正確なファイル名が分かるとか、検索サイト等のキャッシュから手繰るとかで 落とせますよ。 ttp://hyperestraier.sourceforge.net/win/hyperestraier-1.4.10-win32.zip
166 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/29(水) 11:47:50 ] >>164 >>165 ディレクトリ一覧が表示されないだけだったのか。 ありがとう、助かりました。 お早いレスで俺涙目。
167 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/29(水) 18:47:28 ] Tokyo Estraierってどこにあるの?
168 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/30(木) 00:44:04 ] Windows環境でMecabを使いたいんですけど、可能ですか? 試した手順は、下記になります。 前提:WindowsXP、Cygwin環境 1、Mecab0.97と辞書のビルド 2、下記サイトを参考にし、qdbmとHyperEstraierのビルド ttp://www.shinonon.dyndns.org/diary/20071212.html HyperEstraierのビルドで--enable-mecabとしましたが、 その後のmakeでエラーとなります。
169 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/10/30(木) 14:21:13 ] >>167 ttp://hyperestraier.sourceforge.net/past/tokyoestraier-0.0.1.tar.gz ベースはHyper Estraier1.4.13 ソース見ると確かにTokyo Cabinetのincludeが入ってるんだが 実際に使われてるのかちと分からん QDBMも一緒に入ってないとエラー出るし ところで100万以上の文書を対象にインデックス作ると想像以上に遅いんだな… 1秒以下でパパッと結果が表示されるのは何件くらいが限度なんだろ
170 名前:fumiyas [2008/10/30(木) 18:22:25 ] TE コンパイルしてみた。`estcmd create db` だけ試した。 >>162 _idx 以外は QDBM を使ってるんで、_idx だけ見てごらん。 $ /usr/local/tokyoestraier/bin/estcmd crete db $ strings db/_idx/0001 ToKyO CaBiNeT 1.0:510 >>169 HE ソースとの diff とってみればわかるけど、一部のみ TC, ほかは QDBM。 ちなみに、`estcmd repair db` 時に _idx 以下は何もしないようになっている。 いいのか? いまのところ DB の構成を把握していないのでよくわからんが、 _idx が転置インデックス? ほかは? 知っている人、教えて…。 あと 100万以上の文書は試したことないんでアレなんだけど、 参考までにハードウェアの構成とか、estcmd create に 指定したオプション (estcmd を使っているなら。-xh 付けたの?)、 estmaster の _conf の設定等を教えてもらえると嬉しいです。
171 名前:名無しさん@お腹いっぱい。 [2008/12/08(月) 22:30:47 ] Hyper Estraierについて質問させてください。 Windowsで一回動かしたんですが、cygwinのパスで結果が表示されてしまうので、 うれしくないと思い、VMware2.5.1 build-126130 でUbuntu7.10を動かし、 そちらでestcmd gather を走らせました。Hyper Estraier1.4.9です。 Apacheはxamppを使いました。localhost/xampp/ は正常に表示されてると 思います。1.6.8aと出ています。あとphp5もスタートさせました。 でも、localhost/cgi-bin/estseek.cgi にアクセスすると、 Error: the configration file is misshing.とか出ます。 /opt/lampp/cgi-bin/estseek.cgi と同じフォルダに estseek.confは置いてます。 estcmd search casket 'ほげほげ' とかはちゃんとHITして結果が出てきます。 Errorが出てくる原因は何でしょうか。分かる方教えてください。
172 名前:171 mailto:sage [2008/12/09(火) 22:34:48 ] 自己レスです。よく分かりませんが estseek.conf estseek.tmpl estseek.top をchmod 744 したら動きました。失礼しました。
173 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/12(金) 00:50:50 ] >>53 すげー遅レス失礼。 HEの情報収集中→WikipediaのHEのエントリ→ >>53 の製品ページ って感じでその製品を知ったんだけど、GPLって書いてるくせに ソースコードダウンロードのリンクをたどってもソースコードがないんだけど、 これってどうなの? ttp://www.osstech.co.jp/product/chimera#%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89 つーか、会社概要見たけど、中の人がこのスレにいるのか。
174 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/12(金) 01:21:53 ] >>173 別に公開する必要は無い。 会社側からするとChimera Searchのバイナリとあわせてソースコードを提供する、 もしくはバイナリにソースコードの入手方法が明記された文書を添えておけばいい。 GPLv2での3-aと3-bね。
175 名前:173 mailto:sage [2008/12/12(金) 19:40:13 ] >>174 そうなんだ。どうもありがと。 Webページ見たけど個人お断りみたいな事書いてあったな。 関係ないけどGPL v2日本語訳の原文へのリンクが間違ってるね(v3にリンクされてる)。
176 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/12(金) 20:12:53 ] GPLはちゃんと読んでない人は世間の評判から誤解しやすいライセンスだから、 批判するんだったらちゃんと読んで理解してからにした方がいい。
177 名前:名無しさん@お腹いっぱい。 mailto:sage [2008/12/16(火) 17:55:27 ] >>173 これ読むといいよ。 web.archive.org/web/20041024013051/http://home.catv.ne.jp/pp/ginoue/memo/gpl.html
178 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/01(日) 02:03:25 ] >>47 にも書いてるけど,属性検索ができない. Wikipediaの全文検索デモページで試してみたけど効果なし...
179 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/08(日) 23:47:35 ] 疑似ノードマスタって、認証なしなの? 通常のノードマスタみたいにユーザとパスを設定できないの?
180 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/09(月) 01:33:22 ] estcmd outで文書の一括削除はできますか?
181 名前:名無しさん@お腹いっぱい。 [2009/02/13(金) 23:47:32 ] Windows版のバイナリ落としてindexだけはコマンドで作ってみたんですが JavaのAPI使ってファイル検索や全文検索を行うサンプルコードが載って いるサイトとかってないですかね? web環境ないのでSwingから直で操作したいのですがAPIの使い方がよくわかりません・・ 初歩的な質問ですいません。
182 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/23(月) 06:47:28 ] Unix板なのに申し訳ないのですが、Ubuntu Intrepid64bit版を使っています。 mecabを組み込みたかったのでソースからビルドしましたが、ライブラリとしてregexp.hだけ認識されないのでビルドできません。 32bitの時も同様だったのですが、こちらはネットでダウンロードしたライブラリをつっこんでインストール迄無事に成功しました。 aptitude search lib | grep -i regexp などで見つけたものを次々インストールしてみましたが全くお手上げです。 必要なライブラリについてご存知の方いませんか?
183 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/23(月) 09:04:47 ] >>182 やったの去年だからよく覚えてないけど ふつーのUbuntuならソフトウェアの一覧に普通に入っていた気がする
184 名前:名無しさん@お腹いっぱい。 mailto:sage [2009/02/23(月) 17:49:55 ] aptで入るね
185 名前:182 mailto:sage [2009/02/24(火) 06:22:35 ] >>183-184 レス有難うございます、結局手順を忘れていただけで、32bit版でと同様の事をすればいいだけですんなりビルド成功。 aptでlibc-dev(これですよね?)を入れてもlibregex.aがないので、arglist.com/regex/ からregex3.8a.tar.gzを落してビルドし~/lib ~/includeに放り込む。 似たような事で困っている方は試してみて下さい。 どうもお騒がせしました。