1 名前:名無しさん@お腹いっぱい。 [2005/08/23(火) 13:55:32 .net] apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者 SpamAssassin これでSPAM業者を失業に追い込もう....... とまでには、まだまだ遠い道のりだよ(w 学習しろ!!学習しろ!!学習しろ!! sa-learn --spam --mbox /home/hiroyuki/mail/spam ハムをスパムと間違えないで、一生のお願いだから。 スパム業者の荒らしはスルーってことで。 おまいら、まったりとお願いします。 本家 ttp://spamassassin.apache.org/ 2005-06-06: SpamAssassin 3.0.4 released! キーワード local.cf user_prefs spamassassin ベイズ推定 ベイジアンフィルタ ホワイトリスト AWL bayes_journal auto-whitelist
49 名前:名無しさん@お腹いっぱい。 [2005/10/04(火) 09:24:19 .net] 環境 redhat9 sendmail8.12.8-4 milter0.3.0-1.0 spamassassin3.10 質問させてください。 spamassassinでベイジアンフィルタを利用しています。 このベイジアンフィルタなのですが、サーバ単位でspam、hamメールを学習させていますが、 各ユーザ毎にham、spamの基準が違い(mailinglist等)、サーバ単位でなく、 各ユーザ単位でベイジアンフィルタの学習を行わせたいと考えています。 ユーザ毎にベイジアンフィルタのデータベースをbayes_seen、bayes_toksをもって、 自分の趣向に合わせてベイジアンフィルタに学習させるイメージです。 user_prefsがユーザ毎に設定できますが、これはヘッダや本文の条件、 ルールを設定できるだけででした。 ご存知の方がいらっしゃいましたら教えて下さい。 よろしく御願いします。
50 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/10/04(火) 17:22:15 .net] 各ユーザが.forwardからspamassassinを呼び出せば済む。 RedHatだとsendmailのMDAがprocmailだったりしそうだから、 .procmailrcに :0fw: spamassassin.lock * < 256000 |/usr/bin/spamc と書くとか。 しっかし、procmailrcはわけわかんね〜。はよmaildropに移行したい…
51 名前:名無しさん@お腹いっぱい。 [2005/10/05(水) 13:36:05 .net] >>50 49です。ありがとうございます。 設定してみます。
52 名前:名無しさん@お腹いっぱい。 [2005/10/26(水) 08:49:34 .net] procmailでspamassassinの設定する方法はあちらこちらにかいてあるけど qmailでの設定ってほとんど見当たらない。 ユーザごとにいちいち.qmailを編集するのもスマートじゃないし qmail-scannerあたりを書き直せばいいんだろうけど・・・ と思ってたら、vpopmailでの運用をしてたので、案外簡単にできた。
53 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/10/26(水) 20:11:30 .net] >>52 書き直すまでもなく、使えると思うが。 ttp://qmail-scanner.sourceforge.net/
54 名前:名無しさん@お腹いっぱい。 [2005/10/28(金) 07:41:11 .net] なるほど!情報ありがとう。 先にSpamAssassinいれといてQmail-Scannerをインストールすれば 良いってことですね。 ところで、Qmail−Scannerにバグがあるみたいです。 添付ファイルを処理する際にカッコがあると、途中でエラーをおこし、 メールが返送されてしまうのです。 一応、修正を行ってみたのですが、旨くいくかどうかは未確認なので 確認してから報告したいのですが、なんかML加入しないとダメみたいですね。 チョットメンドクサイ・・・
55 名前:名無しさん@お腹いっぱい。 [2005/10/28(金) 08:02:46 .net] procmailで$HOME/.procmailrcを読みに行かなくすることってできるんでしょうか? /etc/procmailrcだけで制御したいのですが、ググって調べてると、 「$HOME/.procmailrcが無いときは/etc/procmailrcが読まれる」 ってなことが書かれてて…。
56 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/10/29(土) 07:14:48 .net] >添付ファイルを処理する際にカッコがあると はて、どゆこと?>>54
57 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/10/29(土) 13:55:36 .net] >>55 ユーザプロセスでは ~/.procmailrc を真っ先に読みに行くってのは ソースレベルでの仕様だから、それが嫌ならソースを書き換えてビルドするか、 さもなくば全ユーザのホームディレクトリ上で ln -s /etc/procmailrc ~/.procmailrc するしかないんじゃない?
58 名前:名無しさん@お腹いっぱい。 [2005/10/30(日) 11:42:12 .net] >>56 わかりにくい表現ですいません。 ログにこんなエラーがありました。 Unmatched ( in regex; marked by <-- HERE in m/^ESC$bfc dj8&5f7w2hESC( <-- HERE b.doc$/ at /var/qmail/bin/qmail-scanner-queue.pl line 22 12, <STDIN> line 3221. ESCの部分は端末上反転していたので、実際は\\と思います。 添付されていたのは日本語の入ったPDFとワード書類です。 で、qmail-scanner-queue.plの該当行のソースがこれ。 push(@uufile_list, $uufile) if(!grep(/^$uufile$/,@uufile_list)); 多分$uufileが正しくクオートされておらず、添付ファイル内の「(」が、 正規表現の一部とみなされているようです。 この推測が当たっていれば$uufile --> \Q$uufile\E とすればOKなはずです。(未確認) で、一応は自己解決をみたわけですが、SpamAssassinのコミュニティに報告するのが メンドクサイ仕組みなので、なんかどうでもいいやっていう気になってます。
59 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/10/30(日) 12:15:53 .net] >>58 添付ファイル名やその中身に括弧文字が 入っていて起こる鰓てのは初耳す。 qmail-scannerの versionと、そのメールを作った ソフトは何ですか(Winのoutlookとか thuderbirdとか、 **xのmewとか。。。?) お話の感じだと、これ、SAの問題ではないと思う。
60 名前:名無しさん@お腹いっぱい。 [2005/10/30(日) 12:59:39 .net] >>59 qmail-scanner-queue.pl 1.25です。 メールを作ったソフトの方は折り返し戻っていってしまったので、 すぐには確認できませんが、送信者からの以前の話からすると Macのソフトらしいです。たぶんEudora? それはともかく、該当行の変数名からしてuuencodeされたファイルと思うのですが、 それが正しければSAの問題じゃないでしょうか・・・
61 名前:59 mailto:sage [2005/10/30(日) 14:07:55 .net] >>60 エラーが起きてるのは、qmail-scanner-queue.pl の、sub check_and_grab_attachments の中ですよね。 uuencode/binhexしたファイル名をいろいろいじったやつ を添付して試してみてるんだけど、症状再現しないす。 うちも qmail-scanner 1.2.5、んで、SA 3.1。
62 名前:名無しさん@お腹いっぱい。 [2005/10/31(月) 02:56:13 .net] >>61 あ・・・qmail-scannerの問題であってSAの問題じゃないのかな? 症状の再現性については、良くわからないけど 他の添付ファイルでいままで問題が起こったことがないので、 特殊な例かもしれません。 問題を起こす添付ファイルは手元に届いていないし、 届いたとしてもそのまま丸投げするわけに行かないので、 もうちょっと掘り下げてみます。
63 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/04(金) 07:10:06 .net] bsfilter と共用してる人いる? それって意味ある? (片方だけ使うよりも、spam と判断する 確率あがる?) bsfilter、spamassassin はどちらも、 ベイズ推定に基づいてるので、あまり意味がないように感じてるんだけど、効果があるか気になった。
64 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/04(金) 08:59:06 .net] >>63 ほとんど意味無いと思う。 SpamAssassinのベイジアンフィルタだけを使わないで、bsfilterを多段にかける とかだったらまだわかるが。
65 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/04(金) 10:31:57 .net] >>64 SA のベイジアンってそのまま使うと日本語考慮してくれなくね?
66 名前:64 mailto:sage [2005/11/04(金) 10:48:57 .net] >>65 あーなるほど。 bsfilterって最初から日本語化されてたっけ? bsfilterをnkfとkakasiで日本語化して使うなら、SpamAssassinも そうやって使うというのはどうだろ。 ちなみに、ベイジアンフィルタ使わなくても、設定でほとんど排除出来るよ。>>63
67 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/04(金) 13:28:25 .net] 中国語やらのspamもとんでくるしcharsetの指定とかがめちゃくちゃなのも多いので、 日本語だけ対応していても仕方がない。 実際spamassassinだけで日本語も中国語もほぼ全て弾けてるよ(カスタムルール有)。 たまに英語のspamが抜けてくるけど、一日一通以下(受け取るSPAMは100超/日)。 false alarmは登録したサイトの広告的なメールマガジンみたいなものだけ経験がある。 これは受け取り望んでることがわからなければどこからどうみてもSPAMだよなあ、 と思ったので学習は諦めてwhitelistに入れた。
68 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/07(月) 17:29:00 .net] sa-learn --hamとか--spamって何を学習させているんですか? メールの内容を見ているの?ヘッダ部分だけ?
69 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/07(月) 17:56:12 .net] >>68 全部
70 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/08(火) 12:30:48 .net] >>69 ありがと。 でもその割には、同じ内容のスパムが、何度も来るんだよね。
71 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/08(火) 13:03:17 .net] >>70 そりゃBAYES_99になっても、他のスコアが低ければ通っちゃう罠
72 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/11(金) 20:55:45 .net] >>63 全く無駄ではないと思う。 ごく稀にSAが取りこぼすspamを捕捉するときがある。 多少の取りこぼしが気にならないなら、入れる必要はないけど。 精度はDNSBLやRazor2とか使えて自動学習してくれる分、SAの方に 分があるように思う。 あと、bsfilterはhamの学習がうまくいかないことがたまにある。
73 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/12(土) 08:09:09 .net] false alarmの可能性も同様に増えるから、そのリスクの見積もりと SAのみの場合にどれだけ不満かの兼ね合いだろうね。
74 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/17(木) 12:01:58 .net] >>71 そなのですか?あちゃあ。 BAYES_99は絶対にアウトにする方法ってありますか? これするとまずい事もあるのですかね。
75 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/17(木) 12:56:53 .net] >>74 BAYES_99 のスコアをやたら大きな値にしておけばいいんじゃない? まずい事っていうか、ベイズを 100% 信じる!という運用ポリシーだと 自分を納得さることが出来るの? (俺には出来ない) いろんなスコアの積み重ねで spam 判定を行うという仕組みは良く 出来てて、納得して利用しているけどなあ。
76 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/29(火) 16:04:35 .net] >>74 推測が必要ない確定的なものはprocmailで捨てれば?
77 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/30(水) 14:40:57 .net] >>75-76 サンクス!! (もともと>>68 です) sa-learn --spamで学習させるという事は絶対にスパム!!wということですよね。 つまり人為的に学習させているわけだけど、BAYES_99のスコアをめちゃ高くしておくと、自動学習でのエラー、つまりハムをスパムと判定してしまったときに、困りますよね。 これはsa-learn --hamで修正するのでしょうけど。あれ?この場合、どっちが勝つんだろ? 仕組みが複雑すぎる..................
78 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/30(水) 17:30:48 .net] 頭の程度との比較の問題だなw > 仕組みが複雑
79 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/11/30(水) 17:37:11 .net] >>77 ベイジアンフィルターの原理わかってる? sa-learn --hamでそのメールをhamと学習させても、それ以前の 学習結果によって同じメールがBAYS_99と判別されることだってあるぞ。 あと、スコアリングについてまるで理解できてなさげだな。
80 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/02(金) 18:36:49 .net] 自動起動のサービスを止めることはできますか?
81 名前:名無しさん@お腹いっぱい。 mailto:sage [2005/12/02(金) 18:38:15 .net] え?
82 名前:名無しさん@お腹いっぱい。 [2005/12/08(木) 13:39:52 .net] >>80 具体的に述べよ。でも、たぶんできるよwww
83 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/10(火) 11:52:34 .net] 各ユーザーがベイジアン学習させるタイミングっていつ? レン鯖で使っているんだけど、なかなか学習効果でないんですよ。
84 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/10(火) 16:01:57 .net] >>83 設定による
85 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/10(火) 20:20:03 .net] razor2 ほかと組み合わせないと、思ったほどの効果はすぐにでない。
86 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/17(火) 12:46:17 .net] sa-learn --spamの学習は、各自のspamボックスを sa-learn --spam --mbox /home/*/mail/spam でなめさせるから良いと思うけど、 間違ってspamに入ってしまったのを、 訂正学習させるのはおまいらどうやってます? sa-learn --ham --mbox /home/*/mail/notspam とか訂正ボックス作れば良いのかな。
87 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/17(火) 15:14:23 .net] wanderlust任せ。
88 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/18(水) 12:34:30 .net] autolearn=spam が付いてる奴は既に学習済み、再学習する必要なし。 autolearn=no のみ sa-learn すべし。
89 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/24(火) 20:53:03 .net] なんか学習させ過ぎるとある時点を境にspam検出率が物凄く落ちるような・・・
90 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/01/26(木) 13:14:55 .net] いつも参考にしていたサイトがディスク障害でデータ消失だって。 ttp://ssss.jp/~trombik/email/spamassassin.html サルベージしていった方がいいかなぁ。
91 名前:名無しさん@お腹いっぱい。 [2006/02/04(土) 19:03:29 .net] qmail/vpopmail SpamAssassin3.1.0 qmail-scanner1.25 の環境です。 存在しないメールアドレス宛に着た場合、 ~vpopmail/domain/example.jp/user1/auto-whitelist ~vpopmail/domain/example.jp/user1/auto-whitelist.mutex が自動生成されてしまいます。 その為、ユーザーディレクトリが訳のわからない状況になってしまい、 このファイルの自動生成を停止させることはできますか? 検索してみたら、生成先のパスを変更する解説は多かったんですが、 自動生成停止は見つからなかったので、お願いします。
92 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/02/16(木) 08:34:09 .net] SPAM判定されたものの行き先フォルダをscoreごとに分けてみた。 5-10: 1 10-20: 3 20-: 10 くらいの割合。 サブジェクトを眺めて誤判定がないか確認するのが楽になった。 scoreに応じて色が変わる(段階的または連続的に)というのも面白いと思ったが wanderlustでそこまでするのは大変そうなので見送り。
93 名前:名無しさん@お腹いっぱい。 [2006/03/11(土) 11:45:40 .net] sendmail+spamassassin+milter で構築しておりやす 外部MTAへ送信するときもX-Flagが付加されているようで 自分自身が送信したメールがX-Spam-Flag:YESって笑えないことも 対策はないでしょうか?
94 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/11(土) 11:56:46 .net] 特定ドメインはチェックしないという設定が逢ったような気が。
95 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/11(土) 12:50:52 .net] milter-spamc を使っていたわけで spamass-milter の方がよさげかな 試してみます
96 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/23(木) 14:03:58 .net] Spamassasin+Postfixで2年ぐらい前に利用してたのですが、 当時、1時間に2-3000通ぐらいしかメールできなくてしぶしぶ外した経験があります。 最近はハードのスペックも上がってきたし、また検討しているのだけど、 みなさんの負荷具合ってどうなんですかね。 実際運用してる方どうですか?どれぐらいのペースでメールの送受信できます? なんとなく平均これぐらいは飛ぶよ、ってのがわかればいいんですけど。
97 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/23(木) 14:57:00 .net] 当時使ってたマシンのスペックは? それが無いと比較できないよ
98 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/23(木) 20:31:24 .net] >>96 以前古い処理能力の低い機械をメールゲートウェイにしていた頃は 並列度を上げるより下げた方が実質の処理能力があがったことはある
99 名前:96 mailto:sage [2006/03/23(木) 22:22:27 .net] >>97-98 当時はCeleronの600MHzぐらいのやつで、他のアプリもごりごり動いてたw まぁ今回はP4-3GHzぐらいのやつで専用のメールゲートウェイにしようかと思うのだが、 メルマガが配信されることがあるサーバなので、できれば懐は広くしておきたいわけよ。 1時間で数万通とかは余裕?平均がどんなもんかしらないのでアレだけど
100 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/24(金) 00:20:50 .net] > Celeronの600MHz って全然2年前じゃないじゃん、5年以上前じゃない? まあ少なくともパフォーマンスの良いシステムはいくらでも有るわけだから 心配ならそれにしとけば問題ないと思うね 取りあえず2chで使ってるくらいのにしといたら
101 名前:96 mailto:sage [2006/03/24(金) 12:53:03 .net] >>100 当時、そのスペック使ってた会社だったのでw あと、何通送れるとかは検証するしかないのか。ちと面倒だな。 最後にSpamassasinのパフォーマンスに関して参考になるサイトがあれば教えて下さいです。 パフォーマンスが落ちるとかなんとか書いているサイトはあるけど具体的な数字で検証しているところが見つからない。
102 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/24(金) 17:04:43 .net] ま、やってみたら、 結局マシンパワーの問題だから最近の高性能マシンならまず問題起きないよ 逆にそれで問題起こるならスンゴイ大量のユーザ抱えてるっと事だからもっと根本から見直した方が良い メールGWを複数設置して並列処理するとかね、 ちなみに1時間に2〜3000通って商売はSPAM屋かい?
103 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/24(金) 17:48:04 .net] >>102 SPAM屋だったら単位時間あたり送付量にゼロの数が二つくらい足らないと思われ
104 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/03/24(金) 18:20:00 .net] 本物のSPAM屋 乙!
105 名前:名無しさん@お腹いっぱい。 [2006/03/26(日) 16:08:02 .net] 3.1.1あげ
106 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/03(月) 16:05:40 .net] $USER_HOME/.spamassassin/user_prefs: 各ユーザーがWebベースで、このファイルをメンテできるツールありますでしょうか。
107 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/04(火) 01:05:04 .net] user_prefsをMySQLで管理しているのであれば、すぐにいくつか見つかると思う。 俺はSquirrelmailのプラグインを使っている。 www.squirrelmail.org/plugin_view.php?id=167
108 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/04(火) 11:20:19 .net] >>107 ありがとうございました。チャレンジしてみます。 他のツールご利用の方いましたら、よろしければ使用感など教えてください。
109 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/04(火) 13:17:58 .net] >>106 List from SA ttp://wiki.apache.org/spamassassin/WebUserInterfaces →phpsaadmin ttp://www.misak.dk/blog/ →WebUserPrefs ttp://sourceforge.net/projects/webuserprefs/
110 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/04(火) 15:59:54 .net] 06.3.18 SpamAssassinユーザー会発足 ttp://www.spamassassin.jp/
111 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/04/30(日) 08:10:26 .net] これってサーバーに入ってなくてもユーザーがホームディレクトリにインストールしてつかえるの?
112 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/03(水) 11:35:52 .net] >>111 svn.apache.org/repos/asf/spamassassin/branches/3.1/INSTALL
113 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/15(月) 11:28:45 .net] cronで、定期的に sa-learn --spam /home/*/Maildir/.Spam/cur とやっているんですが、最新の3.1.1にしてからメールが存在しない時に archive-iterator: readdir found no mail in '/home/hogehoge/Maildir/.Spam/cur' directory というエラーを吐くようになりました。このエラーを出さなくする方法ってないんでしょうか? 面倒だけど、メールが無かったら実行しないようにするスクリプトを組まないといけないのかなぁ。
114 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/05/17(水) 01:22:09 .net] >>113 そりゃエラーじゃない、「読み込むべき対象がない」と報告したに過ぎない。 >メールが無かったら実行しないようにするスクリプト それが本来の解決方法。 更に言うなら>>88 参照。
115 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/06/05(月) 15:25:24 .net] mysqlを設置したのですが、AWLはメールアドレスが順位付けられて 見ていて楽しいです。でも、ユーザー毎に設定されるのが無駄な気が。 デフォーで全ユーザー共通のが便利じゃないかなあ。
116 名前:のくす牧場 mailto:sage [2006/07/09(日) 22:26:05 .net] spamassasinは、スペースで単語を区切っているっぽいので、 日本語の場合はkakasiで分かち書きにして学習させるパッチを作ってみました。 せっかくなので興味のある人は使ってみてください。 sea-mew.jp/nox/data/linux/spamassassin.html
117 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/09(日) 23:29:01 .net] 自分のやってることが車輪の再発明でないかまず確認してもよかったのではないかと。 いや、努力を否定するつもりはないんだけど……。
118 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/09(日) 23:43:16 .net] お、使ってみる。
119 名前:116 mailto:sage [2006/07/10(月) 00:01:24 .net] >>117 もちろん、こんなことだれかが考えていると思って探したら、 ITmediaに記事が出ていたんだけども、 そのサイトに行ってみたけど、 どこから落として良いのかわからなかったのですよ。。。 と思ったら、 mm.apache.jp/pipermail/spamassassin-jp/2006-February/000041.html が見つかりました。
120 名前:116 [2006/07/10(月) 00:29:24 .net] www.emaillab.org/spamassassin/ ここに新しい物がありました。こちらを使う方が良さそうです。
121 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/10(月) 12:02:32 .net] >>116 SpamAssassinほどメジャーなツールで、意外にずっと分かち書き対応パッチ無かったよね。 自分もずっと探してたんだけど、ずっと見つけられなかったもの。 もう一歩遅かった。
122 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/10(月) 20:23:50 .net] そんなの必要? うちだとそんなことしなくても 日本語のSPAMはほぼ完全に蹴ってくれるけど。 パラメータやルールはカスタマイズしてるものの。
123 名前:名無しさん@お腹いっぱい。 [2006/07/10(月) 23:28:01 .net] 123
124 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/11(火) 00:25:57 .net] >>122 ベイジアンフィルタの性能は低いよ。原理的に考えてもそうだよね。分かち書きしてないんだから。 だからよく誤検出の元になる。蹴らないんじゃなくて蹴りすぎる。
125 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/11(火) 11:01:59 .net] うちで蹴りすぎる例はほとんどない。 電気店とかの商売メルマガがたまに蹴られるくらいで、 自分で見てもこれはまあ仕方がない、と思ってしまうようなもの。 2、3回くらいhamとして登録すれば問題なくなるけど、もっとも こういうのはspamassassinに通すより先に振り分けてしまうからな。
126 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/13(木) 00:45:22 .net] >>122 そんなパラメータの調整なんて必要? うちは、日本語化パッチを当てるだけで、完全に蹴ってくれるよ。 そもそも、学習が自動で、調整が要らないのがベイズフィルタの利点では。 >うちで蹴りすぎる例はほとんどない。 蹴っているメールをチェックしなければいけないのであれば、 蹴る意味がないのでは? (蹴っているんじゃなくて、振り分けているだけでは?) もちろん、
127 名前:サんなの人それぞれですけどね。 導入も我慢も諦めも、コストですから。 しかし、このパッチの導入コストは、メリットに十分見合うと思うけどね。 [] [ここ壊れてます]
128 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/13(木) 13:48:55 .net] >>126 単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を ルールに書いてるので。 ベイズフィルタだけを信用するようなスコア設定にもしていないしね。 spamassassinの導入はportsに頼ってるのでパッチはコストが高いです。
129 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/13(木) 21:54:23 .net] >>127 > ベイスフィルタでは原理的に捉えられない特徴を であれば、そのフィルタとベイジアンフィルタの効果は独立事象になるわけだから ベイジアンフィルタの認識率を上げることは、false positiveを下げるために意味ある ことになると思うんだけど。 つまり、ベイジアンフィルタの性能を高めることは意味がある、ということね。 ただ、portsだとかaptだとか使ってる場合、パッチだと導入障壁が高いというのは理解できる。
130 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/14(金) 17:59:35 .net] portsに日本語化patchをオプションで適用できようにsend-prすりゃええやん。
131 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/15(土) 13:56:50 .net] p5-SpamAssassinってちょくちょくアップデートされるんで パッチがすばやく追随してくれる保証があってかつporterが日本人じゃないと 無理じゃない? japanese/ 以下にslave portを作るとかかな。 俺は使う気ないからやらないが。
132 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/15(土) 15:31:04 .net] >>127 おれ、Fedoraだからわからんけど、Portsって不便なんだな。 update調べてパッチ当ててrebuildする10行のスクリプト、cronで動かしてるよ。
133 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/16(日) 00:07:25 .net] コスト云々はそういう話じゃないと思うが。
134 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/16(日) 04:42:41 .net] >131 portsだとMakefile.localで1行でローカルなpatchは当てられる
135 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/16(日) 04:59:19 .net] >>133 なんだ。それはそれですげぇな。 >>126 は、そもそも > 単語の出現確率だけを扱うようなベイスフィルタでは原理的に捉えられない特徴を > ルールに書いてる と言っているので、日本語対応のレベルの話じゃなかったな。すまん。 ともあれ、>>120 のパッチすげー。
136 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/16(日) 05:07:42 .net] >>131 知らないのなら口を出さないほうがいいぞ。あまりにも的外れ。
137 名前:131 mailto:sage [2006/07/17(月) 00:48:40 .net] >>135 すまんかった。今は反省している。
138 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/07/17(月) 06:51:49 .net] なんか素直な奴だなww
139 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/08/09(水) 18:43:52 .net] # SpamAssassin 3.1.4に対応した日本語対応パッチ (案、その5)が発表されました (2006-7-29) # SpamAssassin 3.1.4がリリースされました (2006-7-27) from ttp://www.spamassassin.jp/
140 名前:名無しさん@お腹いっぱい。 [2006/09/12(火) 16:40:39 .net] 3.1.5 にしたら sa-learn が mbx 形式に対してエラーを吐くので調べてみた。 ArchiveIterator.pm の 1144行目。 --- ArchiveIterator.pm.orig Tue Sep 12 16:39:47 2006 +++ ArchiveIterator.pm Tue Sep 12 16:39:58 2006 @@ -1141,7 +1141,7 @@ } $self->bump_scan_progress(); - $info->{"$file.$offset"} = Mail::SpamAssassin::Util::receive_date($header); + $info->{$offset} = Mail::SpamAssassin::Util::receive_date($header); # go onto the next message seek(INPUT, $offset + $size, 0);
141 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/12(火) 20:39:30 .net] >>139 ここに書いてどうする気なんだよ……
142 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/12(火) 20:42:46 .net] 確かに…
143 名前:139 mailto:sage [2006/09/13(水) 01:27:34 .net] 誰かエロい人が project に言ってくれねーかなぁと・・・
144 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/09/13(水) 02:01:41 .net] >>142 お前さんの手柄なんだから自分でコミットすればいいじゃん
145 名前:名無しさん@お腹いっぱい。 [2006/09/13(水) 09:28:55 .net]
146 名前:ホームページ制作王は、世界の権威として名高いCOMDEXが 21世紀のワールドスタンダードに認定したWebパブリッシングアプリケーションである。 ホームページ制作王に不可能はない。 不可能があるとすれば、そこが人類の英知の限界点である。 21世紀、世界のWebはホームページ制作王を中心に回っていくのである。 にもかかわらず、ここ日本では、心ない風評のため、まだまだ普及に 遅れがみられる。 ホームページ制作王を普及させないかぎり、我が国のWebは、 世界の趨勢の後塵を拝するばかりである。 世界が認めた高性能!ホームページ制作王 http://pc8.2ch.net/test/read.cgi/hp/1106508682/ [] [ここ壊れてます]
147 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/07(土) 01:02:21 .net] 3.1.6出たね。
148 名前:名無しさん@お腹いっぱい。 [2006/10/09(月) 10:15:41 .net] ルールを書く際に日本語文字列を使う場合はJISコードに変換して, さらに,メタキャラクタをエスケープしなければなりませんが, 皆さんこの辺はどうやっているのでしょうか。 JISコードへの変換は次のようにやればいいと,ググって見つけたのですが, メタキャラクタのエスケープを実行してくれるような方法はないのでしょうか。 echo 'サンプル' | nkf -j | awk '{gsub(/\x1B[$(]B/,"");print}'
149 名前:名無しさん@お腹いっぱい。 mailto:sage [2006/10/10(火) 03:55:17 .net] つ tlec.linux.or.jp の「おりじなるこんてんつ」