最近あまりにもスパムが酷いので、bsfilter を入れてみた。
これまでは、spamassasin を使っていたのだが、日本語の取り扱いがイマイチな気がしたので、取り替えてみたのだ。とりあえず今は tokenizer に kakasi を指定してやってみている。不思議と今日はあまりスパムが来ない(まぁ、SPFでフィルターしてるからな)ので、まだ4件しかスパムがきていない。今のところ100%正確に振り分けているが、もちろん統計的には有意ではない:-(
インストールは、dselect でやって、Maildrop の .mailfilter に、
xfilter “/usr/bin/bsfilter –pipe –insert-flag –insert-probability”
if (/^X-Spam-Probability: *1..*/:h || /^X-Spam-Probability: *0.[89].*/)
{
to “./Maildir/.Archive.spam09/”
}
としてみている。
こちらを参考にして、~/.bsfilter/bsfilter.conf に
jtokenizer kakasi
spam-cutoff 0.6
としているから、本当は、
xfilter "/usr/bin/bsfilter --pipe --insert-flag --insert-probability" if (/^X-Spam-Flag: Yes/:h) { to Maildir/.Archive.spam09 }
見たいなほうが良いのかな?
まぁいいや。これからが楽しみだ。
@_Nat Zoneをもっと見る
購読すると最新の投稿がメールで送信されます。
11/04 12:00 現在、昨晩22時からで:
受信メール数:73
Spam数:54
Spamとして検知:51 = False Negative : 3
Flase Positive : 0
False Negative はいずれも英文Spamで、
昨日学習させたデータの中には英文Spamが
入っていなかったためにおきていると思われる。
kakasi で tokenize しているので、英文で
どこまで有効になるかわからないが、順次
学習させてゆく。その後、tokenizer を変えてみる
運用もしても良い。