統計学に最後にさわってからずいぶんたってしまったが、仕事でちょっとロジスティック回帰にさわる機会というのかな、スパムフィルタリングなんだが、が出たのでちょっとググった。
http://www.gen-info.osaka-u.ac.jp/testdocs/tomocom/cha.html#roji
が良くまとまっていてなかなか良い。しかも、ここは回帰をページ上ですることができる。
式の展開はこちらの方が見やすい。
http://aoki2.si.gunma-u.ac.jp/lecture/Survival/mul-log.html
スパムフィルタリングというと、ベイズが花盛りだが、ロジスティック回帰でも当然できるはず。ただ、説明変数をどのように取るかは問題ですね。その辺がノウハウなんだろうな。