2011-11-11から1日間の記事一覧

IIR15章まとめ

15章では、サポートベクターマシンとドキュメントにおける機械学習について説まとめている。 サポートベクターマシン(Support Vector Machines) サポートベクターマシン(SVM)は、データを2クラスに分類する高性能な線形識別アルゴリズムである。まず、訓練デ…

IIR14章まとめ

13章に続き14章もテキスト分類の話題だが、今回はベクトル空間も用いた手法について考える。 特徴選択 テキスト分類は、一般に高次元のドキュメント空間になる。しかしそこにはレアなタームも多く含まれており、それらは分類に誤りを生じさせるので、ノイズ…

IIR13章まとめ

13章は、テキスト分類とナイーブベイズについて。 テキスト分類 例えば、メールボックスの中からスパムをフィルタリングすることを考えよう。スパムと自動で判別し、フィルタリングするためには、どうすればよいか? また、言語による分類など、様々なところ…