2012-05-26から1日間の記事一覧

pythonで決定木を使う

pythonで決定木を使う機会があり,scikit-learnというライブラリを使ったのだが,日本語リファレンスが皆無だったのでまとめておく. scikit-learnのインストール easy_install -U scikit-learnこれでおk.ちなみに,scikit-learnというだけあって,scipyが…

CIKMに出せなかった

4月頃からの目標にしていたCIKMの締切に間に合わなかった.原因は,締切直前に見つかったプログラムのバグと,スケジュール管理不足.あと,最後は先生が何とかしてくれるやろという甘い考えが心の片隅にあった.先生にかなり謝られたけど悪いのは完全に自分…

AccuracyとPrecisionの違い

クラス判定などの精度には,AccuracyとPrecisionの2種類がある.Accuracyは,単純にどれだけ正解したかを表し,(TP + TN) / (TP + FP + TN + FN)となる.Precisionは,分類された各クラスのうち,どれだけ正しいのかを表し,positeve: TP / (TP + FP) negati…

SVMなどの機械学習について

研究で機械学習(主にSVM)を使っていて,重要だと思った項目をまとめておく. 不均衡データ問題(imbalanced data) 識別器の訓練データに大きなクラスの偏りがある場合,大きいクラスに流されてしまう問題が生じる.例えば,10,000件の訓練データが(a)9,000件…