機械学習

SVMの性能を最大限に引き出す

SVMの性能を引き出すには,スケーリングとパラメータチューニングが非常に重要.これだけで精度10%くらいあがりました. スケーリング 広い範囲をとる特徴量に引きずられないようにする.LIBSVMでは,何も考えなくても以下のコマンド1発でやってくれる. svm…

pythonで決定木を使う

pythonで決定木を使う機会があり,scikit-learnというライブラリを使ったのだが,日本語リファレンスが皆無だったのでまとめておく. scikit-learnのインストール easy_install -U scikit-learnこれでおk.ちなみに,scikit-learnというだけあって,scipyが…

SVMなどの機械学習について

研究で機械学習(主にSVM)を使っていて,重要だと思った項目をまとめておく. 不均衡データ問題(imbalanced data) 識別器の訓練データに大きなクラスの偏りがある場合,大きいクラスに流されてしまう問題が生じる.例えば,10,000件の訓練データが(a)9,000件…