satopoooonのブログ

自分向けの備忘録

機械学習

MNIST,CNNとかのお勉強

MNIST for expertで機械学習のお勉強中、 わからない単語を以下にメモします。 下の二つが参考文献です。 enakai00.hatenablog.com ujjwalkarn.me 畳み込み(Convolution) 画像から、特徴量を抽出すること、 (画像をシャープにしたり、ぼかしたり色々、フィル…

機械学習で競馬予想

面白い記事があったので、貼り付けます。 logmi.jp 著者のサイトです。 alphaimpact.jp 別の人の記事です。 stockedge.hatenablog.com

TensorFlowでimage recognition(Inception‐v3 転移学習) 

tensorflowのチュートリアルでImage recognitionがありますが、 これを使って自分で分類機を作成してみました。 参考サイトは以下です。 blog.ch3cooh.jp 今回、新たに自分が用意した画像で学習させますが、 このときに転移学習という技術を利用しています。…

kaggleに挑戦その5 過学習、学習不足の可視化

学習曲線 データセットに対してモデルが複雑すぎる場合、過学習する傾向があり汎化性能が落ちてしまう。 トレーニングデータをさらに集めると、過学習は抑えることができるが、データをさらに集めることはコストが非常に高い。 また、実はこれ以上データを集…

kaggleに挑戦その4 k分割交差検証(k-fold cross-validation)及びグリッドサーチ

k分割交差検証 前回までで、ランダムフォレストでモデル予測を実施しました。 今回は、k分割交差検証、グリッドサーチを用いてモデル性能の評価及びハイパーパラメータの修正を行います。 これにより、バイアス高、バリアンス高のバランスをとることができま…

kaggleに挑戦その3 ランダムフォレストを可視化

決定木の可視化 決定木の利点としては、意味解釈可能性があります。 ランダムフォレストで作成された決定木を可視化して、その意味を解釈しようと思います。scikit-learnには、決定木を.dotファイルとしてエクスポートする機能があります。 その前に、.dotフ…

kaggleに挑戦 その2 ランダムフォレスト

はじめに ランダムフォレストを使って、タイタニック号のデータをモデル化します。 ランダムフォレストって何? ランダムフォレストは、複数の決定木を組み合わせて、 各決定木における予想結果の多数決により、結果を得ます。アルゴリズムとしては、 1.ラン…

kaggleに挑戦 その1 決定木を使う

はじめに 機会学習のスキルを身に付けたく、kaggleに挑戦中です。 タイタニック号のデータを、ランダムフォレストでモデル化しました。 今回は、ランダムフォレストの基本となる決定木について書こうと思います。 簡単に自己紹介すると、僕は材料系メーカー…