機械学習
MNIST for expertで機械学習のお勉強中、 わからない単語を以下にメモします。 下の二つが参考文献です。 enakai00.hatenablog.com ujjwalkarn.me 畳み込み(Convolution) 画像から、特徴量を抽出すること、 (画像をシャープにしたり、ぼかしたり色々、フィル…
面白い記事があったので、貼り付けます。 logmi.jp 著者のサイトです。 alphaimpact.jp 別の人の記事です。 stockedge.hatenablog.com
tensorflowのチュートリアルでImage recognitionがありますが、 これを使って自分で分類機を作成してみました。 参考サイトは以下です。 blog.ch3cooh.jp 今回、新たに自分が用意した画像で学習させますが、 このときに転移学習という技術を利用しています。…
学習曲線 データセットに対してモデルが複雑すぎる場合、過学習する傾向があり汎化性能が落ちてしまう。 トレーニングデータをさらに集めると、過学習は抑えることができるが、データをさらに集めることはコストが非常に高い。 また、実はこれ以上データを集…
k分割交差検証 前回までで、ランダムフォレストでモデル予測を実施しました。 今回は、k分割交差検証、グリッドサーチを用いてモデル性能の評価及びハイパーパラメータの修正を行います。 これにより、バイアス高、バリアンス高のバランスをとることができま…
決定木の可視化 決定木の利点としては、意味解釈可能性があります。 ランダムフォレストで作成された決定木を可視化して、その意味を解釈しようと思います。scikit-learnには、決定木を.dotファイルとしてエクスポートする機能があります。 その前に、.dotフ…
はじめに ランダムフォレストを使って、タイタニック号のデータをモデル化します。 ランダムフォレストって何? ランダムフォレストは、複数の決定木を組み合わせて、 各決定木における予想結果の多数決により、結果を得ます。アルゴリズムとしては、 1.ラン…
はじめに 機会学習のスキルを身に付けたく、kaggleに挑戦中です。 タイタニック号のデータを、ランダムフォレストでモデル化しました。 今回は、ランダムフォレストの基本となる決定木について書こうと思います。 簡単に自己紹介すると、僕は材料系メーカー…