MNIST,CNNとかのお勉強
MNIST for expertで機械学習のお勉強中、
わからない単語を以下にメモします。
下の二つが参考文献です。
- 畳み込み(Convolution)
画像から、特徴量を抽出すること、
(画像をシャープにしたり、ぼかしたり色々、フィルタリングとも呼ぶ)
MNIST for expert のチュートリアルでは、
1枚の画像に対して、複数のフィルターをかませて、複数の特徴量を抽出している。
- プーリング
画素数を削減すること。
元画像は28×28ピクセル。
この画像に例えば2つのフィルターをかませると、
それぞれのフィルターに対応した画像が作成されるので、
2×28×28のデータ容量となる。
データ容量削減したいので、2×14×14と圧縮する。
また、
フィルタリング後の画像データ28×28は、14×14に圧縮されると、
特徴量がより際立つデータとなる。
(圧縮時、ノイズ成分がより圧縮されるイメージ?こっちの方がプーリングの主目的?)
MNIST for expert では、畳み込み、プーリングを2段構成にしています。
1段目の32枚のフィルターそれぞれに対して、
2段目のフィルターを1つかけ、足し合わせます。
続いて
1段目の32枚のフィルターそれぞれに対して、
2段目のフィルターを1つ(上のとは別のフィルター)をかけ、足し合わせます。
以下繰り返しです。
バックプロパゲーションにより、
このフィルタ、プーリングの仕方を最適にし、正解率を向上させます