satopoooonのブログ

自分向けの備忘録

MNIST,CNNとかのお勉強

MNIST for expertで機械学習のお勉強中、

わからない単語を以下にメモします。

下の二つが参考文献です。

enakai00.hatenablog.com

ujjwalkarn.me

 

  • 畳み込み(Convolution)

画像から、特徴量を抽出すること、

(画像をシャープにしたり、ぼかしたり色々、フィルタリングとも呼ぶ)

MNIST for expert のチュートリアルでは、

1枚の画像に対して、複数のフィルターをかませて、複数の特徴量を抽出している。

 

  • プーリング

素数を削減すること。

元画像は28×28ピクセル

この画像に例えば2つのフィルターをかませると、

それぞれのフィルターに対応した画像が作成されるので、

2×28×28のデータ容量となる。

データ容量削減したいので、2×14×14と圧縮する。

また、
フィルタリング後の画像データ28×28は、14×14に圧縮されると、

特徴量がより際立つデータとなる。

(圧縮時、ノイズ成分がより圧縮されるイメージ?こっちの方がプーリングの主目的?)

 

MNIST for expert では、畳み込み、プーリングを2段構成にしています。

 

1段目の32枚のフィルターそれぞれに対して、

2段目のフィルターを1つかけ、足し合わせます。

続いて

1段目の32枚のフィルターそれぞれに対して、

2段目のフィルターを1つ(上のとは別のフィルター)をかけ、足し合わせます。

以下繰り返しです。

 

 

 

f:id:satopoooon:20180708093928p:plain

 

 バックプロパゲーションにより、

このフィルタ、プーリングの仕方を最適にし、正解率を向上させます