CNN(畳み込みニューラルネットワーク)

hanamichi-sukusuku.hatenablog.com

上記ではMLPを使用することで比較的高い正解率を叩き出すことができた。しかし、CNN(畳み込みニューラルネットワークを利用することで、より高い精度を出すことができる。

CNNとは畳み込み層(convolution layers)とプーリング層(pooling layers)から構成されるニューラルネットワーク。画像データを解析する際に高い精度を出すことで有名だが、音声認識や顔検出、レコメンド機能や翻訳など様々な用途で利用されている。

f:id:hanamichi_sukusuku:20210207163833j:plain

引用:

ww.imagazine.co.jp

 

 

CNNの仕組みとしては上記画像のような層を持ったネットワークになっている。

 

 

①フィルターを使用し、入力画像の全体に対して畳み込み層でフィルター処理を行う。

②処理した画像をプーリング層に流し込む。

③プーリング層で画像の解像度を下げる処理を行う。

④③の結果を用いて全結合層で結合することで、画像認識が可能、という流れ。

 

分析する画像が入力層に読み込まれた後、このデータをくまなくスキャンして、データの特微量を抽出するために使われるのがフィルターである。抽出された特微データは畳み込み層に送られ、そこで更に特徴の凝縮されたデータが作成されプーリング層、全結合層へと流れていく。

 

イメージとしては多層構造に加え、工夫された2つの隠れ層(畳み込み層、プーリング層)という構造が組み込まれたニューラルネットワークというイメージ。