CNN(畳み込みニューラルネットワーク)
hanamichi-sukusuku.hatenablog.com
上記ではMLPを使用することで比較的高い正解率を叩き出すことができた。しかし、CNN(畳み込みニューラルネットワークを利用することで、より高い精度を出すことができる。
CNNとは畳み込み層(convolution layers)とプーリング層(pooling layers)から構成されるニューラルネットワーク。画像データを解析する際に高い精度を出すことで有名だが、音声認識や顔検出、レコメンド機能や翻訳など様々な用途で利用されている。
引用:
CNNの仕組みとしては上記画像のような層を持ったネットワークになっている。
①フィルターを使用し、入力画像の全体に対して畳み込み層でフィルター処理を行う。
②処理した画像をプーリング層に流し込む。
③プーリング層で画像の解像度を下げる処理を行う。
④③の結果を用いて全結合層で結合することで、画像認識が可能、という流れ。
分析する画像が入力層に読み込まれた後、このデータをくまなくスキャンして、データの特微量を抽出するために使われるのがフィルターである。抽出された特微データは畳み込み層に送られ、そこで更に特徴の凝縮されたデータが作成されプーリング層、全結合層へと流れていく。
イメージとしては多層構造に加え、工夫された2つの隠れ層(畳み込み層、プーリング層)という構造が組み込まれたニューラルネットワークというイメージ。