CNNの簡単紹介1
ようやく実際のニューラルネットワークを紹介します。
今回紹介したものはdeep learningの中でも有名なネットワーク:畳み込みニューラルネットワーク(convolutional neural network:CNN)
このネットワークは、画像認識領域で大活躍中です。
今、大体精度高い製品はこのネットワークを利用して作られています。
このネットワークが出る前は、画像認識の精度は実際あまり高くなかったです、特に複数な画像に対しては。
画像は、1次元のデータではなく2次元のデータです。
要するに、ピクセルとピクセルの間に位置の関連性があります。
それに、この位置関連性は部分的です。
例えば、車が写った画像の場合、画像中の車は画像の一部だけです。
この部分以外の画像は車には関係ないです。
でも、一般のモデルは、このような位置の関連性を認識できないです。
だから簡単な画像(一つ画像に一つの物のみある場合)はいいですが、
普通の画像に対してはあまり認識制度が高くないです。
でもCNNなら、この位置の関連性を認識できます。
CNNのデータ勉強は、一つ一つではなく、一エリア一エリア毎です。
それに、このエリアの大きさも調整できます。
だから画像でこのエリアの特徴を取得できます。
実際、一つのエリアには一つの特徴を代表します。
CNNの画像認識の手順は、設定した複数エリアを全画像をスキャンして、次にこの画像の一つ一つの特徴を探し、最後はこの特徴をまとめて、画像を認識します。
次回はCNNの具体構造と畳み込み(convolutiona)と特徴取得を紹介します。
中国広東省出身、京都オフィス勤務のエンジニア。機械学習に興味がある。京都大学留学生として来日して以来、京都の住みやすさが気に入っている。