Deep learning勉強筆記1-deep learningのdeepはどういう意味?

去年のアルファGO以来、AI、正確には機械学習にはどんどん注目が集まっています。
機械学習の、deep learningの手法はとても人気があります。
自分もこの分野にはとても興味があるので、色々本やビデオを見て、勉強しています。
この勉強筆記は、自分が勉強中に理解したことを綴って、皆とシェアしていきます。
deep learningという手法は皆も聞いたことがあると思います、でもdeep learningの中のdeepはどういう意味だと思いますか?
まずはじめに、deep learningとは、ニューラルネットワークという手法に基づいて構築されたものです。ニューラルネットワークがどのようなものかは次に説明します。
普通のニューラルネットワークは、入力 -> ニューラル層 -> 出力 という構造です。
最初、ニューラル層は1層しかないです。
でも、この簡単な構造は、問題があります。
最大の問題は、表現力不足です。(この部分の具体的説明は今後書きます)
だから、研究者の皆さんは、この簡単な構造を改善しています。
最初の考え方は、出力関数を改善することです。
複雑な出力関数を利用すると、効果がありましたが、でもまだまだです。
もう一つ考え方は、ニューラル層を追加することです。
これは、現代のニューラルネットワークです。
一層ニューラル層なら、一回の抽象しかできないです。
でも複数層のニューラル層あれば、抽象能力は大きく上がって、モデルの勉強能力は大きくなります。
例えば、音声認識の問題であれば、もし一層のニューラル層なら、多分音声を文字に転職するのみしかできないです。でも複数層のニューラル層があるなら、これだけじゃなく、文字の意味とか、感情とかも認識できます。
これが複数層のニューラル層の威力です。
実際、deep learningのdeepは、ニューラル層のdeepの意味です(層の数量)。
当然ですが、単にニューラル層を追加するだけでは駄目です。
研究者達はこの思想について、色々なモデルを開発しました。
今回はここまでです。
続きは、次回ブログに書きます。
Deep learning勉強筆記2はこちら

関連記事

Webエンジニア

フロントエンド

会社・職場紹介

最近の記事 おすすめ記事
  1. 新人さん向けの品質についての読書会

  1. Deep learning勉強筆記11

  2. Intellij IDEAの便利ショートカット

  3. IntelliJ IDEA, Visual Studio Codeのススメ

カテゴリー
アーカイブ
検索
TOP
TOP