機械学習の方法はたくさんあります。
でも実際に問題解決をする場合、どのような方法を選択するかは大きい問題です。
今回は選択の基準を少し紹介します。
1:データ量
伝統的な機械学習方法は、データ量の要求はあまり多くないです。でもdeep learningの機械学習方法は、普通は大量なデータが必要です。
理由は、伝統的な機械学習方法は、変数の量が分かる(変数の量は設計の時に決まります)、だから量はあまり多くないです(deep learningと比べて)。
これに対して、deep learningは、変数の量はとても膨大で10万以上の量が普通です。この原因はdeep learningの構造にあります。deep learningは複数層があり、各層にも何百もの変数があります。だから全部の層の変数を掛けると結果が多いです。
データ量があまり多くない場合、伝統的な機械学習方法の方がdeep learningよりも効果が高いです。
2:問題の種類
もし、画像認識問題や自然言語処理問題を解決したいなら、deep learningの機械学習方法がおすすめです。
deep learningは、この領域にとても素晴らしい成果を出しています。
このタイプの問題に色々なソリューションがあります。だからもし上記のような問題を解決したいならdeep learningを選択してください。
3:スピード
スピードの意味はモデル訓練のスピードです。
もしモデル訓練スピードの早さがほしいなら、伝統的な機械学習方法がおすすめです。例えば、オンラインの勉強システム、新しいデータをつかってすぐモデルを更新したいような場合。
理由は、伝統的な機械学習方法には変数量があまり多くないからです。
4:結果の正確率
もし高い正確率を要求するなら、deep learningがおすすめです。(当然、データ量の保証が必要です)
deep learningは、変数が多いという理由(一つ)で、問題に対して、人類には見えないパターンまでも理解できます。
だから正確率は伝統的な機械学習より高いです。
上記は機械学習方法の選択の基準(概要)です。
でも実際の問題解決時には、やはり様々な利用条件があるので個々の具体的な内容に基づいて決めます。
中国広東省出身、京都オフィス勤務のエンジニア。機械学習に興味がある。京都大学留学生として来日して以来、京都の住みやすさが気に入っている。