機械学習のモデルの実用理解
最近、色々な会社で機械学習の手法が業務開発に導入されています。実際の業務において、予測モデルが一番コアとなる部分です。モデルの性能は、実際の業務に大きく影響をあたえます。
モデルのコア評価には、以下の3つの重要ポイントがあります:
1:低コスト
低コストとは、モデルが既存する、opensourceしている、ハードウェアの要求も低いなどを指します。
大きな会社以外(google, amazon, etc.)、コストが低いモデルを採用することがおすすめです。そうしないと、開発と採用コストが高くなります。
2:解析しやすさ
実際の運用中、モデルからもらった結果をdebugして解明分析が必要になります。しかしモデルが複雑すぎると解析が難しくなります。実際の使用にも影響します。
3:改修しやすさ
機械学習は未来を予測するためのものです。だから、色々改修が必要です。改修しやすいモデルは、実際利用の効果が高いです。
機械学習は最近とても人気があるので、色々新しい手法、モデルが出てきました。でも、上記ポイントを全部満たせるモデルは実際あまり多くないです。例えば、最近一番人気のdeeping learningというものがありますが、ハードウェアの要求も高いし、モデルの解析も難しいです。このため画像処理や自然言語処理に利用されますが、リスク管理が必要な領域にはあまり利用されていないです。
このため実際運用を考える場合は、やはり典型的な確率モデルと線形モデルが一番効果的です。
中国広東省出身、京都オフィス勤務のエンジニア。機械学習に興味がある。京都大学留学生として来日して以来、京都の住みやすさが気に入っている。