機械学習を仕事で使う際の流れについて全体像が何となく分かる本。
本書のなかで、機械学習を使わない選択肢の検討を推奨を検討しているところが、潔くていい。
機械学習はあくまで手段の一つでしかなく、それが必要のない分析は山程あるのだ。
手段ありきで始めると失敗する。それは技術ありきで始めるビジネスと同じ。
まずニーズがあって、そのためのソリューション。
ソリューションから何に適用できるかと考えるのは順序が逆。
世の中は新しい技術が話題になると、そこばかりに目が行ってみんな飛びついてしまう。
プロジェクトの流れ
1.問題を定式化する
2.機械学習をしなくて良い方法を考える
3.システム設計を考える
4.アルゴリズムを選定する
5.特徴量、教師データとログの設計をする
6.前処理をする
7.学習・パラメータチューニング
8.システムに組み込む
リアルタイムでの学習はハードルが高いということがわかった。
そもそもリアルタイムでモデル調整をしないといけない場面は少ない。
難しいことは、必要なければ取り組まなくて良い。
機械学習をWebアプリに組み込む際のシステム構成について言及されているところが良い。
分析は試行錯誤を経てより有効なものになっていく。
機械学習のシステムは、適宜改良できる様になっていないといけない。
だから、一度作ったらブラックボックスになってしまうようなシステムは昨日しない。
サブコンに開発を依頼するときは、ここを一番気をつけないといけない。