2021年10月4日作成
『投資対効果(ビジネスインパクト)を最大化する AI 導入 7 つのルール』(石川 聡彦)を読了。
機械学習プロジェクトを成功させるためには,自社の課題を整理し,機械学習の技術の特徴を把握した上で,機械学習の解くべき課題を特定しなければなりません。(位置 No. 19)
まず自社の課題があり,その中から機械学習で解くべき課題を特定する。
AI という言葉は様々な意味と概念・期待が詰め込まれた「スーツケースワード」などと言われています。(位置 No. 193)
スーツケースワード(suitcase-words)とは,「意識」や「感情」といった,複雑な事象を一括りにした言葉。2006年,Minsky により定義された。
一般に企業が機械学習に取り組む場合,そのプレーヤーは次の 3 つの職種に大別できます。(位置 No. 209)
私の立ち位置は,機械学習プランナー。機械学習プロジェクト全体を企画する。
プロジェクトを開始する時には,「XX.XX % の正解率を期待したい」というようにゴールとなる性能を,エンジニアなどチームメンバーに明確な数字で示すべきです。(位置 No. 415)
目標達成度の度合いとして,KPI(Key Performance Indicators),KGI(Key Goal Indicator) を設定する。
日報のデータが信用できる例はまれです。日報には人間の恣意が紛れ込み,現象を正確に反映できている例が少ないためで,機械学習モデルができても,運用に耐えうるレベルであることは少ないでしょう。日報データを電子化して……という手間もあり,機械学習モデリングでは,現象との間に人間というクッションが介さないデータを利用するのが好まれます。(位置 No. 740)
人間の恣意が紛れ込んだ日報は,現象を正確に反映できていないため,役に立たない機械学習モデルができ上がる。
使えないデータ(手書きデータなど)(位置 No. 914)
使えるデータ(自動で出力されたデータなど)
- フォーマットが統一されていないデータ
- 目的との関連性が不明確なデータ
- 正解ラベルが付いていないデータ
- フォーマットが統一されているデータ
- 目的との関連性が明確なデータ
- 正解ラベルが付いているデータ
使えるデータと使えないデータを仕分けする。