Masassiah Blog

現役サラリーマンのスキルアップのための読書まとめ

AI 導入 7 つのルール

2021年10月4日作成

『投資対効果(ビジネスインパクト)を最大化する AI 導入 7 つのルール』(石川 聡彦)を読了。

機械学習プロジェクトを成功させるためには,自社の課題を整理し,機械学習の技術の特徴を把握した上で,機械学習の解くべき課題を特定しなければなりません。(位置 No. 19)

まず自社の課題があり,その中から機械学習で解くべき課題を特定する。

AI という言葉は様々な意味と概念・期待が詰め込まれた「スーツケースワード」などと言われています。(位置 No. 193)

スーツケースワード(suitcase-words)とは,「意識」や「感情」といった,複雑な事象を一括りにした言葉。2006年,Minsky により定義された。

一般に企業が機械学習に取り組む場合,そのプレーヤーは次の 3 つの職種に大別できます。(位置 No. 209)

  1. 機械学習プランナー
    機械学習プロジェクト全体を企画する人
  2. 機械学習エンジニア
    実際に機械学習モデルをつくる人や,機械学習モデルを安定的に運用するシステムをつくれる人
  3. 現場の利用者・運用担当者(機械学習オペレーター)
    製造,工場,営業,人事,事業部など現場で機械学習モデルを利用・運用する人

私の立ち位置は,機械学習プランナー。機械学習プロジェクト全体を企画する。

プロジェクトを開始する時には,「XX.XX % の正解率を期待したい」というようにゴールとなる性能を,エンジニアなどチームメンバーに明確な数字で示すべきです。(位置 No. 415)

目標達成度の度合いとして,KPI(Key Performance Indicators),KGI(Key Goal Indicator) を設定する。

日報のデータが信用できる例はまれです。日報には人間の恣意が紛れ込み,現象を正確に反映できている例が少ないためで,機械学習モデルができても,運用に耐えうるレベルであることは少ないでしょう。日報データを電子化して……という手間もあり,機械学習モデリングでは,現象との間に人間というクッションが介さないデータを利用するのが好まれます。(位置 No. 740)

人間の恣意が紛れ込んだ日報は,現象を正確に反映できていないため,役に立たない機械学習モデルができ上がる。

使えないデータ(手書きデータなど)(位置 No. 914)

  1. フォーマットが統一されていないデータ
  2. 目的との関連性が不明確なデータ
  3. 正解ラベルが付いていないデータ
使えるデータ(自動で出力されたデータなど)
  1. フォーマットが統一されているデータ
  2. 目的との関連性が明確なデータ
  3. 正解ラベルが付いているデータ

使えるデータと使えないデータを仕分けする。