Masassiah Blog

現役サラリーマンのスキルアップのための読書まとめ

ディープラーニング活用の教科書

ディープラーニングに取り組むため,『ディープラーニング活用の教科書』(日経クロストレンド,日経 BP 社,2018年10月29日)を読んでみた。

AI は決して万能ではない。ビジネス活用するうえでは,業務プロセスを分解して,どこを AI に担わせるかを設計することが成功の近道である。先駆者の挑戦,苦労から活用を成功させるポイントが見えてくるはずだ。(p. 3)

どこを AI に担わせるか,設計するためには業務プロセスの分解が必要。

「熟練の手が必要な作業,高いレベルのサービスを提供しているすべての企業は,AI に投資すべきだと思う」と松尾氏は語る。(p. 21)

私が勤めている会社でも,AI への投資は必要。必要な投資をできるだけの知識を持とう。

必要なスキルセットを整理する上で参考になるんが,データサイエンティスト協会(東京・港)がまとめたデータサイエンティストに必要なスキルセットだ。「ビジネス力」「データサイエンス力」「データエンジニアリング力」の 3 つの力だと定義する。(p. 26 - 27)

  1. ビジネス力(business problem solving):課題背景を理解した上で,ビジネス課題を整理し,解決する力
  2. データサイエンス力(data science):情報処理,人工知能統計学などの情報科学系の知恵を理解し,使う力
  3. データエンジニアリング力(data engineering):データサイエンスを意味のある形にし,実装,運用できるようにする力

ビジネス力をベースに,データサイエンス力,データエンジニア力を加えている。

「人間による確認では,属人化しやすく判定の基準を均一化することが難しいという課題があった。それに何といってもほとんどは正常な電線の映像を見て,その中から数少ない異常を見つけるわけであり,精神的にとてもつらい仕事だ。これを何とかしたいという思いもあった」(case 14 東京パワーグリッド「送電線の異常検知に活用 生産性 5 倍を目指す」p. 117)

精神的につらい仕事を AI に置き換える,というのは重要な観点。

メルカリでは社の方針として「Go Bold」を掲げているが,技術の現場においてもこれは生きており,「機械学習だけでなく,技術的に新しいことは比較的取り入れやすい。もちろん,影響範囲やリスクを明確にしたうえであればだが」という。(p. 149)

Go Bold,というような文化があれば,新しいことに取り組みやすい。

タクシーの需要予測モデルでは,人口統計データ,タクシーの運行データ,気象データ,施設データを掛け合わせて使うことがポイントだ。データ連係で需要予測精度を高める。データ連係は今後の大きなトレンドであり,クルマのデータを軸にデータ保有企業,分析企業,IT 企業などさまざまな企業に,新たな収益機会を生み出すことになりそうだ。(p. 158)

様々なデータを組み合わせることで,需要予測を精度よく行うことができる。

バナー広告配信では,複数のバナーを用意して AB テストを行うことで,CTR の低い広告を停止して高 CTR の広告に配信を絞っていくことが可能だ。だが事前に高 CTR 広告を予測できれば,バナー広告の工数とコストの大幅カットにつながる。これまで日の目を見なかったバナーが評価されるケースも出てきそうだ。(p. 172)

バナー広告一つにしても,かなりの工数とコストがかけられている。それだけ工数とコストをかけるのは,儲かるからなんだろうな。

HEROZ 開発部長の井口圭一氏は「(ディープラーニング以外も含めた)AI は特に次の 2 つを得意としている。1 つは,『法則が自明ではない膨大なデータ(数値,画像,言語,音声の別を問わず)の中から法則性(分類,数値)を見つけ出す』こと,もう 1 つは逆に,『法則は分かっているが,その法則に従って目的に達する最適な手順が分からないときに,その手順を見つけ出す』こと」と説明する。(p. 254)

今,扱っている問題が,AI が得意なものか考えてみる。

  • 法則が自明ではない膨大なデータの中から法則性を見つけ出す
  • 法則は自明だが,その法則に従って目的に達する最適な手順が分からないときに,その手順を見つけ出す

「実現したいことの達成手段は AI だけではない。工場での生産性改善の話では,AI という話ではなく,IoT による無駄の見える化や,普通に無駄な作業・プロセスをやめるなど,通常の "カイゼン" で解決するべき話も多い。状況に応じて,最適解を人,AI,機械,その他の中から導出し,必要であればすべて手配・開発する」(p. 266)

業務プロセスを分解し,解決手段を考える。AI だけが解決手段ではない。

AI 活用がうまくいくデータの要件(p. 268)

  1. 正規化・整形されていて,AI が読み解くべき情報のみに整理されている
  2. データを説明する情報が多い(データベースでいえば列の数が多い)
  3. 可能な限り個別の情報が特定されている
  4. 欠損がない
  5. 偏りがない
  6. データ数が多い

AI 活用のため,データの要件を整理しておこう。

グーグル・クラウド・ジャパンの下田氏は「必要な人材は 4 種類に分けられる」と整理する。(p. 271 - 272)

  1. 活用を経営レベルで判断する意思決定者 = AI 推進経営者
  2. ビジネス活用する現場の人 = AI 活用人材
  3. AI を開発する人 = AI 開発者
  4. AI のためのデータを準備する人 = データ収集・整備人材

私が目指したいのは,AI 開発者か。

AI 技術の知識(p. 274)

  1. AI 技術にはどのような技術,どのような特性があるか
  2. AI 技術の強み,弱み
  3. ある技術を応用するために必要なリソース(計算リソース,データなど)
  4. 現在流行している AI 技術の全体像
  5. (研究者・技術者は特に)現在開発している新しい技術のトレンド

AI 技術の進化のスピードはとてつもないので,中々ついていくことができない。