Masassiah Blog

現役サラリーマンのスキルアップのための読書まとめ

紙と鉛筆で身につけるデータサイエンティストの仮説思考

『紙と鉛筆で身につけるデータサイエンティストの仮説思考』(孝忠 大輔,翔泳社,2022年7月15日)を読了。

データサイエンティストはグラフを読み解く際は,特異な値のデータはないか(特異点),データに繰り返し見られる傾向はないか(傾向性),他と比べた際に異なる箇所はないか(相違性)について確認しています。(位置 No. 1077)

データをグラフ化し,特異点,傾向性,相違性を確認する。

データから法則を見つける力(位置 No. 2828)

  • 判別問題を考える際は,データから見つけ出した法則に当てはめて結果を推測する
  • 決定木モデルを作成する際は,法則を導き出すためのデータを多く集める必要がある
  • 判別問題の精度を評価する際は,適合率と再現率のトレードオフの関係にあることを理解する

目的に応じて,何が必要か見極める。

データから予測する力(位置 No. 2844)

  • データから予測する際は,外側に向かって予測する外挿になっていないか注意する
  • 偏ったデータから見つけ出した関係性は,適用できる範囲が限定されることを理解する
  • 時系列データには,細かな変動を除いたデータの傾向(トレンド)と同じ周期で変動を繰り返す周期性が含まれている

データから予測する時の留意事項として覚えておく。