社会人のためのデータサイエンス入門 第1週の後半・テスト

前回に引き続き、無料講座「社会人のためのデータサイエンス入門」。後半の4講座とテストを受けた。

つかみのよさそうな事例集

後半は前半より具体的な事例紹介。サッカーの勝率を回帰・重回帰で読み解こうする試み(ガチではなくやってみた系)、合計特殊出生率など身近なデータの紹介が扱われている。

サッカーの事例は、今自分の業務で行っているように対象のドメイン知識がない状態でのスタートだったので親近感をおぼえる。

相手が想定もしていなかった分析結果を提出するときは、「このあたりの経験があんまりないので、気になるところがあったらアドバイスをお願いします」的な前置きを意識して行うことが必要など感じる。

1週目のテストは簡単

テストっていうテストを久しぶりに受けた…。「PPDAC」が何だったかというのにちょっと迷ったが、5問とも難なくクリアできた。

PPDACサイクルとは、次の単語の頭文字をつなげたもので、海外や統計教育でもよく使われる統計的探究プロセスです。

P(problem、問題)
P(plan、計画)
D(data、データ収集)
A(analysis、分析)
C(conclusion、結論)

2つのPとCの間に、D(データ収集)とA(分析)のプロセスがあるところに注目してください。明確な問題と計画の立案があってこそ、実際のデータ収集や分析を行うことができ、問題解決へ導くことができる。データ利活用を進めるにあたっての格好のフレームワークといえます。

http://www.stat.go.jp/dstart/point/seminar1/01.html

PPDACはデータ分析のフレームワーク。業務が重なってくると2つのPが抜けたりするので切に注意。

他部署の分析など、外から見るとPlan部分が抜けているケースがよくある。あとConclusionがなかったりする。

このサイトの主
投稿を作成しました 115

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る