社会人のためのデータサイエンス演習 3週目 2

3-3. 相関関係と因果関係の違い

定義

相関関係 = ある変数が変化すると、他方の変数も同時に変化する関係

因果関係 = ある変数が、他方の変化を引き起こす関係(原因と結果)

見せかけの相関

①因果の間に共通因子が隠れている場合がある。例えば所得と健康満足度の間に負の相関があったとして、実は年齢という共通因子が隠れていたケース。

②データのバイアスがある場合。センターの英語と入学後の英語に相関が見られなかったが、実際はその大学に入学したというバイアスが入っていたので相関関係が見えないケース。

③偶然の場合。たまたま起こる場合。試行回数や一貫性を確認する。

④因果の流れが逆の場合。残業しない人は能率がいいが、残業を禁止しても残業する能率の悪い人は悪いままなので意味がないケース。

3-4. 時系列データの見方

時系列データを調べる目的は、変動の法則性を見つけ出して将来を予測すること。

時系列データの構成要素

①傾向・循環変動は長期間の変動及び数年程度の周期変動

②季節変動は季節ごとに繰り返される12ヶ月周期の変動

③不規則変動はそれ以外の不規則な変動

時系列データはデータをそのままプロットしても理解が難しい。そこで上の3つの変動に分解することで法則性を見出す

例えば世帯のエアコンの支出額を見る場合、①で年間推移、②で季節支出を確認できる。

3-5. 時系列データの分解の方法

変動の算出方法

時系列データ = 傾向・循環変動 + 季節変動 + 不規則変動

時系列データを上記の「加法モデル」として捉える。なるほど。

不規則変動の抽出には、時系列データから傾向・循環変動と季節変動を除去することで可能となる。

傾向・循環変動の算出

12ヶ月移動平均を作成することで、季節変動は除去される。不規則変動も除去される。

季節変動の算出

異なる年の同じ月の値の平均値を算出する。

不規則変動の算出

実際に起こったイベントと関連付ける。ここがちょっと分からない。平均を取るなどの手法はない?

このサイトの主
投稿を作成しました 115

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る