社会人のためのデータサイエンス入門 第3週 後半

時系列データ特集。

暦年データと年度データ

暦年データ(Calendar Data)は1月スタートの12月エンド。世界基準なので比較が容易。

年度データは国などでユニークな区切り方のデータ。日本なら4月スタートの3月エンド。

ストックデータとフローデータ

ストックデータはある一点のデータ。特定の日付の売上など。対してフローデータは、特定の期間に発生した量や変化を表したもの。

今期末のストックデータ = 前期末のストックデータ + 今期のフローデータ の関係になる。

実質値と名目値

金額を扱う場合、過去と現在では通貨価値が異なるので直接比較ができない。
そのため、物価の変動分を除去してやる必要がある。

名目値とは実際に市場で利用される価格のこと。実質値とは、ある基準から物価の下落・上昇の値を取り除いた額のこと。

名目値は比較の際に不都合が生じるので、期間の離れた2点間を比較する場合は別途個別の判断が必要になる。

季節性

時系列データの分析は季節性が絡んでくるので、前月・今月比較では変化の動向を把握することが難しい。

よく使用されるのは、前年同月比。季節性を除外することで、変化を視覚化することができる。前年比較を比率で比較するとさらに分かりやすい。

季節調整費という手法もある。出し方はちょっとわからなかった。

季節調整値には、毎年起こる変動の影に隠れた別の動きを、赤裸々にするという効果があります。

季節調整をかけると、“年末商戦がなかった”ように見えてしまいますが、そうではありません。季節調整値同士で比較することで、単純な「今年も年末商戦は盛り上がった」から、「今年の年末商戦は例年以上に盛り上がった」といったようなことが分かりやすくなるのです。

https://www.meti.go.jp/statistics/toppage/report/minikaisetsu/hitokoto_kako/20171102hitokoto.html

多項式回帰と自己回帰

やはり分析の醍醐味は未来の予測。

多項式回帰

トレンドが時間の関数になっている。直線的なトレンドの場合は汎用範囲が広い。大きな構造変化に苦手。

自己回帰モデル

過去の値を使って予測する。変数を増やすことで精度が上がる。

このサイトの主
投稿を作成しました 115

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る