時系列データ特集。
暦年データと年度データ
暦年データ(Calendar Data)は1月スタートの12月エンド。世界基準なので比較が容易。
年度データは国などでユニークな区切り方のデータ。日本なら4月スタートの3月エンド。
ストックデータとフローデータ
ストックデータはある一点のデータ。特定の日付の売上など。対してフローデータは、特定の期間に発生した量や変化を表したもの。
今期末のストックデータ = 前期末のストックデータ + 今期のフローデータ の関係になる。
実質値と名目値
金額を扱う場合、過去と現在では通貨価値が異なるので直接比較ができない。
そのため、物価の変動分を除去してやる必要がある。
名目値とは実際に市場で利用される価格のこと。実質値とは、ある基準から物価の下落・上昇の値を取り除いた額のこと。
名目値は比較の際に不都合が生じるので、期間の離れた2点間を比較する場合は別途個別の判断が必要になる。
季節性
時系列データの分析は季節性が絡んでくるので、前月・今月比較では変化の動向を把握することが難しい。
よく使用されるのは、前年同月比。季節性を除外することで、変化を視覚化することができる。前年比較を比率で比較するとさらに分かりやすい。
季節調整費という手法もある。出し方はちょっとわからなかった。
季節調整値には、毎年起こる変動の影に隠れた別の動きを、赤裸々にするという効果があります。
季節調整をかけると、“年末商戦がなかった”ように見えてしまいますが、そうではありません。季節調整値同士で比較することで、単純な「今年も年末商戦は盛り上がった」から、「今年の年末商戦は例年以上に盛り上がった」といったようなことが分かりやすくなるのです。
https://www.meti.go.jp/statistics/toppage/report/minikaisetsu/hitokoto_kako/20171102hitokoto.html
多項式回帰と自己回帰
やはり分析の醍醐味は未来の予測。
多項式回帰
トレンドが時間の関数になっている。直線的なトレンドの場合は汎用範囲が広い。大きな構造変化に苦手。
自己回帰モデル
過去の値を使って予測する。変数を増やすことで精度が上がる。