社会人のためのデータサイエンス演習 3週目 1

3-1. クロス集計の軸設定と見方

クロス集計は「2変数のカテゴリの組み合わせについてデータ個数や比率を集計」することで、「縦横のカテゴリの関連を調査することができる」。

変数間の関連性を見出すことで、課題のあぶり出しに役立つ。

カテゴリーデータの例

めっちゃ今週のテストに出そう。

分類特徴変数の例
デモグラフィック変数人口統計分布に基づく変数。基礎情報。性別、年齢、職業、年収など
地理的変数地理的な変数。マーケティング等でよく使う。国、行政区、都市と田舎など
心理的変数価値観や好みなどの変数。意識調査などから作成する。~が好き、~を使っているなど
行動変数行動を表す変数。購買履歴、使用頻度、アクセス状況など
変数の例(一部編集)

クロス集計の流れ

仮説生成

カテゴリーごとの予想をもとに、検証可能な仮説を生成する

軸(変数)の設定

仮説を説明可能な変数の組み合わせを検討する

クロス集計実施・解釈

実際に集計して解釈する。軸を変えてみることで、様々な視点から解釈を重ねることができる

参考文献

このサイトの主
投稿を作成しました 98

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る