データ分析プロセス
データ分析プロセスは、主に6つのステージに分かれる。ライフサイクルとは違う。
問いかけ
PPDACにおける最初のPにあたる。課題を定義するために、関係者から適切なヒアリングをして適切な問いを立てる。
準備
データが分析に使用できるようにする段取り。正確性や信頼性の担保や、どのデータがどんな生成によるものかなどを整理する。
前処理はここに含まれない。
処理
いわゆる前処理。前処理した結果を共有し、使えるデータになっているか確認するところまで含める。
分析
整理したデータをもとに、ツールを使って知見を得る。データドリブンな意思決定ができるように注意する。
共有
得られた知見をステークホルダーや関係者に共有する。共有にはビジュアルを工夫し、より理解しやすい形で実施する。
行動
インサイトを生かして実施する。課題を解決し、新しい価値を創造する。
分析ツール
データアナリストを支えるツールは、表計算ソフト、データベースとクエリ、BIソフトなどのビジュアライゼーションを担当するソフトウェア。
クエリ系はまだ触ったことないので少しずつ勉強していく。