AutoMLのPyCaretを使って、教師ありな分類を行う。 ライブラリインストール まずはColab用にインストール。2022.8現在は依存関係のエラーが出てしまうようなので、numba(処理スピードをアップさせるライ […]
PyCaretを使った回帰分析(regression)最終章
shapによるモデルの解釈 機械学習の結果を解釈し、どういったロジックで予測が行われているのかをある程度把握する必要がある。 機械学習に馴染みのないスタッフの場合、完全にブラックボックスから導かれたデータに従うとなると抵 […]
PyCaretを使った回帰分析(regression)後編
モデルの評価 前回はモデルのチューニングまでを済ませたので、続いてモデルの評価に進む。 PyCaretはモデルの評価もあっさり表示してくれる。 そのまま出力すると、パラメータに関する情報が出力される。 もしくは選択肢をク […]
PyCaretを使った回帰分析(regression)
便利なAutoML、PyCaretを使った回帰分析を行う。 ライブラリの読み込み colabを使用する際、2022年8月現在だとエラーが発生したのでnumbaのバージョンを指定してインストールする。インストール後はランタ […]
ビジネス戦略のフレームワーク概略
「統計学は最強の学問である[ビジネス編]」を読む。出だしから印象深い切り出しで、良書の予感。アカデミックな著者なので、非常に分かりやすく、同意しやすい。 ビジネスの幹とリサーチデザイン データ分析の価値は細かい施策(クー […]
Prophetを使って時系列予測をしてみる
時系列予測が必要になってきたので、まずは基礎から試してみる。 Prophetの使い方メモを参考にした。感謝。 予測手順 Google Colabでやった。まずはインストール&インポート。 例示されていた、あるアメフト選手 […]
PPDACサイクルの導入に向けて
データ分析の講座でちらほら出てくるPPDACサイクルについてまとめておく。まさに今の現場で欠如している考え方なので、ぜひ導入していきたい。 歴史とか近年の動き 課題発見や課題解決は一体どのように行っていけばよいのでしょう […]
社会人のためのデータサイエンス演習 5週目 2⃣
5-5. 企業でデータサイエンスを実現するためのポイント データサイエンスがない企業にデータサイエンスを浸透させるのに必要な3つの要素。 人材獲得 人材の育成・獲得。データ分析に詳しい人を集めて、全体の底上げを図る。ある […]
社会人のためのデータサイエンス演習 5週目 1⃣
5-1. 各週のおさらい 特に新しいことなし 5-2. データ分析に基づく問題解決ケーススタディ(1) 問題の分解・整理 ざっくりとした問題意識をいかに具体的な数値での問題意識に落とし込めるか。PPDACサイクルに当ては […]
社会人のためのデータサイエンス演習 4週目
4-1. 回帰分析による予測 予測を行わないビジネス→効率が悪い 予測ができると、無駄が減ったり、てこ入れが必要そうだなどの予測を立てることができる。 あとは単回帰分析の説明で終わり。 4-2. モデル評価と予実評価 モ […]
社会人のためのデータサイエンス演習 3週目 2
3-3. 相関関係と因果関係の違い 定義 相関関係 = ある変数が変化すると、他方の変数も同時に変化する関係 因果関係 = ある変数が、他方の変化を引き起こす関係(原因と結果) 見せかけの相関 ①因果の間に共通因子が隠れ […]
社会人のためのデータサイエンス演習 3週目 1
3-1. クロス集計の軸設定と見方 クロス集計は「2変数のカテゴリの組み合わせについてデータ個数や比率を集計」することで、「縦横のカテゴリの関連を調査することができる」。 変数間の関連性を見出すことで、課題のあぶり出しに […]