時系列予測が必要になってきたので、まずは基礎から試してみる。 Prophetの使い方メモを参考にした。感謝。 予測手順 Google Colabでやった。まずはインストール&インポート。 例示されていた、あるアメフト選手 […]
MovableTypeのステージング環境構築
MovableType(MT)でのステージング環境周りをまとめておく。 ステージング環境とは ステージング環境とはシステム開発工程の一つで、本番環境と同様の状態でシステムの動作や不具合のチェックを行う段階のことです。 開 […]
PPDACサイクルの導入に向けて
データ分析の講座でちらほら出てくるPPDACサイクルについてまとめておく。まさに今の現場で欠如している考え方なので、ぜひ導入していきたい。 歴史とか近年の動き 課題発見や課題解決は一体どのように行っていけばよいのでしょう […]
企業のウェブセキュリティ対策
セキュリティ対策について基礎知識を得る ウェブに関するセキュリティ対策について学ぶ必要があったので、ひとまず図書館ですぐ借りられた本をまとめておく。 あなたのセキュリティ対応間違っています あなたの知らないセキュリティの […]
社会人のためのデータ演習 修了証
前回から日が開いた。データ演習のテストがクリアできていたので、修了証が届いていた。 入門編とは異なり、実践的な講座が多かったのでだいぶ楽しかった。暗記系の穴埋めは若干分かりにくかったが、もし続きが開講されるのであれば挑戦 […]
Pandasで特定の文字列(部分一致)を含む行を抽出する
カテゴリーによる抽出などの完全一致は頻出だけど、部分一致は案外使わないのでメモ。 まずはいつものDF。 部分一致を使う場合は、str.containsメソッドを使う。戻ってくるのはSeries。 第1引数は正規表現での検 […]
社会人のためのデータサイエンス演習 5週目 2⃣
5-5. 企業でデータサイエンスを実現するためのポイント データサイエンスがない企業にデータサイエンスを浸透させるのに必要な3つの要素。 人材獲得 人材の育成・獲得。データ分析に詳しい人を集めて、全体の底上げを図る。ある […]
社会人のためのデータサイエンス演習 5週目 1⃣
5-1. 各週のおさらい 特に新しいことなし 5-2. データ分析に基づく問題解決ケーススタディ(1) 問題の分解・整理 ざっくりとした問題意識をいかに具体的な数値での問題意識に落とし込めるか。PPDACサイクルに当ては […]
社会人のためのデータサイエンス演習 4週目
4-1. 回帰分析による予測 予測を行わないビジネス→効率が悪い 予測ができると、無駄が減ったり、てこ入れが必要そうだなどの予測を立てることができる。 あとは単回帰分析の説明で終わり。 4-2. モデル評価と予実評価 モ […]
社会人のためのデータサイエンス演習 3週目 2
3-3. 相関関係と因果関係の違い 定義 相関関係 = ある変数が変化すると、他方の変数も同時に変化する関係 因果関係 = ある変数が、他方の変化を引き起こす関係(原因と結果) 見せかけの相関 ①因果の間に共通因子が隠れ […]
Pandas 複数の条件に合致した行を削除する
複数のカラムにまたがった条件を満たした行をデータフレームから除去する方法。パッと思いつかなかったのでメモしておく。 シンプルな方法 ひと手間かかるが、複数条件に合致する行のインデックスを定義してdrop関数に渡す。 まず […]
社会人のためのデータサイエンス演習 3週目 1
3-1. クロス集計の軸設定と見方 クロス集計は「2変数のカテゴリの組み合わせについてデータ個数や比率を集計」することで、「縦横のカテゴリの関連を調査することができる」。 変数間の関連性を見出すことで、課題のあぶり出しに […]