2021年 – ページ 5

read_csvのよく使う引数。型指定やエンコード。

Jupyterの冒頭で必ず登場する、read_csvに使用に関して。型指定よくあるのが、ユーザIDや商品IDがintなどになっている場合。mergeしようとした時に、数値とのmergeはダメよと言われるパターン。同 […]

前処理を進めていく上で、生データの中にある誤りを訂正したりする際に使う置換に関して。該当する要素まるごと置換していい場合 “typeA” を “typeB” に置き換える […]

地味に利用頻度が高い、ユニークな値のカウント方法について。前処理を始める前の外観を確認する場合や、取り急ぎ要素の数をまとめた数字が欲しいと言われた場合に便利。 nuniqueメソッドを使うと1手早い。が、なぜかlenを […]

whereメソッドを第1引数に条件を指定して、Falseが返ってきたら第2引数に指定した値や配列で要素を書き換えることができる。 maskメソッドは第1引数の条件が逆で、Trueが返ってきた場合に書き換えを行う。 ifの […]

指数と接点のない生活をしていたので、Jupiterで分析中に指数が出てくると「数値分からん、フォーマット変換忘れてたわ…」となる。フォーマット変換すればいいけど、指数表示でも理解できるように重い腰を上げるこ […]

売上のトランザクションデータの抽出を依頼したときに、売上IDのナンバー（伝票番号の枝番みたいな）の抽出依頼を忘れていた。再度抽出依頼をするのもあれなので、自分で番号を降ることにする。 GroupBy.cumcount( […]

Jupyterlabのコード補完がなかなかうまくいかないので、一旦整理する。 htmlやcssのコーディングでvscodeを使っていると、コード補完がバリバリに働いてくれる。そこからjupyterlabに移動すると、うま […]

pandasでよくsort_valuesをsort_valueと書いてエラーをいただくのでメモする。 Jupyterの予測変換そもそもjupyter labのコードヒントがなかなかうまく動かないのをなんとかしたい。頻出 […]

社内に商品DBを導入したいという依頼があり、導入するにあたってざっくり調べてみる。ちなみにかつて（10年くらい前）Filemakerで受発注の管理を目的とした商品DBは作成したことがあるが、それ以来本格的に関わったこと […]

実務で分析を行う際に、ちょっとややこしそうな実装があるケースがある（だいぶこなれてきたが、新規案件はコードに悩むことがまだある）。そういう時は直接対象データを触る前に、コンパクトなダミーデータで実験してから本実装につな […]

尋ねられたが、ばしっと答えられなかったので概要をまとめる。 Core Web Vitalsとはコア・ウェブ・バイタルはサイトの閲覧者の快適性を測るための指標。単純な表示速度はもちろん、人間が閲覧する際の快適さを重要視す […]

WordPressのテンプレート、Cenoteで引用文を使用した際に日本語だとコーテーションマークにめり込む問題。さっと修正したメモ。まあblockquoteは外で使わないやろ、ということでざっくり指定。ついでにデフォ […]