ファイルを誰かに送る場合や、エクセル等で作業した方が早い場合などはJupyterからいったんCSVで出力することがよくある。出力にはto_csvメソッドを使うが、その引数のメモ。 EXCELユーザにデータを渡す場合 ut […]
read_csvのよく使う引数。型指定やエンコード。
Jupyterの冒頭で必ず登場する、read_csvに使用に関して。 型指定 よくあるのが、ユーザIDや商品IDがintなどになっている場合。mergeしようとした時に、数値とのmergeはダメよと言われるパターン。 同 […]
Pandasでreplaceメソッドを使ったテキスト置換
前処理を進めていく上で、生データの中にある誤りを訂正したりする際に使う置換に関して。 該当する要素まるごと置換していい場合 “typeA” を “typeB” に置き換える […]