PandasでユニークなIDをカウントする方法

地味に利用頻度が高い、ユニークな値のカウント方法について。

前処理を始める前の外観を確認する場合や、取り急ぎ要素の数をまとめた数字が欲しいと言われた場合に便利。

# uniqueメソッドでユニークな値を取得して数える
len(df["uid"].unique())
# 45

# nuniqueメソッドでユニークな値を数える
df.nunique()
# 45

nuniqueメソッドを使うと1手早い。が、なぜかlenを使ってしまうこともしばしばある。

ユニークな要素の各出現数も調べたい場合は、value_countsを使う。

df["uid"].value_counts()
# A 18
# B 15
# C 12
.....


結果は出現回数の多い順に出力される。tolistやtodictでリストや辞書に変換するのもOK。

このサイトの主
投稿を作成しました 115

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る