地味に利用頻度が高い、ユニークな値のカウント方法について。
前処理を始める前の外観を確認する場合や、取り急ぎ要素の数をまとめた数字が欲しいと言われた場合に便利。
# uniqueメソッドでユニークな値を取得して数える
len(df["uid"].unique())
# 45
# nuniqueメソッドでユニークな値を数える
df.nunique()
# 45
nuniqueメソッドを使うと1手早い。が、なぜかlenを使ってしまうこともしばしばある。
ユニークな要素の各出現数も調べたい場合は、value_countsを使う。
df["uid"].value_counts()
# A 18
# B 15
# C 12
.....
結果は出現回数の多い順に出力される。tolistやtodictでリストや辞書に変換するのもOK。