指数と接点のない生活をしていたので、Jupiterで分析中に指数が出てくると「数値分からん、フォーマット変換忘れてたわ…」となる。
# 小数点以下2桁を表示(有効桁数)
pd.options.display.float_format = '{:.2f}'.format
フォーマット変換すればいいけど、指数表示でも理解できるように重い腰を上げることにする。
指数とは
1 ある数・文字の右肩に記して、それを何度掛け合わせるかを示す数字・文字。anのnをいう。
2 統計で、物価・賃金・生産高など同種のものの時間的変動を示す数値。基準となる時点の値を100とし、百分比によって表す。
ここで扱うのは、前者の「べき指数」(冪指数)、または累乗のこと。
100,000,000,000,000みたいに桁数があまりに大きいと可読性が下がる。指数表示することで表記が短縮されて読みやすくなる(ルールを知っていれば)。
指数表記のルール
Rは基数、mを仮数部、eを指数部と呼びます。
https://talavax.com/exponential-notation.html
通常は、10進数を使うことが多いため基数R=10となり、
m×10e
となります。以下はその表記例です。
Pandasで出てくる”e”という表記は、10のべき乗を表す。
1e5 -> 1 * 10の5乗 -> 100000(10万)
1e10 -> 1 * 10の10乗 -> 10000000000(100億)
小数点以下の数値になる場合、eにマイナスの表記が付く
1e-2 -> 1 * 10のマイナス2乗 -> 0.01
1e-5 -> 1 * 10のマイナス10乗 -> 0.00001
ややこしいのが、eにまつわる表記が複数あること。1e10、1E10、1e+10、1e010のいずれも同じ値を示す。
Pandasの場合は “1.23e+12(1.23 * 10の12乗)” のように、プラス表記が付く。
仕組みは分かったが、まったく馴染まない…。ひとまず一覧を覚えて大きめの金額表記くらいはイメージできるようにしよう。