データ分析時に出てくる指数表示にケリをつける

指数と接点のない生活をしていたので、Jupiterで分析中に指数が出てくると「数値分からん、フォーマット変換忘れてたわ…」となる。

# 小数点以下2桁を表示(有効桁数)
pd.options.display.float_format = '{:.2f}'.format 

フォーマット変換すればいいけど、指数表示でも理解できるように重い腰を上げることにする。

指数とは

 ある数・文字右肩に記して、それを何度掛け合わせるかを示す数字文字annをいう。

 統計で、物価賃金生産高など同種のものの時間的変動を示す数値基準となる時点の値を100とし、百分比によって表す。

ここで扱うのは、前者の「べき指数」(冪指数)、または累乗のこと。

100,000,000,000,000みたいに桁数があまりに大きいと可読性が下がる。指数表示することで表記が短縮されて読みやすくなる(ルールを知っていれば)。

指数表記のルール

Rは基数、mを仮数部、eを指数部と呼びます。
通常は、10進数を使うことが多いため基数R=10となり、
m×10e
となります。以下はその表記例です。

https://talavax.com/exponential-notation.html

Pandasで出てくる”e”という表記は、10のべき乗を表す。

1e5 -> 1 * 10の5乗 -> 100000(10万)

1e10 -> 1 * 10の10乗 -> 10000000000(100億)

小数点以下の数値になる場合、eにマイナスの表記が付く

1e-2 -> 1 * 10のマイナス2乗 -> 0.01

1e-5 -> 1 * 10のマイナス10乗 -> 0.00001

ややこしいのが、eにまつわる表記が複数あること。1e10、1E10、1e+10、1e010のいずれも同じ値を示す。

Pandasの場合は “1.23e+12(1.23 * 10の12乗)” のように、プラス表記が付く。 

仕組みは分かったが、まったく馴染まない…。ひとまず一覧を覚えて大きめの金額表記くらいはイメージできるようにしよう。

このサイトの主
投稿を作成しました 115

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。

トップに戻る