エクセルのSTDEV関数とSTDEVP関数は、どちらもデータの散らばり具合を計算してくれる関数ですが、微妙な違いがあります。
STDEV関数とは
意味
不偏標準偏差(データの散らばり具合を表す指標の一つ)を計算する関数です。
式
$x_1,x_2,\cdots,x_n$ に対して、
$\sqrt{\dfrac{1}{n-1}\displaystyle\sum_{k=1}^n(x_i-\overline{x})^2}$
を計算します。ただし、$\overline{x}$ は $x_1,\cdots,x_n$ の平均です。
例
$5,10,15$ に対してSTDEVを適用すると?
→平均は $\overline{x}=\dfrac{5+10+15}{3}=10$ なので、STDEV の値は
$\sqrt{\dfrac{1}{2}(5^2+0^2+5^2)}=\sqrt{25}=5$
となります。
STDEVP関数とは
意味
標準偏差(データの散らばり具合を表す指標の一つ)を計算する関数です。
式
$x_1,x_2,\cdots,x_n$ に対して、
$\sqrt{\dfrac{1}{n}\displaystyle\sum_{k=1}^n(x_i-\overline{x})^2}$
を計算します。ただし、$\overline{x}$ は $x_1,\cdots,x_n$ の平均です。
STDEVでは $n-1$ で割っていたところを、STDEVP では $n$ で割っています。それ以外は同じです。
例
$5,10,15$ に対してSTDEVPを適用すると?
→平均は $\dfrac{5+10+15}{3}=10$ なので、STDEV の値は
$\sqrt{\dfrac{1}{3}(5^2+0^2+5^2)}=\sqrt{\dfrac{50}{3}}\fallingdotseq 4.08$
となります。
使い分け
「母集団の一部」のデータに対しては、不偏標準偏差であるSTDEV
「母集団全体」のデータに対しては、標準偏差であるSTDEVP
を使いましょう。
例えば、
「日本全国には1億人以上いるが、そのうち1000人分のデータを入手して、それをもとに分析を行う」
という場合にはSTDEVを使いましょう。
「200人の学年でテストを実施した。200人分のデータ全部を使って分析を行う」
という場合にはSTDEVPを使いましょう。
このように使い分ける理由、理論を知りたい方は「不偏推定量」「不偏標準偏差」あたりで調べてみてください。
覚え方
STDEVPのPはPopulation(母集団という意味がある)を表しているようです。
(STDEVは標準偏差:Standard Deviation を表します)
これを覚えていれば
STDEVP→母集団全体のデータに使う
ということを忘れにくいです。
補足
・同じデータに両方の関数を適用すると、必ずSTDEVの値の方が大きくなります。
・データ数 $n$ が大きいとき、STDEVとSTDEVPの値はほとんど同じになります。
次回は atan関数とatan2関数の意味と違い を解説します。