STDEV関数とSTDEVP関数の意味と使い分け

エクセルのSTDEV関数とSTDEVP関数は、どちらもデータの散らばり具合を計算してくれる関数ですが、微妙な違いがあります。

STDEV関数とは

意味
不偏標準偏差(データの散らばり具合を表す指標の一つ)を計算する関数です。


$x_1,x_2,\cdots,x_n$ に対して、
$\sqrt{\dfrac{1}{n-1}\displaystyle\sum_{k=1}^n(x_i-\overline{x})^2}$
を計算します。ただし、$\overline{x}$ は $x_1,\cdots,x_n$ の平均です。


$5,10,15$ に対してSTDEVを適用すると?
→平均は $\overline{x}=\dfrac{5+10+15}{3}=10$ なので、STDEV の値は
$\sqrt{\dfrac{1}{2}(5^2+0^2+5^2)}=\sqrt{25}=5$
となります。

STDEVP関数とは

意味
標準偏差(データの散らばり具合を表す指標の一つ)を計算する関数です。


$x_1,x_2,\cdots,x_n$ に対して、
$\sqrt{\dfrac{1}{n}\displaystyle\sum_{k=1}^n(x_i-\overline{x})^2}$
を計算します。ただし、$\overline{x}$ は $x_1,\cdots,x_n$ の平均です。
STDEVでは $n-1$ で割っていたところを、STDEVP では $n$ で割っています。それ以外は同じです。


$5,10,15$ に対してSTDEVPを適用すると?
→平均は $\dfrac{5+10+15}{3}=10$ なので、STDEV の値は
$\sqrt{\dfrac{1}{3}(5^2+0^2+5^2)}=\sqrt{\dfrac{50}{3}}\fallingdotseq 4.08$
となります。

使い分け

「母集団の一部」のデータに対しては、不偏標準偏差であるSTDEV
「母集団全体」のデータに対しては、標準偏差であるSTDEVP
を使いましょう。

例えば、
「日本全国には1億人以上いるが、そのうち1000人分のデータを入手して、それをもとに分析を行う」
という場合にはSTDEVを使いましょう。
「200人の学年でテストを実施した。200人分のデータ全部を使って分析を行う」
という場合にはSTDEVPを使いましょう。

このように使い分ける理由、理論を知りたい方は「不偏推定量」「不偏標準偏差」あたりで調べてみてください。

覚え方

STDEVPのPはPopulation(母集団という意味がある)を表しているようです。
(STDEVは標準偏差:Standard Deviation を表します)

これを覚えていれば
STDEVP→母集団全体のデータに使う
ということを忘れにくいです。

補足

・同じデータに両方の関数を適用すると、必ずSTDEVの値の方が大きくなります。
・データ数 $n$ が大きいとき、STDEVとSTDEVPの値はほとんど同じになります。

次:Rで二項分布の計算をする(dbinomなど)
前:マルコフ連鎖の定常分布と極限分布

スポンサーリンク

スポンサーリンク

誤植がございましたら @mathwordsnet までご連絡をお願いいたします。
ページ上部へ戻る