母平均、標本平均、標本平均の平均という3種類の平均について整理しました。
母平均と標本平均
母集団全体の平均が母平均、サンプルの平均が標本平均です。
このとき、母集団の平均(この例の場合、日本人全員の身長の平均)を母平均と言います。
また、サンプルの平均(この例の場合、取ってきた $100$ 人の身長の平均)を標本平均、またはサンプル平均と言います。
母集団を固定すると、母平均は1つの確定した値になりますが、標本平均はサンプリングの方法(この例の場合、どのように $100$ 人を選ぶか)に依存します。
具体的な計算の例
例題:
母集団のサイズが $4$
それぞれの身長が、$120,140,160,180$
サンプル数が $2$ の場合、
母平均と標本平均はどうなるか?
解答
母平均は母集団の平均なので、$\dfrac{120+140+160+180}{4}=150$
標本平均は標本の取り方に依存します。
例えば、身長の低い $2$ 人を選んだ場合、$\dfrac{120+140}{2}=130$ となります。
標本平均の平均
標本平均を「サンプルの取り方」について平均を取ったものを標本平均の平均、または標本平均の期待値と言います。
先ほどの例題において、標本平均の平均はいくらか?
解答
サンプルの取り方としては ${}_4\mathrm{C}_2=6$ 通り考えられます。それぞれについて平均を計算すると、
$\dfrac{120+140}{2}=130$, $\dfrac{120+160}{2}=140$, $\dfrac{120+180}{2}=150$, $\dfrac{140+160}{2}=150$, $\dfrac{140+180}{2}=160$, $\dfrac{160+180}{2}=170$
この $6$ つの「標本平均」の「平均」を計算すると、
$\dfrac{130+140+\cdots +170}{6}=150$
となります。
標本平均の平均 は $150$ であることが分かりましたが、これは先ほど求めた母平均と一致しています。
補足:この例ではランダムサンプリング(非復元抽出)を仮定しています。
標本平均の平均=母平均
実は、いつでも標本平均の平均は母平均と一致します。これを証明してみます。
サンプルを $X_1,\cdots,X_n$
標本平均を $\overline{X}$
母平均を $\mu$
とします。
期待値の線形性を使うと、標本平均の平均は、
$E[\overline{X}]=E\left[\dfrac{X_1+\cdots +X_n}{n}\right]\\
=\dfrac{1}{n}(E[X_1]+\cdots +E[X_n])\\
=\dfrac{1}{n}(\mu +\cdots +\mu)\\
=\mu$
となり、母平均と一致しました。
次回は t分布の性質および正規分布との関係 を解説します。