ウェルチのt検定でできることと検定の手順

最終更新日 2017/11/07

ウェルチのt検定(Welch のt検定)について。

ウェルチのt検定とは

目的:
ウェルチのt検定は、2つの母集団の平均が等しいかどうかを検定する手法です。

使うデータ:
下記のような、2群のデータ(例えば、A群は部署aの7人の体重、B群は部署bの8人の体重)を使います。
A群:$(50,52,58,46,60,54,51)$
B群:$(55,51,45,56,41,56,65,61)$

帰無仮説:
2つの集団の母平均 $\mu_1$、$\mu_2$ は同じである

対立仮説:
2つの集団の母平均 $\mu_1$、$\mu_2$ は異なる
($\mu_1 > \mu_2$、$\mu_1 < \mu_2$ を対立仮説にすることもあります)

前提

必要な前提:
2つの母集団は、それぞれ正規分布に従っている必要があります。

必要でない前提:
ウェルチのt検定には、
・2つの母集団からのサンプルサイズが等しくない場合でも使える
・2つの母集団の分散(母分散)が等しくない場合でも使える
というメリットがあります。

※母平均の差を検定する手法の中でも、サンプルサイズが等しい場合(2群のデータに対応がある場合)は、対応のあるt検定(母平均の差の検定) が使えます。

具体的な検定の手順

1.統計量の計算
使う統計量は、
$t=\dfrac{\overline{X_1}-\overline{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}$
です。ただし、
・$\overline{X_1},\overline{X_2}$ は、それぞれの群のサンプル平均です。
・$n_1,n_2$ は、それぞれの群のサンプル数です。
・$s_1^2,s_2^2$ は、それぞれの群の不偏標本分散です。

2.棄却域の計算
使う分布は自由度 $d$ の $t$ 分布です。
ただし、
$d=\dfrac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{s_1^4}{n_1^2(n_1-1)}+\frac{s_2^4}{n_2^2(n_2-1)}}$
です(→補足)。

例えば有意水準90%で両側検定を行う場合、自由度 $n-1$ の $t$ 分布の上側5%点を $x$ とすると、棄却域は $|t| \geq x$ となります。

補足
一般に、$d$ は小数になります。自由度が整数でない $t$ 分布も定義できますが
t分布の性質および正規分布との関係
$d$ の小数点以下を切り捨てて整数にしたもののパーセント点を使うことが多いようです(要確認、一応 [2] に記載有り)。

得られる結果

帰無仮説が棄却されない場合($t$ 値が $0$ に近い場合)
→2群の平均値が異なるとは言えない

帰無仮説が棄却された場合($t$ 値が $0$ から遠い場合)
→2群の平均値が異なると予想できる
※対立仮説が $\mu_1\neq \mu_2$ の場合の考察です。

参考にしたサイト

[1] Welch’s t-test(英語版 Wikipedia)
[2] Reporting degrees of freedom for Welch t-test

次回は 独立性の検定(カイ二乗検定)を3ステップで説明 を解説します。

ページ上部へ戻る