対応のある場合のt検定について説明します。
対応のあるt検定とは
できること:
対応のある2群のデータ(それぞれ正規分布に従うと仮定する)に対して、それらの母平均が異なるかどうかを検定する。
使うデータ:
下記のような、対応のある2群のデータ(例えば、A群は握力の値、B群は1週間筋トレした後測った握力の値)
A群(真の平均 $\mu_1$) | B群(真の平均 $\mu_2$) | |
a君 | 32 | 30 |
b君 | 50 | 55 |
c君 | 39 | 43 |
$\vdots$ | $\vdots$ | $\vdots$ |
帰無仮説:
2つの集団の母平均 $\mu_1$、$\mu_2$ は同じである
対立仮説:
2つの集団の母平均 $\mu_1$、$\mu_2$ は異なる
($\mu_1 > \mu_2$、$\mu_1 < \mu_2$ を対立仮説にすることもあります)
具体的な検定の手順
具体的に下記のデータに対して、$\mu_1=\mu_2$ かどうかを検定する方法を説明します。
検定の際に必要になるので、差(B群の値ーA群の値)を計算しておきます。
A群 | B群 | 差 | |
a君 | 32 | 30 | -2 |
b君 | 50 | 55 | 5 |
c君 | 39 | 43 | 4 |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
1.統計量の計算
使う統計量は、
$t=\dfrac{\sqrt{n}\cdot\mu_d}{s}$
です。
・$\mu_d$ は差の平均です。この場合、$-2,5,4,\dots$ の平均です。
・$s$ は差の標準偏差です。この場合、$-2,5,4,\dots$ の標準偏差です。
・$n$ は対の数(データの数)です。
2.棄却域の計算
使う分布は自由度 $n-1$ の $t$ 分布です。例えば有意水準90%で両側検定を行う場合、自由度 $n-1$ の $t$ 分布の上側5%点を $x$ とすると、棄却域は $|t| \geq x$ となります。
得られる結果
帰無仮説が採択された場合($t$ 値が $0$ に近い場合)
→2群の平均値が異なるとは言えない
(例えば薬の効果があったかどうかを判定したい文脈では)薬に効果があるとは言えない。
帰無仮説が棄却された場合($t$ 値が $0$ から遠い場合)
→2群の平均値が異なると予想できる
(例えば薬の効果があったかどうかを判定したい文脈では)薬に効果があると予想できる。
※対立仮説が $\mu_1\neq \mu_2$ の場合の考察です。
参考文献
・小寺平治著 明解演習数理統計
・データ数が十分大きければ、2つの群が正規分布に従っていなくてもこの手法が使えるという記載を見たことがある気がします(要出典)
次回は ウェルチのt検定でできることと検定の手順 を解説します。