t分布の性質および正規分布との関係

確率密度関数が、
$f_n(x)=\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}\left(1+\dfrac{x^2}{n}\right)^{-\frac{n+1}{2}}$
で表される確率分布を、自由度 $n$ の $t$ 分布と言います。

密度関数を理解する

密度関数は複雑な形をしているように見えますが、$\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}$ の部分はただの正規化定数です。$x$ によらないので、重要ではない部分です。つまり、$t$ 分布の密度関数は二次式のマイナス乗(を定数倍したもの)と考えることができます。

また、$\Gamma(n)$ はガンマ関数と呼ばれる関数です。$n$ が正の整数のとき、$\Gamma(n)=(n-1)!$ になります。

基本的な性質

・$f_n(x)$ は偶関数です。つまり、$t$ 分布は、左右対称な分布になります。よって、$t$ 分布の期待値は(存在すれば)$0$ になることも分かります。ただし、期待値が存在するのは $n > 1$ の場合であることが知られています。

・正規分布よりすそが重いです。$x$ の値が大きくなっても、確率の減衰は正規分布ほど急激ではありません。

・$n> 2$ のとき、自由度 $n$ の $t$ 分布の分散は $\dfrac{n}{n-2}$ になることが知られています。計算は大変なので省略します。

t分布の重要性

$X_1,\dots,X_n$ が、互いに独立に、平均 $\mu$、分散 $\sigma^2$ の正規分布に従うとします。このとき、
$\dfrac{\overline{X_n}-\mu}{\sqrt{\frac{s_n^2}{n}}}$
は自由度 $n-1$ の $t$ 分布に従う
ことが知られています。

ただし、$\overline{X_n}$ は標本平均です:
$\overline{X_n}=\dfrac{X_1+\cdots +X_n}{n}$
また、$s_n^2$ は不偏標本分散です:
$s_n^2=\dfrac{1}{n-1}\displaystyle\sum_{k=1}^n(X_i-\overline{X}_n)^2$

この定理は(母集団が正規分布に従う場合で、母分散が未知の場合の)母平均の検定に応用されます。

極限を取ると正規分布

$t$ 分布の自由度 $n$ をどんどん増やしていくと、正規分布に近づいていきます。これを確認してみましょう。

具体的には、$\displaystyle\lim_{n\to\infty}f_n(x)$ が、$Ce^{-\frac{x^2}{2}}$ という正規分布の密度関数と同じ形になることを確認します。

$C_n=\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}$
とおくと、
$f_n(x)=C_n\left(1+\dfrac{x^2}{n}\right)^{-\frac{n+1}{2}}\\
=C_n\left\{\left(1+\dfrac{x^2}{n}\right)^{\frac{n}{x^2}}\right\}^{-\frac{n+1}{2n}\cdot x^2}$
となります。ここで $n\to\infty$ とすると、
$\left(1+\dfrac{x^2}{n}\right)^{\frac{n}{x^2}}\to e$
となるので(→ネイピア数(自然対数の底)の意味と、重要である理由)、
$f_n(x)\to Ce^{-\frac{x^2}{2}}$
となります。
(ただし、$C_n$ が収束することは認めてしまい、その極限値を $C$ と置きました)

次:平均と分散を逐次的に計算するアルゴリズム
前:母平均、標本平均、および標本平均の平均

スポンサーリンク

スポンサーリンク

誤植がございましたら @mathwordsnet までご連絡をお願いいたします。
ページ上部へ戻る