身近な例で仮説検定(ウェルチの検定)

ウェルチの検定 数学

この記事では「母平均の差の検定(ウェルチの検定)」を身近な例で考えてみようと思う。

私は持病の関係で、体に合わないものを食べるとお腹が痛くなるのだが、何が体に合わないかは患者によって異なり一概には言えないと医者に言われている。

某うどん店によく行くのだが、そこで天ぷらを食べるとお腹が痛くなる確率が高い気がしている。

そこで、本当に天ぷらが自分の体に合わない(食べると体調が悪化する)かを統計的仮説検定で検証してみよう!

準備・前提

私は大雑把ではあるが、食事の記録を取っており、食べた物とその後の体調を1〜5段階で記録している。(1は体調がかなり悪くなった。 3は普通で変わりなし。 5は体調がかなり良い。)

今回の仮説検定では、天ぷらを食べた場合と、天ぷら以外の雑多な食事をした場合を比較してみようと思う。

この場合の母集団は、仮に天ぷらを無限回食べた場合の体調の記録と、仮に天ぷら以外を無限回食べた場合の体調の記録である。

これらの母集団には体調のスコアの真の母平均(天ぷらを食べた場合の体調スコアの母平均を\( \mu_1 \)、天ぷら以外を食べた場合の体調スコアの母平均を\( \mu_2 \)とする)

また、母集団の分散について、天ぷらを食べた場合の体調スコアの母分散を\( \sigma_1^2 \)、天ぷら以外を食べた場合の体調スコアの母分散を\( \sigma_2^2 \)とする。

最後に今回考える母集団の分布は正規分布だと仮定する。体調スコアは母平均を中心におよそ左右対称に散らばると想像できるからである。

標本(データ)を取る

天ぷらを食べた場合の体調スコアは以下のようになった。(標本サイズは10)

体調2132422133
天ぷらを食べた場合の体調スコア

標本平均\( \bar{x_1} \)は2.3
標本不偏分散\( s_1^2 \)は0.9
標本サイズ\( n_1 \)は10

天ぷら以外を食べた場合の体調スコアは以下のようになった。(標本サイズは10)

体調3214334325
天ぷら以外を食べた場合の体調スコア

標本平均\( \bar{x_2} \)は3
標本不偏分散\( s_2^2 \)は1.333・・・

標本サイズ\( n_2 \)は10

統計的仮説検定を行う

今回は標本が2つあるので、「2標本の場合」の仮説検定を行う。

また、天ぷらを食べた場合の母平均\( \mu_1 \)と、天ぷら以外を食べた場合の母平均\( \mu_2 \)の差の検定を行う。(母平均の差の検定

天ぷらが自分に合わないと直感的に感じているので、母平均について\( \mu_1 \lt \mu_2 \)(天ぷらを食べた場合の方が平均的に体調が悪い)という結果を想定しているので片側検定を行う。

また母分散は両方とも未知であるとする。

帰無仮説は

$$
H_0 : \mu_1 = \mu_2
$$

対立仮説は

$$
H_1 : \mu_1 \lt \mu_2
$$

となる。

帰無仮説が正しい場合、以下のt統計量

$$
t =- \frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}
$$

近似的に自由度が以下の値に最も近い整数\( \nu^{\ast} \)の自由度のt分布に従う。

$$
\nu = \frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}}
$$

今回の例では

$$
\nu = \frac{(\frac{0.9}{10}+\frac{1.333}{10})^2}{\frac{(\frac{0.9}{10})^2}{10-1}+\frac{(\frac{1.333}{10})^2}{10-1}}\simeq 17.34
$$

よって自由度17のt分布に従い、またt統計量を計算すると

$$
t =- \frac{2.3-3}{\sqrt{\frac{0.9}{10}+\frac{1.333}{10}}}\simeq -1.4812
$$

自由度17のt分布の上側5%点は1.74なので、有意な結果は出ていない。

つまり、このデータから天ぷらが自分の体に合っていないとは言い切れないということが分かる。

参考にした本

このウェルチの検定は赤本p244を参考にしました。

コメント

タイトルとURLをコピーしました