この記事では統計検定準1級の内容であるウィルコクソンの順位和検定を具体例を用いて解説する。
数多ある仮説検定の分類(どのような時に、どのような検定をするか)については以下の記事でまとめた。以下の記事の分類で言えば、ウィルコクソンの順位和検定は2標本の場合 -> 対応がない場合の母平均の差の検定 -> ノンパラメトリック法に分類される。
ウィルコクソンの順位和検定はノンパラメトリック法に分類される。
ノンパラメトリック法は母集団分布を仮定しない仮説検定である。
母集団分布が分かっている場合でも、サンプルサイズが小さい時は、ノンパラメトリック法が有効とされるケースが多くみられる。(統計検定準1級ワークブックより)
具体例を用いた「ウィルコクソンの順位和検定」の解説
今回の具体例では、先々週の平日の売り上げと広告を打った先週の平日の売り上げに有意差があるかどうかを仮説検定する。
帰無仮説と対立仮説を以下のように設定する。
帰無仮説:先々週の売り上げと先週の売り上げの分布は同じ(平均の差はバラツキの範囲内)
対立仮説:広告を打った先週の売り上げの分布の方が良い方にずれている(平均の差はバラツキだけでは説明できない)
データは以下のように出ている。
曜日 | 月 | 火 | 水 | 木 | 金 | 平均 |
先々週(広告なし) | 142 | 115 | 118 | 128 | 76 | 115.8 |
先週(広告あり) | 168 | 158 | 182 | 165 | 154 | 165.4 |
平均を見ると広告ありの先週の方が売り上げが高いですが、これは誤差(売り上げのバラツキ)を超えて広告に効果があることを示しているのでしょうか?(広告の有無に関係なく、たまたま先週の方が売り上げが高くなったのではないか)
これをウィルコクソンの順位和検定で判定します。
まず、上記の表の数値を小さい方から順位に変換します。そして順位和も計算します。
曜日 | 月 | 火 | 水 | 木 | 金 | 順位和 |
先々週(広告なし) | 5 | 2 | 3 | 4 | 1 | 15 |
先週(広告あり) | 9 | 7 | 10 | 8 | 6 | 40 |
帰無仮説が正しいと仮定すると、この10日間の順位はランダムに割り振られるはずです。
順位和は最小の15から最大の40までの値を取る可能性があり、それぞれの順位和を取る場合の数は下のようになります。
順位和 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 |
場合の数 | 1 | 1 | 2 | 3 | 5 | 7 | 9 | 11 | 14 | 16 | 18 | 19 | 20 |
順位和 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 |
場合の数 | 20 | 19 | 18 | 16 | 14 | 11 | 9 | 7 | 5 | 3 | 2 | 1 | 1 |
場合の数の総和は252で、先々週の売り上げの順位和が15以下になる場合の数の総和は1なので(今回は最小値の15を取っているので場合の数の総和は1だが、仮に順位和が18だったら総和は1+1+2+3=7)、順位和が15以下になる確率は\( P(順位和 \leq 15) = \frac{1}{252} = 0.00397\ldots \)
これがP値です。
P値が0.00397…と0.01より小さいので、有意水準1%で有意ということが示されました。
つまり、帰無仮説は棄却され、対立仮説「広告を打った先週の売り上げの分布の方が良い方にずれている」すなわち広告には効果があったということが分かりました。
コメント