統計学のストーリー 第2章:検定
第2章:検定
2種類の標本集団{X1,X2,…,Xm}, {Y1,Y2,…,Yn}の母平均が異なるかどうかを知りたい。
安直には、標本平均を比較すればよい。しかし、その差が小さいとき、例えばのとき、異なると判断してよいのだろうか?サンプリングの偏りでたまたまズレただけではないか?主観で判断するならば、説明力がなく科学ではない。
そこで、これを定量化する。第1章の議論から、と仮定する。
中心極限定理から、
〇母分散が異なるか否かを検定する:F検定
不偏標本分散を算出すると
再生性から
で変数変換すると、
だから、F分布の定義から
これで、「であるとき、[tex; \frac{U^2_X}{U^2_Y}]が採れる確率:p」が計算できる。「ならであると結論付ける」と先に決めてから計算する。の確率密度関数をプロットして、青色の区間にサンプル値が入れば「ならであると結論付ける」
〇母平均が異なるか否かを検定するT検定
F検定で母分散が等しいか否かを調べておく。母分散が等しければA、異なればB。
A)母分散が等しい場合、
なので、t分布の定義から
B)母分散が異なる場合、
ウェルチの近似法