to66’s diary

ぜひ気軽にコメントしてください。

統計学のストーリー 第1章:二項分布から正規分布へ

第1章:二項分布から正規分布

統計学は二項分布から始まる。表が出る確率がpのコインをn回投げたときk回表が出る確率Pr(k)は

 Pr(k)=nCkp^k(1-p)^{n-k}

このときの二項分布をB(n,p)とかく

 

例えば、工場で生産されるネジの溝の深さはばらつきがある。溝の深さは何で決まるか?次のようにたくさんの決定因子に分解していける

f:id:to66:20201020053240p:plain

すると、最終的な決定因子は2択になると考えられる。最終決定因子 \{c_1, c_2, ... , c_n\}\sim B(1,\frac{1}{2})

ここで、溝の深さは最終決定因子の合計であるから、

 溝の深さ=c_1+c_2+...+c_n

nはかなり大きいので中心極限定理が適用できて、 E[B(1,1/2)=1/2] V[B(1,1/2)=1/4]なので

 \frac{溝の深さ}{n}=\frac{c_1+c_2+...+c_n}{n} \sim Norm(1/2, \frac{1/4}{n})

 溝の深さ \sim Norm(1/2, \frac{1/4}{n^3})

よって、溝の深さは正規分布に従う。

以上の議論から、世の中のたくさんのものが正規分布に従う。