正規分布の平均の区間推定:分散未知、t分布を使って

どうも、木村(@kimu3_slime)です。

今回は、正規分布の平均の区間推定について、分散未知、t分布を使った方法を紹介します。

 

平均の区間推定の原理

正規分布から得られたサンプルを使って、その母集団の平均を区間推定する問題を考えましょう。

分散\(\sigma ^2\)が既知であるとき、正規分布を使って区間推定することができました

ただし、普通は分散を知らないから推定をするわけです。

t分布を用いると、分散が未知であるケースでも、平均の区間推定ができることを紹介しましょう。

 

\(X_1,\dots, X_n\)を一般の正規分布に従う独立な確率変数族(サンプル)とします。\(M_n\)をサンプル平均、\(S^2\)を不偏分散とするとき、統計量

\[T= \frac{M_n -\mu}{\frac{S}{\sqrt{n}}}\]

自由度\(n-1\)のt分布に従うことが知られています

つまり、\(F\)を自由度\(n-1\)のt分布の累積分布関数とするとき、\(c>0\)を実数として

\[P(-c \leq T \leq c ) =F(c)-F(-c)\]

が成り立ちます。

 

これを変形して、平均\(\mu\)の信頼区間の形にしましょう。

左辺の中身を変形すると、

\[ -c \leq \frac{M_n -\mu}{\frac{S}{\sqrt{n}}} \leq c\]

\[ -c\frac{S}{\sqrt{n}} \leq M_n -\mu \leq c\frac{S}{\sqrt{n}}\]

\[ M_n-c\frac{S}{\sqrt{n}} \leq  \mu \leq M_n+ c\frac{S}{\sqrt{n}}\]

となります。

一方、右辺はt分布が対称であることから、\(F(-c)=1- F(c)\)が成り立ちます。与えられた信頼水準\(\gamma\)に対し、

\[2F(c)-1 = \gamma\]

\[c = F^{-1}(\frac{\gamma +1}{2})\]

を満たす\(c\)を求めましょう。すると、信頼水準\(\gamma\)の信頼区間の定義

\[P( M_n-c\frac{S}{\sqrt{n}} \leq  \mu \leq M_n+ c\frac{S}{\sqrt{n}})=\gamma\]

を導くことができました。

これはサンプル平均\(M_n\)、サンプル数\(n\)、不偏分散\(S^2\)を使って計算できるので、母集団の分散\(\sigma^2\)を使わずに済んでいますね。

 

信頼区間の求め方

より具体的に、コンピュータ、Juliaを使って信頼区間を計算してみましょう。

正規分布に従う乱数により、20個のサンプルを作りました。

 

このサンプルを使って、95%信頼区間を計算します。

\(c = F^{-1}(\frac{\gamma +1}{2})\)を求めるには、累積分布関数の逆関数「quantile」が使えます。

この区間は、母集団の平均\(\mu = 50\)を含むものとなっていますね。サンプル平均が(たまたま)50よりやや小さく、下側に寄った信頼区間となりました。

 

「20個のサンプルから信頼区間を求める」試行を20回行い、信頼区間と、そこに母集団の平均が含まれる割合を表示しましょう。

今回は、すべての信頼区間が母集団の平均を含んでいますね。

試行回数をk=10000に増やすと、信頼区間が母集団平均を含んでいる割合は0.9497となり、\(\gamma\)に近い値が得られます。これが95%信頼区間の意味です。

 

信頼区間の幅(大きさ)は、

\[\begin{aligned}&\quad (M_n+ c\frac{S}{\sqrt{n}} )-( M_n-c\frac{S}{\sqrt{n}} ) \\&=2c\frac{S}{\sqrt{n}} \end{aligned}\]

です。\(\gamma \to 1\)のとき、\(c\to 1\)なので、信頼水準を上げるほど区間の幅は広がります。また、サンプル数\(n\)を増やすほど信頼区間の幅は狭まりますね。

 

以上、正規分布の平均の区間推定について、分散未知、t分布を使った方法を紹介してきました。

t分布を使うと、サンプルの情報だけで正規分布の平均の推定ができるので便利ですね。

木村すらいむ(@kimu3_slime)でした。ではでは。

 

Probability and Statistics: Pearson New International Edition
DeGroot, Morris(著), Schervish, Mark(著)
Pearson Education Limited (2013-07-30T00:00:01Z)
5つ星のうち4.3
¥10,792 (中古品)

 

入門数理統計学

入門数理統計学

posted with AmaQuick at 2022.03.27
P.G.ホーエル(著), 浅井 晃(翻訳), 村上 正康(翻訳)
培風館 (1978-01-01T00:00:01Z)
5つ星のうち4.1
¥5,280

 

Advanced Engineering Mathematics
Kreyszig, Erwin(著)
John Wiley & Sons Inc (2011-05-03T00:00:01Z)
5つ星のうち4.5
¥5,862 (中古品)

 

こちらもおすすめ

区間推定、信頼区間とは:分散既知の正規分布における平均の推定を例に

t分布とその性質、Juliaによる計算方法

点推定、不偏推定量とは:平均と分散を例に、なぜn-1で割るのか

対称な確率密度関数を持つ累積分布関数の計算