2サンプルの分散の検定:F分布とは、Juliaによる例

どうも、木村(@kimu3_slime)です。

今回は、2サンプルの分散の比の検定について、F分布とは何か、Juliaによる例を紹介します。

 

2サンプルの分散の比の検定

検定の原理と手順

あるテストを10人に受けてもらい、1ヶ月後別の20人に同じテストを受けてもらい、点数が次のようになったとしましょう。

それぞれの分散を計算してみると、

とそれほど大きな違いはありません。このとき、母集団分布の分散は等しいと結論づけることはできるでしょうか。

そこで、2つのサンプルの分散の比について、検定を行いましょう。

今回は、

  1. 2つのサンプルは正規分布に従っている

という仮定を置きます。サンプルのサイズは異なって良いものとします。これは2サンプルの分散の比に関するF検定(F-test)と呼ばれるものです。

 

2つのサンプルの母集団の分散を\(\sigma_X^2 ,\sigma _Y^2\)とし、サンプルサイズを\(n_X, n_Y\)としましょう。そしてサンプルの不偏分散を\(S_X^2, S_Y^2\)とします。このとき、

\[F= \frac{S_X^2}{S_Y^2}\]

は自由度\((n_X-1,n_Y-1)\)のF分布に従うことが知られています。(これはカイ二乗分布から導けます。)

F分布(F-distribution)とは、確率密度関数を\(x>0\)のとき

\[f(x) = \frac{1}{x B(\frac{\nu_1}{2}, \frac{\nu_2}{2}) }\sqrt{\frac{(\nu_1 x)^{\nu_1} \cdot \nu_2 ^{\nu_2}}{(\nu_1 x + \nu_2)^{\nu_1 +\nu_2}} } \]

とする確率分布です。ここで\(B\)はベータ関数であり、2つのパラメータ\((\nu_1,\nu_2)\)は自由度(degree of freedom)と呼ばれています。

 

帰無仮説として

\[H_0: \sigma_X ^2 = \sigma_Y ^2\]

対立仮説として

\[H_1:\sigma_X ^2 \neq  \sigma_Y ^2\]

を設定しましょう。一方は分散の比が1である、もう一方は分散の比が1でない、という仮説とも言いかえられます。

有意水準を\(\alpha\)として決めたとき、帰無仮説が正しい仮定のもとで、

\[P(c_1 \leq F \leq c_2) = 1-\alpha\]

となる区間を求めることができます。

  • サンプルの差がこの区間に入るならば、帰無仮説は棄却されない
  • サンプルの差がこの区間に入らないならば、帰無仮説は棄却される

という考え方で、検定を行えます。

 

検定のやり方

以上が分散の比の検定の原理です。ここからは、実際に検定を行ってみましょう。

JuliaのパッケージHypothesisTestsでは、「VarianceFTest(x,y)」で分散の比が1であるという仮説を検定できます。

最初に示したサンプルを検定すると、分散の比が1であるという仮説は棄却されませんでした。つまり、同じ分散を持っている可能性があるというわけです。

 

異なる分散を持つ分布を設定し、そこからサンプルを得ると、検定によって検出されます。

 

小さな分散の違いは、検出されにくいです。

 

同じ分散の設定のもとでも、サンプルサイズを増やせれば小さな違いが検出されるようになります。

検定によって「分散の比が1でない」と考えられることと、「分散の違いが大きい」ことは一般に別物なので注意しましょう。

 

最後に、有意水準に関する検証をしましょう。

何度も検定を繰り返したとき、帰無仮説が正しいにもかかわらずそれを棄却する割合が有意水準\(\alpha\)です。

母集団分布の分散が等しいデータを与えて、棄却される割合を計算してみましょう。「pvalue(検定)」で、検定のp値を求められます。

10000回サンプルを取って検定を繰り返した結果、約5%が棄却されました。これが有意水準\(\alpha =0.05\)の意味ですね。

 

以上、2サンプルの分散の比の検定について、F分布とは何か、Juliaによる例を紹介してきました。

平均の差に関するt検定では、分散が等しいことを仮定することがありますが、そのチェックとしてもF検定は使えますね。

木村すらいむ(@kimu3_slime)でした。ではでは。

 

Probability and Statistics: Pearson New International Edition
DeGroot, Morris(著), Schervish, Mark(著)
Pearson Education Limited (2013-07-30T00:00:01Z)
5つ星のうち4.3
¥10,792 (中古品)

 

入門数理統計学

入門数理統計学

posted with AmaQuick at 2022.03.27
P.G.ホーエル(著), 浅井 晃(翻訳), 村上 正康(翻訳)
培風館 (1978-01-01T00:00:01Z)
5つ星のうち4.1
¥5,280

 

Advanced Engineering Mathematics
Kreyszig, Erwin(著)
John Wiley & Sons Inc (2011-05-03T00:00:01Z)
5つ星のうち4.5
¥5,862 (中古品)

 

こちらもおすすめ

カイ二乗分布とその性質、Juliaによる計算方法

正規分布の分散の検定、カイ二乗検定とは:Juliaによる求め方

2サンプルの平均の差の検定:等サイズ等分散、Juliaを使って

統計的仮説検定とは:平均の検定、t検定を例に、Juliaを使って