高校数学から始める公理的確率論:標本空間、事象、確率とは

どうも、木村(@kimu3_slime)です。

高校では確率について学びますが、その時点では集合の考え方を表に出さずに計算する印象があります。

今回は、集合を使って確率について捉え直すこと、公理的確率論:標本空間、事象、確率とは何なのかについて、高校レベルの例を用いて説明したいと思います。

(例えば集合の知識は必要ですが、測度論、ルベーグ積分の知識は全く不要です。)

 



試行、結果、事象、確率とは

さて、そもそも確率とは一体何なのでしょうか。言葉を整理していきましょう。

コインを投げて、表が出る確率は\(\frac{1}{2}\)、裏が出る確率は\(\frac{1}{2}\)といったように言いますね。

「コインを投げる」ことは、確率的な試行(probability experiment)と呼ばれるもので、それによって(結果 outcome)が生じます。「表が出る」「裏が出る」といった結果(の集まり)を事象(event)と呼びます。それぞれの事象に対して、確率(probability)という起こりやすさを表す数値が割り当てられるわけですね。

 

集合の言葉を使って、コイン投げの試行を定式化してみましょう。

起こりうる結果は、\(\Omega = \{表、裏\}\)という2つの要素からなる集合です。この試行による結果全体の集合を、標本空間、サンプル空間と呼びます。

そして、標本空間\(\Omega\)の部分集合のことを、事象と呼びましょう。\(E_1=\{ 表\}\)という部分集合は、表が出るという事象で、\(\Omega\)自身という部分集合は、表または裏が出るという事象です。

確率は、その事象=部分集合に対して数値を割り当てる関数の役割をしています。例えば、\(P(E_1)= \frac{1}{2}\)といったように。表または裏のいずれかは必ず出るわけですが、そのことは全体集合の確率が1 \(P(\Omega) = 1\)に対応しています。

 

まず、表、裏が出る確率が等しい、同様に確からしい事象を考えました。いびつなコインを考えたらどうでしょうか?

表、裏という結果が出ること、\(\Omega = \{表、裏\}\)という標本空間の設定には変化なしで良さそうです。ただしそれぞれの事象が割り当てられる確率が変わります。例えば表が出やすいコインなら、\(P(\{表\})= \frac{2}{3}\)、\(P(\{裏\})=\frac{1}{3}\)のように。

同じ\(P\)という記号を使ってしまいましたが、同様に確からしくない事象を捉えるためにも確率の考え方は使えるべきでしょう。

 

公理的確率論

定義

今までに見てきたことを、もっと一般に使えるように定義してみましょう。

確率的試行によって起こりうる結果を、\(\omega_1,\omega_2,\dots, \omega_N \)と番号付けて表すことにします。それらを集めた集合\(\Omega = \{\omega_1,\omega_2,\dots, \omega_N\}\)を標本空間、サンプル空間(sample space)と呼びます。

簡単のため、標本空間として何らかの有限集合を考えましょう。その要素の個数\(\mathrm {card}(\Omega)=N\)は、結果の総数(total number of outcomes)と呼ばれるものです。

そして、\(\Omega\)の部分集合のことを事象(event)と呼びます。空集合\(\varnothing \)は常に部分集合ですが、それは空事象(empty event)と呼ばれます。全体集合\(\Omega\)を事象として見るときは、全事象(whole event)と呼びます。

確率\(P\)(probability)とは、\(\Omega\)の部分集合=事象に対して実数を割り当てる関数(集合関数)で、次の条件を満たすものです。

  1. 空事象、全事象の確率:\(P(\varnothing)= 0\)、\(P(\Omega)=1\)
  2. 非負性:\(E\)が\(\Omega\)の部分集合ならば、\(P(E) \geq 0\)
  3. 加法性:\(E_1,E_2\)が\(\Omega\)の部分集合で、共通部分を持たない\(E_1 \cap E_2 = \varnothing\)ならば、\(P(E_1 \cup E_2) =P(E_1)+P(E_2)\)

1番目は、何も起こらない確率は0、いずれかの結果が起こる(すべての結果が出る)確率は1であることを意味しています。確率とはそういうものですね。そうなるように\(\Omega\)に試行によって起こりうる結果をすべてまとめあげている、ということです。

2番目は、何らかの結果が起こる確率は0以上であることを意味しています。当然そうあるべきでしょう。

3番目は、同時に起こらない事象(共通部分を持たない事象:排反な事象 exclusive events)を考えるときは、部分的に確率を考えて足し合わせることができるという話です。いわゆる和の法則(addition rule)ですが、これも確率としては期待したい性質と言えます。

 

コインを1回投げる試行を考えたいです。そこで、\(\Omega = \{表,裏\}\)と標本空間を定めます。事象\(E\)に対して、\(E\)の要素の個数を\(2\)で割ったものとして、集合\(P(E)= \frac{\mathrm{card} (E)}{2}\)を定めましょう。

これが確率の定義を満たすことを確かめます。

空事象、全事象の確率:空集合の要素数は0なので、\(P(\phi) =\frac{0}{2}=0\)です。全体集合の要素数は\(2\)なので、\(P(\Omega =\frac{2}{2}=1)\)です。

非負性:要素の個数は0個以上なので、\(P(E) \geq 0\)です。

加法性:\(\Omega\)の部分集合は、\(\phi ,\{表\},\{裏\},\Omega\)の4通りです。\(E_1,E_2\)を共通部分を持たない部分集合としましょう。共通部分を持たないので、\(E_1,E_2\)の要素の個数の和は、\(E_1 \cup E_2\)の要素の個数に等しいです。したがって、\(P(E_1 \cup E_2) =\frac{\mathrm {card}(E_1 \cup E_2)}{N}\)と\(P(E_1)+P(E_2) = \frac{\mathrm {card}(E_1)+\mathrm {card}(E_2)}{N} \)は等しいです。

以上によって、\(\Omega = \{表,裏\}\)、\(P(E)= \frac{\mathrm{card} (E)}{2}\)は確率の定義を満たすことが確かめられました。

 

サイコロを1回投げる試行も、同様にして考えることができます。

\(N\)面のサイコロとして、\(\Omega = \{\omega_1,\dots, \omega_N \}\)とします。事象\(E\)に対し、\(P(E)=\frac{\mathrm{card} (E)}{N} \)と定めましょう。さきほどの議論と全く同様にして、これが確率の定義を満たすことが確かめられます。

このような確率が割り当てられるとき、それぞれの事象は同様に確からしい(equally likely)と呼ばれます。それは、一点集合\(\{\omega_i\}\)(根元事象 elementary event、標本点 sample point)の確率が、どれも等しい\(P(\{\omega_i\})= \frac{1}{N}\)を意味しているわけです。

 

いびつなコインは、同様に確からしい事象を生みませんが、確率の枠組みには入っています。

\(\Omega = \{表、裏\}\)に対し、\(P(\phi)=0\)、\(P(\Omega)= 1\)、\(P(\{表\})= \frac{2}{3}\)、\(P(\{裏\})=\frac{1}{3}\)と定めましょう。

空事象と全事象の確率は適切です。非負性も良いでしょう。加法性についてチェックすべき点は、\(E_1 =\{表\}\)、\(E_2=\{裏\}\)のときです。そのときは、\(P(E_1\cup E_2)=P(\Omega)=1\)で、\(P(E_1)+P(E_2)=\frac{2}{3}+\frac{1}{3}=1\)と成り立っていますね。

 

コインを2回投げる試行を考えるときは、\(\Omega= \{表,裏\}\times \{表,裏\}\)という直積集合を考えます。

例えば1回目に表が出て、2回目に裏が出るという事象は、\(\{(表,裏)\}\)と順番を考慮した組として表せるわけです。

それぞれの事象を同様に確からしいと考えて良いならば、確率は事象\(E\)に対し、\(P(E)=\frac{\mathrm{card} (E)}{4} \)と定めれば良いです。

2回コインを投げて1回だけ表が出る確率を求めてみましょう。その事象は2通り\(\{(表,裏),(裏,表) \}\)なので、\(P(E)= \frac{2}{4}\)ですね。

同様に確からしい事象を考えるときは、高校の数学の時間にしたように、場合の数(結果の個数)=事象の要素の個数を数えれば良い、という問題になります。

参考:確率の定義「場合の数」とは何か:結果の個数である

 

性質

このようにして定まる確率には、よく知られた一般的な性質があります。

 

単調性

事象の要素の個数が増えれば、確率は増すと考えるのが自然でしょう。

実際にそれは正しく、事象\(E_1 ,E_2\)が\(E_1 \subset E_2\)を満たすならば、\(P(E_1) \leq P(E_2)\)となります。これを確率の単調性と呼びます。

 

確かめましょう。\(E_1,E_2\)が異なる部分に注目して、\(E_3 := E_2 \setminus E_1\)という差集合を考えます。確率の非負性より、\(P(E_3) \geq 0\)です。\(E_1,E_3\)は共通部分を持たないので、確率の加法性より\(P(E_1 \cup E_3) =P(E_1)+P(E_3) \geq P(E_1)\)です。一方、\(P(E_1 \cup E_3)=P(E_2)\)なので、単調性が示せました。

 

単調性を使えば、「事象の確率は0以上1以下になること \(0\leq P(E ) \leq 1\)」という当然の性質が導けます。

\(E\)を事象とすると、\(E \subset \Omega\)なので、単調性より\(P(E) \leq P(\Omega)=1\)なので。

 

余事象の確率

2回コインを投げて、1回は表が出る確率について考えましょう。

こういう問題は、1回も表が出ない事象\(E = \{(裏,裏)\}\)の確率を計算して\(P(E)= \frac{1}{4}\)、その余事象として\(P(\Omega \setminus E) = 1-\frac{1}{4}=\frac{3}{4}\)と考えると簡単です。

 

一般に、事象\(E\)に対し、その補集合\(\Omega \setminus E\)を余事象(complementary event)と呼びます。余事象の確率は、

\[ \begin{aligned}P(\Omega \setminus E)= 1 – P(E)\end{aligned} \]

となるのです。

確かめましょう。\(E\)と\(\Omega \setminus E\)は共通部分を持たないので、加法性より\(P(E \cup (\Omega \setminus E) )=P(E)+P(\Omega \setminus E)\)です。これを整理すれば、\(P(\Omega \setminus E)=P(E \cup (\Omega \setminus E) )-P(E)\)\(=P(\Omega)-P(E)=1- P(E)\)となりました。

 

事象の独立、積事象の確率

コインを2回投げる試行を考えます。1回目に表が出て、かつ2回目に裏が出る確率を求めたいとしましょう。

\(\Omega= \{表,裏\}\times \{表,裏\}\)とすると、1回目に表が出て事象は\(E_1 =\{(表,表),(表,裏)\}\)、2回目に裏が出る事象は\(E_2 =\{(表,裏),(裏,裏)\}\)です。

両方の事象の共通部分\(E_1\cap E_2\)は、共通事象(intersection of events)、積事象と呼ばれます。

今回ならば、\(E_1\cap E_2 =\{(表,裏)\}\)ですね。その確率は、\(P(E_1\cap E_2)=\frac{1}{4}\)です。一方で、それぞれの事象の確率の積を計算してみると、\(P(E_1)P(E_2)=\frac{2}{4} \frac{2}{4} =\frac{1}{4}\)と結果が一致しています。

 

以上のことをまとめるために、事象の独立という考え方を導入します。

\[ \begin{aligned}P(E_1 \cap E_2) = P(E_1)P(E_2)\end{aligned} \]

が成り立つとき、事象\(E_1,E_2\)は独立である(independent events)と呼びます。そしてこの計算法則は、積の法則(multiplication rule)と呼ばれるものです。

2つの事象が独立であるとは、それぞれの事象が起こり方に影響を与えないことと考えられます。コインを2回振って、1回目に表が出ることと、2回目に裏が出ることには、因果関係がないのです。

くじを引いてもとに戻さないような確率の問題では、事象は独立でなく、この形の積の法則は成り立ちません。そこで

\[ \begin{aligned}P(E_1 \cap E_2) = P(E_1)P(E_2 \mid E_1)\end{aligned} \]

といった条件付き確率を考える必要があるでしょう。これについては別記事で。

 

一般化、発展的話題

確率の枠組みを振り返り、発展的な話題を補足しておきましょう。

今回紹介した公理的な確率は、測度というものの一種です。測度は積分の定義が研究される中で見いだされた概念で、一定の条件を満たす集合関数のことです。

面積や体積といった考え方も、集合に対して数値を割り当てています。それと同じように、確率も事象(集合)に対して数値を割り当てる。ただし、確率の場合、その値は1以下という性質がありますね。

 

測度空間とは、集合\(\Omega\)、その部分集合族\(\mathcal{F}\)、\(\mathcal{F}\)の要素に対し数を対応させる集合関数(測度)\(\mu\)の組で、一定の条件を満たすものです。

今回は\(\Omega\)として有限集合を考えました。有限集合の確率論と言えます。コインを無限に投げ続ける試行や、結果が連続的な値を取るような試行を考えるときには、\(\Omega\)として無限集合(可算集合、非可算集合)を考えることになるでしょう。

無限集合において集合を測るときには、すべての部分集合を測れると考えると不都合なことがあります。そこで測れる集合を\(\mathcal{F}\)として一定の条件で限定する必要が出てくるわけです(可測集合、\(\sigma\)-加法族、完全加法族)。有限集合の場合そのような心配はなく、\(\mathcal{F}=\mathcal{P}(\Omega)\)とべき集合:部分集合全体を対応させれば良いです。

集合関数\(\mu\)が測度と呼ばれるためにも、一般のケースでは、単なる(有限)加法性ではなく、可算加法性と呼ばれる条件を満たす必要があります。しかし有限集合の場合は、有限加法性と可算加法性は等価なので(そもそも部分集合が有限個)、心配はありません。

 

以上、標本空間、事象、確率とは何か、公理的な確率論を、高校レベルからの接続として紹介してきました。

もし議論でわからない部分があれば、集合の基礎的な部分について勉強してみると良いでしょう。

統計学などでも確率論は使われますが、数学的な確率論、公理的確率論の話は難しくて学びにくい印象があります。

一方で、確率を集合の考え方で捉えるのはそれほど難しくないながらも重要で、確率変数や確率分布について正確に理解するために役立つでしょう。この記事がそのきっかけとなれば嬉しいです。

木村すらいむ(@kimu3_slime)でした。ではでは。

 

「確率・統計」を5時間で攻略する本 中学から高校、社会人まで役に立つ! 「勉強のコツ」シリーズ
松岡 宏之(著), 向山 洋一(編集)
PHP研究所 (1998-03-05T00:00:00.000Z)
3.5outof5stars
¥1,100

 

Elementary Statistics: A Step By Step Approach
Bluman, Allan(著)
McGraw-Hill Education (2017-02-16T00:00:01Z)
4.0outof5stars
¥8,861 (中古品)

 

ルベーグ積分入門―使うための理論と演習
吉田 伸生(著)
遊星社 (2006-05-01T00:00:01Z)
4.6outof5stars
¥3,330 (中古品)

 

確率論 (新しい解析学の流れ)
熊谷 隆(著)
共立出版 (2003-03-01T00:00:01Z)
4.5outof5stars
¥2,630 (中古品)

 

こちらもおすすめ

初等確率・統計のスキルツリー:必要な中学・高校数学

中学高校の確率・統計を「5時間で攻略する本」レビュー

「高校生が感動した確率・統計の授業」レビュー

確率の定義「場合の数」とは何か:結果の個数である

抽象ベクトル空間・線形空間の具体例R^N:順序対と直積集合

無限集合の濃度とは? 写像の全単射、可算無限、カントールの対角線論法

集合族の扱い方(和集合・共通部分):実数の区間を例に