確率論はいかに科学へ応用されたか？「確率の哲学的試論」を読む

どうも、木村（@kimu3_slime）です。

ラプラスの「確率の哲学的試論」を読みました。ピエール＝シモン・ラプラス（1749年 – 1827年）は、天体力学、確率論に貢献した数学者です。

確率論は、フェルマーとパスカルによってギャンブルの分析のために始まったと言われています。その考え方は、現在では統計学でも利用されており、科学全般に通じるものになりました。

ゲームの分析が、なぜ科学全般で利用されるようになったのか。古典確率論の集大成と言われる「確率の哲学的試論」を読んでみて、確率論の変化を考えてみます。

人間は不完全、だから確率論が必要だ
仮説の確からしさの理論へ
こちらもおすすめ

人間は不完全、だから確率論が必要だ

まず序論で述べられた、有名な文章が印象的でした。

したがって、われわれは、宇宙の現在の状態はそれに先立つ状態の結果であり、それ以降の状態の原因であると考えなければならない。ある知性が、与えられた時点において、自然を動かしているすべての力と自然を構成しているすべての存在物の各々の状況を知っているとし、さらにこれらの与えられた情報を分析する能力をもっているとしたならば、この知性は、同一の方程式のもとに宇宙のなかの最も大きな物体の運動も、また最も軽い原子の運動をも包摂さしめるであろう。この知性にとって不確かなものは何一つないであろうし、その目には未来も過去と同様に現存することであろう。人間の精神は、天文学に与えることができた完全さのうちに、この知性のささやかな素描を提示している。

引用：確率の哲学的試論 p.10

ラプラスの悪魔ーーと一般には呼ばれることがありますが、原文では単に「知性」と言っているにすぎません。

また、「現在は過去の結果であり、未来の原因」という因果律は、ニュートン力学・運動方程式が描き出す世界観を煮詰めたものです。

この文章は、ラプラスが決定論を述べたと解釈されることがありますが、原文を読んでみると重点はそこだけではないと思います。

「この知性にとって不確かなものは何一つない」ということは、「人間には不確かにしか知れないことがある」の裏返しです。それはまさに不確かさの理論ーー確率論ーーの必要性を述べています。

その後も、かつては彗星が予測し難い運動「天の怒りのしるし」として扱われていた話を持ち出し、「われわれが無知だから」規則性がないように見えることは少なくないと言っています。

決定論的システムにおいてラプラスのいう「知性」があったとしても予測できないことがあることは、後に量子力学の不確定性原理、あるいは力学系におけるカオス現象、などによって知られていきました。

ラプラスの決定論が間違っていたというよりは、ますます確率的な理解が必要になってきた、と言えるでしょう。

仮説の確からしさの理論へ

「確率の哲学的試論」では、コインの表裏、袋から白黒の玉を取り出すような問題だけでなく、データの不規則性が誤差にもとづくものなのかどうか……といった問題を扱います。

これがまさに、確率論がギャンブルだけにでなく、諸科学に応用されるようになった理由だと思いました。

データの観測から妥当な仮説を推測する方法の典型は、ラプラスが第六原理（逆算法）と呼んだものです。現在では、ベイズの定理とも呼ばれます。

\[ \begin{aligned}P(H_j \mid A)= \dfrac{P(H_j)P(A \mid H_j )}{\sum_{i=1} ^n P(H_i) P(E,h_i)}\end{aligned} \]

ここで、\(A\)は観測された事象、\(E_i\)は可能な原因を述べる仮説を表す事象です。

事象\(A\)が観測されたときに原因\(H_j\)が正しい確率\(P(H_j \mid A)\)（事後確率）を求めたい。

それは、原因を想定する仮説\(H_j\)による事象\(A\)の確率\(P(A \mid H_j )\)（尤度）と、原因のアプリオリな確率\(P(H_j)\)（事前確率）によって計算できる。ざっくり言えば、事後確率＝尤度×事前確率です。

ラプラスはこの原理を、事象から原因へ遡る推論の分野での基本的な原理と考えました。

彼が取り上げた「嘘をつく証人」の例を見てみましょう。

1-1000までの数字が書かれた紙が入った壺を考えて、証人が79という数字が書かれた紙を取り出したと発表したとき、それが正しい確率はいくらかを求める問題です。ただし、証人は嘘（間違い）をついていることが経験的にわかっていて、証言が正しい確率を\(9/10\)とする。

79が取り出された事象を\(A\)、証言が正しいという仮説を\(H_1\)、間違っているという仮説を\(H_2\)とします。

仮定より、\[ \begin{aligned}P(H_1)=9/10,P(H_2)=1/10,P(A\mid H_1) = 1/1000\end{aligned} \]で、\[ \begin{aligned} P(A\mid H_2) =(999/1000) \times (1/999)=1/1000 \end{aligned} \]です。

（後半について。79以外が取り出される確率が\(999/1000\)で、取り出された数以外の999通りから証人の嘘によって79が選ばれる確率が\(1/999\)であるため。）

逆算法（ベイズの定理）より、
\[P( H_1 \mid A)&= (\frac{9}{10} \times \frac{1}{1000} )/( \frac{9}{10} \times \frac{1}{1000} + \frac{1}{10} \times\frac{1}{1000} ) \\ &= \frac{9}{10} \]

と求められました。ラプラスはこの手法を使い、彗星の軌道が惑星の軌道と大きな違いを見せる理由を調べたそうです。

「確率の哲学的試論」では、ベイズの定理だけでなく、ガウスやルジャンドルによる最小二乗法や、ベルヌーイによる大数の法則も取り上げられています。

ラプラスは、データにもとづいて仮説が正しい確率を求めようとしました。

それは後に帰納的確率（主観確率）と呼ばれ、多数の試行から相対頻度として求められる確率：統計的確率（客観確率）と比較されることがあるようです。

のちに、ピアソン、ネイマン、フィッシャーによって確立された推計統計学では、頻度主義(frequentism)と呼ばれる立場を取ります。多数のデータが取れて確率が計算できる場合はこちらで良いでしょう。

しかし、少ないデータしか取れず暫定的に確率を見積もらないと計算できないこともあります。こちらはベイズ統計学と呼ばれるもので、ラプラスはどちらかというとこちらの認識をしています。

どうやら、ベイズ統計学は一時的にフィッシャーにより否定されたそうですが、最近ではコンピュータの発展に伴い勢いが戻ってきているようです。