どうも、木村(@kimu3_slime)です。
「人間と社会を変えた9つの確率・統計学物語」を読みました。
古典的確率論の集大成呼ばれるラプラス「確率の哲学的試論」を読んだので、その後の統計学の発展までの歴史が気になったのです。
参考:確率論はいかに科学へ応用されたか? 「確率の哲学的試論」を読む
本書は、歴史を扱った本ですが、本人の記録をもとに書き下した伝記書や歴史書とは違います。
その特徴は、バーチャルインタビュー。著者が独自に書いた、架空の対話形式です。「私」と「学者」が対談しています。人物のイラストがあって、一般向けの本と言えます。式の導出や解説もあり、「数学ガール」に近い形式です。
したがって、教科書よりもやわらかい書き方で、サクサク読めます。多少の確率・統計の知識があった方が良いですが、この本に興味を持つならばその条件は満たされているでしょう。
ただし、著者の書き口にはクセがあります。「高校で考える確率論は受験用であり、実際問題には無益」といった趣旨のことが冒頭に書いてあり、一面では正しいですが言い過ぎと感じます(後に引いているケインズの論らしい)。
また、バーチャルインタビューによる書き方があるので、どこまで事実でどこから著者の言い分なのか不明瞭です。学者の言い争いの部分とかも、出典が書いてないところでは信頼できるのかわかりません。その分、面白みは増しているのですが。やはり、歴史書というよりはお話本として読むのが良いでしょう。
目次
1章 確率は賭けから始まった パスカル、フェルマー
2章 当たりやすさは測定可能 ヤコブ・ベルヌーイ
3章 確率論を発展させたおもしろい問題 ド・モアブル
4章 原因と結果の法則 ベイズ
5章 古典確率論の完成と新しい出発 ラプラス
6章 天文学者も驚いたデータ予測の秘密 ガウス
7章 統計理論を築いた人たち ケトレー、ゴルトン、ピアソン、ゴセット、フィッシャー、ネイマン
8章 現代確率論の誕生 コルモゴロフ
9章 相手を知らずとも百戦危うくない「戦略」とは フォン・ノイマン、サベジ、ワルド、ケインズ
最終章で、不確実性の理論、意思決定やゲーム理論が紹介されているのは独自で良いと思いました。
統計学の歴史をどう捉える?
僕は、特にラプラス以降の確率から統計への歴史について知りたくて読みました。本書では、次のように世代がまとめられています。
統計学の世代論
第0世代 確率論の時代で、パスカル、フェルマーからコルモゴロフまで
第1世代 K.ピアソン、フィッシャーからゴセット、ネイマンを経てワルドまで
第2世代 テューキーから、ブートストラップのエフロンまで
第3世代 ベイズ統計学のもとに統計学の知恵が人類の資産となる時代
本で紹介されているのは、0世代から1世代。それも後半の記述は多くありません。確率論の起こりの話は聞いたことある内容が多かったので、もう少し最近の話を知りたかったです(一般向けの本でそれは難しいのでしょうが)。
さて統計学の基礎を築いた人は、ピアソン、フィッシャー、ネイマンと言われます。
この本を読むと、ピアソンの貢献は大きいと感じました。相関係数の数的な定義を行ったり、回帰直線やカイ二乗分布を定義したり。個別具体の対象によらない、数学的な統計学理論(数理統計学)を築いた人と言えるのではないでしょうか。この点はフィッシャーの貢献も大きいですが。
で、ピアソンとフィッシャーの間には対立があったと言われることがありますが、それについてはこう書かれています。
ピアソン ……ハッキリ言えばですね、フィッシャー氏の念頭には「メンデルの法則」のモデルがあり、データはそれを確認するエビデンスです。これに対して、私たちにはダーウィンの自然淘汰の理論があり、その統計データも蓄積され、平均値とか標準偏差、相関係数などでデータが記述され整理される。まあ、どっちが遺伝学として説明力があるかなのですが、見方の違いですね。
私 両方とも統計学の理論として有効じゃないですか。その意味では、対立しない。
ピアソン そう、結局そうなると思います。統計学の歴史は多くの先覚者の知恵が合流したもので、それぞれの小さな水源はみな違う。そこをあまり強調しない方がいい。統計学は大人の学問です。そして、大人は歴史を理解する。
昔ながらの統計学の説明では、論争があったと説明されます。しかし、現代的な基準では、それは論争というか、分析したい/イメージしている対象が違うのではないかと思っていました。それを「どちらも統計学の理論である」と言ってくれているのは安心しますね。
本を読んでいると、どうもフィッシャーの起こした論争は多いようです。数学的な議論の間違いなら論争すべきでしょうが、統計学のあり方については正解がないのですし、何もそこまで噛みつかなくても……と思いました。フィッシャーが築いた学問自体は良いと思いますが、論争の点については残念です。
統計学の入門書によくもっともらしく書かれているのが、頻度主義vsベイジアンみたいな構図です。そこに対立があるように描かれた原因は、フィッシャーではないかと感じました。
ベイズは「主観確率」を用いるといったよくある誤解(事前確率と言えば良い)については、サベジによるものではないかとも思いました。ベイズを評価したのは良いですが、パーソナル確率や主観説統計学なる概念が、ベイズにとって必須だと思われたのは難しいところです。
#統計 「頻度主義vs.ベイズ主義」のような「主義」に基づく統計学観が時代錯誤であることの根拠の1つは1980年の赤池弘次さんのつの論説の存在。https://t.co/CjrHB6NGiV
— 黒木玄 Gen Kuroki (@genkuroki) August 31, 2019
本書全体を通しても、またラプラスの本を読んでも、頻度vsベイズのような対立認識はおかしく、それらは手法にすぎないのだから、分析の目的やデータに応じて使い分ければ良いという認識にたどりつきました。
また、ワルド(ウォールド Wald)の統計的意思決定論の話は、本書で読む限り面白かったので、教科書を探してみます。(ノイマンのゲーム理論の基礎しか学んだことがないので)
ベイズやテューキーについては、コンピュータと統計、いわゆるデータサイエンスに重要だという話をよく聞くので、こちらについても詳しく書かれた本を読みたくなりました。
木村すらいむ(@kimu3_slime)でした。ではでは。
SBクリエイティブ
売り上げランキング: 607,715
こちらもおすすめ
確率論はいかに科学へ応用されたか? 「確率の哲学的試論」を読む
「数学をつくった人びと」レビュー:数千年受け継がれてきた数学