統計学の歴史:「社会の記録」から「未来を予測する科学」へ

科学史・産業史

統計学(Statistics)の語源は、ラテン語の「status(国家・状態)」に由来する「国家を運営するための数字」にあります。その出発点は、領土内の人口・税収・兵力を正確に把握し、統治に役立てるための記録でした。そこから統計は、数学や確率論と結びつくことで、単なる「記録」から未知を予測する「科学」へと変容を遂げることになります。本稿では、統計学がどのような歴史をたどり、現代の意思決定に不可欠な道具となったのかを振り返ります。

シリーズについて

本サイトのメインテーマは「暮らしの背後にある仕組みを読み解く」こと。中学・高校理科の知識をベースに、特定の専門に偏らず、物事の骨子を見抜く力を養います。記事は「歴史的背景」「科学的原理」「フィールド(実社会での応用)」の3層構造で構成しています。「なぜそうなったか」「どんな仕組みか」「現実で何が見えるか」。この3視点を揃えることで、断片的な知識を「線や面」へとつなげ、社会を生き抜くための判断の源泉を提供します。

国家のための数字――統計の黎明期

統計学の原点は「社会を現実の数字として克明に記録すること」にありました。古今東西、国家を建設しようとする指導者たちは、社会を管理するため、まず「民が何人いて、どれだけの食糧や税収があるか」を把握しようと試みました。

日本においても、記録の作成は国家形成の根幹を支えてきました。飛鳥時代の690年に作成された「庚午年籍」をはじめとする全国的な戸籍作りは、バラバラだった民を国家の管理下に置くために必要なことでした。誰がどこに住んでいるかを正確に把握しなければ、税を徴収することも兵役を課すこともできず、中央集権国家としての体裁を保つことは不可能だったからです。

この「数字による統治」がさらに高度なレベルへと引き上げられたのが、戦国から安土桃山時代にかけての「太閤検地」です。豊臣秀吉が行ったこの事業は、統計史上、極めて重要な「データの規格化」という革命をもたらしました。彼はそれまで地域ごとにバラバラだった「升」や「歩」といった単位を全国で統一し、土地の生産力を「石高」という単一の指標で数値化しました。基準を揃えることで、どの大名がどれだけの軍事力や経済力を持っているかを客観的に比較可能にしたのです。

江戸時代に入ると、日本の記録文化は世界でも類を見ない精度へと進化を遂げます。キリシタン禁制から始まった「宗門人別改帳」は、実質的には全住民を網羅する継続的な人口動態調査となりました。これにより幕府は数百年間にわたって全国の人口増減を把握し、飢饉に備えた食糧計画や都市の治安維持に役立てていました。

こうした動きは西洋でも同様に見られました。古代ローマでは5年に一度、市民の財産を申告させて納税額や軍の階級を決定する「ケンスス」が行われていました。これが現代の国勢調査の起源です。また、11世紀のイングランドでは、ウィリアム1世が家畜の一頭に至るまでを記録させた「ドゥームズデイ・ブック」を作成し、国家の課税能力を徹底的に可視化しました。

転換点が訪れたのは17世紀のイギリスです。ジョン・グラントは、ロンドンの膨大な死亡記録を集計・分析する中で、個別の死という偶発的な出来事の背後に規則性があることを発見しました。死因の割合や季節ごとの変動が一定のパターンを示すことを突き止めたのです。また、ウィリアム・ペティは、国家の富や人口を数値化し、客観的な政策判断の基礎に据える「政治算術」を提唱しました。

「個人はバラバラであっても、集団として俯瞰すれば安定したパターンが現れる」。この洞察こそが、統計を単なる「統治の道具」から、真実を解き明かす「科学」へと脱皮させたのです。

「事実」を「改善」に変えた時代

19世紀、統計はそれまでの「国家が国民を支配・把握するための道具」という枠を飛び越え、「社会の課題を可視化し、解決するための強力な武器」へと劇的な進化を遂げました。

その最初の一歩となったのが、1830年代にベルギーの天文学者ケトレーが提唱した「平均的人間」という概念の発見です。それまで、個々の人間の行動や身体的特徴は予測不可能なバラバラなものだと信じられていました。しかしケトレーが大量の身体測定値を集計したところ、集団として捉えた人間の身長や体重は一定の美しい分布(正規分布)に収まることが判明したのです。

さらに驚くべきことに、個人の自由意志によるものと考えられていた犯罪率や結婚率までもが、社会的な状況によって毎年一定の傾向を示すことを突き止めました。これは「社会や人間集団は、科学的に測定・分析・予測ができる対象である」ということを歴史上初めて証明した、画期的な瞬間でした。

この「社会を測定する技術」を、さらに「社会を直接変える力」へと引き上げたのが、1850年代のクリミア戦争で活躍したフローレンス・ナイチンゲールです。戦地の前線病院に赴いた彼女は、兵士たちが戦闘の傷ではなく、不衛生な院内環境による感染症で次々と命を落としていく惨状を目の当たりにします。

彼女はこの目に見えない危機を数字で捉え、1858年の報告書で「ローズチャート」と呼ばれる独自の円グラフを用いて視覚化しました。月ごとの死因を扇形の面積で表したこのグラフは、誰が見ても一目で「予防可能な感染症」が死因の圧倒的多数を占めていることを物語っていました。文字の羅列では伝わらない現実をデータによって可視化し、英国議会や頑迷な官僚たちを説得して病院の衛生改革を勝ち取ったこの功績は、まさに現代のデータサイエンスの原点であり、意思決定を動かす「説得の技術」そのものでした。

このように統計が社会の姿を映し出す一方で、産業革命によって急加速する経済活動の現場では、「未来の不確実性(リスク)」にどう立ち向かうかが切実な課題となっていました。船の遭難や工場の火災といった不測の事態に対し、19世紀半ばに本格的なプロフェッショナルとして台頭したのが「保険数理士(アクチュアリー)」たちです。

彼らは過去の膨大な事故データから「リスクが発生する確率」を厳密に計算し、それを「保険料」という具体的な金額へと変換していきました。それまでの「なんとなく不吉で怖い」という主観的な不安を、誰もが共有できる客観的な「コスト」へと置き換えたのです。これにより社会は、突発的に降りかかる個人の悲劇を、集団全体で分担して管理可能な「予測可能な制度」へと昇華させることに成功しました。

統計と確率の融合:偶然を「予測」に変えるエンジン

ナイチンゲールがデータを武器に社会を動かし、アクチュアリーがリスクを金額に換算できたのは、その背後に「偶然の中にある法則を導き出す数学」が確立されていたからです。過去の事実を整理する「統計」と、未来を予測する「確率」が融合したことで、人類は不確実な世界をコントロールする強力なエンジンを手に入れました。

その仕組みの原点は、1654年に数学者のパスカルとフェルマーが交わした書簡にまで遡ります。「まだ起きていない未来」を数字で扱う確率論のきっかけは、「賭けを途中でやめたとき、それまでの勝敗に応じて勝ち金をどう分けるのが公平か」という、ある賭博師からの極めて俗っぽい相談でした。

パスカルは、もし勝負を最後まで続けた場合に起こりうる「未来の全てのパターン」を想定し、それぞれの勝率を緻密に計算しました。これによって、それまで「人間の関知し得ない運命」で片付けられていた曖昧な概念を、未来のパターンの比率という「計算可能な数値」へと変換することに成功したのです。この偶然を切り分ける仕組みこそが、のちに不確実な未来の不測の事態に備える、近代的な保険制度の頑健な土台となっていいきました。

しかし、一回一回の偶然を計算できるようになっただけでは、複雑な社会現象までを読み解くことはできません。統計学を単なる数字の記録から本物の「科学」へと押し上げたのが、1713年に発表されたヤコブ・ベルヌーイによる「大数の法則」です。

大数の法則とは、一回一回は予測不可能でデタラメに見える偶然も、数千、数万回と試行を繰り返せば、全体の割合は必ず一つの理論的な正解(期待値)へと近づいていくという原理です。たとえば、コインを数回投げただけでは表ばかりが出るような「偏り」が頻繁に起こりますが、それを数万回、数十万回と投げ続ければ、表が出る割合は限りなく50%という真実に近づいていきます。「データが少ないうちは偶然のノイズに振り回されるが、膨大なデータが集まるほど真実が鮮やかにあぶり出される」というこの仕組みは、現代の世論調査やビッグデータ解析が、驚くほどの精度で社会の動向を言い当てるための根幹を支えています。

さらに1763年、トーマス・ベイズの遺稿として公表された「ベイズの定理」は、この統計学の世界に「学習と更新」という全く新しい概念をもたらしました。それまでの数学が「一度決めたら動かない絶対的な正解」を探すものだったのに対し、ベイズの定理は「不完全な予測からスタートし、新しい情報や証拠が得られるたびに、手持ちの確率(予測)を最適にアップデートしていく」という柔軟なアプローチを取ります。最初は曇っていた見通しが、事実というデータが積み重なるごとに、少しずつクリアになっていくのです。この「経験によって予測の精度を上げ、自己修正していく」というアプローチこそは、まさに現代のAIや機械学習が自らデータを読み込んで賢くなっていくプロセスの原点そのものです。

相関と因果の混同:統計の「落とし穴」と計算科学への進化

20世紀、統計はあらゆる学問の基盤となりましたが、同時に「数字の客観性」ゆえの危うさも浮き彫りになりました。その危うさが顕著に現れたのが、20世紀初頭に生じた「相関関係(関連がある)」と「因果関係(一方が原因である)」の混同です。

当時、カール・ピアソンは2つの変数の関係性を数値で表す「相関係数」を考案し、科学研究に不可欠なツールを確立しました。単なる数字上の関連(相関)を「科学的な正解(因果)」として盲信することは、深刻な誤解や差別を生む――。これは、客観性を担保するはずの統計学が、使い方次第で最大の武器にも凶器にもなるという宿命的な陥穽を露呈した歴史でした。

この数字の悪用や混乱に対し、理論的な一線を引いたのがロナルド・フィッシャーです。彼は「目の前にあるデータの差は、たまたま起きた偶然なのか、それとも意味がある差(必然)なのか」を厳密に判断する「仮説検定」や、偏りのない正しいデータを集めるための「実験計画法」を体系化しました。「たまたま起きた偏り」に人間が騙されないための数理的なルールを作ったことで、統計は現代科学における「証明」の標準言語としての地位を確立したのです。

こうして理論的な枠組みが整った統計学は、20世紀後半、コンピュータの登場によって決定的な限界突破を迎えます。それまで統計学者が紙とペンを使い、数週間かけて行っていた膨大な計算がわずか数秒で終わるようになり、統計は複雑なシミュレーションの道具(計算科学)へと進化しました。人口統計や経済指標といった巨大な実データを瞬時に処理できるようになっただけでなく、乱数を用いて複雑な確率問題を解く「モンテカルロ法」のような画期的な技法も生まれました。

そして、インターネットの普及によって生み出された「ビッグデータ」は、この計算科学を現代の「機械学習(AI)」へとダイレクトに繋ぐことになります。ここで、統計のあり方に歴史的な発想の転換が起きました。従来の統計学が「なぜそうなるのか」という因果の解明、つまり過去の「説明」を重視したのに対し、機械学習は「次に何が起きるか」という未来の「予測」の精度を最大化することを重視します。

たとえば「なぜ顧客はこの商品を買ったのか」という心理的な理由が完全には解明できなくても、「この顧客は次にこの商品を高確率で買う」という予測を正確に当てることができれば、ビジネスやシステムにおいては十分に機能します。この「理由の解明よりも、予測の精度」を最優先するパラダイムシフトこそが、2010年代以降の深層学習(ディープラーニング)の台頭を支え、自動翻訳や画像診断といった現代AI技術を爆発的に進化させる原動力となりました。

編集後記

400年の歴史が教えてくれるのは、統計は数字を使って「見えない仕組み」を可視化する知恵です。個人の動きはバラバラで予測不能ですが、集団として俯瞰すれば、そこには「パターン」が現れます。この規則性を見つけ出すことが、科学的に捉える第一歩となります。「なんとなく怖い」という主観的な不安も、客観的な「確率」という数値に置き換えることによって、人類は未来のリスクを比較し、制度として管理する手段を手にしました。

おわりに

最後までお読みいただき、ありがとうございました。本記事を通じて、暮らしの背後にある仕組みを読み解くヒントは得られましたでしょうか。もし「このテーマをもっと深く知りたい」と感じていただけましたら、ぜひ関連の解説記事もあわせてご覧ください。

本サイトではトピックをできるだけ「歴史・科学・フィールド」の3層構造で体系化しています(教育とキャリアを除く)。一つの事象を多角的に捉えることで、断片的な知識を「線や面」へとつなげることができます。多彩なテーマを用意していますので、ぜひサイト内の記事一覧から、あなたの知的好奇心を刺激するトピックを覗いてみてください。

著者&執筆ポリシー
この記事を書いた人
イカノフ

博士・電気主任技術者・エネルギー管理士・環境計量士、技術士補(生物)ほか)
 |  プロフィール詳細 →

本サイトでは、「科学リテラシーが個人の判断力を養い、社会の基盤を支える」という視点から情報を発信しています。義務教育で学ぶ理科や数学は、大人になった今こそ真価を発揮する知恵です。すべての市民がその力を手にしたとき、社会はどのように変わるのか。私たちはその問いを、多角的な視点から論じていきます。
|  問い合わせ→
|  プライベートポリシー→

イカノフをフォローする
科学史・産業史
タイトルとURLをコピーしました