平均年収や支持率など、私たちは日々多くの数字に囲まれています。しかし、その数字は本当に現実を正しく表しているのでしょうか。本稿では、平均の落とし穴、サンプリングの偏り、グラフによる印象操作などを通して、数字や統計を読み解くための基本的な考え方を解説します。難しい計算ではなく、数字の裏側を見る視点を身につけることが目的です。
数字に騙されないために―数学と統計の正しい使い方
ニュースで「平均年収は500万円」と聞いたとき、「じゃあ自分もそれくらいもらえるはずだ」と思いますか?
実は、この平均には大きな罠が隠れています。
「データは嘘をつかない」とよく言われますが、これは半分正しくて、半分間違っています。
データそのものは嘘をつきませんが、データの使い方を間違えると、とんでもない勘違いをしてしまうのです。
今の時代、私たちは毎日たくさんの数字やグラフを見ます。数字を正しく理解できないと、簡単に騙されてしまいます。。
1. 数学は世界を理解する言葉
数学って何のためにあるの?
「数学なんて日常生活で使わない」と思っていませんか?実は、私たちは毎日数学を使っています。
朝起きて、「あと10分寝られる」と計算する。買い物で「300円のお菓子を2つ買ったら600円」と考える。電車の時刻表を見て「15時45分に着くから、ちょうど間に合う」と判断する。これらすべてに数学が使われています。
でも、数学の本当のすごさは、もっと深いところにあります。
抽象化の力
「抽象化」とは、具体的なものから本質だけを取り出すことです。
例えば、「りんご2個とみかん3個を合わせると5個」という話と、「鉛筆2本とノート3冊を合わせると5つ」という話は、まったく違う状況ですよね。でも、どちらも「2+3=5」という同じ数学で表せます。
これが抽象化です。りんごも鉛筆も、具体的な特徴を捨てて「数」だけに注目すると、同じルールで扱えるのです。
身近な例:地図とスケール
地図を見てください。「1センチが100メートル」と書いてあります。これも数学的な抽象化です。
実際の道路、建物、公園は、すべて違う形や大きさです。でも、すべてを100分の1に縮小するという数学的なルールで、紙の上に表現できます。
このルールのおかげで、知らない場所でも道がわかるのです。
関係性を見つける
数学のもう一つの力は、物事の間の関係を見つけることです。
例:速さと時間と距離
学校まで歩いて30分かかります。自転車なら10分です。なぜでしょう?
歩く速さは時速4キロくらい、自転車は時速12キロくらいです。自転車は歩きの3倍速いので、同じ距離を行くのに3分の1の時間で済みます。
「速さ」「時間」「距離」の3つは、バラバラではなく、関係し合っています。この関係を数学で表すと、一つがわかれば他もわかります。
検証の道具
数学は、「本当にそうか?」を確かめる道具でもあります。
例:お買い得の判断
スーパーで二つの商品があります。
- A商品:500グラムで300円
- B商品:300グラムで200円
どちらがお得でしょう?パッと見ではわかりませんよね。
でも、「100グラムあたり何円か」を計算すると:
- A商品:100グラムあたり60円
- B商品:100グラムあたり約67円
A商品の方がお得だとわかります。数学を使うと、感覚ではわからないことが明確になります。
数学は普遍的な言葉
数学の素晴らしいところは、世界中どこでも同じだということです。
日本語、英語、中国語は違います。でも、「2+2=4」はどこの国でも同じです。宇宙人と出会ったときも、数学なら通じるかもしれません。
だから科学では、数学を使って現象を表現します。数学で表せば、言葉が違う人とも、正確に情報を共有できるからです。
2. 統計の罠―平均だけを見てはいけない
平均の落とし穴
統計でよく使われる「平均」。とても便利ですが、同時にとても危険な数字です。
例1:クラスの平均点
5人の生徒がテストを受けました。点数は:
- Aさん:60点
- Bさん:65点
- Cさん:70点
- Dさん:75点
- Eさん:100点
平均点は74点です。
でも、ちょっと待ってください。5人のうち4人は74点より低い点数です。「平均点」が実態を表しているでしょうか?
Eさんの100点(外れ値)が平均を引き上げているのです。
例2:年収の平均
もっと深刻な例を見ましょう。
ある小さな会社に10人の社員がいます。
- 社長:年収3000万円
- 社員9人:年収それぞれ300万円
この会社の平均年収を計算すると:(3000万円 + 300万円×9人) ÷ 10人 = 570万円
求人広告に「当社の平均年収は570万円!」と書いてあったら、良い会社だと思いますよね。でも実際には、9人は300万円しかもらっていません。
平均が実態を隠してしまった例です。
中央値という考え方
こういう問題を解決するのが「中央値」です。
中央値とは、データを順番に並べたときの真ん中の値です。
先ほどのテストの例だと:60、65、70、75、100 真ん中は70点です。これが中央値です。
会社の例だと:300、300、300、300、300、300、300、300、300、3000(単位:万円) 真ん中は300万円です。
中央値の方が、実態に近いことがわかります。
日本の年収の例
実際の統計でも、この違いは重要です。日本の年収を見ると:
- 平均年収:約430万円
- 中央値:約360万円
70万円も違います。なぜでしょう?
ごく一部の高年収の人(億万長者など)が平均を引き上げているのです。「日本人の半分は平均年収以下」という、変な話が生まれる理由がここにあります。
分散・ばらつきを見る
平均や中央値だけでなく、「ばらつき」も大切です。
例:二つのクラスのテスト
Aクラスの点数:50、60、70、80、90点(平均70点) Bクラスの点数:68、69、70、71、72点(平均70点)
平均は同じです。でも、クラスの雰囲気はまったく違いますよね。
Aクラスは学力差が大きく、できる子とできない子の差が激しいです。Bクラスはみんな同じくらいの学力です。
この「差」を表すのが分散(ばらつき)です。平均だけ見ていたら、この違いに気づけません。
外れ値の影響
「外れ値」とは、他のデータとかけ離れた値のことです。
例:身長の測定
クラスで身長を測りました。ほとんどの生徒は150~170センチです。でも、一人だけ「500センチ」と記録されていました。
これは明らかにおかしいですね。測定ミスか、記入ミスでしょう。
でも、この値を含めて平均を計算したら、平均身長が実際より高くなってしまいます。
データを見るときは、外れ値がないか、あったら理由は何かを考える必要があります。
グラフの嘘
平均の問題は、グラフでも起こります。
例:気温の変化
「今年の平均気温は去年と同じ」というグラフがあったとします。「じゃあ気候は変わってないんだ」と思いますか?
でも、よく見ると:
- 夏はもっと暑くなった(35度→38度)
- 冬はもっと寒くなった(5度→2度)
- 平均すると同じ
平均は同じでも、実際には極端な天気が増えているかもしれません。
数字やグラフを見るときは、その裏にある実態を考えることが大切です。
3. サンプリングと偏り―誰に聞くかで答えが変わる
すべてを調べられない
世の中には、すべてを調べることが不可能なことがたくさんあります。
「日本人は何歳まで生きるか」を知りたいとき、全員が死ぬまで待つわけにはいきません。
だから、一部の人(サンプル)を調べて、全体を推測します。これが「サンプリング」です。
サンプリングの例:視聴率
テレビの視聴率は、全家庭を調べているわけではありません。
全国で約6000世帯に特殊な機械を設置して、その家庭が何を見ているかを調べます。
そのデータから、「全国で何%の人がこの番組を見ている」と推測します。
6000世帯だけで、日本全体の傾向がわかるなんて、不思議ですよね。
でも、正しくサンプリングすれば、かなり正確に推測できるのです。
偏りの怖さ
ここで重要なのが「偏り(バイアス)」です。
サンプルが偏っていると、結果も偏ります。とんでもない間違いを犯すことがあります。
例1:街頭インタビュー
テレビで「若者の意見を聞きました」と、渋谷で街頭インタビューをしています。
でも、待ってください。渋谷の街を平日の昼間に歩いている若者は、「すべての若者」を代表しているでしょうか?
- 学校に行っている学生は含まれていません
- 仕事をしている若者も含まれていません
- 渋谷に来る理由がある若者だけです
このサンプルは偏っています。ここから「若者の意見」を語るのは危険です。
例2:ネット投票
ある新聞社がウェブサイトで「○○政策に賛成ですか?」とアンケートをしました。10万人が回答し、70%が賛成でした。
「国民の70%が賛成だ!」と言えるでしょうか?
いいえ。これに回答したのは:
- その新聞のウェブサイトを見る人(見ない人は含まれない)
- わざわざアンケートに答える人(無関心な人は含まれない)
- その政策に強い意見を持つ人(中立的な人は答えにくい)
このサンプルは大きく偏っています。
例3:戦争の予測(有名な失敗例)
1936年のアメリカ大統領選挙で、ある雑誌が電話で世論調査をしました。結果、「ランドン候補が圧勝する」と予測しました。
でも、実際にはルーズベルト候補が圧勝しました。なぜ予測は外れたのでしょう?
当時、電話を持っているのは裕福な家庭だけでした。電話調査は「お金持ちの意見」を聞いていただけだったのです。お金持ちは保守的な候補を支持する傾向があり、サンプルが偏っていました。
便宜的サンプリングの危険
「便宜的サンプリング」とは、調べやすい人だけを調べることです。
例:薬の治験
新しい薬の効果を調べるとき、「病院に来た患者さん」だけを調べたらどうでしょう?
でも、重症で動けない人は病院に来られないかもしれません。軽症で病院に行かない人もいます。「病院に来た人」は、「すべての患者」ではありません。
これも偏りです。
先入観による偏り
調査する人の先入観も、偏りを生みます。
例:友達へのアンケート
「この映画は面白かったですか?」と友達にアンケートをしました。全員が「面白かった」と答えました。
でも、考えてみてください。その映画を一緒に見に行った友達は、もともとその映画に興味があった人たちです。
興味がない人は誘っていません。
このアンケートでは「映画が面白いかどうか」はわかりません。「興味を持って見に行った人は楽しめた」ということしかわかりません。
正しいサンプリングの方法
では、どうすれば偏りを避けられるのでしょう?
ランダムサンプリング
最も基本的な方法は「ランダム(無作為)サンプリング」です。くじ引きのように、誰が選ばれるかわからない方法で選びます。
例えば、全校生徒から100人を選ぶとき、名簿から機械的に選びます。「1組から2人、2組から2人…」と均等に選んでもいいですし、完全にランダムに選んでもいいです。
大切なのは、調査する人の好みや便利さで選ばないことです。
層別サンプリング
もっと工夫した方法もあります。
日本人全体の意見を知りたいとき、性別、年齢、地域が偏らないように選びます。「20代男性が1000人中200人、20代女性が200人…」というように、人口比率に合わせて選ぶのです。
これで、より正確に「日本人全体」の意見を推測できます。
サンプルサイズ(大きさ)も大切
偏りがなくても、サンプルが小さすぎると信頼できません。
例:コインの表裏
コインを投げて表裏を調べます。「表が出る確率は50%」のはずですが、3回投げただけだと、「表、表、表」と3回連続で表が出ることもあります。「このコインは表しか出ない」と結論づけるのは早すぎます。
でも、1000回投げれば、だいたい500回くらいは表が出ます。サンプルが大きいほど、偶然の影響が小さくなります。
一般的に、数十人では少なく、数百人から数千人あれば、かなり信頼できる結果になります。(テーマや調査方法にもよりますが)
これらを組み合わせて考える
数学的・統計的リテラシーは、これらの知識を組み合わせて使うことです。
ケーススタディ1:ダイエット食品の広告
「この商品を使った人の平均で5キロ痩せました!」という広告を見ました。信じられるでしょうか?
チェックポイント:
- 平均の罠:何人で試しましたか?1人が20キロ痩せて、9人が変わらなかったら、平均は2キロです。でも、ほとんどの人には効果がありません。中央値や分散も知りたいです。
- サンプリングの偏り:誰が試しましたか?もともと痩せる気満々で、運動も食事制限もした人だけではありませんか?「普通の人」が試したデータですか?
- 因果関係:本当にこの商品のおかげですか?同時に運動もしていたら、運動の効果かもしれません。
- 外れ値:誰か一人が極端に痩せた結果で、平均が引き上げられていませんか?
このように、数字の裏側を考えることが大切です。
日常生活で使えるチェックリスト
数字や統計を見たとき、これらを自問してみましょう:
平均を見たら:
- 中央値はいくつ?
- ばらつきはどれくらい?
- 外れ値はない?
- 何人のデータ?
アンケート結果を見たら:
- 誰に聞いた?
- 何人に聞いた?
- どうやって選んだ?
- 質問の仕方は公平?
比較を見たら:
- 条件は同じ?
- 他の要因は排除されてる?
- グラフの目盛りは適切?
因果関係を言われたら:
- 本当に原因と結果?
- 偶然の一致では?
- 他の要因は?
グラフの嘘にも注意
数字だけでなく、グラフでも騙されることがあります。
例:縦軸を切ったグラフ
売上のグラフを見ます。去年100億円、今年105億円。グラフでは、今年の棒が去年の2倍の高さに見えます。
でも、よく見ると、縦軸が95億円から始まっています。
0から始めると、ほとんど差が見えないので、わざと拡大して見せているのです。
これは嘘ではありませんが、印象操作です。
例:円グラフの3D表示
3Dの円グラフは、手前の部分が大きく見えます。同じ20%でも、手前に配置された項目は大きく見え、奥の項目は小さく見えます。
見た目で判断せず、数字を確認することが大切です。
おわりに
数学や統計は、難しい計算をするためだけのものではありません。それは、世界を正確に理解し、騙されないための道具です。
今の時代、数字を使った嘘や誤解がたくさんあります。悪意がある場合もあれば、単に間違えている場合もあります。
でも、数学的・統計的リテラシーを身につければ、そういった罠を見抜けます。
大切なのは:
- 平均だけを信じない(中央値、分散、外れ値も見る)
- 誰のデータか考える(サンプリングの偏りを疑う)
- 数字の裏を読む(どう測った?何と比べた?)
これらを習慣にすれば、ニュースを見るとき、広告を見るとき、何かを判断するとき、より賢い選択ができるようになります。
数字は強力な道具です。正しく使えば真実が見えます。でも、間違えて使えば、または悪意を持って使われれば、人を騙すこともできます。
※AI支援によって記事を作成しています。

コメント