メインコンテンツへスキップ

二項分布・ポアソン分布・指数分布

成功回数・事象回数・待ち時間。一見バラバラな三つの分布が、n と p を動かすうちに一本の道で繋がっていく。

P.05 / DISCRETE + EXPONENTIAL

二項分布・ポアソン分布・指数分布 — 数える世界の確率モデル

正規分布は連続で対称。でも現実のデータはそうとは限らない。コイン投げは離散、来客数はポアソン、待ち時間は指数分布。残りの分布で道具箱を完成させよう。
統計の入り口でよく登場する二項分布ポアソン分布指数分布の三つ。成功回数・事象発生回数・待ち時間——離散と連続の橋渡しをスライダーで体感する。
実験ガイド — 二項分布
  1. Step 1: n=20, p=0.5 → 左右対称のベル型。p を 0.1 に → 右に歪む。
  2. Step 2: n を 50、p を 0.06 に → np≈3。下のポアソン(λ=3)とほぼ同じ形になる。
  3. Step 3: n を大きく、p を小さく保つ → ポアソンに収束していく過程が見える。
二項分布 B(n, p)
いつ使う? → コイン10回で表が何回出るか、不良品検査で100個中何個不良か
20
0.35
n → ∞ かつ np → λ で、二項はポアソンへ。

// ここで使われる公式

具体例で読む(10回コインを投げて表が3回出る確率)
・p=0.5, n=10, k=3 のとき——
・p³ = 0.5³:「3回とも表が出る」確率
・(1−p)⁷ = 0.5⁷:「残り7回ぜんぶ裏」の確率
・この2つを掛けると「表表表裏裏裏裏裏裏裏」という特定の並びの確率になる
・でも表が3回出る並びは他にもある(表裏表裏裏…とか)。全部で ₁₀C₃ = 120通り
・だから P(X=3) = 120 × 0.5³ × 0.5⁷ ≈ 0.117

覚えておくと得する性質
・平均 = np(10回×0.5 = 5回、直感どおり)
・分散 = np(1−p)。p=0.5 のとき分散が最大 ← 結果が一番読めないのは五分五分のとき

実験ガイド — ポアソン分布
  1. Step 1: λ=1 → 0付近に集中した急降下の形。λ=5 → ベル型に近づく。
  2. Step 2: λ を 20 まで上げる → 正規分布のベル型にそっくり(中心極限定理の予告)。
  3. Step 3: λ が平均でもあり分散でもある。λ=3 にしてグラフ左上の「E[X] = Var[X] = λ = 3.00」で確認。
ポアソン分布 Poisson(λ)
いつ使う? → 1時間にコールセンターに来る電話の本数、1日の交通事故件数
3
λ が大きくなるにつれ、ポアソンは正規分布に近づく。

// ここで使われる公式

具体例で読む(1時間に平均3件メールが来る。5件来る確率は?)
・λ=3, k=5 のとき——
・λ⁵ = 3⁵ = 243:「5件分のパワー」(λが大きいほど多く来やすい)
・e⁻³ ≈ 0.050:「0件も来ない確率」が基準。λが大きいほどここが小さい
・5! = 120:5件の来る順番を区別しない ← メールAが先かBが先かは気にしない
・P(X=5) = 243 × 0.050 / 120 ≈ 0.101

二項分布との関係 ← ここは押さえておきたい
・二項分布で n をめちゃくちゃ大きく、p をめちゃくちゃ小さくして np=λ を保つと → ポアソンに化ける
・上のシミュレーションで n=50, p=0.06 にしてみよう。λ=3 のポアソンとほぼ同じ形になる
・最大の特徴:平均 = 分散 = λ。これが成り立たないデータにポアソンを当てはめると失敗する

実験ガイド — 指数分布
  1. Step 1: λ=1 → 平均待ち時間1。λ=2 → 平均0.5。λ が大きいほど「すぐ起きる」。
  2. Step 2: λ を 0.1 に → 裾が長い。稀にしか起きない事象の待ち時間。
  3. Step 3: 無記憶性:もう10分待っても、あと何分待つかは今来た人と同じ。
指数分布 Exp(λ) — 待ち時間
いつ使う? → 次の電話が来るまでの待ち時間、電球が切れるまでの寿命
1
無記憶性:バスを10分待っても、あと何分待つかは今来た人と同じ。過去の待ち時間は将来に影響しない。

// ここで使われる公式

具体例で読む(平均5分に1本バスが来る。10分以上待つ確率は?)
・λ=1/5(1分あたり0.2本)、t=10 のとき——
・P(X > 10) = e⁻⁰·²×¹⁰ = e⁻² ≈ 0.135 → 約13.5%
・右の式は「t分以上待っちゃう確率」。t が大きいほど急激にゼロに近づく

ポアソン分布との裏表の関係
・ポアソンは「一定時間に何回来るか」(回数の分布)
・指数分布は「次に来るまで何分待つか」(時間の分布)
・同じλを"回数"で見るか"待ち時間"で見るかの違いだけ

無記憶性 ← これが指数分布の最大の特徴
・すでに10分待ったとしても、「あと5分以内に来る確率」は最初から数えた場合と同じ
・「もう長く待ったからそろそろ来るはず」は通用しない
・現実にこれが成り立つのは「発生率が時刻によらず一定」な場合だけ(例:放射性崩壊)
・バスや電車は時刻表があるので、実際には無記憶ではない
・むしろ逆方向:時刻表があるバスは「待つほど次の便に近づく」=待ち時間が長いほど次の到着確率が上がる。これが「無記憶でない」状態の中身

// 3つの分布のつながり — バラバラに覚えたら損

この3つ、参考書だと別のページに書いてあるから「3種類の独立した分布」に見えるけど、実はぜんぶつながっている。つながりが見えると、頭の中の整理が一段進む。

二項分布 ──n大・p小──→ ポアソン分布 │ │ │ np, n(1-p)ともに大 │ 「次までの ↓ ↓ 待ち時間」 正規分布で近似 指数分布
  • 二項 → ポアソン:不良品率0.5%の工場で200個検査(n=200, p=0.005)→ λ=1 のポアソンで近似
  • ポアソン ↔ 指数:「1時間にλ回来る」のがポアソン、「次が来るまでの時間」が指数。同じ現象の表と裏
  • 二項 → 正規:np ≥ 5 かつ n(1−p) ≥ 5 なら正規分布 N(np, np(1−p)) で近似できる(中心極限定理の帰結)

// よくある誤解

❌「ポアソン分布はいつでも二項分布の代わりに使える」

p が小さく n が大きいときだけ。p=0.5, n=20 のコイン投げにポアソン近似したら全然合わない。上のシミュレーションで実際に比べてみよう。

❌「もう10分待ったんだから、そろそろバスが来るはず」

指数分布(無記憶性)が前提なら間違い。一方で時刻表があるバスは、待ち時間が長くなるほど次の到着までのハザード(「次1分以内に来る確率」)が上がっていく──これが「無記憶でない」状態の数学的な姿で、ワイブル分布や決定論的到着が扱う領域。指数分布が当てはまるのは「完全にランダムに起きる事象」だけ。

※ ワイブル分布は StatPlay では扱わないが、参考書では「指数分布の次の章」に並ぶ概念として登場することが多い。気になったら手元の入門書で隣のページを開いてみてほしい。

❌「二項分布の分散は np」

np は平均。分散は np(1−p)。(1−p) の掛け忘れは定番のミスポイント。p が 0 や 1 に近いほど分散は小さくなる(結果がほぼ確定するから当然)。

// よく出会う形

離散分布まわりでは、同じ書き換えや同じ平均・分散の組がよく顔を出します。

  • 余事象の形:「3回以上成功する確率」が、1 − P(0) − P(1) − P(2) と書き換えられる場面が頻繁に現れる。「全体から下側を引く」という同じ絵
  • ポアソン近似の形:不良品率2%, 100個 のような「n が大きく p が小さい」場面で、λ = np = 2 のポアソンが二項の代わりに顔を出す
  • 指数分布の生存確率の形:平均寿命1000時間の電球で500時間以上もつ確率は e⁻⁰·⁵ ≈ 0.607。P(X > t) = e⁻λt という形が、寿命や待ち時間で繰り返し見える
  • 平均と分散のセット:ポアソンでは平均 = 分散 = λ、二項では分散 = np(1−p)。それぞれの分布が固有のセットを持っているという形になっている
無記憶性デモ — 「もう10分待った」は無意味?
左は正規分布的な待ち時間。待てば待つほど「そろそろ来る」確率が上がる。右は指数分布。t をどれだけ動かしても曲線が変わらない——これが無記憶性。
正規分布(普通の感覚)
← t が増えると左にシフト(「そろそろ来る」)
指数分布(無記憶)
← t をいくら動かしても同じ形
0
0.20
同じ現象、3つの視点 — コールセンターの1時間
「1時間にλ件電話が来る」を3つの分布で同時に見る。λスライダーを動かすと3つとも変わる。同じ現象を「回数で数える」か「時間で測る」かの違い。
3.0
二項分布 B(60, λ/60)
60分を1分刻み。
各分に電話が来るか来ないか。
ポアソン分布 Poi(λ)
1時間に合計何件来る?
指数分布 Exp(λ)
次の電話まで何分待つ?
(平均 60/λ 分)
次は —平均を取ると正規分布になる? I1 中心極限定理