二項分布・ポアソン分布・指数分布
成功回数・事象回数・待ち時間。一見バラバラな三つの分布が、n と p を動かすうちに一本の道で繋がっていく。
二項分布・ポアソン分布・指数分布 — 数える世界の確率モデル
- Step 1: n=20, p=0.5 → 左右対称のベル型。p を 0.1 に → 右に歪む。
- Step 2: n を 50、p を 0.06 に → np≈3。下のポアソン(λ=3)とほぼ同じ形になる。
- Step 3: n を大きく、p を小さく保つ → ポアソンに収束していく過程が見える。
// ここで使われる公式
具体例で読む(10回コインを投げて表が3回出る確率)
・p=0.5, n=10, k=3 のとき——
・p³ = 0.5³:「3回とも表が出る」確率
・(1−p)⁷ = 0.5⁷:「残り7回ぜんぶ裏」の確率
・この2つを掛けると「表表表裏裏裏裏裏裏裏」という特定の並びの確率になる
・でも表が3回出る並びは他にもある(表裏表裏裏…とか)。全部で ₁₀C₃ = 120通り
・だから P(X=3) = 120 × 0.5³ × 0.5⁷ ≈ 0.117
覚えておくと得する性質
・平均 = np(10回×0.5 = 5回、直感どおり)
・分散 = np(1−p)。p=0.5 のとき分散が最大 ← 結果が一番読めないのは五分五分のとき
- Step 1: λ=1 → 0付近に集中した急降下の形。λ=5 → ベル型に近づく。
- Step 2: λ を 20 まで上げる → 正規分布のベル型にそっくり(中心極限定理の予告)。
- Step 3: λ が平均でもあり分散でもある。λ=3 にしてグラフ左上の「E[X] = Var[X] = λ = 3.00」で確認。
// ここで使われる公式
具体例で読む(1時間に平均3件メールが来る。5件来る確率は?)
・λ=3, k=5 のとき——
・λ⁵ = 3⁵ = 243:「5件分のパワー」(λが大きいほど多く来やすい)
・e⁻³ ≈ 0.050:「0件も来ない確率」が基準。λが大きいほどここが小さい
・5! = 120:5件の来る順番を区別しない ← メールAが先かBが先かは気にしない
・P(X=5) = 243 × 0.050 / 120 ≈ 0.101
二項分布との関係 ← ここは押さえておきたい
・二項分布で n をめちゃくちゃ大きく、p をめちゃくちゃ小さくして np=λ を保つと → ポアソンに化ける
・上のシミュレーションで n=50, p=0.06 にしてみよう。λ=3 のポアソンとほぼ同じ形になる
・最大の特徴:平均 = 分散 = λ。これが成り立たないデータにポアソンを当てはめると失敗する
- Step 1: λ=1 → 平均待ち時間1。λ=2 → 平均0.5。λ が大きいほど「すぐ起きる」。
- Step 2: λ を 0.1 に → 裾が長い。稀にしか起きない事象の待ち時間。
- Step 3: 無記憶性:もう10分待っても、あと何分待つかは今来た人と同じ。
// ここで使われる公式
具体例で読む(平均5分に1本バスが来る。10分以上待つ確率は?)
・λ=1/5(1分あたり0.2本)、t=10 のとき——
・P(X > 10) = e⁻⁰·²×¹⁰ = e⁻² ≈ 0.135 → 約13.5%
・右の式は「t分以上待っちゃう確率」。t が大きいほど急激にゼロに近づく
ポアソン分布との裏表の関係
・ポアソンは「一定時間に何回来るか」(回数の分布)
・指数分布は「次に来るまで何分待つか」(時間の分布)
・同じλを"回数"で見るか"待ち時間"で見るかの違いだけ
無記憶性 ← これが指数分布の最大の特徴
・すでに10分待ったとしても、「あと5分以内に来る確率」は最初から数えた場合と同じ
・「もう長く待ったからそろそろ来るはず」は通用しない
・現実にこれが成り立つのは「発生率が時刻によらず一定」な場合だけ(例:放射性崩壊)
・バスや電車は時刻表があるので、実際には無記憶ではない
・むしろ逆方向:時刻表があるバスは「待つほど次の便に近づく」=待ち時間が長いほど次の到着確率が上がる。これが「無記憶でない」状態の中身
// 3つの分布のつながり — バラバラに覚えたら損
この3つ、参考書だと別のページに書いてあるから「3種類の独立した分布」に見えるけど、実はぜんぶつながっている。つながりが見えると、頭の中の整理が一段進む。
- 二項 → ポアソン:不良品率0.5%の工場で200個検査(n=200, p=0.005)→ λ=1 のポアソンで近似
- ポアソン ↔ 指数:「1時間にλ回来る」のがポアソン、「次が来るまでの時間」が指数。同じ現象の表と裏
- 二項 → 正規:np ≥ 5 かつ n(1−p) ≥ 5 なら正規分布 N(np, np(1−p)) で近似できる(中心極限定理の帰結)
// よくある誤解
p が小さく n が大きいときだけ。p=0.5, n=20 のコイン投げにポアソン近似したら全然合わない。上のシミュレーションで実際に比べてみよう。
指数分布(無記憶性)が前提なら間違い。一方で時刻表があるバスは、待ち時間が長くなるほど次の到着までのハザード(「次1分以内に来る確率」)が上がっていく──これが「無記憶でない」状態の数学的な姿で、ワイブル分布や決定論的到着が扱う領域。指数分布が当てはまるのは「完全にランダムに起きる事象」だけ。
※ ワイブル分布は StatPlay では扱わないが、参考書では「指数分布の次の章」に並ぶ概念として登場することが多い。気になったら手元の入門書で隣のページを開いてみてほしい。
np は平均。分散は np(1−p)。(1−p) の掛け忘れは定番のミスポイント。p が 0 や 1 に近いほど分散は小さくなる(結果がほぼ確定するから当然)。
// よく出会う形
離散分布まわりでは、同じ書き換えや同じ平均・分散の組がよく顔を出します。
- 余事象の形:「3回以上成功する確率」が、1 − P(0) − P(1) − P(2) と書き換えられる場面が頻繁に現れる。「全体から下側を引く」という同じ絵
- ポアソン近似の形:不良品率2%, 100個 のような「n が大きく p が小さい」場面で、λ = np = 2 のポアソンが二項の代わりに顔を出す
- 指数分布の生存確率の形:平均寿命1000時間の電球で500時間以上もつ確率は e⁻⁰·⁵ ≈ 0.607。P(X > t) = e⁻λt という形が、寿命や待ち時間で繰り返し見える
- 平均と分散のセット:ポアソンでは平均 = 分散 = λ、二項では分散 = np(1−p)。それぞれの分布が固有のセットを持っているという形になっている
各分に電話が来るか来ないか。
(平均 60/λ 分)