母比率の検定と推定 — 比率のz検定を可視化
推定では p̂、検定では p₀。一文字違いが標準誤差の式を変える——比率の検定の急所はここに尽きる。
母比率の検定と推定 — 標本比率から母比率を探る
データが「成功 / 失敗」の二択しかない世界。標本比率 p̂ = x/n がすべての出発点で、n が十分大きければ正規分布で近似できる(中心極限定理のおかげ)。
ここでは ① 区間推定 → ② 1標本検定 → ③ 2標本検定 の順に触っていく。平均のときと何が同じで何が違うのか、比べながら進めると整理しやすい。
- Step 1: n=15, p̂=0.50, 95% → 信頼区間がかなり広い。たった15人では精度が出ない。
- Step 2: n を 100 に → 信頼区間がぐっと狭まる。サンプルサイズの威力を実感。
- Step 3: p̂ を 0.90 に → 分散 p(1-p) が小さくなり、CI が狭くなる。p̂=0.50 が最も広い。
- Step 4: p̂=0.90 のまま n を 10 に下げる → ⚠ 警告が出たら正規近似の条件を満たしていない。
▶ ① 母比率の区間推定
「95%信頼区間って、つまり何?」── 最初に立ち止まりやすい場所。答えは「同じ調査を何回もやったら、そのうち約95%の区間が真の母比率を捕まえる」ということ。
Run を押して200回試してみると、この「95%」が本当かどうか確かめられる。
▶ ①-b 信頼区間シミュレーション
- Step 1: n=100, p̂=0.60, p₀=0.50, 有意水準 α=0.05, 両側 → 「60%は50%と有意に違うか?」
α(有意水準)=「これより極端なら偶然じゃないと判断する」基準線。α が棄却域の広さを決める。 - Step 2: p₀ を 0.55 に → z が小さくなり棄却できなくなる。差が小さいと見分けがつかない。
- Step 3: n を 400 に → 同じ p̂=0.60, p₀=0.55 でも今度は棄却できる。サンプルサイズの威力。
- Step 4: 検定タイプを「右側」に → 「50%より大きいか」だけを問う片側検定。p値が半分に。
▶ ② 母比率の検定(1標本z検定)
母平均の検定でやったことと同じ流れ。帰無仮説 H₀: p = p₀ を立てて、標本から計算した z が棄却域に入るかどうかを見るだけ。
標準誤差の式が √(p₀(1−p₀)/n) に変わるところだけ押さえれば、もう迷わないはず。
- Step 1: n₁=n₂=100, p̂₁=0.60, p̂₂=0.45 → 差は有意か?
- Step 2: p̂₂ を 0.55 に近づける → z が小さくなり、棄却が難しくなる。
- Step 3: n₁=n₂=400 に増やす → 同じ差でも検出力が上がる。
- Step 4: n₁=50, n₂=200 と非対称にしてみる → 小さい方のnが精度のボトルネック。
▶ ③ 2つの母比率の差の検定
「薬Aと薬B、どっちが効く?」「広告A vs B、クリック率に差はある?」── そういう2群比較のための検定。
H₀: p₁ = p₂ を仮定してプール比率で共通のSEを作るところがポイント。ここだけ押さえれば1標本と同じ。
// ここで使われる公式
★ 推定と検定で SE の中身が違う
推定では SE = √(p̂(1−p̂)/n)、検定では SE = √(p₀(1−p₀)/n)。 同じ「比率の SE」という名前でも、推定は標本の世界(手元のデータが基準)、検定は H₀ の世界(仮定した母比率が基準)を基準にする。下の最初の2式の分母を見比べると、ここだけが違う。
母比率の区間推定(Wald型信頼区間)
・p̂ = x/n:標本比率(n人中x人が「成功」)
・zα/2:標準正規分布の上側 α/2 点。α は有意水準(=「信頼区間の外側に出る確率」)。95% CI なら α=0.05 で z0.025=1.96
・√(p̂(1−p̂)/n):標本比率の標準誤差。平均の SE = σ/√n と似ているが、分散が p(1−p) で決まるのが比率ならではの特徴
母比率の検定(1標本z検定)
・p₀:帰無仮説で想定する母比率(「50%である」なら p₀ = 0.5)
・分母の SE は p₀ を使う(推定ではなく検定なので、H₀ の世界を基準にする)
・この z が標準正規分布に従うことを使って p値を計算する
2つの母比率の差の検定
・p̂:プール比率(2群を合算した全体の比率)。H₀: p₁ = p₂ の下では2群の母比率は同じはずなので、合算して推定する
・分母は「差の標準誤差」。1/n₁ + 1/n₂ が入ることで、サンプルサイズが小さい方がボトルネックになる構造
// 正規近似の条件 — いつこの方法が使えるのか
比率のz検定・信頼区間は「標本比率 p̂ が正規分布に従う」ことを前提にしている。
この近似が成り立つ目安は:
- np ≥ 5 かつ n(1−p) ≥ 5(検定では p₀ を使う)
- 直感的には「成功も失敗も5回以上は起きそう」ということ
- p が 0 や 1 に近いと、分布が歪んでしまい正規近似が崩れる
条件を満たさない場合は、二項検定(正確検定 / exact binomial test)を使うか、n を増やして出直す。
上の ① のグラフで n を小さくしたり p̂ を 0.01 に近づけると、⚠ 警告が出るのはこのため。
// 推定と検定の使い分け
- 区間推定:「母比率はだいたいどのあたりか?」を知りたいとき → 信頼区間で幅を提示
- 検定:「母比率は p₀ と違うのか?」にYES/NOで答えたいとき → p値で判定
- 両者は表裏一体:95% CIに p₀ が含まれない ⟺ 有意水準 α=0.05 で H₀ を棄却
この対応関係を ① と ② を行き来しながら確認すると、両者が同じことを言っているのが目で見える。同じ n と p̂ で、① の CI に p₀ が入っていなければ ② では棄却される。
// よくある誤解
推定では SE = √(p̂(1−p̂)/n) と標本比率を使うが、検定では SE = √(p₀(1−p₀)/n) と帰無仮説の値を使う。「どの世界を基準にするか」が違う。
p が 0.001 のように極端に小さいと、n=1000 でも np=1 で条件を満たさない。「5以上ルール」は p と n の両方を見る。
H₀: p₁=p₂ の下では母比率は同じはず。だからプール比率で共通の SE を計算する。個別に計算するのは信頼区間を作るとき。
// よく出会う形
比率の検定・推定では、推定の SE と検定の SE の使い分けと、正規近似の条件チェックが繰り返し顔を出します。
- 区間推定の組み立ての形:200人中120人賛成のとき、p̂=0.6, SE=√(0.6×0.4/200), 95%CI = 0.6 ± 1.96×SE。「中心 ± 倍率 × 標準誤差」という三層構造が、比率でもそのまま顔を出している
- 検定統計量の形:500個中35個不良なら、p̂=0.07, p₀=0.05, z = (0.07−0.05)/√(0.05×0.95/500)。分母に「H₀ の世界の SE」が入る、という違いが推定との対比で見える
- 正規近似が成立する条件:np ≥ 5 かつ n(1−p) ≥ 5。n=20, p₀=0.1 だと np₀=2 で条件を外れる、という形でチェックポイントが登場する
- 2標本の差の検定の形:「A群 60/100 改善、B群 45/100 改善」のような場面では、プール比率を分母の SE に使うという特徴的な構造が顔を出す