メインコンテンツへスキップ

母比率の検定と推定 — 比率のz検定を可視化

推定では p̂、検定では p₀。一文字違いが標準誤差の式を変える——比率の検定の急所はここに尽きる。

PROPORTION TEST & ESTIMATION

母比率の検定と推定 — 標本比率から母比率を探る

母平均で信頼区間や検定をやったときと、考え方はまったく同じ。ただ「連続的なデータの平均」から「成功 or 失敗のカウント」に変わると、標準誤差の形がちょっと違ってくる。ここを触って慣れておくと、参考書の公式がスッと入ってくるはず。

データが「成功 / 失敗」の二択しかない世界。標本比率 p̂ = x/n がすべての出発点で、n が十分大きければ正規分布で近似できる(中心極限定理のおかげ)。
ここでは ① 区間推定② 1標本検定③ 2標本検定 の順に触っていく。平均のときと何が同じで何が違うのか、比べながら進めると整理しやすい。

実験ガイド — 順番に試してみよう
  1. Step 1: n=15, p̂=0.50, 95% → 信頼区間がかなり広い。たった15人では精度が出ない。
  2. Step 2: n を 100 に → 信頼区間がぐっと狭まる。サンプルサイズの威力を実感。
  3. Step 3: p̂ を 0.90 に → 分散 p(1-p) が小さくなり、CI が狭くなる。p̂=0.50 が最も広い。
  4. Step 4: p̂=0.90 のまま n を 10 に下げる → ⚠ 警告が出たら正規近似の条件を満たしていない。

▶ ① 母比率の区間推定

標準誤差 SE
信頼区間 下限
信頼区間 上限
誤差幅 E
シミュレーション — 「95%」の意味を確かめる

「95%信頼区間って、つまり何?」── 最初に立ち止まりやすい場所。答えは「同じ調査を何回もやったら、そのうち約95%の区間が真の母比率を捕まえる」ということ。
Run を押して200回試してみると、この「95%」が本当かどうか確かめられる。

▶ ①-b 信頼区間シミュレーション

生成数0
捕捉率
実験ガイド — 比率の検定を体験
  1. Step 1: n=100, p̂=0.60, p₀=0.50, 有意水準 α=0.05, 両側 → 「60%は50%と有意に違うか?」
    α(有意水準)=「これより極端なら偶然じゃないと判断する」基準線。α が棄却域の広さを決める。
  2. Step 2: p₀ を 0.55 に → z が小さくなり棄却できなくなる。差が小さいと見分けがつかない。
  3. Step 3: n を 400 に → 同じ p̂=0.60, p₀=0.55 でも今度は棄却できる。サンプルサイズの威力。
  4. Step 4: 検定タイプを「右側」に → 「50%より大きいか」だけを問う片側検定。p値が半分に。

▶ ② 母比率の検定(1標本z検定)

母平均の検定でやったことと同じ流れ。帰無仮説 H₀: p = p₀ を立てて、標本から計算した z が棄却域に入るかどうかを見るだけ。
標準誤差の式が √(p₀(1−p₀)/n) に変わるところだけ押さえれば、もう迷わないはず。

検定統計量 z
臨界値
p値
判定
実験ガイド — 2群の比率を比較
  1. Step 1: n₁=n₂=100, p̂₁=0.60, p̂₂=0.45 → 差は有意か?
  2. Step 2: p̂₂ を 0.55 に近づける → z が小さくなり、棄却が難しくなる。
  3. Step 3: n₁=n₂=400 に増やす → 同じ差でも検出力が上がる。
  4. Step 4: n₁=50, n₂=200 と非対称にしてみる → 小さい方のnが精度のボトルネック。

▶ ③ 2つの母比率の差の検定

「薬Aと薬B、どっちが効く?」「広告A vs B、クリック率に差はある?」── そういう2群比較のための検定。
H₀: p₁ = p₂ を仮定してプール比率で共通のSEを作るところがポイント。ここだけ押さえれば1標本と同じ。

プール比率 p̂
検定統計量 z
p値
判定

// ここで使われる公式

★ 推定と検定で SE の中身が違う
推定では SE = √(p̂(1−p̂)/n)、検定では SE = √(p₀(1−p₀)/n)。 同じ「比率の SE」という名前でも、推定は標本の世界(手元のデータが基準)、検定は H₀ の世界(仮定した母比率が基準)を基準にする。下の最初の2式の分母を見比べると、ここだけが違う。

母比率の区間推定(Wald型信頼区間)

・p̂ = x/n:標本比率(n人中x人が「成功」)
・zα/2:標準正規分布の上側 α/2 点。α は有意水準(=「信頼区間の外側に出る確率」)。95% CI なら α=0.05 で z0.025=1.96
・√(p̂(1−p̂)/n):標本比率の標準誤差。平均の SE = σ/√n と似ているが、分散が p(1−p) で決まるのが比率ならではの特徴

母比率の検定(1標本z検定)

・p₀:帰無仮説で想定する母比率(「50%である」なら p₀ = 0.5)
・分母の SE は p₀ を使う(推定ではなく検定なので、H₀ の世界を基準にする)
・この z が標準正規分布に従うことを使って p値を計算する

2つの母比率の差の検定

・p̂:プール比率(2群を合算した全体の比率)。H₀: p₁ = p₂ の下では2群の母比率は同じはずなので、合算して推定する
・分母は「差の標準誤差」。1/n₁ + 1/n₂ が入ることで、サンプルサイズが小さい方がボトルネックになる構造

// 正規近似の条件 — いつこの方法が使えるのか

比率のz検定・信頼区間は「標本比率 p̂ が正規分布に従う」ことを前提にしている。
この近似が成り立つ目安は:

  • np ≥ 5 かつ n(1−p) ≥ 5(検定では p₀ を使う)
  • 直感的には「成功も失敗も5回以上は起きそう」ということ
  • p が 0 や 1 に近いと、分布が歪んでしまい正規近似が崩れる

条件を満たさない場合は、二項検定(正確検定 / exact binomial test)を使うか、n を増やして出直す。
上の ① のグラフで n を小さくしたり p̂ を 0.01 に近づけると、⚠ 警告が出るのはこのため。

// 推定と検定の使い分け

  • 区間推定:「母比率はだいたいどのあたりか?」を知りたいとき → 信頼区間で幅を提示
  • 検定:「母比率は p₀ と違うのか?」にYES/NOで答えたいとき → p値で判定
  • 両者は表裏一体:95% CIに p₀ が含まれない ⟺ 有意水準 α=0.05 で H₀ を棄却

この対応関係を ① と ② を行き来しながら確認すると、両者が同じことを言っているのが目で見える。同じ n と p̂ で、① の CI に p₀ が入っていなければ ② では棄却される。

// よくある誤解

❌「推定の SE と検定の SE は同じ」

推定では SE = √(p̂(1−p̂)/n) と標本比率を使うが、検定では SE = √(p₀(1−p₀)/n) と帰無仮説の値を使う。「どの世界を基準にするか」が違う。

❌「n が大きければ何でも正規近似でOK」

p が 0.001 のように極端に小さいと、n=1000 でも np=1 で条件を満たさない。「5以上ルール」は p と n の両方を見る。

❌「2群の検定で、各群の SE を個別に計算して足す」

H₀: p₁=p₂ の下では母比率は同じはず。だからプール比率で共通の SE を計算する。個別に計算するのは信頼区間を作るとき。

// よく出会う形

比率の検定・推定では、推定の SE と検定の SE の使い分けと、正規近似の条件チェックが繰り返し顔を出します。

  • 区間推定の組み立ての形:200人中120人賛成のとき、p̂=0.6, SE=√(0.6×0.4/200), 95%CI = 0.6 ± 1.96×SE。「中心 ± 倍率 × 標準誤差」という三層構造が、比率でもそのまま顔を出している
  • 検定統計量の形:500個中35個不良なら、p̂=0.07, p₀=0.05, z = (0.07−0.05)/√(0.05×0.95/500)。分母に「H₀ の世界の SE」が入る、という違いが推定との対比で見える
  • 正規近似が成立する条件:np ≥ 5 かつ n(1−p) ≥ 5。n=20, p₀=0.1 だと np₀=2 で条件を外れる、という形でチェックポイントが登場する
  • 2標本の差の検定の形:「A群 60/100 改善、B群 45/100 改善」のような場面では、プール比率を分母の SE に使うという特徴的な構造が顔を出す
次は —σ を知らない世界へ I6 t・χ²・F