母比率の検定と推定 — 比率のz検定を可視化

推定では p̂、検定では p₀。一文字違いが標準誤差の式を変える——比率の検定の急所はここに尽きる。

PROPORTION TEST & ESTIMATION

母比率の検定と推定 — 標本比率から母比率を探る

母平均で信頼区間や検定をやったときと、考え方はまったく同じ。ただ「連続的なデータの平均」から「成功 or 失敗のカウント」に変わると、標準誤差の形がちょっと違ってくる。ここを触って慣れておくと、参考書の公式がスッと入ってくるはず。

データが「成功 / 失敗」の二択しかない世界。標本比率 p̂ = x/n がすべての出発点で、n が十分大きければ正規分布で近似できる（中心極限定理のおかげ）。
ここでは ① 区間推定 → ② 1標本検定 → ③ 2標本検定 の順に触っていく。平均のときと何が同じで何が違うのか、比べながら進めると整理しやすい。

実験ガイド — 順番に試してみよう

Step 1: n=15, p̂=0.50, 95% → 信頼区間がかなり広い。たった15人では精度が出ない。
Step 2: n を 100 に → 信頼区間がぐっと狭まる。サンプルサイズの威力を実感。
Step 3: p̂ を 0.90 に → 分散 p(1-p) が小さくなり、CI が狭くなる。p̂=0.50 が最も広い。
Step 4: p̂=0.90 のまま n を 10 に下げる → ⚠ 警告が出たら正規近似の条件を満たしていない。

▶ ① 母比率の区間推定

標本サイズ n = 15

標本比率 p̂ = 0.50

信頼水準

標準誤差 SE—

信頼区間下限—

信頼区間上限—

誤差幅 E—

シミュレーション — 「95%」の意味を確かめる

「95%信頼区間って、つまり何？」── 最初に立ち止まりやすい場所。答えは「同じ調査を何回もやったら、そのうち約95%の区間が真の母比率を捕まえる」ということ。
Run を押して200回試してみると、この「95%」が本当かどうか確かめられる。

▶ ①-b 信頼区間シミュレーション

母比率 p（真の値） = 0.50

標本サイズ n = 30

信頼水準

生成数0

捕捉率—

実験ガイド — 比率の検定を体験

Step 1: n=100, p̂=0.60, p₀=0.50, 有意水準 α=0.05, 両側 → 「60%は50%と有意に違うか？」
α（有意水準）＝「これより極端なら偶然じゃないと判断する」基準線。α が棄却域の広さを決める。
Step 2: p₀ を 0.55 に → z が小さくなり棄却できなくなる。差が小さいと見分けがつかない。
Step 3: n を 400 に → 同じ p̂=0.60, p₀=0.55 でも今度は棄却できる。サンプルサイズの威力。
Step 4: 検定タイプを「右側」に → 「50%より大きいか」だけを問う片側検定。p値が半分に。

▶ ② 母比率の検定（1標本z検定）

母平均の検定でやったことと同じ流れ。帰無仮説 H₀: p = p₀ を立てて、標本から計算した z が棄却域に入るかどうかを見るだけ。
標準誤差の式が √(p₀(1−p₀)/n) に変わるところだけ押さえれば、もう迷わないはず。

標本サイズ n = 100

標本比率 p̂ = 0.60

帰無仮説 p₀ = 0.50

有意水準 α = 0.050

検定タイプ

検定統計量 z—

臨界値—

p値—

判定—

実験ガイド — 2群の比率を比較

Step 1: n₁=n₂=100, p̂₁=0.60, p̂₂=0.45 → 差は有意か？
Step 2: p̂₂ を 0.55 に近づける → z が小さくなり、棄却が難しくなる。
Step 3: n₁=n₂=400 に増やす → 同じ差でも検出力が上がる。
Step 4: n₁=50, n₂=200 と非対称にしてみる → 小さい方のnが精度のボトルネック。

▶ ③ 2つの母比率の差の検定

「薬Aと薬B、どっちが効く？」「広告A vs B、クリック率に差はある？」── そういう2群比較のための検定。
H₀: p₁ = p₂ を仮定してプール比率で共通のSEを作るところがポイント。ここだけ押さえれば1標本と同じ。

n₁ = 100

p̂₁ = 0.60

n₂ = 100

p̂₂ = 0.45

有意水準 α = 0.050

検定タイプ

プール比率 p̂—

検定統計量 z—

p値—

判定—

// ここで使われる公式

★ 推定と検定で SE の中身が違う
推定では SE = √(p̂(1−p̂)/n)、検定では SE = √(p₀(1−p₀)/n)。 同じ「比率の SE」という名前でも、推定は標本の世界（手元のデータが基準）、検定は H₀ の世界（仮定した母比率が基準）を基準にする。下の最初の2式の分母を見比べると、ここだけが違う。

母比率の区間推定（Wald型信頼区間）

・p̂ = x/n：標本比率（n人中x人が「成功」）
・z_α/2：標準正規分布の上側 α/2 点。α は有意水準（＝「信頼区間の外側に出る確率」）。95% CI なら α=0.05 で z_0.025=1.96
・√(p̂(1−p̂)/n)：標本比率の標準誤差。平均の SE = σ/√n と似ているが、分散が p(1−p) で決まるのが比率ならではの特徴

母比率の検定（1標本z検定）

・p₀：帰無仮説で想定する母比率（「50%である」なら p₀ = 0.5）
・分母の SE は p₀ を使う（推定ではなく検定なので、H₀ の世界を基準にする）
・この z が標準正規分布に従うことを使って p値を計算する

2つの母比率の差の検定

・p̂：プール比率（2群を合算した全体の比率）。H₀: p₁ = p₂ の下では2群の母比率は同じはずなので、合算して推定する
・分母は「差の標準誤差」。1/n₁ + 1/n₂ が入ることで、サンプルサイズが小さい方がボトルネックになる構造

// 正規近似の条件 — いつこの方法が使えるのか

比率のz検定・信頼区間は「標本比率 p̂ が正規分布に従う」ことを前提にしている。
この近似が成り立つ目安は：

np ≥ 5 かつ n(1−p) ≥ 5（検定では p₀ を使う）
直感的には「成功も失敗も5回以上は起きそう」ということ
p が 0 や 1 に近いと、分布が歪んでしまい正規近似が崩れる

条件を満たさない場合は、二項検定（正確検定 / exact binomial test）を使うか、n を増やして出直す。
上の ① のグラフで n を小さくしたり p̂ を 0.01 に近づけると、⚠ 警告が出るのはこのため。

// 推定と検定の使い分け

区間推定：「母比率はだいたいどのあたりか？」を知りたいとき → 信頼区間で幅を提示
検定：「母比率は p₀ と違うのか？」にYES/NOで答えたいとき → p値で判定
両者は表裏一体：95% CIに p₀ が含まれない ⟺ 有意水準 α=0.05 で H₀ を棄却

この対応関係を ① と ② を行き来しながら確認すると、両者が同じことを言っているのが目で見える。同じ n と p̂ で、① の CI に p₀ が入っていなければ ② では棄却される。

// よくある誤解

❌「推定の SE と検定の SE は同じ」

推定では SE = √(p̂(1−p̂)/n) と標本比率を使うが、検定では SE = √(p₀(1−p₀)/n) と帰無仮説の値を使う。「どの世界を基準にするか」が違う。

❌「n が大きければ何でも正規近似でOK」

p が 0.001 のように極端に小さいと、n=1000 でも np=1 で条件を満たさない。「5以上ルール」は p と n の両方を見る。

❌「2群の検定で、各群の SE を個別に計算して足す」

H₀: p₁=p₂ の下では母比率は同じはず。だからプール比率で共通の SE を計算する。個別に計算するのは信頼区間を作るとき。

// よく出会う形

比率の検定・推定では、推定の SE と検定の SE の使い分けと、正規近似の条件チェックが繰り返し顔を出します。

区間推定の組み立ての形：200人中120人賛成のとき、p̂=0.6, SE=√(0.6×0.4/200), 95%CI = 0.6 ± 1.96×SE。「中心 ± 倍率 × 標準誤差」という三層構造が、比率でもそのまま顔を出している
検定統計量の形：500個中35個不良なら、p̂=0.07, p₀=0.05, z = (0.07−0.05)/√(0.05×0.95/500)。分母に「H₀ の世界の SE」が入る、という違いが推定との対比で見える
正規近似が成立する条件：np ≥ 5 かつ n(1−p) ≥ 5。n=20, p₀=0.1 だと np₀=2 で条件を外れる、という形でチェックポイントが登場する
2標本の差の検定の形：「A群 60/100 改善、B群 45/100 改善」のような場面では、プール比率を分母の SE に使うという特徴的な構造が顔を出す

// もっと読む

第一種・第二種の過誤って何が違うの？ — 2×2の表で全部見える第一種・第二種の誤りと検出力を、別々ではなく同じ 2×2 上で同時に追える

« 全コラム一覧を見る

次は —σ を知らない世界へ ▸ I6 t・χ²・F