// CASE FILE — TYPE I vs TYPE II
αβ

「冤罪」と「真犯人逃し」、
似てるけど別物

「第一種の過誤」「第二種の過誤」。名前は知っている。式も眺めたことがある。
それなのに、いざ問題に向き合うと、毎回ラベルがぶれる
このコラムは、その揺らぎを 場合分けして 2×2 の表 1 枚に置き直してみる試みです。

StatPlay コラム 過誤の2×2
01

// α・β・検出力、ごちゃつきがちですよね

第一種の過誤、第二種の過誤、検出力。式は知っていても、いざ問題に向き合ってみると、α と β と「棄却する/しない」と「真/偽」が一斉に踊り始めて、どれがどれだか分からなくなる。そういう瞬間、ありませんか

StatPlay の中にも過誤を扱うセクションがあるんですが、「α はここ、β はここ、ほら動きます」と名前を貼っているだけだと、揺らぎの正体には触れていない。見ても通り過ぎてしまうことが起きやすい場所です。

このコラムは、その揺らぎを 「場合分けして整理する」 方向で見直してみる試みです。「H₀ が真/偽」と「棄却する/しない」の 2 軸で、起きている話を 4 つの場合に分けてみる。それだけで一気に整理しやすくなるかもしれない。試してみてもらえると嬉しいです。

02

// 1 軸で考えると、必ずぶれる

過誤の問題が揺れやすい原因はシンプルで、過誤を「1 本の確率」として語ろうとしているからです。

たとえば「第二種の過誤は、棄却域に入らない確率」と説明したくなる。間違いではないのですが、この言い方には決定的に足りていない情報がある。「H₀ が真のときの話なのか、H₁ が真のときの話なのか」が抜け落ちているのです。

実際に問題に向き合ってみると、正解は次のようにペアで決まることが見えてきます。

つまり過誤は 「世界(H₀ 真/H₁ 真)」と「判定(棄却する/しない)」の組み合わせで決まる量。世界を抜きに「棄却域に入る/入らない」だけで語ると、片方の軸を落としているのと同じで、必ずどこかで揺れます。

2 軸で見るために、次のセクションで表に置き直してみます。

03

// 2×2 マトリクスに置き直す — このコラムの背骨

過誤の話は、結局この表 1 枚に収まります。

H₀ を棄却しない H₀ を棄却
H₀ が真
(差はない)
正解
1 − α
信頼度
第一種の過誤
α
≒ 冤罪
H₀ が偽
(差がある)
第二種の過誤
β
≒ 真犯人逃し
正解
1 − β
検出力

縦が「本当はどちらの世界にいるのか」、横が「下した判定」。4 マスのうち 2 つが正解、2 つが過誤です。

ここで一度立ち止まって、表をしっかり眺めてみてください。 ポイントは、4 つのマスの確率は、別の世界のものを足したわけではないということ。横に見ると「H₀ が真の世界の中で、棄却しない+棄却する=1」、別の行で「H₀ が偽の世界の中で、棄却しない+棄却する=1」。つまり行ごとに足して 1 になる表で、αとβは別々の行にいます。

この「行が別」という事実が、次のねじれの正体です。

04 · INTERACTIVE

// 触ってみる — 4 マスはそれぞれ分布のどこ?

ここまでで「過誤は 2×2」という枠は揃いました。でも表だけだと、4 マスが分布のどこに対応するのかは見えてきません。 下のミニ可視化では、表の 4 マスをクリックすると、対応する分布の領域がハイライトされます。まず予想してからクリックしてみてください。「ここがαだろう」「ここがβだろう」と当てに行く感覚が、後で効いてきます。

棄却しない棄却
H₀ 真
1−α
正解
α
冤罪
H₀ 偽
β
真犯人逃し
1−β
検出力

触ってみると、おそらく次の 2 つのことが見えてきます。

この「α と β は別の山の上に乗っている」という見え方が、次のセクションの主題です。

05

// αとβは「別の世界」の確率

ここがこのコラム最大のヤマです。場合分けで一番効いてくる地点でもあります。

αとβは、そもそも別の前提条件の下で定義された確率です。

つまり、両者は同じ確率空間にいない。文章で書くとあっさりしていますが、これは結構重い意味を持っていて、たとえば次のような問いがそのまま整理できます。

「α + β は何を表す?」

答え:何も表さない。そもそも 2×2 の表は縦に足す表ではありません。行ごとに足して 1 になる作りで、H₀ が真の世界では (1−α) + α = 1、H₁ が真の世界では β + (1−β) = 1。世界をまたいで足すことに意味はない。それぞれの世界の中で「棄却しない+棄却する=1」が成り立っている、というのが表が示している関係です(表の行ごとに足して 1 だった、あの話)。

もう一つ、しばしば言われる非対称性もここから自然に整理できます。

αが先に決まり、βがδ次第で動く。この非対称さは「片方の世界しか具体化されていないから」という、場合分けの直接の帰結として読めます。

06 · INTERACTIVE

// 触ってみる — δが入って初めて、βが描ける

「βは H₁ の位置が決まらないと描けない」というのは、触るのが一番早いところです。 下の図では、α と効果量 δ を独立に動かせます。片方を動かしている間、もう片方は静かに固定。FIXED 表示が「いま固定中」の合図です(ロックされているわけではないので、いつでも反対側を動かせます)。まず α だけ動かして β がどう変わるか見てください。次に α は固定で δ だけ動かして β がどう変わるか見てください。両者の挙動の差で、何が「H₀ 世界の量」で何が「H₁ 世界の量」かが見えてきます。

α (有意水準)
δ (効果量)
α0.050
β
検出力 1−β
臨界値

ここで見えたことを言葉に固定しておきます。

つまり、α は H₀ 世界の道具、β は H₁ 世界の道具。同じ画面に並べているだけで、住んでいる世界が違う。場合分けの主張が、そのまま画面に出ています。

07

// 検出力は「βの裏返し」、新しい概念ではない

「αとβに加えて検出力という第三のキャラクターがいる」と最初は見えがちです。でも場合分けで整理すると、検出力は新キャラではありません。

1 − β = 検出力(Power)

これは同じ H₁ 世界の中で、棄却できる確率=βの裏側です。表の右下のマスがそれ。同じ事実を「見逃し率」で語るか「ちゃんと検出できる率」で語るかの違いだけ。

ではなぜ検出力という言葉がわざわざあるかというと、サンプルサイズ設計の入力にしやすいからです。

なので、「αとβと検出力」と 3 つ並べて覚える必要はなく、実体は 2×2 の 4 マスのまま、検出力は β の言い換え、と整理しておくとスッキリします。

08 · INTERACTIVE

// 触ってみる — n を増やすと、何が変わる?

最後にもう一つ、触っておきたい量があります。サンプルサイズ n です。 「α と β はトレードオフで、片方を下げると片方が上がる」という言い方をよく見ますが、これにはカラクリがあって、n を増やすとそのトレードオフ自体が緩む。下の図で、n だけ動かしてみてください。α は固定(0.05)です。

α (FIXED)
0.050
━━━━
β
↓↓↓
検出力 1−β
↑↑↑

n=30 では同じ大きさの効果でも「効果なし」と判定するリスク (β) が大きい。n=300 にすればそれが大幅に下がる。これが、「n を大きく取りましょう」と言われるときに本当に何が起きているか。α を犠牲にせずに見逃し(β)だけを減らせる、唯一の正攻法です。

n を動かして見えたことを言葉に固定しておきます。

「αとβはシーソー」という説明は半分本当で、シーソーの支点を n で動かせる、というのが場合分けで見たときの全体像です。

09

// もう一段深く触りたくなったら

ここまでで、過誤の 2×2、α と β の世界の違い、検出力との関係、n の効き方が一通り並びました。

実際の検定の流れの中で、α・β・検出力・効果量・n が 同時に どう動くかを触ってみたい場合は、検定トピックの「2 つの誤り」セクションに、本格版の Canvas を置いてあります。

このコラムが「整理の場」、向こうの可視化が「動かして遊ぶ場」、という役割分担です。先に整理 → 後で遊ぶ、の順番で進めてみてください。

// KEY TAKEAWAY

FAQ

// よくある質問

場合分けして見ると整理しやすい問いです。α は H₀ が真の世界での棄却率、β は H₁ が真の世界での不棄却率で、別々の世界の確率として定義されている。同じ確率空間にいないので、足しても解釈できる量にはなりません。各世界の中で「棄却する+棄却しない=1」が成り立っている、というのが表が示している関係です。

場合分けで見ると整理しやすい。α は動きません(事前に決めた値で固定)。動くのはβで、n が小さいと標準誤差 σ/√n が大きくなり、H₀ 分布と H₁ 分布の重なりが増えて β が上がる。結果として検出力 1−β が下がる。これが「サンプルが少ないと、本当に効く薬でも有意差が出にくい」状態の中身です。

場合分けして見ると整理しやすい。「有意でない」という結果は、本当に差がない場合と、差はあるけれど n が足りなくて検出できなかった場合(β が大きい=検出力不足)の両方で起こる。同じ「棄却できない」という出力に、二通りの原因が紛れ込んでいる。だから「差がない」と主張するには検出力が十分だったことを別途示す必要がある(事前のパワー分析、信頼区間の幅の確認など)。

2×2の表が並んだら、実物に戻ってみてください。

α と β が別々の世界の量として整理できたら、実際の検定(z 検定・t 検定)の中でこれらがどう同時に動くかを触ってみるのが次のステップ。
信頼区間との対応も、過誤の表で見ると別の風景に見えてきます。