// α・β・検出力、ごちゃつきがちですよね
第一種の過誤、第二種の過誤、検出力。式は知っていても、いざ問題に向き合ってみると、α と β と「棄却する/しない」と「真/偽」が一斉に踊り始めて、どれがどれだか分からなくなる。そういう瞬間、ありませんか。
StatPlay の中にも過誤を扱うセクションがあるんですが、「α はここ、β はここ、ほら動きます」と名前を貼っているだけだと、揺らぎの正体には触れていない。見ても通り過ぎてしまうことが起きやすい場所です。
このコラムは、その揺らぎを 「場合分けして整理する」 方向で見直してみる試みです。「H₀ が真/偽」と「棄却する/しない」の 2 軸で、起きている話を 4 つの場合に分けてみる。それだけで一気に整理しやすくなるかもしれない。試してみてもらえると嬉しいです。
// 1 軸で考えると、必ずぶれる
過誤の問題が揺れやすい原因はシンプルで、過誤を「1 本の確率」として語ろうとしているからです。
たとえば「第二種の過誤は、棄却域に入らない確率」と説明したくなる。間違いではないのですが、この言い方には決定的に足りていない情報がある。「H₀ が真のときの話なのか、H₁ が真のときの話なのか」が抜け落ちているのです。
実際に問題に向き合ってみると、正解は次のようにペアで決まることが見えてきます。
- 第一種の過誤:H₀ が真の世界での「棄却してしまう」確率
- 第二種の過誤:H₁ が真の世界での「棄却できない」確率
つまり過誤は 「世界(H₀ 真/H₁ 真)」と「判定(棄却する/しない)」の組み合わせで決まる量。世界を抜きに「棄却域に入る/入らない」だけで語ると、片方の軸を落としているのと同じで、必ずどこかで揺れます。
2 軸で見るために、次のセクションで表に置き直してみます。
// 2×2 マトリクスに置き直す — このコラムの背骨
過誤の話は、結局この表 1 枚に収まります。
| H₀ を棄却しない | H₀ を棄却 | |
|---|---|---|
| H₀ が真 (差はない) |
正解
1 − α
信頼度
|
第一種の過誤
α
≒ 冤罪
|
| H₀ が偽 (差がある) |
第二種の過誤
β
≒ 真犯人逃し
|
正解
1 − β
検出力
|
縦が「本当はどちらの世界にいるのか」、横が「下した判定」。4 マスのうち 2 つが正解、2 つが過誤です。
ここで一度立ち止まって、表をしっかり眺めてみてください。 ポイントは、4 つのマスの確率は、別の世界のものを足したわけではないということ。横に見ると「H₀ が真の世界の中で、棄却しない+棄却する=1」、別の行で「H₀ が偽の世界の中で、棄却しない+棄却する=1」。つまり行ごとに足して 1 になる表で、αとβは別々の行にいます。
この「行が別」という事実が、次のねじれの正体です。
// 触ってみる — 4 マスはそれぞれ分布のどこ?
ここまでで「過誤は 2×2」という枠は揃いました。でも表だけだと、4 マスが分布のどこに対応するのかは見えてきません。 下のミニ可視化では、表の 4 マスをクリックすると、対応する分布の領域がハイライトされます。まず予想してからクリックしてみてください。「ここがαだろう」「ここがβだろう」と当てに行く感覚が、後で効いてきます。
| 棄却しない | 棄却 | |
|---|---|---|
| H₀ 真 |
1−α 正解
|
α 冤罪
|
| H₀ 偽 |
β 真犯人逃し
|
1−β 検出力
|
触ってみると、おそらく次の 2 つのことが見えてきます。
- α は青い山(H₀ 真の世界)の裾。H₁ の山は無関係。
- β は紫の山(H₁ 真の世界)のうち、青い山の臨界値の内側にハマっている部分。H₀ の山とは別の山の上で測っている。
この「α と β は別の山の上に乗っている」という見え方が、次のセクションの主題です。
// αとβは「別の世界」の確率
ここがこのコラム最大のヤマです。場合分けで一番効いてくる地点でもあります。
αとβは、そもそも別の前提条件の下で定義された確率です。
- α は「H₀ が真の世界」で、棄却してしまう確率。
- β は「H₁ が真の世界」で、棄却できない確率。
つまり、両者は同じ確率空間にいない。文章で書くとあっさりしていますが、これは結構重い意味を持っていて、たとえば次のような問いがそのまま整理できます。
「α + β は何を表す?」
答え:何も表さない。そもそも 2×2 の表は縦に足す表ではありません。行ごとに足して 1 になる作りで、H₀ が真の世界では (1−α) + α = 1、H₁ が真の世界では β + (1−β) = 1。世界をまたいで足すことに意味はない。それぞれの世界の中で「棄却しない+棄却する=1」が成り立っている、というのが表が示している関係です(表の行ごとに足して 1 だった、あの話)。
もう一つ、しばしば言われる非対称性もここから自然に整理できます。
- α はH₀ さえ決まれば描ける(分布の形が決まる)。だから実験前から「αを 0.05 にする」と決め打ちできる。
- β はH₁ がどこにあるかが決まらないと描けない。H₁ の山が H₀ からどれだけ離れているか(=後で出てくる効果量 δ)を仮定しないと、面積を切り出せない。
αが先に決まり、βがδ次第で動く。この非対称さは「片方の世界しか具体化されていないから」という、場合分けの直接の帰結として読めます。
// 触ってみる — δが入って初めて、βが描ける
「βは H₁ の位置が決まらないと描けない」というのは、触るのが一番早いところです。 下の図では、α と効果量 δ を独立に動かせます。片方を動かしている間、もう片方は静かに固定。FIXED 表示が「いま固定中」の合図です(ロックされているわけではないので、いつでも反対側を動かせます)。まず α だけ動かして β がどう変わるか見てください。次に α は固定で δ だけ動かして β がどう変わるか見てください。両者の挙動の差で、何が「H₀ 世界の量」で何が「H₁ 世界の量」かが見えてきます。
ここで見えたことを言葉に固定しておきます。
- α だけ動かすと、青い山の塗りつぶし面積が増減する。主役は α、β は基本的に動かないと見てよい。
- δ だけ動かすと、紫の山が左右にスライドし、β(紫の山の臨界値間の面積)が大きく変わる。α は完全に動かない。
つまり、α は H₀ 世界の道具、β は H₁ 世界の道具。同じ画面に並べているだけで、住んでいる世界が違う。場合分けの主張が、そのまま画面に出ています。
// 検出力は「βの裏返し」、新しい概念ではない
「αとβに加えて検出力という第三のキャラクターがいる」と最初は見えがちです。でも場合分けで整理すると、検出力は新キャラではありません。
これは同じ H₁ 世界の中で、棄却できる確率=βの裏側です。表の右下のマスがそれ。同じ事実を「見逃し率」で語るか「ちゃんと検出できる率」で語るかの違いだけ。
ではなぜ検出力という言葉がわざわざあるかというと、サンプルサイズ設計の入力にしやすいからです。
- 「βを 0.2 以下に抑えたい」より「検出力 0.8 以上を確保したい」と言う方が、目標として前向きで、必要な n を逆算する計算式に直接突っ込みやすい。
- StatPlay で α と n を動かしてみると、検出力 1−β がどう連動して動くかがそのまま見える(次のインタラクティブで触ります)。
なので、「αとβと検出力」と 3 つ並べて覚える必要はなく、実体は 2×2 の 4 マスのまま、検出力は β の言い換え、と整理しておくとスッキリします。
// 触ってみる — n を増やすと、何が変わる?
最後にもう一つ、触っておきたい量があります。サンプルサイズ n です。
「α と β はトレードオフで、片方を下げると片方が上がる」という言い方をよく見ますが、これにはカラクリがあって、n を増やすとそのトレードオフ自体が緩む。下の図で、n だけ動かしてみてください。α は固定(0.05)です。
n=30 では同じ大きさの効果でも「効果なし」と判定するリスク (β) が大きい。n=300 にすればそれが大幅に下がる。これが、「n を大きく取りましょう」と言われるときに本当に何が起きているか。α を犠牲にせずに見逃し(β)だけを減らせる、唯一の正攻法です。
n を動かして見えたことを言葉に固定しておきます。
- α は動かない。青の面積はずっと 5%。
- β だけが下がる。山が痩せて重なりが減るから。
- 結果として検出力 1−β が上がる。
「αとβはシーソー」という説明は半分本当で、シーソーの支点を n で動かせる、というのが場合分けで見たときの全体像です。
// もう一段深く触りたくなったら
ここまでで、過誤の 2×2、α と β の世界の違い、検出力との関係、n の効き方が一通り並びました。
実際の検定の流れの中で、α・β・検出力・効果量・n が 同時に どう動くかを触ってみたい場合は、検定トピックの「2 つの誤り」セクションに、本格版の Canvas を置いてあります。
- 検定トピック / 2 つの誤りセクション へ →
- プリセット効果量つきリンク:
- 弱い効果量(δ=0.5)で開く →
- 中ぐらいの効果量(δ=2.0)で開く →
このコラムが「整理の場」、向こうの可視化が「動かして遊ぶ場」、という役割分担です。先に整理 → 後で遊ぶ、の順番で進めてみてください。
// KEY TAKEAWAY
- 過誤は 2×2 で見ると整理しやすい — H₀ 真/偽 × 棄却する/しない の場合分け。1 軸だとどうしても揺れる
- α と β は別世界の確率と整理できる — αは H₀ 世界、βは H₁ 世界。足し算しても意味のある量にはならない
- 検出力 = 1 − β、つまり β の裏返し — 同じ事実の表裏。サンプルサイズ設計に直接使える前向きな言い換えで、新しい概念ではない
- n は α を犠牲にせず β だけを下げる — トレードオフの支点そのものを動かせる量、と整理できる
// よくある質問
場合分けして見ると整理しやすい問いです。α は H₀ が真の世界での棄却率、β は H₁ が真の世界での不棄却率で、別々の世界の確率として定義されている。同じ確率空間にいないので、足しても解釈できる量にはなりません。各世界の中で「棄却する+棄却しない=1」が成り立っている、というのが表が示している関係です。
場合分けで見ると整理しやすい。α は動きません(事前に決めた値で固定)。動くのはβで、n が小さいと標準誤差 σ/√n が大きくなり、H₀ 分布と H₁ 分布の重なりが増えて β が上がる。結果として検出力 1−β が下がる。これが「サンプルが少ないと、本当に効く薬でも有意差が出にくい」状態の中身です。
場合分けして見ると整理しやすい。「有意でない」という結果は、本当に差がない場合と、差はあるけれど n が足りなくて検出できなかった場合(β が大きい=検出力不足)の両方で起こる。同じ「棄却できない」という出力に、二通りの原因が紛れ込んでいる。だから「差がない」と主張するには検出力が十分だったことを別途示す必要がある(事前のパワー分析、信頼区間の幅の確認など)。
2×2の表が並んだら、実物に戻ってみてください。
α と β が別々の世界の量として整理できたら、実際の検定(z 検定・t 検定)の中でこれらがどう同時に動くかを触ってみるのが次のステップ。
信頼区間との対応も、過誤の表で見ると別の風景に見えてきます。