第一種・第二種の過誤って何が違うの？

Q: αとβは合計したらどうなる？

場合分けして見ると整理しやすい問いです。α は H₀ が真の世界での棄却率、β は H₁ が真の世界での不棄却率で、別々の世界の確率として定義されている。同じ確率空間にいないので、足しても解釈できる量にはならない。各世界の中で「棄却する＋棄却しない＝1」が成り立っている、というのが表が示している関係です。

Q: サンプルサイズが少ないとどう過誤に影響する？

場合分けで見ると整理しやすい。α は事前に決めた値で固定なので動かない。動くのは β で、n が小さいと標準誤差 σ/√n が大きくなり、H₀ 分布と H₁ 分布の重なりが増えて β が上がる。結果として検出力 1−β が下がる。これが「サンプルが少ないと、本当に効く薬でも有意差が出にくい」状態の中身です。

Q: 「有意でない＝差がない」と言ってはいけないのはなぜ？

場合分けして見ると整理しやすい。「有意でない」という結果は、本当に差がない場合と、差はあるけれど n が足りなくて検出できなかった場合（β が大きい＝検出力不足）の両方で起こる。同じ「棄却できない」という出力に、二通りの原因が紛れ込んでいる。だから「差がない」と主張するには、検出力が十分だったことを別途示す必要があります。

// α・β・検出力、ごちゃつきがちですよね

第一種の過誤、第二種の過誤、検出力。式は知っていても、いざ問題に向き合ってみると、α と β と「棄却する／しない」と「真／偽」が一斉に踊り始めて、どれがどれだか分からなくなる。そういう瞬間、ありませんか。

StatPlay の中にも過誤を扱うセクションがあるんですが、「α はここ、β はここ、ほら動きます」と名前を貼っているだけだと、揺らぎの正体には触れていない。見ても通り過ぎてしまうことが起きやすい場所です。

このコラムは、その揺らぎを 「場合分けして整理する」 方向で見直してみる試みです。「H₀ が真／偽」と「棄却する／しない」の 2 軸で、起きている話を 4 つの場合に分けてみる。それだけで一気に整理しやすくなるかもしれない。試してみてもらえると嬉しいです。

// 1 軸で考えると、必ずぶれる

過誤の問題が揺れやすい原因はシンプルで、過誤を「1 本の確率」として語ろうとしているからです。

たとえば「第二種の過誤は、棄却域に入らない確率」と説明したくなる。間違いではないのですが、この言い方には決定的に足りていない情報がある。「H₀ が真のときの話なのか、H₁ が真のときの話なのか」が抜け落ちているのです。

実際に問題に向き合ってみると、正解は次のようにペアで決まることが見えてきます。

第一種の過誤：H₀ が真の世界での「棄却してしまう」確率
第二種の過誤：H₁ が真の世界での「棄却できない」確率

つまり過誤は 「世界（H₀ 真／H₁ 真）」と「判定（棄却する／しない）」の組み合わせで決まる量。世界を抜きに「棄却域に入る／入らない」だけで語ると、片方の軸を落としているのと同じで、必ずどこかで揺れます。

2 軸で見るために、次のセクションで表に置き直してみます。

// 2×2 マトリクスに置き直す — このコラムの背骨

過誤の話は、結局この表 1 枚に収まります。

	H₀ を棄却しない	H₀ を棄却
H₀ が真（差はない）	正解 1 − α 信頼度	第一種の過誤 α ≒ 冤罪
H₀ が偽（差がある）	第二種の過誤 β ≒ 真犯人逃し	正解 1 − β 検出力

縦が「本当はどちらの世界にいるのか」、横が「下した判定」。4 マスのうち 2 つが正解、2 つが過誤です。

ここで一度立ち止まって、表をしっかり眺めてみてください。ポイントは、4 つのマスの確率は、別の世界のものを足したわけではないということ。横に見ると「H₀ が真の世界の中で、棄却しない＋棄却する＝1」、別の行で「H₀ が偽の世界の中で、棄却しない＋棄却する＝1」。つまり行ごとに足して 1 になる表で、αとβは別々の行にいます。

この「行が別」という事実が、次のねじれの正体です。

04 · INTERACTIVE

// 触ってみる — 4 マスはそれぞれ分布のどこ？

ここまでで「過誤は 2×2」という枠は揃いました。でも表だけだと、4 マスが分布のどこに対応するのかは見えてきません。下のミニ可視化では、表の 4 マスをクリックすると、対応する分布の領域がハイライトされます。まず予想してからクリックしてみてください。「ここがαだろう」「ここがβだろう」と当てに行く感覚が、後で効いてきます。

	棄却しない	棄却
H₀ 真	1−α 正解	α 冤罪
H₀ 偽	β 真犯人逃し	1−β 検出力

触ってみると、おそらく次の 2 つのことが見えてきます。

α は青い山（H₀ 真の世界）の裾。H₁ の山は無関係。
β は紫の山（H₁ 真の世界）のうち、青い山の臨界値の内側にハマっている部分。H₀ の山とは別の山の上で測っている。

この「α と β は別の山の上に乗っている」という見え方が、次のセクションの主題です。

// αとβは「別の世界」の確率

ここがこのコラム最大のヤマです。場合分けで一番効いてくる地点でもあります。

αとβは、そもそも別の前提条件の下で定義された確率です。

α は「H₀ が真の世界」で、棄却してしまう確率。
β は「H₁ が真の世界」で、棄却できない確率。

つまり、両者は同じ確率空間にいない。文章で書くとあっさりしていますが、これは結構重い意味を持っていて、たとえば次のような問いがそのまま整理できます。

「α + β は何を表す？」

答え：何も表さない。そもそも 2×2 の表は縦に足す表ではありません。行ごとに足して 1 になる作りで、H₀ が真の世界では (1−α) + α = 1、H₁ が真の世界では β + (1−β) = 1。世界をまたいで足すことに意味はない。それぞれの世界の中で「棄却しない＋棄却する＝1」が成り立っている、というのが表が示している関係です（表の行ごとに足して 1 だった、あの話）。

もう一つ、しばしば言われる非対称性もここから自然に整理できます。

α はH₀ さえ決まれば描ける（分布の形が決まる）。だから実験前から「αを 0.05 にする」と決め打ちできる。
β はH₁ がどこにあるかが決まらないと描けない。H₁ の山が H₀ からどれだけ離れているか（＝後で出てくる効果量 δ）を仮定しないと、面積を切り出せない。

αが先に決まり、βがδ次第で動く。この非対称さは「片方の世界しか具体化されていないから」という、場合分けの直接の帰結として読めます。

06 · INTERACTIVE

// 触ってみる — δが入って初めて、βが描ける

「βは H₁ の位置が決まらないと描けない」というのは、触るのが一番早いところです。下の図では、α と効果量 δ を独立に動かせます。片方を動かしている間、もう片方は静かに固定。FIXED 表示が「いま固定中」の合図です（ロックされているわけではないので、いつでも反対側を動かせます）。まず α だけ動かして β がどう変わるか見てください。次に α は固定で δ だけ動かして β がどう変わるか見てください。両者の挙動の差で、何が「H₀ 世界の量」で何が「H₁ 世界の量」かが見えてきます。

α (有意水準)

α = 0.050

δ (効果量)

δ = 2.00

α0.050

β—

検出力 1−β—

臨界値—

ここで見えたことを言葉に固定しておきます。

α だけ動かすと、青い山の塗りつぶし面積が増減する。主役は α、β は基本的に動かないと見てよい。
δ だけ動かすと、紫の山が左右にスライドし、β（紫の山の臨界値間の面積）が大きく変わる。α は完全に動かない。

つまり、α は H₀ 世界の道具、β は H₁ 世界の道具。同じ画面に並べているだけで、住んでいる世界が違う。場合分けの主張が、そのまま画面に出ています。

// 検出力は「βの裏返し」、新しい概念ではない

「αとβに加えて検出力という第三のキャラクターがいる」と最初は見えがちです。でも場合分けで整理すると、検出力は新キャラではありません。

1 − β = 検出力（Power）

これは同じ H₁ 世界の中で、棄却できる確率＝βの裏側です。表の右下のマスがそれ。同じ事実を「見逃し率」で語るか「ちゃんと検出できる率」で語るかの違いだけ。

ではなぜ検出力という言葉がわざわざあるかというと、サンプルサイズ設計の入力にしやすいからです。

「βを 0.2 以下に抑えたい」より「検出力 0.8 以上を確保したい」と言う方が、目標として前向きで、必要な n を逆算する計算式に直接突っ込みやすい。
StatPlay で α と n を動かしてみると、検出力 1−β がどう連動して動くかがそのまま見える（次のインタラクティブで触ります）。

なので、「αとβと検出力」と 3 つ並べて覚える必要はなく、実体は 2×2 の 4 マスのまま、検出力は β の言い換え、と整理しておくとスッキリします。

08 · INTERACTIVE

// 触ってみる — n を増やすと、何が変わる？

最後にもう一つ、触っておきたい量があります。サンプルサイズ n です。「α と β はトレードオフで、片方を下げると片方が上がる」という言い方をよく見ますが、これにはカラクリがあって、n を増やすとそのトレードオフ自体が緩む。下の図で、n だけ動かしてみてください。α は固定（0.05）です。

サンプルサイズ n = 30

α (FIXED)

0.050

━━━━

—

↓↓↓

検出力 1−β

—

↑↑↑

n=30 では同じ大きさの効果でも「効果なし」と判定するリスク (β) が大きい。n=300 にすればそれが大幅に下がる。これが、「n を大きく取りましょう」と言われるときに本当に何が起きているか。α を犠牲にせずに見逃し（β）だけを減らせる、唯一の正攻法です。

n を動かして見えたことを言葉に固定しておきます。

α は動かない。青の面積はずっと 5%。
β だけが下がる。山が痩せて重なりが減るから。
結果として検出力 1−β が上がる。

「αとβはシーソー」という説明は半分本当で、シーソーの支点を n で動かせる、というのが場合分けで見たときの全体像です。

// もう一段深く触りたくなったら

ここまでで、過誤の 2×2、α と β の世界の違い、検出力との関係、n の効き方が一通り並びました。

実際の検定の流れの中で、α・β・検出力・効果量・n が 同時に どう動くかを触ってみたい場合は、検定トピックの「2 つの誤り」セクションに、本格版の Canvas を置いてあります。

このコラムが「整理の場」、向こうの可視化が「動かして遊ぶ場」、という役割分担です。先に整理 → 後で遊ぶ、の順番で進めてみてください。

// KEY TAKEAWAY

過誤は 2×2 で見ると整理しやすい — H₀ 真／偽 × 棄却する／しないの場合分け。1 軸だとどうしても揺れる
α と β は別世界の確率と整理できる — αは H₀ 世界、βは H₁ 世界。足し算しても意味のある量にはならない
検出力 = 1 − β、つまり β の裏返し — 同じ事実の表裏。サンプルサイズ設計に直接使える前向きな言い換えで、新しい概念ではない
n は α を犠牲にせず β だけを下げる — トレードオフの支点そのものを動かせる量、と整理できる

FAQ

// よくある質問

αとβは合計したらどうなる？

場合分けして見ると整理しやすい問いです。α は H₀ が真の世界での棄却率、β は H₁ が真の世界での不棄却率で、別々の世界の確率として定義されている。同じ確率空間にいないので、足しても解釈できる量にはなりません。各世界の中で「棄却する＋棄却しない＝1」が成り立っている、というのが表が示している関係です。

サンプルサイズが少ないとどう過誤に影響する？

場合分けで見ると整理しやすい。α は動きません（事前に決めた値で固定）。動くのはβで、n が小さいと標準誤差 σ/√n が大きくなり、H₀ 分布と H₁ 分布の重なりが増えて β が上がる。結果として検出力 1−β が下がる。これが「サンプルが少ないと、本当に効く薬でも有意差が出にくい」状態の中身です。

「有意でない＝差がない」と言ってはいけないのはなぜ？

場合分けして見ると整理しやすい。「有意でない」という結果は、本当に差がない場合と、差はあるけれど n が足りなくて検出できなかった場合（β が大きい＝検出力不足）の両方で起こる。同じ「棄却できない」という出力に、二通りの原因が紛れ込んでいる。だから「差がない」と主張するには検出力が十分だったことを別途示す必要がある（事前のパワー分析、信頼区間の幅の確認など）。

2×2の表が並んだら、実物に戻ってみてください。

α と β が別々の世界の量として整理できたら、実際の検定（z 検定・t 検定）の中でこれらがどう同時に動くかを触ってみるのが次のステップ。
信頼区間との対応も、過誤の表で見ると別の風景に見えてきます。

// 触って動かす

α と β を 2×2 の上で取り違えなくする効果量 δ・α・n を同時に動かすと、整理した 2×2 が α と β の面積として画面で動き続ける

// もっと読む

誕生日のパラドックス — 23人で50%超え確率の直感を裏切る古典コラムが動き、第 1 種・第 2 種の混乱と同じ系譜に並ぶ標準偏差と標準誤差の違い — SDとSEを1枚の絵で見分ける検定統計量 (x̄−μ₀)/SE の分母には SE が住んでいる、過誤の 2×2 と SD/SE の二階建てが「軸を増やすと見える」同じ整理戦略を共有する

« 全コラム一覧を見る