t分布・χ²分布・F分布 — 三大検定分布の違い

t は平均、χ² は分散、F は分散の比。すべて標準正規から派生した家族で、自由度を動かせば似顔絵が見えてくる。

I.05 / t · χ² · F DISTRIBUTIONS

三大検定分布 — t・χ²・F の素顔

ここまで平均の検定には σ を知っている前提だった。現実では σ も推定するしかない。その瞬間 Z は t 分布に化ける。分散を直接検定するなら χ²、2つの分散を比べるなら F。全部 N(0,1) の子孫だけど、何を知らないかで名前が変わる。

t・χ²・F は、どれも正規分布から"作って"生まれた派生分布。 "もとは標準正規なんだけど、標本からしか情報を取れない現実"を反映するためにスケーリングしたもの、と思うとスッキリする。
ざっくり使い分けると — t：母分散を知らずに平均を検定する時（＝現実の平均検定はほぼ全部これ）。 χ²：分散そのものの検定、独立性や適合度（カテゴリカル）。 F：分散比の検定（分散分析 ANOVA、回帰の全体 F 検定）。
自由度 df を動かすと、t は df→∞ で N(0,1) に一致し、χ²／F は df が大きいほど対称なベル形に近づく。これ自体、裏では中心極限定理が効いている。

実験ガイド — t分布

Step 1: n=3 → 自由度1、裾がめちゃくちゃ重い（コーシー分布と同じ）。
Step 2: n=10 → まだ正規より裾が厚いが、近づいてきた。
Step 3: n=31 → ほぼ N(0,1) と区別がつかない。信頼区間の2本のバーもほぼ重なる。

信頼区間で体感

Step A: n=5、95%のまま → t分布の方がかなり広い（正規だと過信）。
Step B: n=50にする → どの信頼水準でもほぼ一致。大標本の威力。
Step C: 信頼水準を99%にする → 差がさらに広がる（小標本ほど顕著）。

▶ t 分布

作り方: t = Z / √(χ²ₖ/k) ， Z~N(0,1)。
使いどころ: 母分散未知の平均検定、回帰係数の t 値。
例：クラス30人の平均点が全国平均と違うか調べるとき。
クセ: 正規より裾が重い（外れ値に優しい）。df→∞ で N(0,1)。

サンプルサイズ n = 5 (df = 4)

信頼水準: 90% 95% 99%

↔ グラフを左右にドラッグで n 変更

サンプルサイズ n 5

自由度 df 4

信頼水準 95%

t 臨界値 ±2.776

z 臨界値 ±1.960

t / z 比 1.416

サンプルが少ないとき、正規分布で計算した信頼区間は狭すぎる。t分布はその不確実性を正直に反映した分布です。nが増えるにつれt分布は正規分布に近づく——それがこの2本のバーで見えます。

実験ガイド — χ²分布

Step 1: 「公正なサイコロ」のまま試行ボタンを何度か押す → 均等なはずでも毎回バラつく。棒グラフの偏りとχ²統計量の変化を見る。
Step 2: セレクトを「イカサマ」に切り替えて試行 → 1の目だけ飛び出て、χ²が棄却域に入る。
Step 3: 試行回数スライダーを増やす → サンプルが多いほど小さな偏りでも検出できる（検出力が上がる）。

分布の形で体感

Step A: dfスライダーを1にする → 右に激しく歪む。
Step B: df=30 → ベル型に近づく。平均=dfを確認。
Step C: 正規近似（紫の破線）との一致度合いを見ながらdfを動かす。

▶ χ² 分布

作り方: χ²ₖ = Z₁² + Z₂² + ... + Zₖ² （標準正規 k 個の二乗和）。
使いどころ: 分散の検定、独立性／適合度のカイ二乗検定。
例：サイコロの出目が均等か、アンケートの「はい/いいえ」に偏りがないか調べるとき。
クセ: 非負・右に歪む。平均 = k、分散 = 2k。df大で正規ベル化。

試行回数 n = 60

df (k) = 5

↔ グラフを左右にドラッグで df 変更

試行回数 n 60

自由度 df 5

検定統計量 χ² —

χ² 臨界値 11.070

p 値 —

判定 —

カイ二乗分布は「観察と期待のズレの大きさ」を測る物差しです。ズレが偶然の範囲か、本物の偏りかを判定するために使います。

実験ガイド — F分布

Step 1: AとBのSDを同じ（例：10と10）にする → F≈1、棄却されない。
Step 2: BのSDだけ大きくする（例：A=5, B=15）→ Fが大きくなり棄却域に入る。
Step 3: nを増やす → 同じSD差でもp値が下がる（検出力が上がる）。

分布の形で体感

Step A: n=6 → 裾が重い不安定な形。
Step B: n=50 → ベル型に近づく。F=1のラインを確認。
Step C: AとBのSDを交互に変えて「分散比」の意味を体感する。

▶ F 分布

作り方: F = (χ²ₘ/m) / (χ²ₙ/n) （2つの独立な χ² の比）。
使いどころ: 分散分析（ANOVA）、回帰モデルの全体 F 検定。
例：3クラスの平均点に差があるか調べるとき（一元配置分散分析）。
クセ: 非負・右歪み。分子/分母の df で形が変わる。

グループA SD = 8

グループB SD = 15

各グループ n = 20 (df₁ = df₂ = 19)

↔ グラフを左右にドラッグで n 変更

グループA SD 8

グループB SD 15

df₁, df₂ 19, 19

F 統計量 3.516

F 臨界値 2.168

p 値 0.005

F分布は2つのグループの「ばらつきの比」を評価します。分散分析（ANOVA）もこのF統計量を使って、グループ間の差を検定しています。

// ここで使われる公式

ぜんぶ N(0,1) の子ども
・Z, Z₁, Z₂, ... は全部ふつうの標準正規分布。これを材料に3つの分布が作れる

χ²分布：Z を二乗して足す ← 「ばらつきの合計」
・Z₁² + Z₂² + ... + Zₖ² がχ²(k)に従う。二乗してるから常に正の値で、右に歪んだ形
・k が大きくなると左右対称に近づく（中心極限定理の帰結！）

t分布：Z を「推定したσ」で割る ← 「σを知らない正規分布」
・t = Z / √(χ²/k)。分母の χ²/k は σ² の推定量だと思えばいい
・k が小さい（データが少ない）→ σ の推定が不安定 → 裾が太くなる
・k→∞ で分母が1に安定 → t が Z とまったく同じになる（標準正規に一致）

F分布：2つの χ² の比 ← 「2つの分散の比」
・「Aグループの分散 ÷ Bグループの分散」を検定するための分布
・分子と分母で自由度が違うから、入れ替えると別の分布になる ← 注意

// 自由度 (df) って結局なに？

「自由度」という名前から意味が浮かびにくい用語の代表格。整理すると「自由に値を決められるデータの個数」と読める。

例：3人のテストの平均が60点だと分かっているとする。
・1人目：70点（自由）
・2人目：55点（自由）
・3人目：？ → 60×3 − 70 − 55 = 55 で自動的に決まる（不自由）
→ 3人なのに自由に決められるのは2人 → df = n−1 = 2

自由度が小さいとどうなるか：
・情報が少ない → 推定が不安定 → 分布の裾が広がる（極端な値が出やすい）
・df=1 の t分布はかなり裾が太い。df=30 になると正規分布とほぼ見分けがつかない
・上のシミュレーションで df を動かして確かめてみよう

// いつどれを使う？早見表

やりたいこと	σ を知ってる？	使う分布
平均の検定	知ってる（珍しい）	z（標準正規）
平均の検定	知らない（普通こっち）	t分布
分散の検定（1群）	—	χ²分布
分散の比較（2群）	—	F分布
回帰の係数が有意か	—	t分布
回帰モデル全体が有意か	—	F分布
カテゴリの適合度・独立性	—	χ²分布

使う分布が決まったらインタラクティブ確率分布表で臨界値をグラフと一緒に確認

// よくある誤解

❌「t分布は正規分布とまったく別の分布」

t分布は「σを知らないから推定値で代用した正規分布」。df→∞ で N(0,1) に一致する。裾の太さの違いだけ。

❌「χ²分布の自由度 = n」

ほとんどの場合 n−1。平均を推定するたびに自由度が1つ減る。適合度検定は k−1、独立性検定は (r−1)(c−1)。

❌「F分布の df₁ と df₂ を入れ替えても同じ」

F 分布は非対称。分子の自由度と分母の自由度を間違えると臨界値が変わって判定も変わる。

// よく出会う形

t・χ²・F の三つは、互いに連動した形でよく現れます。

自由度がスライドする場面：1標本 t検定で n=20 なら df = n−1 = 19。「平均をひとつ推定するごとに自由度が1減る」という形がここに現れる
t分布の極限の形：自由度を大きくしていくと、t分布は N(0,1) に重なっていく。上のシミュレーションでスライダーを動かすと、その重なる過程が絵として見える
χ²(n−1) の登場の仕方：(n−1)S²/σ² が χ²(n−1) に従う、という形は分散の検定や信頼区間で繰り返し顔を出す
三分布のつながり：t² は F(1, k) と同じ分布になる。三つの分布が独立にあるのではなく、同じ N(0,1) から派生した家族だという形が透けて見える

// もっと読む

第一種・第二種の過誤って何が違うの？ — 2×2の表で全部見える第一種・第二種の誤りと検出力を、別々ではなく同じ 2×2 上で同時に追える

« 全コラム一覧を見る

次は —「ズレ」を数値化して検定する ▸ I7 カイ二乗検定