t分布・χ²分布・F分布 — 三大検定分布の違い
自由度で形が変わる t分布、分散の検定に使う χ²分布、分散比の F分布を並べて可視化。自由度スライダーで3つの分布の関係と違いを一度に掴む。
I.05 / t · χ² · F DISTRIBUTIONS
三大検定分布
ここまで平均の検定には σ を知っている前提だった。現実では σ も推定するしかない。その瞬間 Z は t 分布に化ける。分散を直接検定するなら χ²、2つの分散を比べるなら F。全部 N(0,1) の子孫だけど、何を知らないかで名前が変わる。
t・χ²・F は、どれも正規分布から"作って"生まれた派生分布。
"もとは標準正規なんだけど、標本からしか情報を取れない現実"を反映するためにスケーリングしたもの、と思うとスッキリする。
ざっくり使い分けると —
t:母分散を知らずに平均を検定する時(=現実の平均検定はほぼ全部これ)。
χ²:分散そのものの検定、独立性や適合度(カテゴリカル)。
F:分散比の検定(分散分析 ANOVA、回帰の全体 F 検定)。
自由度 df を動かすと、t は df→∞ で N(0,1) に一致し、χ²/F は df が大きいほど対称なベル形に近づく。これ自体、裏では中心極限定理が効いている。
▶ t distribution
作り方: t = Z / √(χ²ₖ/k) , Z~N(0,1)。
使いどころ: 母分散未知の平均検定、回帰係数の t 値。
クセ: 正規より裾が重い(外れ値に優しい)。df→∞ で N(0,1)。
使いどころ: 母分散未知の平均検定、回帰係数の t 値。
クセ: 正規より裾が重い(外れ値に優しい)。df→∞ で N(0,1)。
↔ グラフを左右にドラッグで df 変更
▶ χ² distribution
作り方: χ²ₖ = Z₁² + Z₂² + ... + Zₖ² (標準正規を k 個足して二乗和)。
使いどころ: 分散の検定、独立性/適合度のカイ二乗検定。
クセ: 非負・右に歪む。平均 = k、分散 = 2k。df大で正規ベル化。
使いどころ: 分散の検定、独立性/適合度のカイ二乗検定。
クセ: 非負・右に歪む。平均 = k、分散 = 2k。df大で正規ベル化。
↔ グラフを左右にドラッグで df 変更
▶ F distribution
作り方: F = (χ²ₘ/m) / (χ²ₙ/n) (2つの独立な χ² の比)。
使いどころ: 分散分析(ANOVA)、回帰モデルの全体 F 検定。
クセ: 非負・右歪み。分子/分母の df で形が変わる。
使いどころ: 分散分析(ANOVA)、回帰モデルの全体 F 検定。
クセ: 非負・右歪み。分子/分母の df で形が変わる。
↔ グラフを左右にドラッグで df₁ 変更 · df₂ はスライダーで調整