カイ二乗検定 — 適合度と独立性
サイコロの公正さを確かめる適合度検定と、クロス集計表で2変数の独立性を調べる独立性検定。観測値と期待値のズレをχ²統計量として数値化し、棄却域との関係をインタラクティブに可視化する。
I.06 / CHI-SQUARED TEST
カイ二乗検定
ここまでは「平均」の検定だった。でも世の中にはカテゴリしかないデータがある — アンケートの選択肢、サイコロの出目、病気と喫煙の組み合わせ。こういうデータの「ズレ」を測るのが カイ二乗検定。期待からのズレが大きいほど、χ² 統計量が光る。
適合度検定は「観測されたカテゴリ分布は、理論分布と合っているか?」を調べる。サイコロが公正かどうか、が典型例。
独立性検定は「2つのカテゴリ変数は独立か?」を調べる。クロス集計表の各セルで期待度数とのズレを計算し、χ² = Σ (O−E)²/E を合計する。
なぜ E で割る? → 「期待10人に対して2人のズレ」と「期待1000人に対して2人のズレ」は重みが違う。E で割ることで相対的なズレに揃えている。
どちらも χ²分布に従う統計量を使い、右裾の面積が p 値になる。自由度は適合度なら k−1、独立性なら (r−1)(c−1)。
▶ ① 適合度検定 — サイコロは公正か?
🎲 左側のバーをクリックして出目を1つずつ追加(Shift+クリックで−1)
帰無仮説を棄却する基準。0.05 = 「5%以下の確率でしか起きないなら偶然ではない」。
投下数 n 0
検定統計量 χ² —
自由度 df —
p値 —
判定 —
▶ ② 独立性検定 — 2変数は独立か?
左側のセルをクリックして観測値を+1(Shift+クリックで−1)
独立性検定の有意水準。小さいほど慎重な判定になる。
総数 n 0
検定統計量 χ² —
自由度 df —
p値 —
判定 —