メインコンテンツへスキップ
StatPlay トピック カイ二乗検定

カイ二乗検定 — 適合度と独立性

サイコロの公正さを確かめる適合度検定と、クロス集計表で2変数の独立性を調べる独立性検定。観測値と期待値のズレをχ²統計量として数値化し、棄却域との関係をインタラクティブに可視化する。

I.06 / CHI-SQUARED TEST

カイ二乗検定

ここまでは「平均」の検定だった。でも世の中にはカテゴリしかないデータがある — アンケートの選択肢、サイコロの出目、病気と喫煙の組み合わせ。こういうデータの「ズレ」を測るのが カイ二乗検定。期待からのズレが大きいほど、χ² 統計量が光る。

適合度検定は「観測されたカテゴリ分布は、理論分布と合っているか?」を調べる。サイコロが公正かどうか、が典型例。
独立性検定は「2つのカテゴリ変数は独立か?」を調べる。クロス集計表の各セルで期待度数とのズレを計算し、χ² = Σ (O−E)²/E を合計する。
なぜ E で割る? → 「期待10人に対して2人のズレ」と「期待1000人に対して2人のズレ」は重みが違う。E で割ることで相対的なズレに揃えている。
どちらも χ²分布に従う統計量を使い、右裾の面積が p 値になる。自由度は適合度なら k−1、独立性なら (r−1)(c−1)。

▶ ① 適合度検定 — サイコロは公正か?

🎲 左側のバーをクリックして出目を1つずつ追加(Shift+クリックで−1)
帰無仮説を棄却する基準。0.05 = 「5%以下の確率でしか起きないなら偶然ではない」。
投下数 n 0
検定統計量 χ²
自由度 df
p値
判定

▶ ② 独立性検定 — 2変数は独立か?

左側のセルをクリックして観測値を+1(Shift+クリックで−1)
独立性検定の有意水準。小さいほど慎重な判定になる。
総数 n 0
検定統計量 χ²
自由度 df
p値
判定
次は —関係を直線で捕まえる M.01 単回帰分析