重回帰分析 — 2+変数の世界
2変数の重回帰を3D空間で可視化し、さらに3変数以上への拡張を含意。偏回帰係数の意味と、高次元空間で起きていることをインタラクティブに学ぶ。
M.02 / MULTIPLE REGRESSION
重回帰分析
単回帰は 1 本の線。でも他の影響を取り除きたい——広告費の効果を「曜日や季節を固定したうえで」見たい。それが重回帰。軸が増え、偏回帰係数はまわりをコントロールした上での効き目になる。
説明変数が2つ以上ある場合が重回帰。
x₁(例:勉強時間)と x₂(例:睡眠時間)から y(テスト点)を予測する、のように複数の要因を同時に扱う。
回帰"直線"ではなく、回帰平面になる。x₁ を1増やしたときの y への効果(他の変数を固定したうえで)が β₁、x₂ に対するのが β₂。
真のパラメータを設定してデータを生成し、推定された係数と真の値を比較しよう。
ドラッグでキャンバスを回転すると、平面とデータ点の立体構造が見える。
※ 可視化できるのは x₁, x₂ の 2 変数まで(人間の目は 3 次元が限界)。
でも数式上は ŷ = β₀ + β₁x₁ + β₂x₂ + β₃x₃ + … + βkxk といくらでも変数を足せる。
x₃ 以降は "グラフにできないだけ" で、推定の手続き β̂ = (XᵀX)⁻¹Xᵀy はそのまま機能する。
実務では 5〜50 変数くらいがごく普通。
ŷ = β₀ + β₁x₁ + β₂x₂ , β̂ = (XᵀX)⁻¹Xᵀy
推定 β̂₀—
推定 β̂₁—
推定 β̂₂—
R²—