メインコンテンツへスキップ

標準正規分布を直感で掴む

z = 1.96 という数字に見覚えがあれば、それは確率の世界共通言語。1本の曲線が検定・信頼区間・t分布、すべての出発点になっている。

P.01 / STANDARD NORMAL

標準正規分布 — すべてのはじまり

統計のすべてを支配するあの曲線から始めよう——標準正規分布。中心極限定理も仮説検定も信頼区間も、すべてここに帰ってくる。まずはベルカーブを触ってみよう。

ぶっちゃけ この曲線ひとつがなければ、 この先に出てくる検定も、信頼区間も、t分布も、回帰分析も、ぜんぶ成立しない
標準正規分布 N(0, 1) は、平均0・標準偏差1のベル型カーブ。 「どんな正規分布も z = (x − μ) / σ でここに重ねられる」という一行のトリックが、 100年前の統計学者たちに"紙の表ひとつで世界中の確率を計算する"力を与えた。
つまりこれは、統計のラスボスじゃなくて、起源(オリジン)。 ここさえ掴めれば、残りのページは"標準正規の応用"として一気通貫で読める。

実験ガイド — 順番に試してみよう
  1. Step 1: k のスライダーを 1.0 にする → 面積は約68%。これが「±1σ に約7割」。
  2. Step 2: k を 1.96 にする → 面積は約95%。この数字、検定や信頼区間で何度も出てくる。
  3. Step 3: k を 3.0 まで広げる → ほぼ100%。外側はもうほとんどない。

▶ 「68 - 95 - 99.7」は暗記じゃなくて見て分かる

スライダーで幅 k を伸び縮みさせると、青く塗られた面積がそのまま"確率"。 ± 1σ ですでに約7割、± 2σ で約95%、± 3σ でほぼ全部。
z = 1.96 という数字に見覚えがあれば、それは"両側5%"の臨界値。 検定も信頼区間もこの 1.96 から出発する — それくらい、この曲線が主役なのだ。

P( |Z| ≤ k )
P( Z ≤ k )
外側の確率

// ここで使われる公式

左の式 z = (x − μ) / σ
・x − μ:データから平均を引く → 「平均からどれだけ離れているか」
・÷ σ:それを標準偏差で割る → 単位を「σ何個分」に統一する
・結果の z:どんな正規分布でも同じ物差しで比較できる"共通スコア"

右の式 φ(z)
・e−z²/2:z=0(平均)で最大、離れるほど急激に小さくなる → 釣鐘型の正体
・1/√(2π):面積の合計がちょうど1(= 確率の総和)になるための調整係数
・φ(z) の値:その z における曲線の「高さ」(確率密度)。面積が確率になる

実験ガイド — 標準化アニメーション
  1. Step 1: ▶ 標準化する を押す → μ=2, σ=1.5 の曲線がスーッと N(0,1) に変身する。
  2. Step 2: μ を −2、σ を 2.5 に変えて再度 ▶ → 全然違う形なのに、同じピンクの曲線にピタッ。
  3. Step 3: 進度スライダーを途中で止める → 変換の途中経過を観察。μ が0に、σ が1に近づいていく。

▶ 正規分布、ぜんぶ"あの一本"に化ける瞬間

身長、IQ、血圧の測定値、工場の部品誤差 — 世の中にある正規分布っぽいものは平均も広がりもバラバラ。 でも z = (x − μ) / σ をかませるだけで、全部まとめてピンクのあの曲線にピタッと重なる。
スクロールしたら自動で変身していく(もう一度見たい時は ▶ ボタン)。これが、すべての統計公式が "標準正規表" 一枚で済む理由。

元の分布N(2.0, 1.5²)
変換後の平均
変換後のσ

// よくある誤解

❌「z=1.96 はキリのいい数字だから採用された」

両側確率がちょうど 5% になる z の正確な値は 1.959964… で、1.96 はその小数第3位の四捨五入。キリが良いわけでもなく、約束事でもない。P(−1.96 ≤ Z ≤ 1.96) = 0.95000… であり 0.95 との差はごくわずか。手計算では 1.96 で十分。

❌「標準化したらデータの情報が消える」

z = (x−μ)/σ は可逆。x = μ + zσ で元に戻せる。標準化はスケールを揃えるだけで、情報は一切失われない。

❌「標準正規分布は理論だけのもの」

どんな正規分布も z = (x−μ)/σ で標準正規に変換できるから、この1つの分布を知っていれば全部の確率が計算できる。だからこそ「すべてのはじまり」。

// よく出会う形

標準正規分布のまわりでは、「標準化 → 表引き」の流れと、その変奏がいつも繰り返し顔を出します。

  • 表のスタイルの違い:同じ z 値でも、表が「上側確率」なのか「累積確率」なのかで読み取る数字が変わる、という形がここに住んでいる
  • 区間確率は引き算の形:P(0.5 ≤ Z ≤ 1.5) = Φ(1.5) − Φ(0.5)。「累積どうしの差」で区間が出るという同じ絵が、いろんな問題で繰り返し顔を出す
  • 標準化してから表を引く流れ:N(170, 6²) で X ≥ 180 なら、z = (180−170)/6 ≈ 1.67 という形に揃えてから表へ向かう。一般正規はいつも、この経路を通る
  • 逆引きの形:「上側5%点は?」と聞かれると、z = 1.645 という値が出る。表を逆向きに使う、という同じ動きの形がここに見える

一般正規 N(μ,σ²) → z の翻訳の本拠地は 正規分布と標準化

次は —正規分布そのものを扱う P2 正規分布