Z

身長160cmと年収500万円。
どっちが「ふつう」から遠い

単位も平均もバラバラなのに、比べられる。
その魔法の名前は、標準化

StatPlay コラム 標準化って何?

「身長160cm」と「年収500万円」—— どちらが「普通」から遠いだろう?
そもそも cm と円を比べるなんて、意味がなさそうに見える。
でも統計学には、あらゆる数値を同じ土俵に乗せる翻訳機がある。
それが「標準化」だ。

01

// 比べられない、を比べたい

たとえば、あなたの友人がこう言ったとする。

「俺、身長182cmなんだよね」
「私、TOEIC 860点だよ」

どちらも「すごい」のはなんとなくわかる。
でも「どっちがより珍しいか」は、このままじゃ答えられない。
なぜなら——

単位も平均もばらつきも全部違う。りんごとオレンジだ。
この「比較不可能」を「比較可能」に変えるのが、標準化の仕事。

02

// 翻訳機の正体

標準化の式は、これだけ。

Z = (X − μ) ÷ σ

やっていることは2ステップだけだ。

Step 1:平均を引く
(X − μ) で「平均からどれだけ離れているか」を出す。
これで基準点がゼロに揃う

Step 2:標準偏差で割る
σ で割ることで「cm」「点」「円」といった単位が消える
残るのは「σ 何個分」という無次元の数だけ。

この2ステップで、どんなデータも「平均0・標準偏差1」の共通言語に翻訳される。
翻訳後の値を Z スコアと呼ぶ。

03

// 翻訳してみよう

さっきの「身長182cm」と「TOEIC 860点」を実際に標準化してみる。

▼ 身長(成人男性)

値 X 182cm
平均 μ 171cm
÷
標準偏差 σ 6cm
=
Z スコア +1.83

▼ TOEIC

値 X 860
平均 μ 610
÷
標準偏差 σ 170
=
Z スコア +1.47
身長182cm は平均から1.83σ上。
TOEIC 860点 は平均から1.47σ上。
→ 同じ「すごい」でも、身長182cmのほうが統計的にはレア。

cm も点も消えた。残ったのは「σ 何個分」だけ。
これが標準化の力だ——りんごとオレンジを、同じ天秤に乗せた

04

// なぜこれが「面白い」のか

標準化が面白いのは、単なる計算テクニックじゃないからだ。
よく考えてみてほしい。

「ふつう」とは何か?
標準化は暗に「平均がふつうで、そこからの距離が珍しさだ」と定義している。
つまり標準化は、「ふつう」の数学的定義を与えている。

単位が消える、ということ
cm を σ で割ると、cm が約分されて消える。
残るのは純粋な比率。物理学で言う「無次元量」。
標準化は、データから「意味」だけを抽出する蒸留器だ。

統計学の「共通語」になっている
z検定、t検定、偏差値、信頼区間——
統計学の重要な道具のほとんどが、裏側で標準化を使っている
標準化を理解すれば、それらが「全部同じことをやっている」と気づく。

05

// 偏差値の正体、ふたたび

ところで、日本人なら誰でも知っている「偏差値」。
あれの正体は、標準化に化粧をしただけだ。

偏差値 = 50 + 10 × Z

標準化した値(Zスコア)に10を掛けて50を足す。それだけ。
なぜこんな変換をするかというと——

つまり偏差値は、標準化のユーザーフレンドリー版
本質は同じ。「平均からσ何個分か」を測っているだけだ。

Z スコア 偏差値
平均050
+1σ+1.060
+2σ+2.070
-1σ-1.040
-2σ-2.030
06

// 3問クイズ — ここまでの理解を確認

Q1. 標準化すると、元の単位(cm、点、円)はどうなる?

標準偏差の単位は元のデータと同じ(cm なら cm)。割り算で単位が約分され、Z スコアは「σ 何個分」という無次元の比率になる。

Q2. Z = -0.5 は「平均より上」?「平均より下」?

Z が負なら平均より下。Z = -0.5 は「平均から標準偏差の半分だけ下」を意味する。

Q3. 偏差値60は、Zスコアでいくつ?

偏差値 = 50 + 10 × Z なので、60 = 50 + 10 × Z → Z = 1.0。偏差値60は「平均から σ ちょうど1つ分上」。

// KEY TAKEAWAY

FAQ

// よくある質問

Z = (X − μ) ÷ σ。データから平均を引いて標準偏差で割る変換のこと。単位や尺度が異なるデータを「平均からσ何個分離れているか」という共通の物差しに変換する操作。

Zスコアは平均0・標準偏差1のスケール。偏差値は平均50・標準偏差10のスケール。偏差値 = 50 + 10 × Z なので、偏差値は標準化にスケール変換を加えたもの。本質的に同じ操作をしている。

標準化は「cm」「円」「点」といった元の単位を消し去り、すべてを「σ何個分」という無次元の共通言語に変換する。これにより、身長と年収のように本来比較できないものも「どちらがより珍しいか」を比較できるようになる。

仮説検定(z検定・t検定)、機械学習の前処理(特徴量スケーリング)、偏差値の計算、異なる指標間の比較など、統計学のあらゆる場面で使われる。統計検定2級では正規分布の確率計算で必ず登場する。

変わらない。標準化は「平行移動(平均を引く)」と「拡大縮小(σで割る)」だけなので、分布の形はそのまま保存される。歪んだ分布を標準化しても、歪んだまま。正規分布を標準化すると、標準正規分布 N(0,1) になる。

標準化は、統計学の「ロゼッタストーン」だ。

この共通言語を使って、正規分布の確率計算や仮説検定がどう動くのかを体感しよう。
StatPlay のインタラクティブ教材で、数式の向こう側を触れる。