- シンクタンクならニッセイ基礎研究所 >
- 経済 >
- 経済予測・経済見通し >
- 統計分析を理解しよう:正規分布、標準化、標準正規分布の概念
統計分析を理解しよう:正規分布、標準化、標準正規分布の概念
生活研究部 上席研究員・ヘルスケアリサーチセンター・ジェロントロジー推進室兼任
金 明中 (きむ みょんじゅん)
研究・専門分野
高齢者雇用、不安定労働、働き方改革、貧困・格差、日韓社会政策比較、日韓経済比較、人的資源管理、基礎統計
03-3512-1825
このレポートの関連カテゴリ
文字サイズ
- 小
- 中
- 大
正規分布とは?
一方、連続確率分布とは、あるクラスにおける学生の体重、身長など、数値そのものに意味があり、四則演算ができるデータ(このようなデータを「量的データ」あるいは「連続データ」という)で、確率変数が連続的な場合の確率分布である1。そして、連続確率分布をグラフで描いたものが確率密度関数である。確率密度関数は図表1のように多様な形があり得るものの、Cのように真ん中に山が来て左右対称の形をしているのが「正規分布」の一般的な形である。
(1) -∞~∞の実数値をとる。
(2) 山が一つで平均値(
、以下、平均)付近の確率密度が最も大きく、平均と中央値、最頻値が一致する。(3) 平均を中心として左右対称の釣鐘型の分布である。
(4) 平均から離れるほど、確率密度が小さくなる。
(5) 正規分布のカーブの下の面積は形にかかわらず、どれも”1”になっており、分布のカーブの下の面積は確率を示している。
つまり、
⇒ 平均から左右に標準偏差1つ分(平均(
)±標準偏差(
)×1)の区間にデータが入る確率は68.26%
⇒ 平均から左右に標準偏差2つ分(平均(
)±標準偏差(
)×2)の区間にデータが入る確率は95.44%
⇒ 平均から左右に標準偏差3つ分(平均(
)±標準偏差(
)×3)の区間にデータが入る確率は99.74%
である(図表2)。
は3.14159…、eは2.71828…という値がすでに決まっているので、平均(
)と標準偏差(
)さえ分かれば正規分布の形が決まることになる。つまり、平均は確率密度関数のグラフの位置を決め、標準偏差はグラフの形を決定する。標準偏差が小さいと、平均付近にデータが集まり、標準偏差が大きいと、データが平均から大きく離れることになる。
1 変数(variables、変量とも言う)とは、調査対象により異なり、ある調査を行って得られた結果(データ)に名前を付けたものである。また、確率変数とは、標本空間にある全ての要素を実数に対応させたものだと言える。
標準化と標準正規分布
と仮定できる場合、このデータを標準化した「標準正規分布表」を用いて一定区間の確率(面積)を求める方法が利用されている。標準化とは、世の中の無数の確率変数が同じ平均と標準偏差を持つように確率変数を変換することである。確率変数
を標準化するには、該当する値(
)から平均(
)を引き、標準偏差(
)で割ればよい。すると、確率変数は標準化確率変数に変わり、確率変数の単位に関係なく平均0、標準偏差1の値を持つことになる。標準化した
は、ある値
が平均から離れた距離が標準偏差の何倍であるかを意味する。
まず、式(5)を利用して284gと315gを標準化すると、標準化した値はそれぞれ-1.6と1.5になる。つまり、確率変数
が284gから315gの間に入る確率と、標準正規分布の変数である
が-1.6と1.5の間に入る確率は同じである(図表4)。また、標準正規分布の確率密度関数は左右対称であるので、
の値が0から-1.6の間に入る確率は、
の値が0から1.6の間に入る確率を標準正規分布表から確認すればよい(式(6))。そこで、標準正規分布表を利用してその確率を求めると、確率変数
が284gから315gの間に入る確率は、87.84%(0.4452+0.4332=0.8784)であることが分かる(図表5)。本資料記載のデータは各種の情報源から入手・加工したものであり、その正確性と完全性を保証するものではありません。
また、本資料は情報提供が目的であり、記載の意見や予測は、いかなる契約の締結や解約を勧誘するものではありません。
(2021年01月19日「研究員の眼」)
このレポートの関連カテゴリ
生活研究部 上席研究員・ヘルスケアリサーチセンター・ジェロントロジー推進室兼任
金 明中 (きむ みょんじゅん)
研究・専門分野
高齢者雇用、不安定労働、働き方改革、貧困・格差、日韓社会政策比較、日韓経済比較、人的資源管理、基礎統計
03-3512-1825
新着記事
-
2025年12月16日
日銀利上げが確実視、でも進まない円高の行方~マーケット・カルテ1月号 -
2025年12月16日
講義中にネトフリを見る学生たち-8割の学生が「講義中に動画を見たことがある」と回答 -
2025年12月16日
変わるクリスマス~「誰と過ごすか」から「どう過ごしたいか」へ-データで読み解く暮らしの風景 -
2025年12月16日
中国の社会保障財政(2024年)【アジア・新興国】中国保険市場の最新動向(72) -
2025年12月16日
今週のレポート・コラムまとめ【12/9-12/15発行分】
お知らせ
-
2025年12月16日
News Release
令和7年度 住宅ストック維持・向上促進事業「良質住宅ストック形成のための市場環境整備促進事業」に関するシンポジウムの開催
-
2025年12月01日
News Release
-
2025年12月01日
News Release
【統計分析を理解しよう:正規分布、標準化、標準正規分布の概念】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。
統計分析を理解しよう:正規分布、標準化、標準正規分布の概念のレポート Topへ











の正規分布に従うとき(式(3))、その確率密度関数は式(4)のようになる。









