コラム

正規分布の生保での活用例-中心極限定理は、保険数理をどのように支えているか?

2016年04月04日

(篠原 拓也) 保険計理

実験や観測、アンケートなどから得られるデータを、統計的に分析する際に、避けては通れない分布がある。正規分布である。この分布は、グラフに描くと、左右対称で、滑らかな形をしている。
 
正規分布は、日本では高等学校などの数学の授業で出てくる。しかし、分布の算式が複雑なためか、あまり詳しくは取り上げられていない。そのためか、日本の高等学校で学んだ生徒にとって、正規分布は、確率や統計に出てくる用語として聞いたことはあるが、細かいことは知らないといった、中途半端な存在になっているように思われる。
 
正規分布に関連する重要な定理として、「中心極限定理」がある。簡単に、内容を見てみよう。
 

分散が存在するようなデータの母集団を考える。この母集団から、標本データをいくつか取り出して、その平均を計算してみよう。この標本データの平均のことを、「標本平均」と呼ぶ。取り出す標本データの数を、どんどん増やしていくと、標本平均はどうなるだろうか。

実は、データの母集団が、二項分布や、ポアソン分布など、どのような分布であったとしても、標本平均は、母集団の真の平均を中心とした、正規分布に、近似的に従うことになる。

上記説明では、表現上、わかりやすさを優先して、数学的な厳密さは省略している。なお、二項分布や、ポアソン分布については詳述しない。興味のある方は、専門書を、ご参照いただきたい。

中心極限定理により、多数の標本データを取り出すと、標本平均が正規分布に近づいていく。そして、ここが重要なポイントなのだが、正規分布という、明確なゴールに近づいていくため、標本平均が母集団の真の平均から、ぶれる場合の、ぶれ幅や、その確率が計算できることになる。
 
具体的には、各標本データについて、標本データの値と、標本平均の差の二乗をとって、その合計を標本データの数で除して平方根をとったものを、「標本標準偏差」と呼ぶ。(なお、標本データの数があまり大きくない場合は、標本データの数ではなく、標本データの数から1を引いた数、で除す。)この標本標準偏差を、標本データの数の平方根で除したものを、「標準誤差」と呼ぶ。
 
標本平均のぶれが、母集団の真の平均から、標準誤差の範囲内にとどまる確率は、68.3%となる。同様に、ぶれが、標準誤差の2倍に納まる確率は、95.4%、3倍に納まる確率は、99.7%となる。
万一の際の保障を行う生命保険では、将来の保険金支払いを確実に行うために、保険会社は、法令上、責任準備金を積み立てることとされている。責任準備金の計算に用いる基礎率として、法令で、標準死亡率が定められている。標準死亡率には、作成の際に、標準誤差の2倍に相当する割り増しが施されている。この割り増しにより、標準死亡率が、母集団の真の平均よりも大きくなるのは、100%と95.4%の差である4.6%の半分、つまり2.3%ということになる。(なお、割り増しには上限がある。一部の年齢では、その上限に達しているため、実際はもう少し複雑な状況となっている。)
 
この2.3%とは、標本データを100回取り出したら、そのうちの97.7回は通常の予測の範囲に納まるが、2.3回は通常の予測を超える、ということを意味する。なお、仮に、通常の予測を超える範囲の、高い死亡率が生じた場合でも、ふつうは、すぐに保険金の支払いに支障が生じることはない。保険会社は、別途、危険準備金などの準備金や、自己資本を積み立てており、保険金の支払いに支障が生じないよう、盤石な健全性を築いている。
 
生命保険で用いられている保険数理は、高等学校の数学で出てくる正規分布がベースになっている。これは、少し、正規分布を身近に感じることのできる活用例だと思われるが、いかがだろうか。
 
レポートについてお問い合わせ
(取材・講演依頼)