コラム
2024年06月11日

クラメル・ラオの不等式の活用-たまには学問の理論を振り返ってみよう

保険研究部 主席研究員 兼 気候変動リサーチセンター チーフ気候変動アナリスト 兼 ヘルスケアリサーチセンター 主席研究員 篠原 拓也

このレポートの関連カテゴリ

文字サイズ

統計学の分野の1つに、「推測統計」がある。これは、限られた標本をもとに、調査したい母集団全体の特徴を推測する、というものだ。
 
例えば、テレビの視聴率の調査や、工場での製品の抜き取り検査などが、これにあてはまる。各種メディアでよく行われる世論調査も、推測統計であることが一般的だ。
 
推測統計には、母集団の特徴となる母数(平均や分散など)を推測する「推定」と、抽出された標本の統計量に関する仮説が正しいかどうかを統計学的に判定する「検定」がある。
 
今回は、推定のうち、1つの値でずばり母数を推測する「点推定」について、例を用いて見ていくこととしよう。

◇ コイン投げを例にとる

まず、具体例を1つ挙げることにしよう。
 

(コインの表が出る確率の推測)
いま、手元に普通のコインが1枚あります。このコインを投げたときに、表が出る確率を知りたいとします。コインを最大10回まで何回か投げて、表が出る確率を推測する場合、どういうやり方がよいと考えられるでしょうか?

いきなりコインが出てきたが、確率や統計の話では、コインは定番中の定番なので、お許しいただきたい。
 
さて、このような確率の推測をするということは、このコインは、表が出る確率が2分の1かどうか、よくわからないようだ。読者は、コインの表と裏に刻まれている文字の凹凸が大きく異なっている、または古いコインのため長年の使用に伴って少し変形している、などと考えていただきたい。
 
コインは、“普通のコイン”なので、何回か投げたときに各回に表が出る確率は同じで、各回のコイン投げの結果は互いに独立、と考えてよいだろう。

◇ 「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」

そこで、先ほどの文章中に条件として「コインを最大10回まで何回か投げて」とあるので、最大回数投げることにして、「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」で、表が出る確率を推測することが考えられる。このコインの、真に表が出る確率をpとすると、pを10回の平均で推測するわけだ。
 
ここで、1回コインを投げたときについて考える。1回のコイン投げの結果を表す確率変数Xを持ち出してきて、表の場合はX=1、裏の場合はX=0 とする。すると、1回のコイン投げで、表が出る回数の平均は、p(=1×p+0×(1-p))回となる。通常pは小数なので、普通はこういう言い方はしないが、ここでは大目に見ていただきたい。
 
コインを10回投げれば、その10倍で10p回表が出る。それを10で割り算するのだから、結局平均(期待値)はpとなる。このように標本から測定した推定量の期待値が母数に等しいとき、その推定量は不偏推定量と言われる。「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」の推定量は不偏推定量となっており、表が出る確率の推測として適切なやり方ということになる。
 
1回コインを投げたときに表が出る回数の分散は、(Xの2乗)の平均 から、(Xの平均)の2乗 を引き算することで計算できる。つまり、{12×p+02×(1-p)}-p2 = p-p2 = p(1-p)となる。コインを何回か投げる場合、各回のコイン投げの結果は互いに独立と考えてよいので、コインを10回投げるときには、10倍で10p(1-p)が分散となる。
 
「10回投げて表が出た回数を10で割り算した平均」について分散を計算するときには、10p(1-p)を10ではなく、102で割り算するため、p(1-p)/10が分散となる。
 
ここで、問題となるのは、この分散の水準は大きいのか小さいのかという点だ。分散は、推定結果が、どれくらい真の平均であるpの周りにばらついているかを表している。分散が小さいほど、ばらつきが小さくて、よい推定ということになる。
 
この「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」による分散の水準が大きいのか小さいのかを見るには、他の方法と比較してみることが必要となる。
 

◇ 「コインを5回投げて表が出た回数を5で割り算して平均をとる方法」

そこで、コインを投げる回数を半分の5回にしたらどうなるかを考えてみる。もし、5回のコイン投げの場合でも、10回のコイン投げの場合と同じ分散になるのであれば、投げる手間が半分の5回のほうがよい方法だと言えるだろう。
 
「コインを5回投げて表が出た回数を5で割り算して平均をとる方法」の期待値はpで、この方法の推定量も不偏推定量だ。だが分散は、p(1-p)/5となり、10回のときの2倍に膨らんでしまう。
 
やはり、投げる回数を減らして(楽をして)も同じ分散となるといった、うまい話はないということなのだろう。

◇ 「コインを10回投げて表が出た回について加重平均をとる方法」

別の方法として、「コインを10回投げて表が出た回について加重平均をとる方法」を考えてみる。具体的には、1回目のコイン投げには1、2回目のコイン投げには2、…、10回目のコイン投げには10、の“重み”を設定して加重平均をとる。例えば、3回目と5回目と6回目と7回目と10回目に表が出たとすると、pを(3+5+6+7+10)/(1+2+…+10)=31/55と推定することとなる。
 
この方法でも、期待値はpとなる。推定量は不偏推定量だ。問題は分散だが、計算してみると、これは14/11×p(1-p)/10となる。(※1) 「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」の分散p(1-p)/10よりも、やや大きいという結果になる。
 
このように比較してみると、「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」の分散は小さく、推定としてよい方法なのだということがわかってくる。

◇ 比較相手となる別の方法が次々に現れて際限がない...

ただ、このように「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」に対して、別の方法と分散を比較していくやり方では、比較相手となる別の方法が次々に現れて際限がなくなる。
 
例えば、「奇数回には1、偶数回には2、の“重み”を設定して加重平均をとる方法」、「1回目のコイン投げには12、2回目のコイン投げには22、…、10回目のコイン投げには102、の“重み”を設定して加重平均をとる方法」など、いくらでも比較相手の方法が考えられるからだ。(ちなみに、どちらの方法も、推定量は不偏推定量だ。ところが分散について計算すると、前者はp(1-p)/9 (※2)、後者は94/55×p(1-p)/10 (※3) となって、いずれもp(1-p)/10より大きい。)

◇ クラメル・ラオの不等式 : 分散には下限がある

ここで、際限のない比較に終止符を打つ、うまい不等式がある。「クラメル・ラオの不等式」だ。(この不等式に関する数学的に厳密な諸条件の提示や証明は、本稿では行わない。興味のある方は、統計的推定に関する専門書籍をご参照いただきたい。)
 
「不偏推定量をどのようにとったとしても、その分散を、“フィッシャー情報量”という一定の数式の逆数よりも小さくすることはできない」という、分散の“下限”を表す不等式だ。
 
少し注意が必要なのは、“下限”は“最小”とは異なるということだ。分散がその下限になるような推定の方法が必ずある、ということではない。だが、もしある方法で分散がクラメル・ラオの不等式の下限に一致したならば、その方法よりも分散が小さくなるような不偏推定量は、他にいくら探しても見つからない ―― つまり、その方法の分散が最小である、ということがわかる。
 
この不等式を算式で表すと、偏微分の記号や対数の記号が出てきて難解な感じになるが、少し我慢して式展開をしてみると次のようになる。


 
この結果、「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」の分散は、クラメル・ラオの不等式の下限に一致することがわかる。つまり、この方法の分散が最小であることがわかるわけだ。
 
「コインを10回投げて表が出た回数を10で割り算して平均をとる方法」の推定量は、最小分散不変推定量であることが示された。

◇ 理論を振り返ってみるのも重要では

日頃実務で推測統計を行っているという人でも、作業の際に、いちいち統計学の理論に立ち返って確認をするということは、あまりないかもしれない。
 
しかし、今回取り上げたクラメル・ラオの不等式のように、統計学の理論には、先人たちが苦労の末にたどりついた有用な成果が、結晶となって詰め込まれている。
 
これは、何も統計学に限られた話ではない。さまざまな学問の理論には、いま取りかかっている検討や作業の正統性を裏付けるような、基礎的な知識の体系が息づいている。
 
たまには、こうした理論を振り返ってみることも重要ではないかと思われるが、いかがだろうか。

(参考) (※1)~(※3)の計算
(※1)~(※3)の計算

(参考文献)
 
「確率統計演習1 確率」国沢清典編(培風館, 1966年)
 
「確率統計演習2 統計」国沢清典編(培風館, 1966年)

(2024年06月11日「研究員の眼」)

このレポートの関連カテゴリ

Xでシェアする Facebookでシェアする

保険研究部   主席研究員 兼 気候変動リサーチセンター チーフ気候変動アナリスト 兼 ヘルスケアリサーチセンター 主席研究員

篠原 拓也 (しのはら たくや)

研究・専門分野
保険商品・計理、共済計理人・コンサルティング業務

経歴
  • 【職歴】
     1992年 日本生命保険相互会社入社
     2014年 ニッセイ基礎研究所へ

    【加入団体等】
     ・日本アクチュアリー会 正会員

公式SNSアカウント

新着レポートを随時お届け!
日々の情報収集にぜひご活用ください。

週間アクセスランキング

レポート紹介

【クラメル・ラオの不等式の活用-たまには学問の理論を振り返ってみよう】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。

クラメル・ラオの不等式の活用-たまには学問の理論を振り返ってみようのレポート Topへ