- シンクタンクならニッセイ基礎研究所 >
- 経済 >
- 経済予測・経済見通し >
- 統計分析を理解しよう-よく使われている統計分析方法の概要-
統計分析を理解しよう-よく使われている統計分析方法の概要-
生活研究部 主任研究員・ヘルスケアリサーチセンター・ジェロントロジー推進室兼任 金 明中
このレポートの関連カテゴリ
はじめに
統計分析は大きく「差の検定」と「関係の検定」に区分
一方、「関係の検定」はAという変数がBという変数に与える影響(関係)を分析する方法であり、

(1) t-test
t-test は、2つ以下の集団の平均の差を検定する方法であり、1)1サンプルの検定、2)対応のないt検定、3)対応のあるt 検定が代表的である。それぞれの例を以下に示す。
1) 1サンプルの検定
例)中学校1年生の平均身長が150Cmであるかどうかを検定する。
2) 対応のないt 検定
例) ある会社の男性と女性の賃金に差があるかどうかを検定する。
3) 対応のあるt 検定
例)授業前と授業後のテスト点数に差があるかどうかを検定する。
(2) 分散分析(ANOVA)
一方、分散分析は3つ以上の集団の平均の差を検定する方法であり、一般的には1)一元配置の分散分析、2)二元配置の分散分析、3)三元配置の分散分析がよく使われている。
1) 一元配置の分散分析
説明変数(要因)が1つ
例:3カ国の平均身長の違い
2) 二元配置の分散分析
説明変数(要因)が2つ
例:3カ国×男性と女性の平均身長の違い
3) 三元配置の分散分析
説明変数(要因)が3つ以上
例:3カ国×学歴別×男性と女性の平均身長の違い
(1)

名義尺度1から得られた質的データに対する検定で、標本で得られた結果で母集団を推測できるかどうかを判断する方法である。具体的には期待度数(期待値・理論値)を求め、その期待度数から観測度数(測定された値)がどの程度の割合でずれているか(観測度数と期待度数の差=残差)を検定する。
1 単に区別するために用いられている尺度。例えば、血液型のA型、B型、O型、AB型をそれぞれ1、2、3、4という数値に対応させたもの。平均、分散、標準偏差を求めても意味がない。
散布図や相関係数をもとにして、2変数の関係を調べる統計解析の手法である。相関係数とは、 簡単にいうと2つの変数がどのような関係にあるのかを数値で表したものであり、相関係数は-1から+1の間の値をとる。一般的に相関係数はrで表記され、得られた相関係数は次のように解釈する。
・r=0のとき、2つの変数には関連性がない
・rが1 に近いときは2つの確率変数には正の相関がある
・rが-1 に近いときは2つの確率変数には負の相関がある
(3) 重回帰分析(線形回帰分析)
統計的分析方法の中で最も使われているのが回帰分析である。回帰分析を簡単に言うと、ある変数の値で、他の変数の値を予測し、両者の関連性を確認する分析方法だと言える。一般的には予測される変数を被説明変数(従属変数、目的変数とも呼ぶ)と呼び、予測のために使われる変数を説明変数(説明変数)と呼ぶ。また、被説明変数を予測する際に使われる説明変数が一つであると単回帰分析(simple regression model)であり、説明変数が二つ以上であると重回帰分析(multiple regression model)である。相関分析との大きな違いは相関分析が変数と変数の間の「1:1」の関係を分析することに対して、回帰分析は一つの被説明変数と多数の説明変数の関係、つまり「1:N」の関係を分析しているところだと言える。
(4) ロジスティック分析(非線形回帰分析)
一般的な回帰モデルは、説明変数と被説明変数の間の線形関係を仮定し、分析を行う。しかしながら社会のすべての現象が線形的な関係ではないので、非線形的な関係に対する分析も必要である。例えば所得がいくらぐらいである時、家を所有するのか、給料がどのぐらいある時、車を買うのか、年収がどのぐらいである時、結婚をするのかなど説明変数は量的データであるものの、被説明変数は「家を所有している、家を所有していない」などの質的データになっている場合がある。従って、被説明変数が質的変数である場合には重回帰分析(線形回帰分析)ではなく、ロジスティック分析(非線形回帰分析)を行う必要がある。つまり、ロジスティック回帰分析は質的変数である被説明変数の確率を予測する方法である。例えば、家を所有している場合を1、家を所有していない場合を0とする2値しかとりえない値を被説明変数の実績値として用い、説明変数を用いてその発生確率を予測することができる。
(5) パネル分析
パネル分析は、パネルデータを用いた分析方法である。パネルデータとは個人や企業等の複数の経済主体の情報を時系列で追跡したデータである。パネルデータを通常の回帰分析(最小二乗法)で推定した場合、推定値にバイアスが発生する恐れがある。つまり、通常の最小二乗法では企業や個人の持っている固有効果を誤差項に含めて推定を行っているが、その結果、固有効果により誤差項に自己相関が発生したり、誤差項が説明変数と相関するために、BLUE(Best Linear Unbiased Estimator、最良線形不偏推定量)を得るための誤差項の仮定が満たされなくなるケースが多い。そこで、パネル分析をすることにより、個体の観察されない固有効果がコントロールできるので、バイアスのある推定値を得るリスクを減らすことができるのである。また、それ以外のパネル分析のメリットとしては、個体のダイナミックな動きを測定することができる、サンプル数が増える、多重共線性(muiti-collinearity)の問題が緩和されることなどが挙げられる。
結びに代えて
このレポートの関連カテゴリ

03-3512-1825
(2019年06月28日「研究員の眼」)
ソーシャルメディア
新着記事
-
2021年01月25日
新型コロナ ワクチンのただ乗り-ワクチン忌避をいかに減らすか? -
2021年01月25日
バイデン政権が発足-安定政権も、新型コロナ対策と追加経済対策が喫緊の課題となる中で厳しい船出 -
2021年01月22日
バイデン新政権発足、円相場への影響は?~マーケット・カルテ2月号 -
2021年01月22日
ECB政策理事会-政策変更なし、経済見通しも想定内 -
2021年01月22日
未婚化と雇用 ~コロナ禍で求められる雇用の確保~
レポート紹介
-
研究領域
-
経済
-
金融・為替
-
資産運用・資産形成
-
年金
-
社会保障制度
-
保険
-
不動産
-
経営・ビジネス
-
暮らし
-
ジェロントロジー(高齢社会総合研究)
-
医療・介護・健康・ヘルスケア
-
政策提言
-
-
注目テーマ・キーワード
-
統計・指標・重要イベント
-
媒体
- アクセスランキング
お知らせ
-
2021年01月21日
News Release
-
2020年10月15日
News Release
-
2020年07月09日
News Release
【統計分析を理解しよう-よく使われている統計分析方法の概要-】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。
統計分析を理解しよう-よく使われている統計分析方法の概要-のレポート Topへ