- シンクタンクならニッセイ基礎研究所 >
- 経済 >
- 経済予測・経済見通し >
- 統計分析を理解しよう-よく使われている統計分析方法の概要-
はじめに
統計分析は大きく「差の検定」と「関係の検定」に区分
一方、「関係の検定」はAという変数がBという変数に与える影響(関係)を分析する方法であり、(カイ二乗)検定(Chi-squared Test)、相関分析(Correlation Analysis)、回帰分析(Linear Regression)、ロジスティック分析(Logistic Regression)、パネル分析(Panel Analysis)などがよく使われている。
(1) t-test
t-test は、2つ以下の集団の平均の差を検定する方法であり、1)1サンプルの検定、2)対応のないt検定、3)対応のあるt 検定が代表的である。それぞれの例を以下に示す。
1) 1サンプルの検定
例)中学校1年生の平均身長が150Cmであるかどうかを検定する。
2) 対応のないt 検定
例) ある会社の男性と女性の賃金に差があるかどうかを検定する。
3) 対応のあるt 検定
例)授業前と授業後のテスト点数に差があるかどうかを検定する。
(2) 分散分析(ANOVA)
一方、分散分析は3つ以上の集団の平均の差を検定する方法であり、一般的には1)一元配置の分散分析、2)二元配置の分散分析、3)三元配置の分散分析がよく使われている。
1) 一元配置の分散分析
説明変数(要因)が1つ
例:3カ国の平均身長の違い
2) 二元配置の分散分析
説明変数(要因)が2つ
例:3カ国×男性と女性の平均身長の違い
3) 三元配置の分散分析
説明変数(要因)が3つ以上
例:3カ国×学歴別×男性と女性の平均身長の違い
(1) (カイ二乗)検定
名義尺度1から得られた質的データに対する検定で、標本で得られた結果で母集団を推測できるかどうかを判断する方法である。具体的には期待度数(期待値・理論値)を求め、その期待度数から観測度数(測定された値)がどの程度の割合でずれているか(観測度数と期待度数の差=残差)を検定する。
1 単に区別するために用いられている尺度。例えば、血液型のA型、B型、O型、AB型をそれぞれ1、2、3、4という数値に対応させたもの。平均、分散、標準偏差を求めても意味がない。
散布図や相関係数をもとにして、2変数の関係を調べる統計解析の手法である。相関係数とは、 簡単にいうと2つの変数がどのような関係にあるのかを数値で表したものであり、相関係数は-1から+1の間の値をとる。一般的に相関係数はrで表記され、得られた相関係数は次のように解釈する。
・r=0のとき、2つの変数には関連性がない
・rが1 に近いときは2つの確率変数には正の相関がある
・rが-1 に近いときは2つの確率変数には負の相関がある
(3) 重回帰分析(線形回帰分析)
統計的分析方法の中で最も使われているのが回帰分析である。回帰分析を簡単に言うと、ある変数の値で、他の変数の値を予測し、両者の関連性を確認する分析方法だと言える。一般的には予測される変数を被説明変数(従属変数、目的変数とも呼ぶ)と呼び、予測のために使われる変数を説明変数(説明変数)と呼ぶ。また、被説明変数を予測する際に使われる説明変数が一つであると単回帰分析(simple regression model)であり、説明変数が二つ以上であると重回帰分析(multiple regression model)である。相関分析との大きな違いは相関分析が変数と変数の間の「1:1」の関係を分析することに対して、回帰分析は一つの被説明変数と多数の説明変数の関係、つまり「1:N」の関係を分析しているところだと言える。
(4) ロジスティック分析(非線形回帰分析)
一般的な回帰モデルは、説明変数と被説明変数の間の線形関係を仮定し、分析を行う。しかしながら社会のすべての現象が線形的な関係ではないので、非線形的な関係に対する分析も必要である。例えば所得がいくらぐらいである時、家を所有するのか、給料がどのぐらいある時、車を買うのか、年収がどのぐらいである時、結婚をするのかなど説明変数は量的データであるものの、被説明変数は「家を所有している、家を所有していない」などの質的データになっている場合がある。従って、被説明変数が質的変数である場合には重回帰分析(線形回帰分析)ではなく、ロジスティック分析(非線形回帰分析)を行う必要がある。つまり、ロジスティック回帰分析は質的変数である被説明変数の確率を予測する方法である。例えば、家を所有している場合を1、家を所有していない場合を0とする2値しかとりえない値を被説明変数の実績値として用い、説明変数を用いてその発生確率を予測することができる。
(5) パネル分析
パネル分析は、パネルデータを用いた分析方法である。パネルデータとは個人や企業等の複数の経済主体の情報を時系列で追跡したデータである。パネルデータを通常の回帰分析(最小二乗法)で推定した場合、推定値にバイアスが発生する恐れがある。つまり、通常の最小二乗法では企業や個人の持っている固有効果を誤差項に含めて推定を行っているが、その結果、固有効果により誤差項に自己相関が発生したり、誤差項が説明変数と相関するために、BLUE(Best Linear Unbiased Estimator、最良線形不偏推定量)を得るための誤差項の仮定が満たされなくなるケースが多い。そこで、パネル分析をすることにより、個体の観察されない固有効果がコントロールできるので、バイアスのある推定値を得るリスクを減らすことができるのである。また、それ以外のパネル分析のメリットとしては、個体のダイナミックな動きを測定することができる、サンプル数が増える、多重共線性(muiti-collinearity)の問題が緩和されることなどが挙げられる。
結びに代えて
このレポートの関連カテゴリ
生活研究部 上席研究員・ヘルスケアリサーチセンター・ジェロントロジー推進室兼任
金 明中 (きむ みょんじゅん)
研究・専門分野
高齢者雇用、不安定労働、働き方改革、貧困・格差、日韓社会政策比較、日韓経済比較、人的資源管理、基礎統計
03-3512-1825
- プロフィール
【職歴】
独立行政法人労働政策研究・研修機構アシスタント・フェロー、日本経済研究センター研究員を経て、2008年9月ニッセイ基礎研究所へ、2023年7月から現職
・2011年~ 日本女子大学非常勤講師
・2015年~ 日本女子大学現代女性キャリア研究所特任研究員
・2021年~ 横浜市立大学非常勤講師
・2021年~ 専修大学非常勤講師
・2021年~ 日本大学非常勤講師
・2022年~ 亜細亜大学都市創造学部特任准教授
・2022年~ 慶應義塾大学非常勤講師
・2024年~ 関東学院大学非常勤講師
・2019年 労働政策研究会議準備委員会準備委員
東アジア経済経営学会理事
・2021年 第36回韓日経済経営国際学術大会準備委員会準備委員
【加入団体等】
・日本経済学会
・日本労務学会
・社会政策学会
・日本労使関係研究協会
・東アジア経済経営学会
・現代韓国朝鮮学会
・韓国人事管理学会
・博士(慶應義塾大学、商学)
(2019年06月28日「研究員の眼」)
公式SNSアカウント
新着レポートを随時お届け!日々の情報収集にぜひご活用ください。
新着記事
-
2024年04月30日
今週のレポート・コラムまとめ【4/23-4/26発行分】 -
2024年04月26日
ドイツの産業空洞化リスク-グローバル化逆回転はドイツへの逆風、日本への追い風か?- -
2024年04月26日
米GDP(24年1-3月期)-前期比年率+1.6%と前期から低下、市場予想の+2.5%も大幅に下回る -
2024年04月26日
滞留するふるさと納税 -
2024年04月26日
EUのDMA関連調査開始決定-GAFAそれぞれの問題を指摘
レポート紹介
-
研究領域
-
経済
-
金融・為替
-
資産運用・資産形成
-
年金
-
社会保障制度
-
保険
-
不動産
-
経営・ビジネス
-
暮らし
-
ジェロントロジー(高齢社会総合研究)
-
医療・介護・健康・ヘルスケア
-
政策提言
-
-
注目テーマ・キーワード
-
統計・指標・重要イベント
-
媒体
- アクセスランキング
お知らせ
-
2024年04月02日
News Release
-
2024年02月19日
News Release
-
2023年07月03日
News Release
【統計分析を理解しよう-よく使われている統計分析方法の概要-】【シンクタンク】ニッセイ基礎研究所は、保険・年金・社会保障、経済・金融・不動産、暮らし・高齢社会、経営・ビジネスなどの各専門領域の研究員を抱え、様々な情報提供を行っています。
統計分析を理解しよう-よく使われている統計分析方法の概要-のレポート Topへ