1|分析結果を見る上での留意点
あるデータ(A)とあるデータ(B)の互いの関係性の強さを測る分析方法に、相関分析がある。
一口に相関分析といっても、あるデータとあるデータの関係性の強さを見る場合、
1)ある調査年に発生したデータに絞って、その時点で、その中に所属するグループのもつ2つの項目間の関係性の有無を考えるケース、ならびに、
2)1つのデータの時系列変化ともう1つのデータの時系列変化の関係性を見る、という方法がある。
1)は例えば、あるクラスの生徒の卒業時点の身長と体重の関係性をみる・あるイベントでの参加者の視力とイベントで行われた間違い探しゲームの正解率の関係性を見る、などである。
2)は、ある町の人口の30年間の推移と課税所得の30年間の推移をみて、人口規模と課税所得の変化度合いの間に関係があるかをみる、
といったものである。
本分析の1章においては、1)を行っている。東京都の62自治体のそれぞれの最新の出生率推計値とその他の最新データとの間にどのような関係性があるのか、という「現時点での関係性の強さ分析」をみていることに留意されたい
1。
ある時点における62自治体のそれぞれの推計出生率と、同じくある時点(出来うる限り最新値)の東京都62自治体の62個の(一部の項目は51個の)単年度データとの関係を分析する。
この62という自治体のカウントは、総務省統計局が「市区町村データ」として公開している行政区分に基づいている
2。
1章での分析をもう少し具体的に例示すると、62自治体のそれぞれの出生率(A)と待機児童率(B)の2つのデータ(62データ×2項目)を入手することが出来たとしよう。
この2つの入手可能な最新年のデータの間に、
1.関係があるといえるのか
2.あるといえるとしたら、どのような強さで関係があるのか
3.結局、待機児童率は出生率との間にプラスマイナス、どちらの関係性をもつのか
(両者の因果関係は相関分析だけでは示せないことに留意)
を明らかにしている。
上記の(B)の待機児童率のみならず、東京都62自治体のそれぞれの(A)合計特殊出生率(ベイズ推定値)
3とその他の入手可能な公的な大規模データの間の相関分析をそれぞれについて試み、そもそも東京都の最新出生率に対して、ある項目の最新データが
1.関係があるのか 2.あるとしたらどのような強さで関係があるのか
3.結局そのデータは出生率上昇にプラスの関係なのかマイナスの関係なのか
を以下に検証した。なお、出生率への影響を知るための市区町村データは全て、総務省統計局の市区町村オープンデータ(最新データ)、2015年国勢調査市区町村オープンデータ、東京都の総務局のオープンデータ最新データ)から抽出した。
相関分析は2つのデータ間の関係性の強さは示すものの「因果関係」を説明するものではないことだけは、以下の分析結果を見る際に十分留意しつつ、どのような結果が現れたかを示していくこととする。
1 出生率といった人や社会の意識のあり方が背景にある可能性が高いデータを説明する場合、長期時系列変化同士の相関は不適切な結果となることも少なくない。
実際、最新時点の単年度分析では「女性労働力率と出生率には関係がないか正の関係である」との今の社会背景を適切に示した結果が出るが、長期的には「女性労働力率が上がると出生率が下がる」という負の関係性がでてくる。簡単に言うならば、過去の社会状況を多く含むデータの説明で「現在の社会状況」は説明できない、ということである。
2 【 62自治体一覧 】
千代田区 中央区 港区 新宿区 文京区 台東区 墨田区 江東区 品川区 目黒区 大田区 世田谷区 渋谷区 中野区 杉並区 豊島区 北区 荒川区 板橋区 練馬区 足立区 葛飾区 江戸川区 八王子市 立川市 武蔵野市 三鷹市 青梅市 府中市 昭島市 調布市 町田市 小金井市 小平市 日野市 東村山市 国分寺市 国立市 福生市 狛江市 東大和市 清瀬市 東久留米市 武蔵村山市 多摩市 稲城市 羽村市 あきる野市 西東京市 瑞穂町 日の出町 檜原村 奥多摩町 大島町 利島村 新島村 神津島村 三宅村 御蔵島村 八丈町 青ヶ島村 小笠原村
3 厚生労働省「平成20年~平成24年人口動態保健所・市町村別統計」
エリア区分が小さくなると単年の出生率の変動が大きくなる。そのため、平均的なエリアの出生率を推定するための統計指標として、まとまった一定期間の出生率から確率統計的に算出される数値がベイズ推定値である。