左辺の「死亡率」と、右辺の「変数」には、2009-10, 12-19年(10年分)の1月~12月の実績データを入力する。そして、重回帰分析を通じて、「係数」の値を求めていく。
また、ダミー変数については、地域区分(Da1~Da10)と月(Dm1~Dm11)の2種類のものを用いる。
このうち、Da1~Da10については、北海道はDa1のみ1。東北はDa2のみ1。関東甲信はDa3のみ1。北陸はDa4のみ1。東海はDa5のみ1。近畿はDa6のみ1。中国はDa7のみ1。四国はDa8のみ1。九州北部はDa9のみ1。九州南部・奄美はDa10のみ1。それ以外はすべて0とする。
また、Dm1~Dm11については、1月はDm1のみ1。2月はDm2のみ1。3月はDm3のみ1。4月はDm4のみ1。5月はDm5のみ1。6月はDm6のみ1。7月はDm7のみ1。8月はDm8のみ1。10月はDm10のみ1。11月はDm11のみ1。それ以外はすべて0とする。(Dm9およびdm9は無し。)
その結果、具体例を挙げると、回帰式の4行目は以下のようになる。
(例)
近畿の6月 → 暑熱期の回帰式において、 I + da6 + dm6
四国の9月 → 〃 I + da8
沖縄の9月 → 〃 I
北海道の3月 → それ以外の時期の回帰式において、I + da1 + dm3
関東甲信の12月 → 〃 I + da3
沖縄の12月 → 〃 I
つまり、2つの回帰式において、定数と、地域区分ダミー、月ダミーにより、気候指数以外の、地域区分や月の違いにともなう死亡率の違いを表すこととなる。
第1節に述べたとおり、回帰式は、全部で504本(=2×21×6×2)作成することとなる。
回帰式には、2009-10, 12-19年(10年分)の1月~12月の実績データを入力する。地域区分は11区分ある。このため、暑熱期の回帰式には10×11×5の550個のデータ、それ以外の時期の回帰式には、10×11×7の770個のデータがあることとなる。
7
まとめると、これらのデータをもとに、504本の回帰式の係数を導出していく。それを通じ死亡率と気候指数の関係性を明らかにしていく。これが、本稿での回帰分析の内容となる。
6 回帰計算にあたり、統計ソフトとして、IBM SPSS Statistics バージョン29.0.1.0 を使用する。
7 ただし、一部の月では、データが欠落している場合がありうる。さらに、若齢では、異常無(老衰等)の死因で、死亡率がゼロとなり、ロジット変換できない場合もありうる。こうしたデータがないものや、ロジット変換できないものが出現した場合は、それを除外して回帰分析の作業を進めることとする。