左辺の「死亡率」と、右辺の「変数」に、1971年1月~2021年12月の実績データを入力する。そして、重回帰分析を通じて、「係数」の値を求めていく。
ここで、3行目の時間項については、1970年からの経過年数(整数値)をTIMEという変数で持たせて、死亡率の説明要素として用いる。通常、死亡率は医療技術の進歩等、気候の要因とは別の、時間に応じた改善トレンドを有していることから、それを表現するために、この項を設定することとした。
また、ダミー変数については、地域区分(Da1~Da10)と月(Dm1~Dm11)の2種類のものを用いる。
このうち、Da1~Da10については、北海道はDa1のみ1。東北はDa2のみ1。関東甲信はDa3のみ1。北陸はDa4のみ1。東海はDa5のみ1。近畿はDa6のみ1。中国はDa7のみ1。四国はDa8のみ1。九州北部はDa9のみ1。九州南部・奄美はDa10のみ1。それ以外はすべて0とする。
また、Dm1~Dm11については、1月はDm1のみ1。2月はDm2のみ1。3月はDm3のみ1。4月はDm4のみ1。5月はDm5のみ1。6月はDm6のみ1。7月はDm7のみ1。8月はDm8のみ1。9月はDm9のみ1。10月はDm10のみ1。11月はDm11のみ1。それ以外はすべて0とする。
その結果、具体例を挙げると、回帰式の4行目は以下のようになる。
(例)
北海道の3月 → I + da1 + dm3
関東甲信の12月 → I + da3
沖縄の6月 → I + dm6
沖縄の12月 → I
つまり、定数と、地域区分ダミー、月ダミーにより、気候指数以外の、地域区分や月の違いにともなう死亡率の違いを表すこととなる。
回帰式は、性別(2個)、年齢区分(21個)、死因(6個)ごとに設ける。すなわち全部で、2×21×6の、252個の回帰式を設けることとなる。
また、回帰式ごとに、過去に蓄積されたデータとして、1971~2021年(51年)、地域区分(11区分)、月(12ヵ月)がある。つまり全部で、51×11×12の6732個のデータがある。ただし、沖縄については、本土復帰前の1971年や1972年のデータは一部欠落しているため、1973年以降のデータを用いることとする。その結果、6708個のデータを回帰式に入力することとなる
14。
まとめると、これら6708個のデータをもとに、252個の回帰式の係数を求めていく。それを通じて、死亡率と気候指数の関係性を明らかにしていく。これが、今回の回帰分析の内容となる。
13 回帰計算にあたり、統計ソフトとして、IBM SPSS Statistics バージョン29.0.1.0 を使用する。
14 また、一部の月では、北陸の海面水位指数のデータも欠落している。さらに、若齢では、異常無(老衰等)の死因で、死亡率がゼロとなり、ロジット変換できない場合もある。こうしたデータがないものや、ロジット変換できないものについては除外して、回帰分析の作業を進めることとする。