本章では、2023年度に手掛けた気候指数と死亡率の関係の定式化について、概要を振り返る。
22
22 第2章の内容は、2ページの注記3、4に示したレポートの概要となっている。
1|気候指数の活用-気候変動が人の生命や健康に与える影響を定量的に把握
気候指数の用途として、さまざまなものが考えられる。例えば、中長期的な地球温暖化の進展や、気候変動に伴う生物多様性への影響を見極める際に、気候指数を活用することが考えられる。
気候指数を通じて、気候変動が人の生命や健康に与える影響を定量的に予測することも考えられる。気温上昇により、高温指数が上昇した時に、死亡率はどれだけ高くなるのか、健康はどれだけ損なわれるのか、といった点の解明である。
そこで、これまでに気候変動と死亡率の関係を回帰分析の統計手法を用いて把握することを試みた。
関係式は、まず死亡数と人口のデータをもとに死亡率(目的変数)を求め、気候指数(説明変数)を用いて、それを回帰計算する手法で導出した。具体的には、性別、年齢群団、死因別に回帰式を立式して、各説明変数の係数を算出した。その際、ロジットを用いた分析
23、気温関連の気候指数(高温、低温)の2乗項の設定、時間項の導入、ダミー変数を通じた月や地域区分ごとの差の反映など、いくつかの技術的な工夫を行った。
23 今回の回帰計算は、リンク関数としてロジットを指定した、一般化線形モデル(GLM)の一種とも考えられる。
2|7つの気候指数すべてを回帰計算に使用
回帰式の設定において、どの気候指数を説明変数に用いるかという点について、検討を行った。回帰式に採用する気候指数を限定することも検討したが、その場合、いくつかの影響がこぼれ落ちてしまうことが懸念された。例えば、低温指数を排除すると、低温が循環器系疾患による死亡に与える影響は表現できなくなる。また、降水指数を不採用とすると、降水が自殺を含めた精神疾患に及ぼす影響も加味されなくなる、等である
24。そこで、関係の解明の有無によらず、7つの気候指数すべてを回帰計算に使用することとした。
気候指数は、グラフでの表示に用いる5年移動平均のものではなく、月ごとの指数をそのまま用いている。なお、極端な気象現象が死亡率に影響を及ぼすまでの"タイムラグ"は生じないものと想定した。
24 さらに、死亡率との関係が十分に解明されていない気候指数について不採用となる可能性もある。現在、疫学や生気象学の諸研究において、そうした関係の解明に向けた努力が進められているなかにあって、既に解明された関係だけに着目して気候指数の採否を決定することは、主観的で妥当性を欠く取扱いとなる恐れがある。
3|大震災やコロナ禍の年のデータは回帰計算に使用しない
死亡数のデータは「人口動態統計」(厚生労働省)、人口のデータは「国勢調査」と「人口推計」(いずれも総務省)を用いている。死亡数と人口は、毎年、データが公表されている。直近では、2023年の死亡数(確定値)の実績が公表されている。2022年、2023年の死亡数は約156.9万人、157.1万人となっており、コロナ禍の影響により高い水準が続いている。このようにコロナ禍や大震災等の気候変動以外の影響が明らかな1995、2011、2020-23年のデータは、回帰計算の学習データには使用しないこととした。
4|直近10年分のデータを学習データとして、回帰式を作成
学習データとして何年分のデータを用いるべきか、試算を通じて検討を行った結果、学習データを10年分とするケースの説明力が高いことが判明した。
25
この結果から、直近10年分の有効なデータ(大震災やコロナ禍の影響を含まないデータ)を用いることとした。
25 検討の内容については、2ページの注記4のレポートをご参照いただきたい。
5|回帰式は、性別、年齢群団、死因、暑熱期とそれ以外の時期別に504本作成
死亡率の分子の死亡数のデータは、性別、年齢群団、死因、地域区分、月別のデータとなるよう、適宜、按分処理等のデータ補整を行う。なお、傷病ごとの死因分類の詳細については、付録図表の「死因の分類について」をご参照いただきたい。
死亡率と高温指数の関係を考えた場合、夏季と冬季とでは、同じ指数1の変化でも死亡率に与える影響は異なることが考えられる。そこで、この違いを考慮して、暑熱期(5-9月)と、それ以外の時期(10-4月)とで、回帰式を分けることとした。
この結果、回帰式は、性別(2つ)、年齢群団(21個)、死因(6つ)、暑熱期とそれ以外の時期(2つ)ごとに設定し、全部で504本作成する形となった。
6|回帰式にはロジット変換や対数変換を組み入れる
死亡率はロジット変換、気候指数は対数変換を施したうえで、回帰計算を行う。
ロジット変換は、0~1の範囲で値をとる確率を、実数全体に引き延ばす。一方、逆変換は、実数全体を値域として得られた回帰計算の結果を、0~1の範囲で値をとる確率に変換する。一般に、ロジット変換では、確率が0.5近辺の場合、精度が下がるとされる。今回は、死亡率を回帰するもので、その値は、通常、0.5よりもはるかに小さいことから、変換による精度の低下は限定的と考えられる。
気候指数は負値の場合もありうる。その場合は、そのまま自然対数をとることはできない。そこで、ある定数Cをすべての気候指数に足し算して負値を解消したうえで、自然対数をとることとする。
26 具体的には、過去の気候指数の推移を踏まえて、安全な水準として、C=10と置くこととした。
26 1971年1月~2022年12月の月ごとの気候指数を見ていったところ、最小値は、1977年5月に北陸で記録された海面水位指数 -3.142。最大値は、2012年9月に北海道で記録された高温指数5.709であった。負値の解消ということであれば、Cを3.142を上回る定数として設定すればよいこととなる。ただし、今後の変動が過去の変動範囲におさまる保証はない。
7|ダミー変数は、地域区分と月について組み込む
ダミー変数については、地域区分と月の2種類のものを用いることとする。
地域区分については、11の区分であるため、10個のダミー変数を用いることとなる。一方、月については、暑熱期は4個。それ以外の時期は6個のダミー変数を用いる形となる。
8|高温と低温の指数については、2乗の項も用いる
高温と低温の指数については、線形回帰
27をやめて、2乗の項も導入する。この取り扱いは、温暖化の健康影響に関する先行研究を踏まえたものである。2014年に公表された環境省の研究費用を用いた研究の報告書
28に掲載されている「温暖化の健康影響 -評価法の精緻化と対応策の構築-」という報告では、「至適気温」と、それを踏まえた回帰式の立式について、次の説明がなされている。
「厚労省から死亡小票データ、気象庁から気象データを入手して、日別の最高気温と死亡数の関連を観察すると(中略)V字型になる。暑くても寒くても死亡数は増加するので、中間付近に死亡数が最も少ない気温(=至適気温)があり、この気温を超えた、ある気温での死亡数から至適気温での死亡数を引いた部分を超過死亡と定義した。(以下略)」
27 説明変数と被説明変数の関係を1次関数で当てはめること。
28 「地球温暖化『日本への影響』-新たなシナリオに基づく総合的影響予測と適応策-」(環境省環境研究総合推進費 戦略研究開発領域 S-8 温暖化影響評価・適応政策に関する総合的研究 2014報告書, S-8 温暖化影響・適応研究プロジェクトチーム)