乖離度が標準正規分布に従うものと想定すると、-1から1の間に入る確率は、約68.3%となる。逆に、乖離度が1を超える確率は、約15.9%となる。乖離度が2を超えるのは珍しいことで、その確率は、約2.3%。乖離度が3を超えるのは大変珍しいことで、約0.1%の確率となる。このようにして、気候に関する極端さの度合いを定量化していく。この乖離度を、7つの項目それぞれで計算する。
4|元データとして気象庁の気象データと潮位データを使用する
指数作成の元データは、高温、低温、降水、乾燥、風、湿度については過去の気象データ、海面水位については歴史的潮位資料と近年の潮位資料の潮位データとする。いずれも気象庁のホームページからダウンロードして取得したデータとする。
気象データは、日単位のものとし、各観測地点の「日最高気温 (℃)」、「日最低気温(℃)」、「降水量の日合計 (mm)」、「日平均風速 (m/s)」、「日平均相対湿度 (%)」のデータである。乾燥指数のために、降水に関しては、降水現象の有無に関する「現象なし情報」も用いる。
一方、潮位データは、月単位のものとし、各観測地点の「月平均潮位 (cm)」を用いる。
5|7つの項目について、指数を作成する
以下の(1)~(7)では、ポイントを絞って、項目別に作成方法を概観していく。いずれも、参照期間を基準として、それと比較した"極端さ"の度合いを示すものとして乖離度を用いる、という方針が貫かれている。
(1) 高温 : 上側10%に入る日の割合から算出
高温は、参照期間中の気温分布に照らした場合に、月のうち、上側10%の中に入る日が、何日を占めるかという割合をとる。例えば、ある年の4月5日については、1971年から2000年までの4月5日とその前後5日間(3月31日、4月1~4日および6~10日)の、合計330日分のデータのうち、33番目に高いデータが閾値(しきいち)となる。この閾値以上の日が何日あったか、をみることとなる。
気温は、1日のうちにも変動するため、日最高気温と日最低気温のそれぞれについて、その割合をとる。この割合から、参照期間の平均を差し引き、その結果を参照期間の標準偏差で割り算して、それぞれの乖離度が計算される。そして、その和半をとって、高温の指数とする。
(2) 低温 : 下側10%に入る日の割合から算出
低温は、高温と同様に、参照期間中の気温分布に照らした場合に、月のうち、下側10%の中に入る日が、何日を占めるかという割合をとる。日最高気温と日最低気温のそれぞれについて、その割合をとる。この割合から、参照期間の平均を差し引き、その結果を参照期間の標準偏差で割り算して、それぞれの乖離度が計算される。そして、その和半をとって、低温の指数とする。
(3) 降水 : 5日間の降水量の最大値から算出
降水は、月のうち、連続する5日間の降水量をみる。高温と同様に、参照期間中の降水量の上側10%の中に入る日が、その月にどれだけあるかという割合でみていく。この割合から、参照期間の平均を差し引き、その結果を参照期間の標準偏差で割り算して、降水の指数とする。
(4) 乾燥 : 乾燥日が連続する日数から算出
乾燥の指数は、連続乾燥日から算出する。すなわち、乾燥日が何日続くかという、最大連続日数についてデータをとる。その際、乾燥日をどのように判定するかが検討ポイントとなる。降水量が0ミリメートルでも、わずかながら降水が見られる場合と、まったく降水が見られない場合があるためだ。
これについては、気象データにおいて観測単位(降水量0.5ミリメートル)未満で、降水の現象の有無の観測をした結果として表示されている「現象なし情報」を用いて判定する
10。
参照期間中の同月の乾燥日の最大連続日数をもとに、その月の参照期間からの乖離度が計算される。これを、乾燥の指数とする。
10 現象なし情報は、降水の現象があった日は0、なかった日は1の値で表示されている。