病気の発生動向を研究する学問分野として、疫学がある。ある集団をもとに、病気の発生動向を観測する。そして、得られたデータを統計処理する。その結果、「○○の健康状態の人は、◇◇の病気にかかりやすい」といったことを明らかにする。
昨今のデータサイエンスの隆盛を背景に、疫学の分野では、さまざまな統計解析が進められている。そして、そこで得られた結果をもとに、有効な健康増進策を推進しようという動きも出てきている。
ただし、疫学の統計解析には、一筋縄ではいかない点があるので注意が必要だ。たとえば、病気の合併症について、つぎのような分析をしたとする。
[病気の合併症に関する分析]
(1) 病気Aと病気Cの合併症と、病気Bと病気Cの合併症では、一体どちらが起こりやすいのか?
ある病院の診療記録をもとに、割り出すことにしたい。
(2) 病気Aにかかっていた人は620人。そのうち80人は病気Cにもかかっていた。
したがって、AとCの合併率は、13% (=80人÷620人)。
一方、病気Bにかかっていた人は240人。そのうち60人は病気Cにもかかっていた。
したがって、BとCの合併率は、25% (=60人÷240人)。
(3) 2つの合併率を比べると、病気Bと病気Cのほうが、病気Aと病気Cよりも高い。
そこで、「病気Bと病気Cの合併症のほうが起こりやすい」と結論づけた。
一見すると、この分析には、特段、問題がないようにみえるかもしれない。しかし、実は、大きな問題が潜んでいる。読者のみなさんは、お気付きだろうか?
「ある病院の診療記録」をもとに、合併率を計算していることが問題なのだ。
どんな病気でも、患者がすべて病院に来て診療を受けるわけではない。身体の調子が多少悪くても、しばらく様子をみる人や、市販薬を使って自分で治そう(いわゆるセルフメディケーション)という人がいる。特に、急激な痛みなどを伴わない慢性の病気で、病状が徐々に進行していくような場合には、そうした傾向が強くなるだろう。
つまり、病気にかかってはいるが、病院で受療していない「潜在患者」について、考えてみる必要がある。
先ほどの例で、「病気Aにかかった患者の6割、病気Bにかかった患者の2割、病気Cにかかった患者の5割が、かかってすぐに病院で受療した」としてみよう。なお、最初から合併症として受療するケースは考慮しないことにする。
このような場合、潜在患者も含めて患者全体でみると、合併率はどうなるだろうか。
まず、病気Aの患者からみてみよう。Aにはかかっているが、Cとの合併症ではない患者は、540人(=620人-80人)受療していた。これは、患者全体の6割で、背後には、まだ4割の潜在患者がいる。つまりAにはかかっているが、Cとの合併症ではない患者は、潜在患者を含めると、900人(=540人÷0.6)いることになる。
AとCの合併症の患者はどうか。潜在患者を含めると、全部でX人いるとしよう。そのうちの6割が病気Aで受療し、残りの5割が病気Cで受療する。これを方程式で表すと、
X×0.6 + (X-X×0.6)×0.5 = 80人
となる。この方程式を解くと、X=100人となる。
つぎに、病気Bの患者をみてみよう。Bにはかかっているが、Cとの合併症ではない患者は、180人(=240人-60人) 受療していた。これは、患者全体の2割に過ぎず、背後には、さらに8割の潜在患者がいる。つまりBにはかかっているが、Cとの合併症ではない患者は、潜在患者を含めると、900人(=180人÷0.2)いることになる。
BとCの合併症の患者はどうか。潜在患者を含めると、全部でY人いるとしよう。そのうちの2割が病気Bで受療し、残りの5割が病気Cで受療する。これを方程式で表すと、
Y×0.2 + (Y-Y×0.2)×0.5 = 60人
となる。この方程式を解くと、Y=100人となる。
まとめると、病気AもBも、それぞれ1000人の患者がいて、病気Cとの合併症の患者が100人ずついる、ということになる。合併率はどちらも10%で、合併症のかかりやすさは同じという結果だ。