【第19回】
ランダム化ができなかったらどうするか?
—疫学の進歩が証明したたばこのリスク

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

 前回までの内容を読んでいただければランダム化比較実験の強力さと、その力を享受できない状況についてわかっていただけたと思う。

 適切なランダム化さえできれば、我々はこの世のありとあらゆる因果関係を科学的に検証し、利用することができる。だが、ランダム化による制御自体が不可能な場合、仮に可能であったとしても倫理的に許されない場合、そして理論上は倫理的な問題とならない場合であっても、関係者からの感情的な反発が予想される場合にはランダム化に基づく統計学の利用があまり適さない。

 だが、いくらランダム化比較実験が強力な手法だとはいえ、ランダム化ができない場面において統計学が役立たずになるなんてことはもちろんない。

 第15回に「科学は観察と実験からなる」という言葉を紹介したが、ランダム化に基づいて条件をコントロールする実験だけでなく、ただ何も手を加えずに調査を行なう観察においても統計学は大きな力を発揮するのだ。

 今回からしばらくは、こうしたランダム化が適さない状況において、どのような統計手法を用いれば因果関係の推定が行なえるのか、ということについて説明したい。

たばこの箱を見てみよう

 ランダム化比較実験が倫理的に許されない状況として、喫煙とがんの因果関係の例をすでに挙げた。すでにさまざまなエビデンスが喫煙によるがんのリスクを示しているため、わざわざ「悪いとわかっていること」を人為的に研究参加者たちに行なうのは倫理的に許されないというのがその理由だ。

 ちなみにもしあなたの周りにたばこの箱があったら「疫学的な推計によると、喫煙者は肺がんにより死亡する危険性が非喫煙者に比べて約2倍から4倍高くなります」といった警告表示をすぐに見つけることができるはずである。この「疫学的な推計」、つまり統計学を用いた観察研究の中身がどのようなものであるかは、これから数回の連載を読んでいけばわかるかと思う。

 もちろん最初から喫煙ががんの原因になるということがわかっていたわけではない。
 18世紀にはすでに煤(すす)にまみれて働く煙突掃除夫たちが皮膚がん(当時はそうは呼ばれていなかったが)になりやすいということは知られていたし、1915年には日本人である山極勝三郎と市川厚一が、ウサギの耳にコールタールを塗ることで発がんさせられるということも報告していた。同じようにタールの含まれたタバコに発がん性があるのではないか? というのはがんに関心を持つ医学研究者であれば誰でも思いつくところだろう。

 そうしたアイディアの実証を試みるデータを報告した最初期の人物に、イギリスのリチャード・ドールとA・ブラッドフォード・ヒルがいる。

 第2回で紹介したスノウの疫学は、彼の死後もイギリスにおいて着実に普及し進歩を遂げた。ドールとヒルも、スノウ以後に進歩を遂げた疫学的方法論に則り、喫煙と肺がんの関係性について統計学的な分析を試みたのである。

「ケースコントロール研究」の登場

 彼らは1948年から1952年にかけて、イギリス中の病院から1465名の肺がんによる入院患者を見つけ、彼らの性別・年代・社会階層や居住地域と喫煙歴の有無を調査した。そして同時に、喫煙以外の性別・年代・社会階層や居住地域について同様の条件を満たす、肺がん以外の疾患で入院している患者を同数見つけ調査した。

 なお、喫煙以外にも肺炎にかかった経験の有無であるとか、住宅の暖房設備の種類であるとか、肺がんのリスク要因と考えられる項目についても調査されたが、最も大きな関連性が示唆されたのが喫煙だった。そうした彼らの研究成果は次の表に示す通りである。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード