【第4回】
ITと統計学のすばらしき結婚
—「これからの10年で最もセクシーな職業」の誕生

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

なぜ今、統計学が花開いたのか

 なぜ今、このように統計学がさまざまな分野で重要視されるようになったのだろうか。

 データ間の関連性から因果関係を推論するという現代統計学の基本的な考え方は今世紀の前半にはほぼ確立していたし、主要な統計解析手法は1960年代頃にはほぼ出揃っていた。現代統計学の父と呼ばれるロナルド・A・フィッシャーが亡くなって2012年でちょうど50年にもなる。

 これだけ統計学がパワフルなものであるのならば、もっと前から社会の至るところで使われているべきじゃないか? という疑問ももっともだ。その答えは統計学自体ではなく、統計学を活用するための環境の変化にある。
 そうした変化について理解するために、第2回で述べたフラミンガムという田舎町の住民を巻き込んだ大規模な疫学研究のことをもう少し詳しく紹介しよう。

 この疫学研究は一般的にフラミンガム研究と呼ばれ、戦後間もない1948年に、当時増え続けていた心臓病の原因を明らかにするために立ち上げられた。コッホらの研究はコレラ菌を含むさまざまな病気の原因となる細菌を特定し、ワクチンや抗生物質といった対処方法の発見にも繋がった。だが、細菌による感染症で亡くなる人が少なくなると、今度は相対的に細菌と無関係な病気である心臓病やがん、脳卒中といった病気がアメリカをはじめとする先進国での死因の多くをしめるようになり、医学上の大きな課題となったのである。

 そうした背景もあって、ニューディール政策で有名なフランクリン・ルーズベルト大統領の肝入り(余談だがルーズベルト自身も心臓病で亡くなっている)で、この人類初とも言える大規模な疫学研究プロジェクトは立ち上げられた。心臓病だろうがコレラだろうが、原因不明なのであればその原因を明らかにするために行なうべきことは慎重かつ大規模なデータの収集であり、その適切な統計解析以外にはあり得ないのである。

 フラミンガムには当時2万8千人ほどの住民が住んでおり、29~69歳の住民のうち約3分の2にあたる5127名が研究チームの呼びかけに応えて研究へ参加した。当時は心臓病の原因について確かなことはほとんど何もわかっていなかったため、性別や年齢といった基本的な情報のほか、これまでにかかったことのある病気や生活習慣、血圧、心電図、血液成分の検査値、社会経済学的指標(学歴など)といった考えうる限りの多様な項目が調べられた。また採取された血液は、後に検査方法が進歩したり検査項目が追加されたりする場合に備えて凍結保存された。

 フラミンガム研究は現在も継続しているが、その後も他の研究で新しいことがわかるたびに調査項目が追加され、今では最初の研究参加者の子どもや孫に対しても遺伝子検査を含む調査がなされている。

フラミンガム研究の調査が2年に1回だったわけ

 このように、5千余名を対象に検査と聞き取り調査を行なうというフラミンガム研究であったが、研究スタート時はその調査間隔が2年に1回だった。

 これだけ大規模に徹底した調査を行なうのであれば、毎年調べればよいではないかと思うだろうし、実際に当時の研究者もそうしたいのは山々だったろう。だが、当時の技術的な限界として、2年に1回という調査のペースがギリギリのところだったのだ。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード