【第20回】
「平凡への回帰」を分析する回帰分析
—優生学の祖・ゴルトンの貢献

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

回帰分析とは何か

 ランダム化比較実験が許されない状況であれば観察データのみを用いて疫学的な手法による推計を行なう。前回そのための方法の1つとして、ケースコントロール研究におけるマッチングというやり方を紹介したが、「フェアな比較」をするための手法はこれだけではない。より高度な手法を用いればわざわざデータの取り方を工夫しなくても、可能な限り条件を揃えた「フェアな比較」が可能になるのである。

 そのための最も重要な枠組みの1つが回帰分析だ。
 大学の統計学の教科書を読めば「t検定」だとか「カイ二乗検定」だとか「分散分析」だとか「回帰分析」だとかいう手法が必ず登場する。しかしながらこれらの統計手法はすべて、大きく言えば「一般化線形モデル」という広義の回帰分析の考え方で統一的に理解できることが1972年にネルダーとウェダーバーンという2人の統計学者によって示されている。データ間の関連性を示し、それが誤差と呼べる範囲なのかどうかを検定する手法はすべて、大きな枠組で言えば回帰分析の一種であると考えられるのだ。

 だが、こうした回帰分析というものはなぜ必要なのだろうか。データを用いなくても我々は経験から傾向性や法則性を学びとることができる。それを「ジンクス」や「理論」や「成功の方程式」などと呼んでいる人もいるだろう。

 じつは回帰分析がなぜ必要か、という質問に対する答えは、そもそもこの手法につけられた「回帰」とはどういう意味かということが関わってくる。そこで今日はこの「回帰」という現象が発見された歴史について説明しよう。

背の低い野村君の恋愛

 私が世界で最初の回帰分析の話を聞いた時に思い出したのは、中高時代の友人である野村くんのことだった。

 彼は当時、自分より背の低い女子としか付き合おうとしなかった。彼自身かなり小柄なので、相手の女子も必然的に限られてくる。当時一緒に遊んでいた友達の中には小林さんという170cm近い身長の女子もいたが、彼女のような女性は完璧に恋愛対象外である。

 私は当時学校でチャールズ・ダーウィンの進化論を教わったこともあって、野村くんのような男のせいで人類は2種類に別れてしまうのではないかと危惧した。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード