【第22回】
統計学の理解が劇的に進む1枚の表
—一般化線形モデルとは

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

統計学の2種類の教科書

 前々回から前回にかけて紹介した回帰分析はそれ自体有用なツールでもあるが、そこから多くの統計学的手法を「広義の回帰分析」として統一的に理解すればさらにその応用範囲は広がるだろう。
 このような「広義の回帰分析」という考え方は、統計学者たちから「一般化線形モデル」という名で呼ばれている。線形とは回帰分析のように直線的な関係性のことを指し、「色々手法はあるけど結局回帰分析みたいなことしてるっていう点で一般化して整理できるよね?」というのが一般化線形モデルの意図するところだ。

 極端な表現をすれば、基礎統計学の教科書は大きく2つに分けられると私は考えている。一方は一般化線形モデルという視点を活かさないためにフィッシャーたちの時代に作られた手法を「別々のもの」として紹介している本、そしてもう一方は「基本的に同じ手法」として俯瞰した形で説明している本である。

 前者の書き方でしばしば起こる悲劇は以下のようなものだ。
 t検定だとか回帰分析だとか、呼び名の由来がわかるわけでも規則性があるわけでもない個別の手法をいちいち覚え、結局のところどういうときに何を使えばよいのか、という点についてはわからずじまい。何となく演習問題で解かされた手計算のやり方をテストで書けば単位はもらえたが、結局あれはいったい何だったのだろう、と社会人になってから統計学について思い返すたびに首をひねることになる—。

 これが「基本的に同じ手法」というコンセプトのもと、実用的にはたった1枚の表でどう使い分けるか、何を見ればよいのか整理できたとすればどうだろうか? 統計学の理解のために必要な手間は劇的に減少し、ずいぶん見通しがよくなると思う。
 そのたった1枚の表とは次のようなものだ。

図表1 統計学の理解が劇的に進む1枚の表

 本連載では統計学の目的として、フェアな比較に基づき違いを生む要因を見つけることを何度もあげているが、どのような分析軸で(これを説明変数と呼ぶ)どのような値を比較したいか(こちらは結果変数と呼ぶ)、ということさえ決まれば用いるべき手法は簡単に選べる。繰り返すが、この表に載せられたものはすべて同じ「一般化線形モデル」という広義の回帰分析なのである。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード