【第25回】
統計家たちの仁義なき争い (1)
—社会調査法vs.疫学・生物統計学

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

統計学の6つの分野

 p値や信頼区間、回帰モデルといったここまでの内容が理解できれば。おそらく統計学という強力な学問の「幹」は手に入れたことになるだろう。

 しかしながら、統計学が面白いのはその「幹」だけではない。「枝葉」というとあまり聞こえがよくないが、広範な学問分野で応用されるために枝分かれした先にある「ディティール」を知れば、現代における統計学を使った研究のフロンティアをよく理解することができる。また学問的背景の異なる統計家同士の論争を俯瞰して見られるようにもなるだろう。

 統計学は数学的な理論に基いて組立てられているものの、その数理的性質を現実に適用したときには必ずいくつかの仮定や、仮定の扱いに関する現実的な判断が必要になる。またそうした現実的な判断は、分野ごとの哲学、目的、伝統や、扱おうとしているデータの性質によって左右されるのである。たとえば回帰モデルを用いる際には複数の説明変数の影響は独立しているという仮定をおいている、というのは数学的な事実だ。一方、その仮定をどう取り扱うか、という考え方は数学的な理論ではなく分野ごとの視座によって異なるのだ。

 だが実のところ、統計学を自分の研究や業務で用いている専門家も、あるいは統計学的な手法自体を研究している統計学者も、こうした分野間での考え方の違いに気づいている人は少ないように思う。統計学自体は広範な分野に応用できるものであるが、現代における学問の専門性は細分化が進んでおり、1つの分野の専門家が他の専門分野の視座を理解することは難しくなっているのかもしれない。

 そのせいで異なる分野の専門家間で解析方法の取扱いについてモメることもあれば、よその分野で大昔から用いられている手法が別の名前で再発明されることもある。

 今回から数回の内容は、みなさんが今後統計学に触れる際、そうしたつまらないことで混乱しないようにするためのものである。たとえば以下に挙げる6つの特徴的な分野における考え方を学べば、今この世に流通しているほとんどの統計学に関する言説について「どのような立場から述べたものであるか」が理解できるのではないだろうか。 

①実態把握を行なう社会調査法
②原因究明のための疫学・生物統計学
③モデリングに関心をよせる計量経済学
④抽象的なものを測定する心理統計学
⑤機械的分類のためのデータマイニング
⑥自然言語処理のためのテキストマイニング

 今日はまず、これまでにも何度となく触れてきた①と②の考え方についておさらいすることにしよう。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード