統計学の6つの分野
p値や信頼区間、回帰モデルといったここまでの内容が理解できれば。おそらく統計学という強力な学問の「幹」は手に入れたことになるだろう。
しかしながら、統計学が面白いのはその「幹」だけではない。「枝葉」というとあまり聞こえがよくないが、広範な学問分野で応用されるために枝分かれした先にある「ディティール」を知れば、現代における統計学を使った研究のフロンティアをよく理解することができる。また学問的背景の異なる統計家同士の論争を俯瞰して見られるようにもなるだろう。
統計学は数学的な理論に基いて組立てられているものの、その数理的性質を現実に適用したときには必ずいくつかの仮定や、仮定の扱いに関する現実的な判断が必要になる。またそうした現実的な判断は、分野ごとの哲学、目的、伝統や、扱おうとしているデータの性質によって左右されるのである。たとえば回帰モデルを用いる際には複数の説明変数の影響は独立しているという仮定をおいている、というのは数学的な事実だ。一方、その仮定をどう取り扱うか、という考え方は数学的な理論ではなく分野ごとの視座によって異なるのだ。
だが実のところ、統計学を自分の研究や業務で用いている専門家も、あるいは統計学的な手法自体を研究している統計学者も、こうした分野間での考え方の違いに気づいている人は少ないように思う。統計学自体は広範な分野に応用できるものであるが、現代における学問の専門性は細分化が進んでおり、1つの分野の専門家が他の専門分野の視座を理解することは難しくなっているのかもしれない。
そのせいで異なる分野の専門家間で解析方法の取扱いについてモメることもあれば、よその分野で大昔から用いられている手法が別の名前で再発明されることもある。
今回から数回の内容は、みなさんが今後統計学に触れる際、そうしたつまらないことで混乱しないようにするためのものである。たとえば以下に挙げる6つの特徴的な分野における考え方を学べば、今この世に流通しているほとんどの統計学に関する言説について「どのような立場から述べたものであるか」が理解できるのではないだろうか。
①実態把握を行なう社会調査法
②原因究明のための疫学・生物統計学
③モデリングに関心をよせる計量経済学
④抽象的なものを測定する心理統計学
⑤機械的分類のためのデータマイニング
⑥自然言語処理のためのテキストマイニング
今日はまず、これまでにも何度となく触れてきた①と②の考え方についておさらいすることにしよう。
cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。