「データの取り方」が大切というお話
前回も述べたように、断面的なデータだけを解析しても「因果関係の向き」について明らかにすることはできない。
暴力的なゲームのプレー時間と犯罪率についての例をあげたが、2つの項目が統計学的に強い関連性を示していたとしても、前者が後者の原因なのか、あるいは逆に後者が前者の原因なのか、さらにそこで測定されていなかった第三の(たとえば家庭環境の悪さであるとか本人の暴力性であるといった)要因がその両者に影響を与えているのか、といったことは、単純なクロス集計とp値だけではわからないのである。
だがこれは、あくまで断面的なデータからでは、あるいは、それに対するシンプルな統計解析だけではわからない、という話である。データの取り方自体を工夫すれば、あるいはより高度な解析手法を用いれば、完璧にとは言わないまでも何が原因で何が結果なのか、そしてその「原因」を制御することによって、どれだけ「結果」を左右することができるのかをかなりの部分明らかにすることができる。
そこで今回からしばらくは、特にこの「データの取り方を工夫する」というやり方にフォーカスしていこうと思う。具体的には、近年ウェブ界隈で「A/Bテスト」と呼ばれ、統計家が長年「ランダム化比較実験」とか「ランダム化比較試験」と呼ぶものがどれだけ強力か、という話が本連載のこれから数回の中心的なテーマとなるだろう。
「科学」の対象を拡大したランダム化比較実験
こうしたランダム化比較実験がどれだけ強力か、今回説明するその最も大きな理由は、「倫理的に許す限り、人間の制御しうる何物についても、その因果関係を分析できるから」である。
そう、仮に「超能力が存在するか」を証明しろと言われれば、統計家は喜んでその実証に力を貸すことだろう。仮に統計学で超能力を科学的に実証できないとすれば、その理由はたった1つだけだ。実用レベルの超能力がこの世に存在しないから、である。
占い師や超能力者と称するオカルト関係の仕事を生業とする人、あるいはそうしたものを信じる(そして場合によってはカモられる)人たちは、しばしば「この世には現代科学では割り切れないものだってある」という謎の主張をする。
とんでもない! フィッシャーがほとんど独力で作り上げたこのランダム化比較実験という方法論は、科学哲学を揺り動かし、科学で扱える対象の領域を爆発的に拡大させた。倫理性や制御可能性などの現実的な制約はあるにせよ、「科学で扱い得ないもの」なんて存在しないのだ。
たとえばフィッシャーが1935年に著した『実験計画法』という世界で初めてランダム化比較実験を体系立てた名著には、ミルクティにうるさい婦人の話が登場する。
1920年代末のイギリスにて、陽射しの強いある夏の午後。何人かの英国紳士と婦人たちが屋外のテーブルで紅茶を楽しんでいたときのことだった。その場にいたある婦人はミルクティについて「紅茶を先に入れたミルクティ」か「ミルクを先に入れたミルクティ」か、味が全然違うからすぐにわかると言ったらしい。この一見どうでもよさそうな婦人の主張ですら、科学的に実証できるというのがランダム化比較実験の力なのである。
その場にいた科学の教育を受けた紳士たちのほとんどは、婦人の主張を笑い飛ばした。彼らが学んだ科学的知識に基づけば、紅茶とミルクが一度よく混ざってしまえばそこに何ら化学的性質の違いなどない。
だが、その場にいた1人の小柄で、分厚い眼鏡をかけ髭を生やした男だけが、婦人の説明を面白がって「その命題をテストしてみようじゃないか」と提案したそうだ。この男こそが、現代統計学の父、ロナルド・A・フィッシャーである。