統計解析では「因果関係の向き」に注意する
ここまでに書いたような「比較」および「p値の算出までを含めた解析」を行なえば、きっと意味のあるデータの偏りがすぐに見つけられるだろうし、その偏りをうまくコントロールすれば、効率的に利益をあげられそうなやり方が見えてくるだろう。
だが、こうした統計解析ができるようになった後、注意しなければいけないのは「因果関係の向き」である。
たとえば次のようなグラフによって「広告の効果」を分析したとしよう。
これを見れば、購入者のほうが広告の認知率が高いことがわかる。
素直に考えれば、広告を見た人ほど、あるいは同じように広告を見たにせよ広告を後々まで覚えている人ほど商品を購買している可能性が高いのではないかと解釈するだろう。ちなみにこのような結果のp値、すなわち「本当は何の差もないのに誤差によってこれだけの偏りが偶然生じた確率」は0.1%を下回る。
しかしながら、このデータと統計解析の結果からは、因果関係の向きとしてはその逆の説明だって成り立つのである。
すなわち、「広告を認知していたから商品を購入した」のか、「商品を購入したから広告をその後も認知していた」のか、そのどちらの仮説が正しいのかについて、このような一時点の調査データとその解析結果は、p値がいくら小さかろうがまったく情報を与えないのだ。
ゲームと少年犯罪をめぐる考察あれこれ
こうした問題はしばしば科学的調査においても顕在化する。
たとえば親に対するアンケート調査の結果、子どもが暴力的なテレビゲームで遊んでいたかどうか、という質問項目と、子どもの犯罪・補導歴の有無の関連性を分析し、少年犯罪者のほうが暴力的なテレビゲームで遊んでいる割合が高かった、という結果が得られたとしても、暴力的なテレビゲームを規制して犯罪率が下げられるかどうかはよくわからないのだ。