【第32回】
エビデンスを探してみよう
—日本の失業対策を統計学的に考える

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人がその本当の面白さを知っているだろうか。この連載では、cakesという新しいプラットフォームに相応しい、最新かつ最も刺激的な統計学の世界を紹介したい。(毎週火・金更新)

 前回紹介した文献データベースに適切な検索文を入れれば、エビデンスを探すことができる。

 題材は何でもいいのだが、たとえばあなたが日本経済の問題の1つとして雇用対策をどう解決すればいいのかについて興味があったとしよう。失業やワーキングプアーといった雇用問題について、政治家やテレビのコメンテーターはしばしば「問題だ」と発言したり、「頑張った人が報われる社会を」といった抽象的なお題目を唱えるわけだが、果たして政府はどのような政策でこの問題を解決すればいいのだろうか。その答えをエビデンスから探ってみよう。

日本語文献を探してみよう

 先ほどのエビデンスのヒエラルキーに沿って、まず探すべきは系統的レビューの結果を探したい。
 試しにJ-STAGEから日本語の文献を探してみよう。検索すべきトピックは「雇用 政策」、それに加えて系統的レビューやメタアナリシスを示す単語である、「系統的レビュー」「システマティックレビュー」「システマチックレビュー」「メタアナリシス」「メタ解析」のいずれかを含む論文を実際に検索してみた。その結果得られた全文献のタイトルは次の表に示す通りである。

図表1 日本語文献の検索結果①

 タイトルだけ見てもわかるように、この中にはまったく雇用関係の政策を系統的にレビューしましたという研究はない。

 では次のエビデンスレベルであるランダム化比較実験ではどうだろう? ランダム化という言葉を使えばおそらくこうした研究が見つかるはずである。

図表2 日本語文献の検索結果②

 これでも雇用関係の研究は見つからない。「雇用 政策」という言葉が入っているにもかかわらず、これらはほとんど医学研究ばかりであり、どうやら日本でランダム化を研究に取り入れているのは医学分野の生物統計家だけではないかということが示唆される(図表2)。

 では観察研究ではどうだろうか?
 「雇用 政策 ヘックマン」で検索してみると、「書評」とだけ書かれた文献と、「農村女性問題と地域活性化」という文献が見つかる。やはりこれも求めていたものではない。ちなみに「ヘックマン」を「傾向スコア」や「プロペンシティスコア」に変えるとヒットする文献数はゼロである。観察研究の中でも少し高度な因果推論を行なったものは見つからないようである。

 そこで「雇用 政策 回帰分析」で検索すると240件と、ある程度の数の文献が見つかるようになった。これらを丁寧に見ていけば失業に関連する要因は何かといった回帰分析の結果が見つけられるかもしれない。

英語文献の探し方

 とは言うものの、全般的に日本語文献にはあまり良い実証研究が少ないようである。そもそも、日本語で書いた論文は日本人しか読まないが、英語で論文を書けば世界中の人が読むためインパクトが大きい。そのため、大学という組織において日本語の文献を何本書いたか、というのはあまり評価の対象にならない。日本語で論文を書く意味があるとしたら、日本人向けに日本特有の問題を説明したい場合か、論文雑誌側から「こういう内容を読者に説明する解説論文を書いてください」と依頼された場合、あるいは研究者が壊滅的に英語を書けない場合ぐらいである。

 したがって、日本人の研究者が我々の求めているようなエビデンスを作っていたとしても英語で書いている可能性はある。そこで英語を恐れず、Google Scholarで先程と同様の検索をしてみよう。

 やるべきことは先ほどの単語を直訳して検索すればいいだけだ。雇用はEmploymentで政策はPolicyである。システマティックレビューを探すなら”Systematic Review”か”Meta-Analysis”という単語を、ランダム化比較実験を探すなら”Randomized”という単語を、観察研究なら”Heckman”, ”Propensity Score”, “Regression”といった単語を用いればいい。

 実際にGoogle Scholarで”Employment Policy Meta-Analysis”と検索してみると"Active Labour Market Policy Evaluations: A Meta‐Analysis"というタイトルの2010年に書かれた論文が見つかる。直訳的に読んだだけでも「労働市場政策の評価」に関するメタアナリシス論文、つまり最上位のエビデンスであることがわかるだろう。

 英語が得意ならこの論文の冒頭に書かれているアブストラクト、つまり要約を読んでみればいいし、もしそうでなければこの文章をGoogle翻訳にかけてみるというやり方もある。おそらくは以下のような翻訳結果が得られるはずだ。

本稿では、積極的労働市場政策のMicroeconometric最近評価のメタ分析を提示します。我々のサンプルでは、1995年から2007年の間に実施さ97の研究から引き出された199プログラムの見積もりで構成されています。
 (中略)
プログラムの種類を比較すると、補助金、公共部門の雇用プログラムは、少なくとも影響好調見積もりを持っています。就職活動支援プログラムは、教室のに対し、比較的良好な短期的な影響を持っており、オン•ザ•ジョブ•トレーニング•プログラムは、短期よりも中期的には良い結果を示す傾向にある。

 これだけでも1995年から2007年にかけて行なわれた199の政策プログラムを評価していることはわかる。また中略以降の文章に「有効な政策は何か」が書かれてあることも推察できるだろう。ここでは誤訳などの可能性も警戒して結論を下すことは保留しつつ、補助金(subsidized)、公共部門(public sector)、就職活動支援(Job search assistance)、教室の(classroom)、オン・ザ・ジョブ・トレーニング(on-the-job training)、といった単語に注目し、政策の有効性に関する統計解析の表を見つければいい。

 この論文では図表が最後にまとまっているが、その中に効果のあったプログラムの割合を示すものがある。その表の結果の要点をまとめると次のようになるだろう。

図表3 論文中の政策プログラムの効果

(D Card, et al 2010)のTable5より

 Estimateとは「推定する」という意味で、「N=」とはサンプル数の数を示す。また、Significantというのが「有意な」つまり「誤差とは考えられないレベル」という意味であるという統計学的な専門用語さえ知っていれば英語が苦手でもこの図表の意味を理解することはそれほどむずかしくない。

 つまり短期的なインパクト(12カ月以内)において有意にポジティブな結果を示していた政策は、短期的な指標を評価していた全部で183のプログラムのうち39.3%であり、同様にこのうち32.8%は「誤差の範囲」、27.9%がむしろ「有意にネガティブな結果」を示していたというのだ。

 中期的(24カ月以内)あるいは長期的(36カ月以上)評価を行なっていた政策はこれより少ないが、「有意にポジティブ」な政策の割合は増え、過半数となっている。どうやら雇用政策というのは、うまくやればきちんと成果を実証できるものであると言って問題はないようである。

 また、プログラムの種類別に中期的な政策の効果を示す回帰分析の結果を示している表もあった。
 この表にはそれぞれ6種類の回帰モデルが示されているが、プログラムの種類による効果の違いに注目したモデル(2)と全部の変数を入れて調整したモデル(6)さえ見れば「世界的にはどのような政策に効果が見られるのか」がわかるはずだ。その結果だけの要点だけを抜き出すと次の表のようになる。

図表4 論文中の種類別政策プログラムの効果

(D Card, et al 2010)のTable8より

 表の説明を見るとOrdered Probit Models for Sign/Significance~とあり、これは順序プロビット回帰を使って、それぞれのプログラムが「誤差とは言えないネガティブな効果」「誤差の範囲」「誤差とは言えないポジティブな効果」のどれに該当する可能性が高いかという関連性を示している。順序プロビットとは二値すなわち0か1かで示される結果変数に対して行なうプロビット回帰を0か1か2かというような順序性のある結果変数に対して拡張したものである(同様の拡張がされた順序ロジスティック回帰というのも存在している)。

 プロビット回帰の回帰係数はロジスティックのように解釈がしやすいわけではないが、少なくともこの回帰係数がプラスなら雇用政策としてうまくいきやすいことを示しており、一方マイナスならうまくいきにくいという可能性が示唆されている。

 すなわち、座学中心であろうがOJT形式であろうが、職業訓練のような政策プログラムは中期的な雇用対策として有効に機能する可能性が高い。職探しに関する支援も中期的に有効である。一般企業に対して雇用のための補助金を出す(subsidize)というやり方も悪くない。しかしながら、Public Sectorつまり行政や公益法人のようなものに対して雇用のための補助金を出すのは、世界的に見てうまくいっていないらしい。

 単語の意味を辞書で引きながらであったとしても、統計学に関する理解さえあれば海外の論文からここまでのことはわかる。それ以上のことを知りたければ、そこで初めて気合いを入れて「職探しの支援」や「一般企業に対する補助金」の具体的な内容に関して、論文の本文を読んだり、メタアナリシスの対象となった元論文を読み解けばよいのである。

日本の課題は何か

 この論文の中には分析対象となった政策研究の国別内訳も報告されていたが、我が国からはゼロという結果であった。

図表5 分析対象となった研究の国別内訳

(D Card, et al 2010)のTable2より

 日本においてもハローワークに行けば失業者向けの職業訓練をしているし、職探しを手伝ってもくれている。現時点ですでに雇用に関連した企業への補助金だって若者向けの枠がある。政治家や厚生労働省の公務員たちだってボンクラではない。直感的にか、あるいは今回やったようなエビデンスレビューを経てかは知らないが、有効性のありそうな雇用政策をとることはすでに行なっている。

 しかしながら、「取るべき政策が取られていない」という問題はなくても、「その評価がなされていない」という課題はあるのかもしれない。

 職業訓練や職探しの支援や雇用の補助金といった政策は海外ですでにさまざまな成果を出している。もちろんすべてがうまくいっているわけではないし、成功した取り組みの詳細について調べる必要もあるだろう。だが、すでに日本でもこうしたエビデンスのある政策を取っていたのだとすれば、その効果を国内でも実証し、改善すべき点は改善し、より大きなリソースをかけて取り組むことが我が国の雇用対策には求められるのではないだろうか。

 

おわりに

 外科医を引退するまでの私の父は、ほとんど家族と過ごすこともなかったし、睡眠時間すら削って働き続けていた。

 もし万一自分の仕事の失敗によって誰かの命が失われたとき、自分が許される可能性があるとすれば、「全力を尽くし続けること」だけだと思っていたらしい。まったく言い訳の余地を残さず、全力で励み続けて失敗するのであれば、それはもう能力だとか運命だとか自分の預かり知らぬ何かのせいである。そうすることだけが自分の救われる道だと思っていたのだそうだ。

 そうした彼の考え方を子どもの頃の私は尊敬していたが、その一方で「全力」と「最善」は異なるのではないかということも考え始めていた。たとえば睡眠時間を削って目の前のことをこなし続けること、これは全力である。一方で長期にわたって睡眠時間を削り続けたせいで集中力が失われたり健康を害したりしたために、トータルで失敗が増えてしまうのであれば「最善」ではない。

 失敗が許されないのは何も医師だけに限った話ではない。経営者の間違いは従業員とその家族を路頭に迷わせる。従業員の間違いは顧客や同僚に大きな迷惑をかける。親の間違いは子どもの人生を狂わせる。そうした大きな失敗をしでかしたとき、私たちは大きな罪の意識を感じるだろう。

 どうすれば私たちはこうした許され得ない失敗を避けられるのだろうか。

 私たちが一番簡単に目にすることができる明らかな失敗は、プロスポーツ選手によるものだろう。たとえば毎晩ニュースを見れば、解説者はよくチャンスで三振した打者や、シュートを外したサッカー選手の重心やフォームを指して「失敗の理由」を説明している。だが全盛期のイチローでさえ打席に立てば半数以上アウトになるし、メッシやクリスティアーノ・ロナウドでさえシーズンを通して7割以上のシュートを外している。確率的に考えれば失敗するのは「当たり前」であり、そこに個別の理由を求めることはばかばかしい。だが、個別の成功や失敗を超えてフォームであれ、考え方であれ、最善のチャレンジをし続けるからこそ彼らは偉大な記録を打ち立てたのではないか、と私は思う。

 では私たちは、どうすれば最善を尽くすことができるのだろうか?

 そのヒントは、アメリカの医療においてこうした「最善」が大きな成功を収めた事例である、100K Livesキャンペーンの中に存在しているかもしれない。10万人の命と名付けられたこのキャンペーンは、2004年から2006年にかけてアメリカ全体の入院死亡率を5%低下させ、年間12万人も死亡を減らした。

 そのために行なったことはごくシンプルなものである。心停止/呼吸停止のリスクのある患者に緊急対応チームの派遣、急性心筋梗塞に対するエビデンスに基づいた治療の徹底、投薬内容確認の徹底、手洗いの徹底による院内感染の防止といった「やるべきだとわかりきった目標」を全米の病院で徹底するようにしただけだ。それで実際に10万人以上の命が救われたのである。

 100K Livesキャンペーンの10万人という数字の背後には『To Err is Human』というInstitute of Medicine(米国医学研究所)が出版した報告書が存在している。この冒頭でアメリカ人は毎年約10万人が医療ミスで亡くなっている、というショッキングな推計が公表されており、「だったらわかりきったミスをなくせばいい」と100K Livesは立ちあがったのだ。

 最善が何か、自分1人の頭で考えていても「がむしゃらに頑張る」といった程度のアイディアしか生まれないかもしれない。だが世の中にはいろいろな分野で「最善が何か」を明らかにすることだけに命をかけている人たちがいる。無責任な評論家が偽物の「最善」を世に広める一方で、真実の多くは文献データベースの中に大量に蓄積はされていても、あまり我々の目には触れることはない。

 おそらく我々がすべきことの多くは、すでに文献やデータの上では明らかなのである。だがそれを現実のものとして実行するまでのギャップが我々を「最善」から遠ざけているのではないかと思う。

 やるべきことが明らかなのであれば、私たちがすべきなのはいかに速くそうした真実を探し当て、理解し、自らが実践するとともに、その知恵を周りに普及していくかということだろう。統計学の素晴らしいところはこうした「最善」への道を最も速く確実に導いてくれるところではないかと思う。

 統計学によって得られる最善の道を使えば、お金を儲けることも、自分の知性を磨くことも、健康になることもずいぶんと楽になるだろう。だがそれはあくまで副産物である。統計リテラシーによって手に入る最も大きな価値は、自分の人生を自分がいつでも最善にコントロールできるという幸福な実感なのだ。

 ちなみに『人は誰でも間違える』という邦題で『To Err is Human』の日本語訳は出版されているのだが、この訳はその原題のニュアンスを少し損なっている。To Err is Humanという言葉は聖書からの引用であり、一般的には「過ちは人の常」という日本語訳が当てられる。それにこの「過ちは人の常」という聖書の言葉にはまだ続きがある。

 過ちは人の常、許すは神の業 (To err is human, to forgive divine.)

 我々は今後何度も間違いを犯す。だがたとえ過ちが人の常だったとしても、最善を尽くし続けられる方法がこの世に存在しているというのは、人間に与えられたずいぶんありがたい許しだと私は思っている。

 

統計学が最強の学問である

西内 啓
ダイヤモンド社
2013-01-25

ケイクス

この連載について

初回を読む
統計学が最強の学問である

西内啓

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。 どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたして...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

netalius69 #neta #学び |統計学が最強の学問である|西内啓|cakes(ケイクス): あえて断言しよう。あらゆる学問のなかで 5年弱前 replyretweetfavorite

kantoku_kun 「もし万一自分の仕事の失敗によって誰かの命が失われたとき、自分が許される可能性があるとすれば、「全力を尽くし続けること」だけだと思っていたらしい。」医療従事者なら考えることなのかな。聞いてみたいけど、肯定されても辛いから聞けない。 http://t.co/4GYhlatP7M 約7年前 replyretweetfavorite