データ分析で「過失」という概念が進化を遂げてしまう?

人工知能が人間の専門家に勝利? データ分析をしないと訴えられる未来がくる? 第3回では、コンピュータと人間の役割の相違から、データ分析が一般化した未来の予測まで、データ分析の最前線に立つお二人がお話していきます!
cakesでも大人気だった連載の実践編である『統計学が最強の学問である[実践編]』が好評発売中です!

コンピュータが得意なこと、人間にしかできないこと

西内啓(以下、西内) 『データの見えざる手』では、人工知能ソフトウェアと人間の専門家が、あるホームセンタの売上向上について競争したところ、人工知能が勝利したという結果が書かれていますね。人工知能が導き出した施策は顧客単価の15%アップにつながったけれど、人間の提案した施策は、店舗売上も顧客の行動にもほとんど影響がなかった。

矢野和男(以下、矢野) そうなんです。スタッフや顧客に首から下げる名刺型のウエアラブルセンサをつけてもらい、店内に場所情報の発信器を設置することで、顧客やスタッフがどこに、どれだけの時間滞在し、いつどこで会話し、その会話でどんなパターンのやりとりが発生したかという情報を収集しました。そうしたら、店内のとあるスポットに店員がいるだけで、顧客単価が向上するということがわかったんです。

西内 おもしろいのは、なぜ、そこにスタッフがいたら顧客単価が向上するのかは結局わからないということ。だから、人間がその効果を予測することは絶対不可能です。ということで、計算だけでなく仮説を立てることすらコンピュータに任せた方がいいと書かれていましたね。これに対して、私は半分イエスで、半分ノーという立場なんです。

矢野 ほう、どういうことでしょうか。

西内 データ分析というのは、「予測」と「洞察」でぜんぜん違う使い方をするんですよね。予測というのは、Amazonのレコメンドエンジンなんかをイメージするとわかりやすいです。どんなアルゴリズムで、どんなデータの影響が強いのかわからないけれど、表示されたものを買ってもらえる確率が上がれば上がるほど儲かる。コンピュータに計算させて、それが自動的に出てくるようにすればいい。

矢野 機械学習ですね。

西内 そうです。こういう限定されたテーマの予測をやる場合は、人間の頭を通さないほうが圧倒的に効率いいし、効果も上がります。でもデータを使って「洞察」、つまり何らかの因果関係を説明したい場合は、課題のフォーカスポイントや打つアクションが無限にあるので、どれをやるか選ぶことまでは自動化できないんですよ。

矢野 はい。

西内 だからといって、「人間が仮説を考えなければいけない」というのは、また違います。洞察をするにしても、仮説じゃなくて「問い」を考えるべきなんです。仮説とは、イエス・ノーの二択で答えられるものです。問いというのは、それでは答えられないものを含む。できるだけ、イエス・ノーで答えられないような適切な問いを設定するのが重要です。この問いは、アウトカム、解析単位、説明変数という構造になっています。例えば、売上というアウトカムに注目するとしましょう。次は、解析単位です。

矢野 この場合の単位とは?

西内 これは物理学で使う単位ではなく、売上の高い商品と低い商品の違いとはなにか、売上を上げられる従業員とそうでない従業員の違いとはなにかなどの、問題の切り口を指します。そして3つ目の、説明変数。これをいかに、これまで考えたこともないものにするか、が重要なポイントです。

矢野 なるほど。

西内 ここで、仮説を考えて一つずつ説明変数をつくるというのでは、データが多すぎて無理です。私がよくやるのは、とりあえずすべての要因を説明変数にしてしまうという方法です。それをコンピュータで分析し、影響のあるものとないもので取捨選択して、残ったなかから当たり前すぎる要因をはねる。それは、現場の人に見てもらいながらやります。そうすると、けっこう意外な要因が残るんですよね。

データ分析をしないと訴えられる未来

矢野 その考え方は、私もほとんど同じです。ただ、いま西内さんがおっしゃった「当たり前をはねる」というところも、我々が開発した人工知能ソフトウェア「H(Hitachi Online Learning Machine for Elastic Society)」はすべてフレームワークで自動的に計算できるようにしてあるんです。

西内 それは便利ですね。

矢野 そうじゃないと、効率が悪くてやってられないんですよ(笑)。だから、データを入れればそこまでコンピュータが考えられるような仕組みを、自分たちのためにつくったんです。やはり、膨大なデータがあるときに、組み合わせも含めてなにが利いているのかということを見つけるのは、コンピュータのほうが圧倒的に速く、そして網羅的です。だから、仮説を立てることも学習できるマシンに任せた方がいいと考えています。

西内 なるほど。

矢野 データの背後に何があるのかということを見つけるのは、今よりもっとコンピュータに頼ったほうがいいと考えています。人工知能をもっと発展させて、頼れるフレームワークをつくるべきです。でも、そこまでコンピュータに任せた上で、人間にしかできないことがまだあるんですよ。

西内 なんでしょう。

この続きは有料会員登録をすると
読むことができます。
cakes・note会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
どっちが最強!? 物理学VS統計学—矢野和男×西内啓 対談

矢野和男 /西内啓

人間の行動を変えるには、さてどうしたらいいものか? 経済学者は「インセンティブ」。社会学者は「まわりとの関係性」。政治学者は「権力」。さて、物理学者と統計学者は? ウエアラブルセンサによって身体活動のデータ分析し、人間を支配する隠れた...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

miyaan2010 |どっちが最強!? 物理学VS統計学――矢野和男×西内啓 対談|矢野和男 地震予知が過失の例になるかな。 https://t.co/pcr7ggSyVy 3年以上前 replyretweetfavorite

yaiask 『 https://t.co/7KZbTT0fhx 3年以上前 replyretweetfavorite

philomyu そういえばcakesの対談も第3回が公開されたみたいです。 3年以上前 replyretweetfavorite