ビッグデータ “超”分析の教科書

データの正しい解析単位の選択肢を知ろう—分析のフレームワークを知る【第2回】

目の前の課題を解決するために、どのようにデータと取り組めばよいのか。ベストセラー『1億人のための統計解析』の著者である統計家の西内啓さんが解説していきます。
分析のフレームワークを知る第2回は解析単位について。比較に用いる最適な解析単位になりえるものをどう見つけ出せばいいのでしょうか?
11/17(月)発売の『実践! ビジネスに役立つ “超”分析の教科書』から気になる内容を一部お伝えしていきます。

 アウトカムが決まれば次に考えるべきは解析単位である。

 同じ売り上げというアウトカムを用いるにしても、売り上げの高い顧客とそうでない顧客の違いに注目するか、売り上げを上げてくる営業スタッフとそうでない営業スタッフの違いに注目するか、売り上げの高いヒット商品とそうでない商品の違いに注目するかで、見えてくるものは全く異なってくる。

 こうした視点のことを、さも専門的なセンスかのように「分析の切り口」と表現する者もいるが、単に比較に用いる解析単位には複数の選択肢があることさえ分かっていれば、誰でも考えられるものである。

 具体的には図表「解析単位の定石」に示すように、人間(WHO)・物(WHAT)・手段(HOW)・時間(WHEN)・場所(WHERE)といった解析単位の何を考えても構わない。

 図の並び順は私の経験上、解析単位として用いられることが多い順に上から並べたが、その背後には「よい解析単位とは何か?」という基準が存在している。

 まず解析単位は、最低でも数十〜数百程度はなければならない。例えば、たった2店舗だけしか運営していない会社が何テラバイトのPOS(販売時点情報管理)データを収集したとしても、「売り上げの高い店舗とそうでない店舗の違いは何か?」というデータ分析に意味はない。売り上げの高い一方の店舗の特徴を羅列して終わり、というだけのことである。店舗を解析単位として用いたいのであれば、最低数十店舗を運営していなければ、「全体的な傾向性」を見ることはできないのだ。

この続きは有料会員登録をすると
読むことができます。
cakes会員の方はここからログイン

1週間無料のお試し購読する

cakesは定額読み放題のコンテンツ配信サイトです。簡単なお手続きで、サイト内のすべての記事を読むことができます。cakesには他にも以下のような記事があります。

人気の連載

おすすめ記事

この連載について

初回を読む
ビッグデータ “超”分析の教科書

日経ビッグデータ編集部

ビッグデータ時代が到来した今、これからのビジネスパーソンには、データを読み取り、分析する基本的な能力が求められています。このニーズに応えるため、データ分析の基本的な考え方からデータ分析に成功した企業のケーススタディ、データ分析に関わる...もっと読む

この連載の人気記事

関連記事

関連キーワード

コメント

Tweetがありません