CLOSE

組織的にデータを活用するための4つのファクター(全4記事)

2022.06.24

Brand Topics

PR

データ分析から導き出す「強い野球チーム」のつくり方 映画『マネーボール』で学ぶデータサイエンス

提供:株式会社データミックス

「AIや機械学習を導入して、会社のDXを進めたい」。そのためには大量のデータが必要なことは分かっているが、実際に必要なのはどんなデータなのか、そのデータをどうやって分析すれば仕事に活用できるのかが分からなくて困っているーー。そんな悩みを抱えるビジネスパーソンを対象に、データサイエンスの教育プログラムを提供する株式会社データミックスの代表取締役・堅田洋資氏が、データ活用方法を伝えるセミナーを開催しました。映画『マネーボール』で立てられた問い「出塁率の最大化」をヒントに、良い問いとはなにかについて、マーケティングツールなどを使いながら詳しく解説します。

映画『マネーボール』に学ぶ、良質な問いの立て方

堅田洋資氏:それでは「問いの質を上げるにはどうするのか」「どうやって問いの量を増やすのか」、そして「データで競争優位をどう築くか」の3つについて、これから話をしていきます。

まず、問いの質を上げるにはどうしたらいいかということですね。左側の山をちょっと見ていきます。

まず、問いがなければサイエンスはできないし、スタートできません。良い問いを立てるにはどうしたらいいでしょうか。ここで、『マネーボール』という映画の話をちょっとしたいんですけれども、見たことがある人はいらっしゃいますかね。

これはブラッド・ピットが主演している古い映画で、彼の役は「オークランド・アスレチックス」というメジャーリーグの球団の雇われ経営者です。

彼が困っているのは、金持ち球団に強い選手がどんどん引き抜かれていって、弱い選手しか残らないこと。だけど、お金はそんなにない。そこでどうしたのかというと、データサイエンティストを雇ってチームや選手を分析し、データでチームを強くしようと試みるわけです。

しかしながら、行く手を阻む人はいっぱいいる。なかなか組織は動かないし、人事権を持っている監督も最初はすごく反抗してくる。いろいろあって最終的には強いチームができあがるという、そんな話です。

では、この話のどこがすごいのでしょうか。

「出塁率の最大化」という問いの価値

普通の野球チームだったらどう考えるでしょうか。金持ち球団に強い選手が引き抜かれて困っているという問題があって、それでも強い選手を獲得しなければならない。であれば「どうやって良い選手を発掘するか」という問いを立てるのが極めて一般的だし、そりゃそうだよなって思いますよね。

ですが、この問いでは、どういうデータを使って、どういう分析技術を使えばいいのかわかりません。

この映画の中に、キーワードになる「出塁率」という言葉が出てきます。この数字を上げるというのは、要は塁に出る確率を最大化するということです。別にヒットじゃなくてもいい。フォアボールでもデッドボールでもなんでもいいから、とにかく出塁する確率を上げていく。彼らはどんな問いを立てたかというと、「予算内で出塁率を最大化するための選手の組み合わせってなんだろう?」ということなんですね。

問いを「出塁率の最大化問題だ」と立てられたところに、極めて大事なポイントが詰まっています。分析していくと、選手別のデータとして「この選手はヒットを打たないけど、フォアボールはよくあるよね」とか、「この選手はケガしているけど、ケガのわりにはけっこうヒット打つよね」といったデータが取れてくる。

そして、それを解析するのに必要なのは統計学であったり確率論の技術だとわかってくる。このように、問いをうまく立てることによって、データを持ち出す余地が出てくるということなんですね。

良い問いとは、数字で答えたくなるようなもの

データ分析する上での「良い問いと悪い問いって何だろう?」についてなんですが、ちょっとスライドの左と右を見比べてください。決定的な違いはなんでしょうか。

悪い問いの方には、「昨年からユーザー数は増えたのか」とか「進捗は順調か」「フォローできているのか」「お客さんはいるのか」とあります。これ、私もついつい言ってしまいますけど、ちょっと言い換えるだけでデータを見にいきたくなる問いに変わります。

「何人増えたのか」「どのくらい変化したのか」「1ヶ月以内のフォロー数、コンタクト率はどのくらいなのか」「100人いたら、何人に電話かけているのか」「何割に電話をかけているのか」みたいな感じに変換するんですね。

他にも、例えば「東京都に住んでいるお客さんって何パーセントいるのか」と聞いてみる。単に「いるのか」と聞くのではなく、「何パーセントいるのか」と聞く。こうやって数字で答えたくなるように問いを言い換えるだけで、自然とデータを見にいきたくなるよということなんですね。

当たり前じゃないかと思うかもしれませんが、これが意外に難しいと思っています。

これを少し定式化するというか、ある程度ステップに分けて考えてみます。ランダムに問いを投げかけるのではなく、まず達成したいことを決める。例えば売上の目標や中期経営計画などあると思いますけれども、そういったことからビジネスの定量化を行います。そこで打ち手が出てきて、やっと問いが明確化されるというステップになります。

ちょっと抽象的なので、具体的にひとつずつ見ていきます。達成したいことの明確化については、会社ごとの戦略の話になるので割愛して、2つ目のビジネスの定量化からいきたいと思います。

このビジネスの定量化は、クライアントとお話しする中でも最近よくテーマとして上がってくるなという印象を持っています。とくに大事なのが顧客行動の理解だと思っていますので、今日はそれを体感していただければと思います。

カスタマージャーニーを使った顧客の行動分析

顧客行動を理解するのに一番使いやすいのは、「カスタマージャーニー」というフレームワークです。まずフェーズを区切ります。要は、お客さんがその商品を購入したいと思うタイミングとか、ファンになるまでのステップで区切っていくということです。

その時に、お客さんがどういう行動をして、どこにコンタクトポイント、つまり接点があるのかを書き出していきます。

これはマーケティングのフレームワークなので、マーケターの方はもっと詳しく行うと思います。ですがデータ分析側からすると、そのときのお客さんがどんな動きをしていて、どんな心理状態なのか想像がつくかどうかがポイントになってくるんですね。

例えば、みなさんがコンビニエンスストアの店長だとして考えてみましょう。(スライドを指して)これは横浜のとある郊外の地図ですね。みなさんの店の近くに、同じチェーンの店が2つあります。さらに隣にはマクドナルドがあります。

こんな立地環境にある店舗を任されたみなさんは、この店舗の課題である「通りがかる外回り営業マンをいかに取り込むか」について対策を決めないといけない。ここでカスタマージャーニーをつくるとしたら、どう考えたらいいでしょうか。

ヒントは「認知する」ところから「購入する」までの間に起こることです。どんなフェーズに切るといいか、もしくはどんな行動があるか、ちょっと考えていただきましょう。お店を認知したら次はなにするか、その次はどうするか、最終的に購入するまでになにをするか、ちょっと頭の中でイメージしてみてください。

認知したあと「お店に行く」、「品物を探す」、そして購入する。当たり前といえば当たり前なんですけど、こうしてフェーズを区切ってみましょう。

次は「どんなことをするだろう」「どんなきっかけで行くだろう」と考えてみます。車で通りがかったからとか、お店に行った時に車が停められるかなとか、休憩スペースがあるかなとか。他にも弁当は売っているのかなとか、また行こうと思えるのかなとか、いろいろありますよね。こういったお客さんの行動をたくさん書き出してみます。

そこから最終的に、こういった行動がわかってきます。きっとお客さんは、通りがかったときに混んでないし休憩できそうだからと立ち寄ったけど、弁当が売ってないじゃないかと気づく。じゃあ、隣のマクドナルドで食べようってなってしまうと。これは売り逃しているということですね。すると、問題は品切れだということが、定性的な情報としてわかるということです。

こんな感じで、お客さんの動きを詳しく理解できているかというのが、ビジネスの定量化の第一歩です。

KPIツリーによる指標分解

ここまでは定性の話ですけれども、次はこれをどうやって定量化していくか。売上から費用を引いたら利益が出ますよね。では売上と費用を構成する要素は、どうすれば分解できるでしょう。こういう時に、KPIツリーというものが使われます。

初めて見るという方もいらっしゃると思いますが、なんてことはありません。売上を「平均単価×顧客数」に、顧客数を「認知人数×購入率」といった具合に指標分解していくものなんですね。

ルールは簡単で、左の例では、平均単価と顧客数を掛けたら上の指標に戻ります。右の例では、時間帯ごとに切り分けた数字を足し算したら上の指標に戻ります。つまり、掛けたり足したりしたら上の指標に戻るというのがルールです。

ただし、掛け算か足し算で、ちょっと意味が変わります。例えば掛け算の場合、分解したって単価を上げたら顧客数が下がるじゃないか、ということはこの2つって連動してるじゃないかと思うかもしれません。それはもう、おっしゃるとおりです。

「掛け算の2つの指標を独立だとみなす」のはどういう意味かというと、一方の指標が上がったら、もう一方の指標は下がるという関係性はあるけど、いったんそれは置いて、割り切って分解するということです。

足し算はセグメントに分けるということです。先ほどの朝、昼、夜もそうだし、例えば、社会人と学生とそれ以外の人に分けるというのも、セグメントに分けることになりますね。

分解後の指標は、自分で数字を動かせるものにする

では、分解できればなんでもいいのでしょうか。残念ながらそうではありません。

売上は「単価×数量」に分解できますし、商圏内のコンビニ売上全体、要は3店舗が近くにあるので、その3店舗全体の売上のうち、自分の店舗のシェアを測るということでも売上は導き出せます。いろんな掛け算の仕方がありますが、今回であればどちらがいいと思うでしょうか。

ポイントは、「その指標を上げられるか、もしくは下げられるか」「何か作用させられるか」という問いに答えられるかどうかです。

分解後の指標はActionableと書いていますけど、例えば「単価を上げてください」って言われたら、それが良いか悪いかは別として可能ですよね。値上げすればいいだけですから。

ですが、「3店舗のコンビニ全体の売上を上げてください」って言われたらどうでしょう。「3店舗で同時にキャンペーンでもやりましょうか」みたいになると、自分だけではなんともできなくなります。

つまり、自分でその指標を上げ下げできるのか、何か打ち手があるのかを意識しながら分解すると、より良い分解になるかなと思います。

ただ、右側の分解はダメなのかというと、そんなことはありません。ケースバイケースです。「打ち手を考えてください」と言われたときには使いにくいんですが、例えばとある会社の将来の売上を予測したい、客観的に見たいとなった場合は、右のほうが使いやすかったりするんですね。

マーケットは伸びていて、その会社のシェアが一定でキープできる前提での計算であれば、とても簡単にできる。そういう場合は右のほうが使いやすかったりします。

なので、立場によっても良い悪いは変わるんですけども、少なくとも自分が今できる打ち手でデータ活用しようということであれば、Actionableなほうがいいですよということですね。

レシート枚数という指標を分析すると?

では、コンビニエンスストアの売上を分解するとしたらどうなるかを考えていきます。先ほど申し上げたとおり、「分解したときに打ち手につながるのか」を意識していただくといいですね。

ちょっとヒントを出します。みなさんも頭の中で、どう分解するといいか考えていただければと思います。

例えば売上を、「レシート枚数×レシート単価」に分解します。レシートは4枚で、それぞれAさん、Aさん、Bさん、Cさんが買い物しています。となると、レシートは4枚ですがお客さんは3人ですね。ここでのレシート枚数は、のべ購入客数としましょう。レシート単価のほうは、この1枚1枚のレシートを平均したもの、つまり取引単価ですね。

続いて、レシート枚数はどう分解できるでしょうか。もちろん足し算でも分解できますが、今日は掛け算だけで説明します。

さて、もう1つヒントがあります。レシート枚数が算出できるということは、買っているんですね。買っているということは、品物を探しにきているということです。ということは、来店していますねと。来店しているということは、認知もしていますね。これがヒントです。

ということで、さあ、どんな分解になるかをちょっと考えてみましょう。最初の2つだけみなさんと一緒にクイズ形式でやってみましょう。

レシート枚数を分解するとしたら、AとBにどういうものが入ると思いますかと。選択肢1は「店舗の立地×商品力」。選択肢2は「のべ来客数×購入率」。さあ、どっちでしょう。

答えは2の「のべ来客数掛ける購入率」です。

なぜこの問題にしたかというと、実はKPIツリーとイシューツリーという似たフレームワークがあって、定性情報でもいいとなると1を選びたくなるんですけども、今回は指標を分解したいので、必要なのはあくまで数字なんですね。数字がこなきゃいけないので、選択肢2が正しいですよということです。

例えば私が20回お店に行って、そのうち50パーセントの割合でしか買い物しなかったら、レシートは10枚ですよと。これが1つ目の計算です。

分解で悩んだら、1つ前の指標に「率」をつけてみる

もう1つ。「のべ来客数」を分解してみましょう。選択肢1は「1回以上来店したことがある人数」。私が10回行こうが、私は1人しかいないので1人と数えます。それに「平均来店頻度」、つまりリピート数を掛けます。

選択肢2は「認知人数×来店率」。さあ、どっちだと思いますか? これは難しいと思います。1でも2でもいい気がしますね。

答えは1の来店人数です。私は1人しかいないので、私1人が20回買いものにいって、50パーセントの確率でしか買いものをしないのであれば、10枚しかレシートは出てこないよということになりますね。

それでは、なぜ認知人数のほうはダメなのか。これは考え方次第ですけれども、1回でもそこにお店があると思ったら認知数は1、2と数えられはします。しかし、のべ来客数って、のべの人数ですよね。認知人数のほうはのべじゃないのに、のべ来客数はのべなので、これはつまり単位が合ってないんです。なので、選択肢にないわけです。

単位を「1回でも来たことがある人」としてしまえば、「認知人数×来店率」でも変ではないですね。私の友だちを含めて10人がお店があることを知っているけれども、10パーセントの人しか行ったことがないとなると、来店人数は1になります。

先ほどの、20回買いものに行ったけれど50パーセントしか買いものをしないので、10枚レシートが出てきた場合と同じ数字になります。

これはコンビニエンスストアの例なので想像がつくと思うんですけれども、実際の仕事でやってみると「分解をやってみたけど行き詰まった」ということがあるかと思います。

その時のコツは、前の指標に「率」をつけることだとよく言っています。来店人数を分解したいときに「来店率って取れないかな」と考えられるか。また「来店率とペアにするのはなにがいいだろうか、認知人数かな」みたいな感じで考えていくと、うまく分解できたりします。

最後に、商圏認知人数はどう考えたらいいでしょうか。横浜のコンビニエンスストアにわざわざ外国から来たりしないので、「商圏人口×認知率」という感じで分解ができるよということですね。

実はけっこう分解できるんですよ。「購入点数×点単価」、例えば1回の買い物あたり、みんな300円くらい買っていくとします。

平均の購入点数がだいたい3つくらい、例えばおにぎり2つと缶コーヒー1個で300円みたいな感じで買っていくとします。すると、だいたい1個あたり100円くらいのものを買っていくという感じで分解できたりします。

実はこれ、もっと分解できます。ちょっと想像してほしいんですけど、購入しているということは、みなさんは必ずお店に行った時にそれが視界に入っているはずなんですよ。

今私の手元にはオレンジジュースがあるんですけど、これを視界に入れずに買うことはできないですよね。絶対にこのオレンジジュースだと認知して買っているわけなので。

ということは、視認している点数の中で「これを買おう」と思ってカゴに入れた割合が導き出せます。そして、そのお店の中で取り扱っている点数、これはSKU数とか呼んだりしますけど、その取扱点数の中で視認できている割合が計算できます。

でも、そのお店がすべての商品を取り扱っているわけじゃないので、取扱可能な商品数に対しての取扱率という感じで分解ができます。このように、がんばればいろんな分解ができます。

指標を分解することで、変化を定量的に語れるようになる

先ほどなぜカスタマージャーニーの話をしたかなんですが、今分解した数字を右から見ていくと、認知して来店して品物を探して買い物するという流れになっていますよね。ということは、これはまさにカスタマージャーニーなんですね。

みなさんはコンビニエンスストアでの消費体験があるので想像がつくんですけど、お客さんとしての体験がないもの、業務への理解がないものをKPIツリーで分解するのは難しいです。ほぼ不可能なんじゃないかと思います。

なんでこんなに分解してるのかというと、最初にお話しした『マネーボール』の出塁率みたいな数字を出したいからなんですね。

コンビニエンスストアの例では購入率や来店率といったいろんな率が出てきました。ではその率を改善すればいいとなったときに、何をすればいいか。

品揃えを改善したらいいんじゃないか。そしたら購入率が上がるんじゃないか。ポイントカードを発行したら来店頻度が上がるんじゃないか。看板を置いたりのぼりを立てたりしたら来店率が上がるんじゃないか。チラシを撒いたら認知率は上がるんじゃないか。

というように、「この率や指標を上げたいからこういう行動をするよね」というペアリングをしていきたいがために、KPIツリーを分解してきたわけです。

売上を上げたいなと思ったときに、この指標に分解して全部に数字を入れていけば、何パーセント上げれば売上が何パーセント上がるという、定量的なことも語れるようになります。

指標を上げるためにはどんな打ち手があるか、どんな行動を取ったらいいのかも考えられるので、この分解は定量的に考えるために重要だと思います。

「問い」にはレベルがある

KPIのツリーができて、例えば売上を上げたいなと考えたときに、去年に比べて来店頻度が低いことに気づいたとします。そこで打ち手としてクーポンの発行を決めたとしましょう。みんな最近価格に敏感だし、クーポンでも打ってみようと。

なんとなく良さそうな気がするかもしれませんが、これはダメです。「売上を上げよう、オー!」「電話いっぱいしよう、オー!」と言うのと、実はあんまり変わらないです。

なぜかというと、売上が分解されただけで、まだ問いになっていないんですね。やりたいことがあるのはとてもいいことなんですけれども、「クーポンを打ってうまくいくのかな」「誰に打ったらいいんだろうな」「何パーセント割引だったらいいんだろうな」とか、いろいろと気になりますよね。それに気づくのが大事です。

こういう打ち手がいいなと思ったときに、あれもこれも知っておきたいなって思えるかどうかが、まさに問いになってくるんですよね。

「そもそも今の来店頻度って何回なのか」「お客さんは本当に価格に敏感なのか」「価格を下げたらお客さんは増えるのか」「何パーセントの値引きしたらいいんだろうか」と、多くの問いが出てくるんですよね。

これが重要で、この問いを出せるかどうかが、データを活用できるかのきっかけになるんです。そしてこの問い自体に、必ず数字で答えたくなるものが入っていることが大事になってきます。

では、これを少し整理するとどうなるか。問いにはレベルがあるというのがポイントですね。当然、自分も経営者なので利益を上げたいですと。では利益を上げるためには、何パーセントの割引をすれば利益が最大化されるかを、率直に言うと知りたい。ですがそれはなかなか難しいですね。

そもそも今の来店頻度を知らなければわかるはずもないし、来店頻度と割引率の関係がわからなかったら計算できないですよね。

実は、過去や現状の定量的な把握に始まって、関係性の把握、因果関係の把握、将来予測、最適解と、問いのレベルってだんだん上がっていくんですね。これを意識的にできるかどうかは、データ活用のポイントです。

ここまで整理ができれば、あとは知りたいことに対して答えるためのデータと、それを料理する技術があるかどうかという話になってきます。

続きを読むには会員登録
(無料)が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
著者フォローや記事の保存機能など、便利な機能がご利用いただけます。

無料会員登録

会員の方はこちら

株式会社データミックス

関連タグ:

この記事のスピーカー

同じログの記事

コミュニティ情報

Brand Topics

Brand Topics

  • ランサムウェア攻撃後、わずか2日半でシステム復旧 名古屋港コンテナターミナルが早期復旧できた理由 

人気の記事

人気の記事

新着イベント

ログミーBusinessに
記事掲載しませんか?

イベント・インタビュー・対談 etc.

“編集しない編集”で、
スピーカーの「意図をそのまま」お届け!