データサイエンスの事前準備のポイント

松本健太郎氏:「事前準備が大事」と説明した背景には、例えばデータを揃えないといけないとなった際に、そもそも手元に必要なデータが揃っているのかを確認しなければならないことがあります。

手元に揃っているデータは果たして正確なのか? という確認と、確認の確認も必要になってきます。もし必要なデータが揃っていないのであれば、データを一から計測をしないといけない羽目になってしまって、結果的に分析に取り掛かるのに1ヶ月から2ヶ月遅れてしまうというケースもよくある話だと思っています。

それ以外にも、どういった問いを解けばどういった答えが返ってくるのか。つまり、問いに対して「恐らくこうじゃないか」という仮説を事前に立てて、分析に取り掛かるわけです。つまり、大量のデータを与えられて「ここから何か分かることはないかしら」と、とりあえずデータに触れてみるのは、分析とは言わないということだと思っています。

必要な問いを解くと、どういう答えが考えられるのか。それに加えて、その仮説は次のどのようなアクションにつながるのかという、すべて「恐らくこうじゃないのか」という仮説を立てたうえで、データを準備して実際に分析をしてみて、「その通りだった」「そうじゃなかった」「まったく予想外の答えが出てきた」となってくると、もう一度元に戻る場合も本当によくあります。

マーケにおいて、データは「パーフェクトな存在」ではない

その意味においては、事前準備こそが分析をする上では肝になってくるかなと思っています。まず、このnoteを書いたときの社会風景として、「データサイエンスがすごい」、あるいは「ビックデータをやっていない企業はダメだ」という風潮があったかと思います。

ただし一方で、実際に現場に立って分析をしてみると、データはそもそも完全でパーフェクトな存在かというと、かなり疑わしいところがあると思っています。もっと前段階でいうと、データって数字とは限らないわけです。それは言語かもしれませんし、映像かもしれません。

もし仮にデータ=数字なんだとすると、実際に分析に取り掛かるとなってくると、例えばある商品があって、「なぜ売れないのか?」というのを数字で考えるとなった際に、人間の気持ち、あるいはその当時の背景、あるいはそもそもエコ志向なのかとか、おいしいものならガッツリ食べたいよねという消費者マインドとか。数字にしきれないさまざまな要素がある中で、数字で表現することで相当な情報の欠落が発生してしまいます。

その意味において、データそのものに対してデータはあればあるほど良いんだという信仰は、非常に間違っているというふうに思っていて。本当に考えないといけないのは、データの質そのものだと思っています。

データでわかることの限界

質とは何かというと、どこまでこの現実世界の情報を、姿・形を損なわない形で圧縮をすることができるか。世間ではオリンピックが注目されていますし、一方で新型コロナに関する報道も注目を集めていますが、その瞬間の世論を数字で表現できますか? ってなると、それは相当難しいことだと思っています。

ただしビックデータ信仰というのは、「それって数字で表現できますよね?」「それって数字で分析できますよね?」と言っているのに等しいわけです。この矛盾に気付かない限りは、どれだけデータを使って分析をしたとしても、少し間違った答えが出がちですよ、ということに気付けないんじゃないかなとは思っています。

データで分かることの限界を痛感したのは、特にデジタルマーケティングの業務をしていた際です。デジタルマーケティングは、あらゆるマーケティング活動を数字で表現できることが強みだと考えていたんですが、なぜユーザーはコンバージョンに至らなかったのか、あるいはなぜこのユーザーは商品を購入してくれたのかという、「なぜ」を数字で導くことができなかったというのが直接的なきっかけです。

実際には、デジタルマーケティングに携わられている方の中にも、数字を見ただけでWhyが浮かんで、「なぜそれをするのか」という仮説を立てられる方もおられましたけれども。僕は僕自身のことを凡人だと思っているので、僕と同じような凡人の方が数字を見ただけでWhyが浮かぶマーケティングをすることができなかった。

それをきっかけにして、「数字でWhyが浮かばないのであれば、どういうデータがあれば、なぜなんだろうと考えることができるのか?」というのを考えだしたのがきっかけです。

数字に縛られすぎると、偏った結論に至ることも

マーケティング、あるいはデジタルマーケティングもそうだと思いますし、分析、データサイエンスも数字だけに縛られていると、ものすごく偏った結論にいってしまうことがあるんだなと考えたのがきっかけです。これまでビジネスの上では、数字にとらわれてばっかりだったと思います。

例えば、コンバージョンレートが何パーセントだったとか、CPAがいくらだったとか、CTRがいくらだった、それに対して上がった・下がったに一喜一憂をしてましたし。コンバージョンがウィークリーで何件だった・下がったということに対して、なぜ下がったのだろうと考えた時に、下がった理由がよく分からないので、結局それを放置してしまったということもよくありました。

「データには限界がある」というのは、そもそもこのビックデータブームが来る前の2000年より前、もっというとインターネットの時代が来る1995年より前は、どちらかというと一般常識だったんじゃないかなと思っています。

これは人がデータで表現しきれない部分を補うために、「現地・現物が大事だよ」というふうに言ったり、あるいはビジネスマンの勘や商人の勘という言葉がありますが、数字で表現しきれないことに対して勘を働かせて補っていくのは当たり前でしたし、むしろ奨励されていたことがあったんじゃないかなと思っています。

現状のままでは「正解の陳腐化」が起きる可能性も

ただし一方で、ここまでビックデータブームがきて、データサイエンスの重要性が理解されている現代において、むしろこれは「僕自身の勘でこういう結論に至りました」と言うと、ものすごく小馬鹿にするような風潮があるんじゃないかなと思っています。まずはそれをやめることから始めないといけないと思っています。

そして現地・現物に行って感じたこと、あるいは見たことを、数字じゃなくても何かしらの言語等でデータで表現をして理解をしていく。

あるいはこれが「勘だ」となった時に、それを笑うんじゃなくて、なぜそういうふうに思ったのかという、言語化能力を会社を挙げて推進をしていくことに努めていかないと、データそのものはかなり汎用性があるもので、ある特定の会社のみが取得できているデータの方がケースとしてはかなり少ないわけです。

そうなってくると、自社だけでなく競合のA社、競合のB社、競合のC社で、同じようなデータが手元にあって、データサイエンスという1つの答えを見つける手法がさらに進化をしてしまうと、行き着く先としてはどの会社も同じような結論になって、どの会社も同じような製品を作るという、正解の陳腐化を辿ってしまうんじゃないかなと思っています。

データを有効活用した、セブンイレブンの事例

例えば、みなさんがご存知のセブンイレブンやユニクロとかが、データの使い方が上手い会社だと思っていて。データに溺れることなく、データを使いこなしている。

まずは仮説ありきで、仮説の裏付けとしてデータを使う。本来はそれが一般的なんですが、いつの間にか逆転をしてしまっていて。データがあってそれを読み解いて、仮説を発見しようというアプローチをしている会社が意外と多いと思います。

分かりやすい例で言うと、例えばセブンイレブンでよく言われている話として、おでんがどのタイミングで売れるか。多くの人が秋冬だと思いがちですが、夏から秋への季節の変わり目に売れますよねと。「何で?」と言うと、理由はシンプルで。寒い時じゃなくて、急激な温度の寒暖差の差が激しい時ほど、温かいものが欲しくなる。あるいは冷たいものが欲しくなると言われています。

なので、昨日まで25度だったのに、秋口に差し掛かって急に気温が18度になりましたと。一気に7度下がったので、何か温かいものが欲しいですよね。というので、9月の何でもない日におでんが売れることがあったりします。

数字だけ見ると、「9月に突然おでんが売れ始めてますね。何でなんでしたっけ?」というふうに考えてしまいがちですが、人間が気温の寒暖差でどう感じるかという知識、あるいはその時に人間はどう感じるかという、人に対する感情移入ができていると、数字を見ただけで、「これってこういうことですよね」という仮説を持つことができるというのが、よく言われている話ですよね。

言語化能力を高めるためのコツ

言語化能力を身に付ける、あるいは言語化能力を高めるというのは、作家のように、それこそ村上春樹さんのように、言葉のセンテンスを磨いていくということでは決してありません。今、目の前で起きている事象そのものを、起きている事象のまま表現できるかどうかが言語化能力だと思っています。

例えば、多くのビジネスマンが「売上が下がった、どうしよう」と表現をするんですけれども。「どうしよう」というのは、売上が下がってしまったことに対して慌てふためいているわけですが、その時に考えないといけないのは、「そもそも売上が下がるというのは本当に悪なのか?」ということです。

ビジネスにおいて本当に考えないといけないのは利益を上げることなので、売上が下がって結果的に利益が上がったのであれば、それはハッピーなことじゃないかなと考えています。

とにもかくにも、「KPIで何かが下がった、戻さないといけない」「KPIが上がった、これでみんなハッピーだ」という、目の前の現象にとらわれるのではなくて、まずは本質そのものを見極めること。そして本質を見極める能力が身に付いたら、何が起きているのかを言葉で表現をすること。それだけで、言語化能力はだいぶ高まっていくと思います。