2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
意思決定に回帰分析を利用した話と3つの学び(全1記事)
リンクをコピー
記事をブックマーク
二見大揮氏:本日は「意思決定に回帰分析を利用した話と3つの学び」というタイトルで発表します。まずは自己紹介から。二見大揮と言います。2019年4月にRetty株式会社に新卒で入社して、現在はWebやアプリのプロダクト内の分析を行う、データ分析チームに所属しています。
今回お伝えしたい3つのポイントを最初に共有します。まず意思決定のアクションにつながる成果物をちゃんと把握する。交互作用なども考慮しながら「MECE」な分析設計に落とし込む。最後に信頼区間とp値から効きそうな説明変数を見つける。この順番で説明します。
弊社のサービス紹介をします。「食を通じて世界中の人々をHappyに」をビジョンに掲げたRettyというグルメサービスを運営しています。会場でRettyを知っている人、使ったことがある人っていますか?
(会場挙手)
ありがとうございます。けっこういらっしゃいますね。月間で4,000万人ぐらいの利用者がいるので、データもすごく貯まります。そのデータを使ってプロダクトを作っていくのが、僕の所属しているチームです。
データ分析チームだと、サイエンス寄りというか、メインは意思決定や基盤作り。あとはみんなが自由にデータを使えるようにする民主化みたいなことをやっています。方法としては、回帰分析を使っているので、その手順をみなさんに共有したいと思います。
今回の登壇では、僕は細かな技術などは詳しくないので省きます。回帰分析で今回具体例出してるんですけど、高度な意思決定をするときに、難しい分析も使いたいですが、そのときに抽象化して使えると思うので、意識して聞いていただければと思います。
分析にもさまざまな手法があります。ただ、一定以上の大きな意思決定の分析をしたい場合、シンプルなデータ分析でいい部分から難しい複雑な分析をしたい部分が出てくると思います。一方で、ちゃんと説明するのが難しかったり設計が複雑になっている部分をクリアにしておく必要があります。
じゃあ「Retty」はどうやって回帰分析を意思決定に利用したのかですが、「ちゃんと分析して課題設計をする」「分析設計をする結果」「それをどう評価するのか」。この3つに分けて話したいと思います。
課題設計は、意思決定者が誰かを把握して、何を意思決定したいかを知る必要があります。そして、どんなデータがあればその意思決定ができるのかを考えます。この、誰が・何の意思決定をしたいのか・何を提供したらいいのか。この3つのポイントを押さえておく必要があります。
これを蔑ろにすると、分析者が「こういう分析があればいいだろう」と勝手に解釈して、最終的な意思決定者が「これだと難しいな」となり、差し戻しが起こる可能性があります。これはデータ分析全部にも言える話です。最終的な意思決定者が何を求めているのかは前提として重要です。
次に実際に分析設計していく話です。意思決定者に納得感を持ってもらうため、順序を追って説明するには説明変数に「MECE」を使用するのが一番適任だと思います。あとは、重回帰分析だと交互作用とかもあると思うので、ちゃんと考慮して使用する必要があります。
プロダクトの分析だとけっこうあるのですが、施策の打ちやすさや季節要因があります。Rettyだとグルメサービスなので忘年会シーズンとかは使用される方が増えるんですけど、そんな繁忙期もしっかり加味する必要があります。
それぞれについて説明すると、僕が体験した事例でこんなことがあります。重回帰分析やろうとなったときに、MECEにちゃんと割り出した結果、10個ぐらい重要そうな変数が残りました。
先輩に「これどうですか?」と見せたら「これって本当に全部網羅した? ここなんで入ってないの?」と答えが返ってきました。結果は、納得感があまりない状態で差し戻しになりました。なので、最初にちゃんと抜け漏れなく作業しましょう。
2つ目の交互作用の話だと、例えばプッシュ通知の数と口コミの投稿数みたいなデータがあります。プッシュ通知を送れば送るほど、口コミ数がどんどん増えていく状態の際に、既存と新規で違うタイプのデータがあったとします。
このときにプッシュ通知と新規・既存の組み合わせで重回帰分析を行った結果、既存のイメージが強いときだと、「これ本当にこんなインパクト出るの?」みたいな疑問が生まれます。プッシュ通知をちゃんと打っている前提条件を揃えるとインパクトは一緒ですが、既存ユーザーのイメージが強い場合「本当にこんなインパクトになるのか?」となるので、順番通りで組み合わせてください。
重回帰分析の式だと、ちゃんと1個1個順番に、交互作用や施策の打ちやすさ、変数の組み合わせを考えていきましょう。
最後は、どうやって分析を評価するかという話です。予測誤差の精度は参考程度に、ここが意思決定分析の特徴だと思っています。
Kaggleなどデータサイエンスの分野だと予測精度のいいモデルを作ることが大事だと思いますが、そこだけにこだわりすぎると、かなり時間が必要になります。どうやってそこの評価をするかというと、p値などが偶然その結果になったのか、信頼区間がどれぐらいの影響の範囲なのかを見て評価することが大切です。
また、意外な説明変数があった場合に考察が必要です。本当にこの分析で意外な変数が見つかったらうれしいですが、自分でちゃんと説明ができないとせっかく見つけたのに使ってもらえない可能性もあります。ここの説明はちゃんと用意しておいてください。
ちゃんと予測精度のいい重回帰モデルを作成しようと思ったときに、時間がかかりすぎることもあるので、意思決定するのに、時間がかかりすぎることもあります。あとは、偶然効果のある変数を見つけるとここで、意思決定に使いづらかったりすると思います。
まとめると、意思決定者が何を知れるか把握しておこう。ちゃんと交互作用とかを考慮しましょう。最後に、ちゃんと信頼区間とかp値とかから「たまたまじゃないか?」とか「どのぐらいのばらつきでそこに投資をしていく意思決定ができるか?」というところを見つけてください。
最後に、Rettyで実際に経験した事例ですが、僕はプロダクト側の分析者で、営業側のチームと連携を強くするための意思決定を利用しました。
まず、82個変数があったので、ここをちゃんと意思決定者と一緒に洗い出して、最後にそこに考察を加えます。大きく意思決定しそうなところにフォーカスして、変数に施策を打っていきました。
変数に例えばABCみたいなランクをつけて、どれぐらいインパクトがあるか。どれぐらいの確度でそこに対して意思決定できそうか。そして最終的に意思決定できるようになりました。
以上になります。ありがとうございました。
(会場拍手)
関連タグ:
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.12
今までとこれからで、エンジニアに求められる「スキル」の違い AI時代のエンジニアの未来と生存戦略のカギとは
PR | 2024.11.26
なぜ電話営業はなくならない?その要因は「属人化」 通話内容をデータ化するZoomのクラウドサービス活用術
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05