ありがちな落とし穴
ありがちな落とし穴をパーっと書きましたけど、まずツール先行主義ですね。今、ピープルアナリティクスとか、データドリブンな人事をサポートするようなツールがいっぱい出ていますね。高価なシステムを入れたけど、誰も使いこなせないと。

タレントマネジメントシステムとか、めちゃくちゃ便利な、やり方によってはものすごく効果が出るんですけど。単に高価な、データを入れておくだけの、箱になってしまっているとか。
あるいは相関と因果の混同。こういったものも、特にデータを使ってくると、なんとなく数字でパキッと出ると、もうなんか従ってしまうっていう人。特に数学とか統計とか苦手な方。失礼な言い方かもしれませんけど、人事の方で多いかもしれません。
そういった場合、盲目的に信じてしまうっていうのがあると思うんですが、相関関係と因果関係、よくありがちですけど、違いますよね。
例えばアイスクリームの売上高と高齢者の死亡率っていうのが相関するみたいな。相関するというデータがあっても、じゃあ因果関係があるかというと、違うわけですね。
単に夏にソフトクリームもアイスクリームも売れるし、夏の酷暑とか熱中症とか、高齢者の方がお亡くなりになることが多いっていう、別の共通の原因があるだけで因果関係はないわけです。ここらへんの相関と因果関係を混同したりとかですね。
こういう統計的な、基本的なロジックっていうのを間違うことによって変な判断を下してしまうことがあるかなと思います。例えばエンゲージメントの高い部署は業績が多い。だからアンケートだけやれば業績が上がるかというと、当然ながらそんなことはないわけですね。
倫理・信頼の問題
あと、倫理・信頼の問題っていうのは、人事担当者とか経営者からすると、このデータドリブンな人事は、かなり切れ味の鋭い道具、武器にできると思うんですね。
ところが、やられるほうとしてみたら怖いですよね? 人だったら、間違った判断を言っても「僕はこうじゃないと思っていて」って「じゃあやめとこうか」みたいなことってあるかもしれないなと思うんですけど。
AIとかデータの場合は、そもそもまずブラックボックスというか、なんでそう決まったのか。「いやAIが言ったから」とか、「統計的に言うとこうなっている」とか、なってきたりするので、怖いですよね。
その人の人生に影響を与える人事の判断について、AIとか統計学だけで判断していいのか。こういう落とし穴を、今から細かく1つずつ見ていければと思っています。
(スライドを示して)まず1つあるのは、データの不完全性というのが大きなテーマとしてあります。マーケティングだったりそういう事業系のデータ分析。AIを使ってですが、こっちはかなり進んでいると言いますか。しかもデータを集めるのも、そんなに機微情報じゃないことも多いと言いますか。

例えばマーケティングするのに、ある商品っていうのを売るのに、「こっちとAとBどっちがいいですか」みたいなことをいっぱい聞いて、世の中に聞くことはしやすいですけど。
採用情報とか人事の評価ってものすごいクローズドなところで、どっかで漏れたらえらいことだったりするんですね。データがどこにも存在しないというか、獲得するのにものすごく大変だっていうことがあります。
データの不完全性をどうするか
データを揃えるのに時間がかかるっていうのが、人事の特徴でもあって、例えば早期退職者のデータって集めようと思ったら、どうしたらいいですか? これは今ずっとSPIみたいな性格適性検査をずっと過去にやっていたとすれば、昔のデータの中で、早期に辞めちゃった人ってピックアップすればありますけど。
今まで適性検査とかやったことがなければ、今から例えば、じゃあやると。ほんで一般の社員の方々全員にやってもらって、でも早期退職者って何年ぐらいか経たないとデータ集まんないんですよね。
もう早期退職した人に電話をかけて、「ごめんなさい、早期退職者のデータを取りたいんでテスト受けてもらえませんか」なんてことをやるのはやはり現実的じゃないですよね。
あと、サンプルセレクション問題っていうのがあります。どういうものかっていうと、例えば採用時の評価と入社後のパフォーマンスというのが、相関があるのかどうかっていうのを考えたいという問題があったとします。
ところが、このサンプルがセレクション、つまり選抜されちゃっていると。実際に得られるデータっていうのは、選抜された後なんだという問題です。
例えばもしも採用時の評価とこの入社後のパフォーマンスっていうのが(スライドを示して)こういうふうに相関がすごいありますよね。
「入社後のパフォーマンス」の評価基準は?
ところが、採用時の評価が低い人って、不合格なわけです。だからこのデータはありません。採用時の評価が高い人、全員が辞退するわけじゃないと思うんですけど。採用時の評価がめちゃくちゃ高い人って競合も多いし、良いところに受かっちゃうんで、辞退されることが多いんですね。
そうすると会社の中に残っているデータって、この真ん中の、入社って書いてあるところの部分ですね。これがセレクトされたサンプルってことなんですけど。

これでもしも相関を測ったら、「いや、なんにも相関ないね」って出る可能性、なんなら「反対の負の相関がありますね」となる可能性だってあるわけですね。これをサンプルセレクション問題と思います。これが人事の難しいところですよね。
あと、何を是とするのかっていうのは、例えばこの入社後のパフォーマンスって、何をもってパフォーマンスと言いますか。それは人事評価なのか、それともコンピテンシーのチェックなのか。あるいはエンゲージメントサーベイの結果なのか。360度評価の結果なのか。どれにしたらいいかわかんないですよね。
例えば人事制度って「人事評価はラッキー・アンラッキーもあるわけですよね」みたいなことだったり。なんなら1年目・2年目・3年目だったりすると、ほとんどみんな普通と、Aだということだってあるんです。
その是の数字が向上したとしても、生産性が実際に上がったのか、評価のバイアスかもわからないわけですね。先ほど言ったように、そもそもの人事評価自体に対してバイアスがすでにかかっています。Aタイプの人はAタイプの人を評価しやすい。Bタイプの人はBタイプの人を評価しやすいみたいなことになっているんですね。
自社データだけでは不十分
……となってくると、なかなかデータが不完全ということになります。あと「自社データだけではなく他社データとの比較が重要に」って書いてあるんですけど。
だから本当はプラットフォーマーというか、マイナビさんとかリクナビさんとか、ビズリーチさんとかOfferBoxとかいろいろありますよね。ああいったところの全部のデータを持っているような会社がもしあったとすれば、いろんなところ、業界とかも比較しながら、そのデータの完全性がある程度担保できるんですけど。
自社のデータだけって、結局これって自分が集められている人たち、まずは採用をイメージすると、ベストかどうかなんてわからないですよね。自分たちがアプローチできていない人たちの中に「もっと自社に適した人がいるかもしれない」みたいなことも考えないといけない。だから他社のデータとの比較が重要になってくるわけです。
こういうのを、特に外資系の人事コンサルティング会社とかっていろんな会社からデータを集めて、協同組合みたいな感じで、自分のところのデータを提供すれば他の人のデータも使えるみたいなのをやっていますけど。まさにそういう目的でやっているんじゃないかなと思います。
他社データとの比較をいかにしてやるのかって、難しいところですね。データの不完全性、ピープルアナリティクス、データドリブンな人事判断っていうのはものすごくいいんだけど、そもそもデータ、ちゃんと集まるんですか? っていうところ、これを乗り越えなきゃいけないんですね。
だから悪いことは言わないのでって言ったら変ですけど、タレントマネジメントシステムとか採用の適性検査のデータとか。できるだけ早く、将来的にピープルアナリティクスで人事を高度化していく方向性があるのであれば、データは先んじて、ありとあらゆるものを取っておくようにしないといけないことになります。