スポーツ統計とシステム制御の研究者

小中英嗣氏(以下、小中):「無観客試合におけるホームアドバンテージ」といったタイトルでお話をします。まずは自己紹介から。名古屋の名城大学で理工学部の教員をしている小中です。システム制御や最適化、機械学習とかの研究をしています。最近は趣味と実益を兼ねて、スポーツ統計を一生懸命やっている最中です。

本イベントには2回目と4回目でもお話をしていて、資料(https://spoana.connpass.com/)も残っていると思います。またTwitterは@konakalabという名前でやっています。

研究内容なんですが、「スポーツの研究をしているよ」と言うと「競技は何ですか?」と聞かれますが、僕は「全部です」と答えていて。競技を問わない、統一的な予測モデルやランキングシステムに関心があり、そこに強みが出せるかなと思って活動しています。

無観客試合のホームアドバンテージ

今回の内容は不幸なかたちで注目されてしまうことになった「ホームアドバンテージと無観客」についてです。

ホームアドバンテージは、けっこう古くから研究されています。古い論文がたくさんあるんですが、「スポーツにおいて、ホームチームが50パーセント以上の勝率を一貫して挙げること」と定義できます。いくつか要因があっての話なんですけど、これはちょっとあとで話します。

とりあえず、サッカーに関心をもったので、一通り調べてみました。世界中のサッカーリーグの試合結果を集計しているWebサイトを見つけて、ここから世界の120個のリーグのだいたい10年間分のホーム・アウェイチームの得失点を集めました。終了済みのシーズンについて、基礎統計を見てみたところ、試合数が17万試合ぐらいで、ホームで勝ったものが8万試合。これはかなり明確なホームアドバンテージです。

得失点も26万対20万ぐらいで、これもホームチームが圧倒的。これはいろんな国のリーグが混じっていて、小さな国も全部混じっています。「やっぱりメジャーなところに絞って調べよう」と欧州5大リーグに着目したら、試合数が10分の1ぐらいになりましたが、ビックリしたことに、比率がほとんど変わらない結果でした。

「けっこうホームアドバンテージってあるんだね」ということが、ひとまず確認できました。

図なんですが、ホームアドバンテージはある。横軸をリーグの試合数、縦軸を勝率としたデータの例です。0よりホームチームの勝ちの割合が大きい。色は大陸ごとの色です。アフリカはけっこう強烈にホームの勝率が高いところがあります。

Jリーグを見ると、けっこうマイルドなんですね。日本のいろいろなスポーツをいくつか調べると、ホームアドバンテージは若干マイルドな傾向があります。バスケも調べたらマイルドでしたね。

Pollardさんという熱心に研究されている方がいらっしゃって、その人がいくつかの要因を想定しています。移動、環境の慣れとか、審判の判定が偏ってしまう、などです。その内でCrowd effects…...Crowdは観客のことなんですけど、観客の影響があると。

「これはもっとも明確にありそうだし、ファンはこれが支配的だと信じてるよね」というコメントを残しています。こういう影響は、ふだんは分離が難しいです。しかし、無観客の試合が行われるようになってしまったので、この結果が、実はホームアドバンテージの分析に役に立つんじゃないかの観点で少しやってみました。

ヨーロッパの5大リーグでの検証結果

状況を整理すると、今は無観客で行われる試合数がとても多い状態です。例えば、何か懲罰的な理由で行われる無観客試合は例外的でとても少ないです。ほとんどありません。ただし、COVID-19が原因の無観客試合は、5節、10節分ぐらいあります。

しかし、ホームとアウェイの対戦のバランスが均一ではありません。シーズン途中で中断後無観客試合に突入してしまったので、たまたま強いチームがホームに固まっている(またはその逆の)可能性が、今は排除できません。勝敗と得失点のシンプルな統計では不十分じゃないかなと思っています。思ってはいますが、これはまだやっていないです。すみません。先にやるべきだったんですけどやっていません。

今回は対比較法ということで、試合の得失点から調整した割合を出します。その割合がホームチームとアウェイチームの実力値のレーティングの差と、全ホームチームがもっている共通のアドバンテージの和を変数として、ロジスティック回帰で説明できるようにする。これらのパラメータを調節してホームアドバンテージを抽出するというアイディアです。

イングランドのプレミアムリーグで、5節分、約1ヶ月間の試合に対してやってみました。1ヶ月分ぐらいの試合結果から、レーティングとホームアドバンテージを調べて、この〇が1試合の結果です。この〇が各チームのレーティングとホームアドバンテージを調整して一番青線に近づいた結果は、この程度でした。

赤い線がホームアドバンテージとして抽出された量です。0より右なので、ホームにアドバンテージがあると抽出できました。ホームは全チームがこれだけ強いとすると、フィッティングが一番うまくいくという意味です。この処理を毎節実行します。

対象をデータが取れた120のリーグ全部にすると死にそうだったので(笑)、ヨーロッパの5大リーグを対象にして、「過去のシーズンの結果」「中断前の有観客だけ結果」「無観客の試合だけの結果」「有観客と無観客が混ざっている結果」の4つにラベルを付けました。そこから中央値の差を検定しています。

これが主結果です。左から順に、過去のデータ、今年の普通のとき、混ざっているとき、無観客試合。赤線が中央値です。過去と今シーズンの有観客では差が無いように見えますが、無観客期間ではホームアドバンテージが0に近づいています。

中央値の差を順位和検定で検定してみました。過去と今シーズンの有観客、これら2つからは有意差が検出できませんでした。ですが、今年の有観客と今年の無観客の試合で比較したところ、非常に小さいp値で有意差があると検出できました。要はこの2つの中央値に差があるということです。ホームアドバンテージの中央値に差があると出ました。

説明が前後しますが、フランスは中断してしまったので無観客試合のデータがありません。それを踏まえた結果と考察ですが、まとめると、無観客となった後でのホームアドバンテージには変化があって、これは小さくなる方向、0に近づくほうへの変化です。ただ、リーグごとに見たら影響が違っていて、その中で、影響がとても大きかったのが、なぜかスペインとドイツでした。

イングランドとイタリアはほぼ変わりません。イングランドはまだ試合数が少ないのでわからないんですが、なぜか国ごとに差がありました。この原因はよくわかりませんが、ホームアドバンテージが消失してしまった国があったことは事実です。

他の影響も考えられて、具体的には無観客試合が数ヶ月間の中断とセットになっています。中断の影響がもしあったとしたら、分離ができていないので、ホームアドバンテージ変化が本当にCrowd effectsのみに起因するのかと言われると、正直なところよくわかりません。

無観客試合だとホームアドバンテージは縮小する

まとめですが、サッカーにおけるホームアドバンテージはかなり明確な現象であることは様々な研究・統計から明確です。その原因とされる要因のうち、Crowd effectsに着目しました。今は無観客で試合が行われている状態で、一部のリーグではかなり明確に無観客期にホームアドバンテージが縮小する、有意差があるといったような結果が出ました。

ですが、これもたまたまかもしれません。5大(実際は4つの)リーグに対してのみ分析を行いましたが、今後がんばって調査対象を広げられれば、ヨーロッパ全体ぐらいはできるかなと考えてます。以上がまとめです。

スライドはSpeaker Deckにまとめてあって、細かいデータもお見せできます。例えば、ドイツは本当にホームアドバンテージがなくなっているよとか。細かいデータはPDFを上げていますので、そちらをご確認いただければと思います。ありがとうございました。

質疑応答

司会者:はい、ありがとうございます。けっこうコメントが来ていまして、質問の中で、こちらは考察、定性的なところでわかれば、という話だと思うんですが。「Crowd effectsとして具体的に何がこのポジティブな影響を与えていると思いますか?」という内容です。

プロ野球とかだと、無観客試合のときに、オンライン観戦しているファンの映像や音声だけを流すことがあると思います。少しでも無観客になってしまった悪影響を潰すような効果があるのかどうか、どうお考えですか?

小中:ちょっと明確なことは言えませんね。過去の論文をサーベイしたところだと、「観客の歓声が審判に影響を与えそうだ」という仮説をがんばって検証している人がいます。要は、観客が騒ぐので審判が冷静な判断ができない、認知科学的にどうやってもバイアスを取り除けないんじゃないか、みたいな。歓声がすごく大きい状態で、審判が見間違えてしまうようなことがやっぱり起こり得るのではないかという研究です。

もう1つおもしろいのが、「ホームアドバンテージがあると信じているチームがそれを前提に戦略を立てると、本当にホームアドバンテージが出る」というもの。要はアウェイだから勝ち点1でいいじゃんと思い込んで試合をすると、本当に勝ち点1をもって帰る。結局、ホームアドバンテージになってしまう。これらの要素の分離は簡単ではないですね。

あとは移動で食事がまずいとか口に合わない、長距離移動は疲れるとか、ホテルが嫌だとか、いろいろ言っている人はいますが、どれも決定的な感じはしません。素人が思いつくような要素について、一生懸命いろんな人が統計的に研究していますが、なかなか決定打はなさそうな感じです。

司会者:なるほど。関連したところで「移動距離による勝率への影響で無観客になったこともあって、例えばJリーグだと東と西でチームを分けてやっているので、移動距離が少し減っているみたいなところはあると思います。そういうところの影響はあり得るのでしょうか?」といった質問が来ています。

小中:ありえそうな気もするし、それを調査している論文は見つけました。移動のしんどさとかは影響なくはないかなとは思いますが、それはちょっと明確にできてないです。

司会者:なるほど。ありがとうございます。最後の質問として、「ホームアドバンテージがなくなったということは、今まで以上に、ジャイアントキリング(番狂わせ)みたいなところが起こりづらくなっているという理解になるんでしょうか?」。

小中:どうなんですかね。それはちょっと考えてなかったですね(笑)。確かにホームでがんばった故のジャイアントキリングは、ひょっとしたら少なくなるのかもしれません。「その仮説が正しいのであれば」という感じで、すみません。

司会者:確かにこれは、私もパッとYesかNoかが難しいですね。いろいろと他にも来ているのですが、時間の関係で終了させていただきたいと思います。小中先生ありがとうございました。