spoana 登壇は3回目

廣澤聖士氏(以下、廣澤):「回転不足判定選手権を開催してみた!」というところで発表いたします。よろしくお願いいたします。

自己紹介ですが、Twitterは@hironowa_ruでやっています。ずっとスポーツ畑で、現在は国立スポーツ科学センターで日本代表選手の映像分析サポートを行っています。spoanaは第1回ではLT、第6回ではロングトークで発表して、今回が3回目になります。

ジャンプの基礎点と出来栄え点

第1回のLTでジャンプの点数の付け方、とくに回転不足判定難しすぎる問題というのを取り上げたのですが、今回もこの回転不足判定を取り扱います。

ここでさっくりと復習をしておきます。前置きが長くなってしまいますが、理解してほしいのでお付き合いください。フィギュアスケートのジャンプの点の付け方は、予め技ごとに定められている基礎点と、その質で加減される出来栄え点の合計で点数が決まります。例えば、基礎点の場合は僕が跳ぶ1回転のジャンプであってもオリンピック王者が跳ぶ1回転ジャンプであっても同じ点数になります。

しかし出来栄え点のほうでは同じにはなりません。ここが大きな違いになります。もし回転不足と認定されてしまえば基礎点と出来栄え点の両方で点数が引かれてしまいます。

回転不足の判定は2段階で定義されています。現行ルールでは、軽度回転不足は「4分の1回転以上、2分の1回転未満不足」の場合と定義されています。

ちなみに17年、18年シーズンまでは「4分の1回転より大きく、2分の1回転未満不足」という定義でした。軽度回転不足となると、基礎点が定められたパーセンテージに下がってしまい、出来栄え点でもマイナス評価になってしまいます。

もう1つが重度回転不足です。これは「2分の1回転以上不足」の場合と定義されています。この場合ですと1回転少ないジャンプの基礎点にまで下げられてしまいます。例えば3回転のアクセルジャンプが重度回転不足と認識されてしまうと2回転のアクセルジャンプの基礎点まで下がり、出来栄え点でも大きくマイナス評価を受けます。

回転不足は、選手の感覚と実際の判定にギャップがある

これは第1回でもやりましたが、次の3つのジャンプの回転不足の判定というのを実際にしてみてください。いずれも同じ選手の18-19シーズンのトリプルルッツジャンプで、そのときの基礎点は5.9点です。ここから増減がどの程度行われるのかというのをみなさんで判別してみてください。

本当は会場のみなさんの雰囲気も聞きたいんですが、ちょっと先に行きます。みなさんわかりましたでしょうかね? 答え合わせですが、1本目のジャンプは軽度回転不足と認識されました。トリプルルッツに赤い"く"の字が付きます。2本目のジャンプは回転不足なし、3本目のジャンプが重度回転不足と認識されてしまったものです。

では点数がどう変わってくるかというと、1本目のジャンプはこのシーズンにおいては基礎点の5.90点を基準に75パーセントに下がってしまいます。そのあと出来栄え点でマイナス評価をもらってしまうので、最終的には3.54点になります。2本目のジャンプはしっかりと回転が回っているという評価だったので基礎点はそのまま5.9点、出来栄え点がプラスの評価で0.93点、最終的には6.83点もらえます。

一番かわいそうなのが重度回転不足で、トリプルルッツの3回転というかなり難しいジャンプに挑んでいますが、重度回転不足と認定されてしまうと2回転のルッツジャンプという評価になり基礎点が2.10点まで下がってしまいます。同じように出来栄え点でもマイナスをもらってしまうので、最終得点は1.53点になります。

重度回転不足になってしまいますと、綺麗に2回転ジャンプを跳んだほうが、点数が高くなるというような仕組みになっています。このように一見同じような出来に見えても点数に差がでてしまうというからくりの1つが回転不足の判定になります。

例えば前シーズンの世界選手権女子ではわずか2点の間に2位から5位の選手が集まりました。見た目的にノーミスではなくジャンプの回転不足を含めて技術の細かい違いというのが順位に大きく影響を与えるのが現在のフィギュアスケートです。

試合後のインタビュー記事だと、「刺さっている」という表現がよく出るんですけど、「そんなに刺さっていますか?」「あれで刺さるの?」「普通に降りたなと思ったんですけど」と、やっぱり選手としても感覚と違うなというところをもっている。また、解説者であっても「確実に回っているように見えた。厳しいジャッジですね」というところで、実際の判定とのギャップがある様子がうかがえました。

選手はどれだけ見分けられるものなのか

選手はどれだけ見分けられるものなのかなと疑問に思ったので、今回は大学の部活で「回転不足判定選手権」というのを開催してみました。

競技規則は、全員が同じ100個の動画をスクリーンで見て、「回転不足なし」「軽度回転不足」「重度回転不足」のいずれに当てはまるかというのを解答してもらいます。50問終了時に15分間の休憩を入れて残りの50問を解答してもらうというやり方にしました。

解答の流れですが、通常の速度で動画を1度見てもらって解答をしてもらいます。これを解答1としました。その後動画を2回見てもらって再度解答してもらいます。これを解答2としました。実際の競技では通常速度で判断が難しい場合に限ってスロー再生を用いることがあるとなっていますが、ジャンプの一連の流れの中でも技術役員が必要だと判断した部分のみをスロー再生をするという、ちょっと特殊な操作になるとのことだったので今回は通常速度のみを対象にすることにしました。

(動画を見ながら)実際にどんな感じでやったのかというところで、こんな感じでやりましたよというところです。さっきみたいな動画ですね。これを見てもらって一時停止とかはもちろん、みなさんの解答の状況を見ながらこちらで判断したんですけど、こういう動画を使って判別をしてもらうということをやりました。

問題の候補となるデータセットの作り方は、まず国際大会の放映映像から単独ジャンプの部分を切り出して累計762個のデータセットを作成しました。ラベルの内訳というのはこちらの通りです。

このデータセットから今回用いる問題となる100個を抽出することにしました。それぞれのラベルから17個ずつは自分の競技経験者の立場で判別がかなり簡単とはいえない、容易ではなさそうなものを抽出しました。残りはラベルが均等になるように無作為で抽出しました。

今回の出場者は14名の方にエントリーをいただきました。(スライドを見ながら)一覧表に所持級と書いてあるんですけど、フィギュアスケートには連盟が主催する検定級というのがありまして、初級、1級、2級と上がっていって8級まで存在します。テレビで見る選手のほとんどは7級で、8級まで取得する人はほとんどいないです。表は級順にソートしています。

競技歴と技術指導状況というのはどのような人から氷上での技術指導を受けているのかというのを数字から選んでいただいたもので、プロのクラブインストラクターに習った人が多かったです。あとは技術指導をどれぐらい受けているかというところでデータを取りました。

競技者でも判定を正確に行うのは容易ではない

というところで、この結果を分析してみました。ちなみに優勝者には某電子マネーという商品を用意したので、大学生はけっこう本気で取り組んでいるというような状況です。

結果は、平均正解率は60.71ですね。解答2の最終的な平均正解率は60.71パーセント、最大値は71で、この2人ですね。最小値は49パーセントでした。ちなみに第1回のspoanaで発表したC3D+SVMというモデルで今回のデータセットで推測すると60.8パーセントだったんですけど、テストデータがまったく同じというわけではないので、あくまでも参考記録です。

視聴回数の違いというところですと、この解答1と解答2のところですね。こちら関しては大きな差はありませんでした。ですが個人での視聴回数の違いでは正解率での増減が少し見られるというところがあります。終わったあとに「どうだった?」というアンケートを取ったんですが、過半数の8名が「難しい」を選び、残りの6名が「やや難しい」という選択を行いました。

結論としては競技者でも判定を正確に行うのは容易ではないということがわかりました。全員の判定の最頻値を取ったときの正解率というのは73パーセントで、個人の最大値を上回りました。軽度回転不足を回転不足なし、重度回転不足を軽度回転不足と誤判定するケースが多く見受けられたので、選手の判定は実際の判定より甘めかなということが言えます。

問題別の正解率を見ると、いわゆるチンパンジーに負けてしまう、正解率が3分の1以下の問題というのが計20問ありました。とくにここの1問に関しては全員が回転不足なしと判定したんですけど、実際は軽度の回転不足だったという問題も1問ありました。やっぱり認識のズレはあるんじゃないかなということが個人的に考えられるところです。ラベルごとの正解率としては軽度回転不足の正解率の平均がすごく低いというところでした。

経験年数と指導状況で統計的有意差が見られる

もう1つ、競技歴と所持級、指導状況のそれぞれの中央値で上位群と下位群に分けて平均値の差の検定をやってみました。結果は、所持級上位と下位の間では、5パーセント水準での優位差は見られませんでした。一方で経験年数上位群と下位群では5パーセント水準で統計的有意差が見られました。指導状況では1パーセント水準で有意差が見られました。

ここで1つ疑問が生じるんですけど、3回検定をやってαエラーが一度も起こらない確率はどれくらいなんだろうと計算してみると、約14パーセントあります。こちらに対する処理というのはやっぱりやったほうがいいんじゃないかというところで、多重比較法というのを使ってやってみました。

Bonferroni法という比較的厳しめなものを使いました。すごく単純で有意水準はαパーセントでN回検定するんだったら各水準をN分のαにするというところ。今回は3回だったので3分の5パーセントにしよう。p値を3倍するのと同じだと思うんですが、これで検定を行うとしました。

そうすると、こちらの統計の有意差が残念ながらαエラーっぽいなというところで、1パーセント水準で統計的有意差が得られたのは指導状況のみだということろで、これの理由としては公式資料が限定的で自分で学習するのがすごく難しいので、インストラクターの指導を頻度高く受けていることというのが、正解率に影響を与えたのではないかなと考えています。

指導状況の違いによったときに、その上位群と下位群で最頻値を取ったときに正解とどう違うかを見たときに、やはり差が出るところは軽度回転不足をしっかり見極められているか。(スライドを示し)こちらが上位群でこちらが下位群なんですけど、やはり軽度回転不足が正解なものを不足なしと捉えてしまったりとか、本来は軽度回転不足じゃないものを軽度回転不足と認識してしまっている。

ここで差が出てしまっているなというところで、やはりインストラクターの指導が少ないことで基準の変更のキャッチアップがさらに難しくなっている可能性があるのではないかなと考えました。

みなさんが難しいと思っていただいたのはその通り

ちょっと長くなってしまいましたが、まとめです。やっぱり見た目ノーミスというところと実際の得点が違う場合があるのがフィギュアスケートですね。その中で大きなからくりの1つが回転不足になります。競技者であっても、テレビで見るような映像で回転不足かどうかというのを正確に見極めるのはやっぱり容易ではありません。ですから、みなさんが難しいと思っていただいたのはその通りだと思います。

公式のインプットが文章のみに限られているので、インストラクター頼みになっているところは否めないのかなと思います。「インストラクターについてない選手はどうなるんだろう?」と言われると、けっこう不公平性がありそうだなと思っているので、認識のすり合わせの機会があってもよいのかな? と思っています。

最後、基礎的な部分かもしれないんですが、検定の繰り返しで有意差が出たというところにはもしかしたらαエラーかもしれないというところを疑って使っていただけるといいのかなというところで、終わりにいたします。すみません、伸びてしまいましたがご清聴ありがとうございました。

コンセンサスがあるのかないのか

司会者:ありがとうございます。統計的に大事なところにも言及いただいて、とてもおもしろかったです。フィギュアスケートに関するコメントがけっこう来ていて、質問としては「正解はどう取ったのか?」というところの質問が来ているんですけど、こちらフィギュアスケートは回転ごとにこういう採点がされてこういう点数が付きましたと公表されるという理解でいいんでしょうか?

廣澤:そうですね。その通りです。正解は公式の競技結果から持ってきています。

司会者:なるほど。あとはその回転というところは「実際審判員はどこを見ているのか?」というところで、ご回答をいただいている方もいるんですけど、氷から離れたタイミングから着くまでを見ているという感じなんでしょうか?

廣澤:そちらに関してはルールブックに明確な記載がないので、正直回答が難しいところではあります。一部審判員の方がインタビューで、ここを見ているみたいな話をしているのもありますが、審判間で統一のものであるのか、あくまでも一個人の意見なのかはわからないというところです。

フィギュアスケートのジャンプは氷上を滑り、回りながら離氷する・着氷するという競技特性を持っているので、どこが回転の始まりであるのかを厳密に定義するのが難しい印象をもっています。そこの明確な定義を今後していくのか、していかないのかというのは議論が分かれているのかなと思っていて、現在のところ公式のルールブックではそこは明文化されていないという認識です。

司会者:なるほど。おもしろいですね。サッカーでいうと去年少しルールが改訂になったときに、日本サッカー協会が選手に「こうやっていきます!」みたいな共有の説明をする場があったという話があったんですが、そういうところがあってもおもしろいのかなとは話を聞いていて思いましたね。

廣澤:今PDFは見れていますか? ルールブック上はこの表記がすべてなんですよね。「ジャンプが回転不足判定になるのは、不足している回転が“1/4回転以上、1/2回転未満”の場合である」。ルール変更も「1/4回転より大きく」が「1/4回転以上」のように変わったと知らされるのみです。なので回転の始まりはどこからで終わりはどこまでなのかとか、身体のどこの部位で回転を測るのかというところはすべての人が見れる公的な文書内では明らかにされていません。競技経験があれば暗黙的にはこうかなというものがあるように思いますが、全体としてコンセンサスがあるのかないのかは競技を行っていた身でもちょっとわからないというところが個人的な見解です。

司会者:なるほど。ありがとうございます。ちょっとこちらでいったん締めようと思います。おもしろい発表をありがとうございました。

廣澤:ありがとうございました。