読書・NBA・ポケモン

読書・ポケモン・NBA・統計学について書きます

チームのOffensive EfficiencyはBリーグの試合の勝敗を効果的に予測するか?

 バスケットボールの攻撃をスタッツから評価する方法としてFour Factorsというものがある(バスケットボールを数字で分解する。〜みんなに知ってほしいFour Factors〜|Sports Analytics Lab)。これは、バスケにおける攻撃の終わり方(シュートが決まったか、オフェンスリバウンドが取れて攻撃を再開できたかetc.)に注目した分析方法である。

 この記事では、このFour Factorsを一つにまとめたような指標である、Offensive Efficiency(以下、OE。Shea & Baker, 2013)を紹介する。

 Shea & Baker(2013)では、NBAのデータを用いて、チームのOEが勝率と正の相関を示すことを見出している。本記事では、これがBリーグにおいても当てはまるのかを検討する。

 さらに、OEが他の攻撃指標よりも効果的に勝利を予測するのかを調べた。

Offensive Efficiencyとは?

 OEはShea & Baker で提案されたスタッツで「その選手が終わらせたポゼッションの内、得点またはアシストがついたポゼッションの割合」を意味する。数式を確認すると、Four Factorsとよく似た視点の分析であることがよく分かる。

 OEでは得点・アシストが付いたポゼッションを分子が表しており、分母はある選手(またはチーム)が終わらせたポゼッションを近似している。また、オフェンシブリバウンドは攻撃機会を増やす、つまりターンオーバーとは逆の指標であると考えられるので、TOとは逆にマイナスの符号で分母に投入されている。

 OEは基本的には0〜1の値を取り*1、大きいほうが攻撃の効率が良い。これは終わらせたポゼションに占める、得点に結びついた割合が多いと解釈できるからである。

 Shea & Baker(2013)では、OEがチームにとって重要であることを示すために、NBAのデータを用いて、チームのOEを算出し、それがチームの勝率と正の相関を示すことを報告している。

 ただし、Shea & Baker(2013)の分析にも疑問が残る。たとえば、OEに使われた指標を全部盛り込んだ重回帰モデルのほうが、勝率を正確に予測するのではないか? とか、ペイント内得点のほうが正確に勝率を予測するのではないか? NBAではOEと勝率が正の相関を示したけれど、Bリーグではそれが当てはまるのか?といった疑問である。以降ではこれらの疑問に答えていく。

分析

分析の方針

 BリーグにおいてもOEが高いほどチームが勝つかを調べるために、本記事ではロジスティック回帰分析という方法を用いる。ロジスティック回帰分析とは、勝つか負けるかといった結果が2通りしかない現象を、OEやペイント内得点といったスタッツで予測・説明する統計学的方法だ。

 まず、NBAではOEと勝率が正の相関を示したけれど、Bリーグではそれが当てはまるのか? という疑問に答えるために、勝敗をOEでロジスティック回帰し、OEが高いほどチームが勝っているかを統計的に調べる。

 次に、OEに使われた指標を全部盛り込んだモデルのほうが、勝率を正確に予測するのではないか? といった、OEが他の指標よりも効果的なのか? という疑問に答えるために、赤池情報量基準(AIC*2を用いたモデル選択を行う。本記事では、OEのライバルとして、OEに使われた指標を全部使ったモデルと、ペイント内得点を使ったモデルを比較した。

データセット

bleaguebydata.hatenablog.jp

 こちらで紹介されているデータセット(b.games.summary)を分析に用いた。7900試合分(したがって、N=7900)のデータが読み込まれた。

 このデータには勝敗が含まれていなかったので、勝ちを1、負けを0として、データセットに組み込んだ。もちろんOEも含まれていなかったので、計算した上でデータセットに組み込んだ。

 なお、分析にはR3.6.2を用いた。

分析結果

BリーグにおいてもOEが高いほどチームは勝つか?

 勝敗で色分けしたOEのヒストグラムを図1*3に示す。この図から、OEが高いほど青色のバーの割合が大きくなっていることを読み取ることができる。つまり、OEが高いほどチームが勝っていることが多いことが分かる。

f:id:morry0371:20191231124056p:plain

図1:勝敗で色分けしたOEのヒストグラム

 勝敗を被説明変数、OEを説明変数としたロジスティック回帰分析の結果を表1に示す。分析の結果、OEの係数は正の値を示した。この結果は、OEが高いほどチームが勝利する確率が高いことを意味する。したがって、BリーグでもOEが高いチームほど試合に勝つ確率が高いことが分かった。

f:id:morry0371:20191229202240p:plain

OEが高いチームほど試合に勝つ確率が高い。
OEは勝敗を他の指標より効果的に予測できるか? 

 勝敗を被説明変数として、AICでモデルを比較した。比較したモデルは次の通り:OEを説明変数としたモデル(モデル1)、ペイント内得点を説明変数としたモデル(モデル2)、得点・オフェンスリバウンド・アシスト・ターンオーバーを説明変数としたモデル(モデル3)。各モデルのAICを表2に示す。

 AICによるモデル比較の結果、OEのみを説明変数としたモデルが、比較したモデル3つの中では、一番当てはまりが良いことが分かった。したがって、ペイント内得点(モデル2)や攻撃の指標をすべて投入した場合(モデル3)よりも、OEのほうが正確に勝敗を予測できることが分かった。

f:id:morry0371:20191229203110p:plain

OEのみを説明変数としたモデルのAICが一番小さい(一番予測が正確)

まとめ

 本記事の目的はOEが高いほどチームが勝っているかを調べることと、OEが他の攻撃指標よりも効果的に勝利を予測するのかを調べることであった。まず、ロジスティック回帰分析の結果、OEが高いチームほど試合に勝っていることが分かった。さらに、AICによるモデルの比較から、OEがたとえばペイント内得点よりも効果的に勝利を予測することが分かった。

*お声掛けいただければ、分析に使ったRのコードをお渡しします。統計学やバスケットボールの有識者からのご意見・アドバイスもお待ちしております。

 

引用文献

Shea, S. M. & Baker, C.E., 2013. Basketball Analysis Objective and Efficient Strategies for Understanding How Teams Win. 

南風原朝和, 2014. 続・心理統計学の基礎. 有斐閣

*1:オフェンスリバウンドを多く取る選手の場合は1を超える値が算出されることがある

*2:AICについてはたとえば南風原(2014)を参照

*3:この図はバスケのデータ分析さん(twitterID @b__s__k__t)からアドバイスを頂きました。ありがとうございます。