シャープレー値による貢献度解析

World Baseball Classic で日本が優勝してよかったですね。野球のようなチームで行うゲームで、各選手がどのくらい勝利に貢献したかを定量化できれば、たとえば年俸を決めたり、他チームに移籍したりするときに有用なデータになると考えられます。こういう分析も機械学習の守備範囲に入ります。会社の人事課などでも使えるのではないでしょうか。
ちょっと検索したら下記が見つかりました。
https://www.nutanix.com/theforecastbynutanix/industry/how-machine-learning-and-ai-can-predict-player-outcomes
1980年代から野球についてこのような試みは行われていたようで、Sabermetricsという言葉ができています。

A Guide to Sabermetric Research


上記で紹介されている論文は、これを64の特性ベクトルを作って分析した、というもののようです。確かに、野球の分析はデータサイエンスの例題としては面白いですね。守備ポジションと打順が決まっているので、サッカーよりも数値化しやすそうです。
全体の勝敗や点数に対する個人の貢献度を求めるときによく使われるのは2012年にノーベル経済学賞になったShapley値(その61年前の1951年に提案!)を使うSHAP (SHapley Additive exPlanations) というライブラリですが、これも考慮する変数が多くなると計算時間が大変になります。どう整理して計算機に食べさせるかが腕の見せ所になると思います(私は概念を教えてはいますが、自分では試す時間があまりとれません。「エア〇〇」と言われないように、なんとか時間を作りたいです…)
https://www.datarobot.com/jp/blog/explain-machine-learning-models-using-shap/

英語は https://en.wikipedia.org/wiki/Shapley_value から
cooperative game theory 協力ゲームの理論
“a coalition of players cooperates, and obtains a certain oveall gain from that cooperation.”
coalition コアりション 同盟、連合
“For cost-sharing games with concave cost functions, the optimal cost-sharing rule that optimizes the price of anarchy, followed by the price of stability, is precisely the Shapley value cost-sharing rule.”
cost-sharing games コストシェアリング コスト分担型のゲーム
concave コン「ケイ」ヴ  凹型
convex コン「ヴェッ」クス 凸型
optimal 「オ」プティマる 最適の
anarchy 「ア」ナーキー 無政府状態、無秩序
anonymity 無名性
守備 defense
打順 batting order
貢献度 contribution
WBCのclassic は「決定戦」の意味だそうです。

WBCのクラシックの意味とは?なぜクラシック?【ワールドベースボールクラシック】

Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA