2019年4月9日火曜日

第236夜 データの取り扱い講義――騎手を要素に分解する(4)




▼残りの表
放っておくとまだまだ続くので今回で最後にする。
やはり長くなりすぎた。
1項目でもこれくらいいろいろ考えて算出している、と言いたかっただけなので、満足した。


お読みいただいている皆さんには、残り項目はいずれブログ記事にした際にでもご覧いただきたいと思う。



とりあえず、以下に表だけ載せておく。
少し乱暴な注釈で申し訳ないが、修正賞金平均とは騎手が獲得した賞金金額のことで、優勝賞金平均とは出走したレースの優勝賞金額のことである。
騎乗経験数とは、騎乗馬とのコンビを組んだ回数を表わす。
ちなみに、LOGは数字をLOG対数に置き換えたもので、対数が
数字になるので10倍にしている。

直近1年間勝利回数(LOG) 出走回数 勝利数 勝率
6未満 32768 879 2.7
6 11581 401 3.5
7 6122 225 3.7
8 5692 203 3.6
9 11220 440 3.9
10 16510 693 4.2
11 16276 688 4.2
12 19215 946 4.9
13 30975 1529 4.9
14 25210 1403 5.6
15 32175 1938 6.0
16 38622 2841 7.4
17 42514 3355 7.9
18 32384 2889 8.9
19 24180 2741 11.3
20 28498 3949 13.9
21 8568 1339 15.6
22 719 151 21.0

直近1年間修正賞金平均(LOG) 出走回数 勝利数 勝率
54 7,168 147 2.1
55 10,673 281 2.6
56 18,564 567 3.1
57 28,041 935 3.3
58 42,509 1,786 4.2
59 42,166 2,072 4.9
60 58,653 3,603 6.1
61 52,646 3,974 7.5
62 35,738 3,084 8.6
63 32,027 3,617 11.3
64 25,765 3,470 13.5
65 12,678 1,803 14.2
65超 5,751 1,065 18.5

直近1年間優勝賞金平均(LOG) 出走回数 勝利数 勝率
67未満 1,037 31 3.0
67 10,183 290 2.8
68 55,196 2,176 3.9
69 122,651 6,127 5.0
70 122,682 9,000 7.3
71 63,758 7,893 12.4
72 6,788 960 14.1
72超 934 133 14.2

乗り替わり 出走回数 勝利数 勝率
初騎乗 198,684 11,531 5.8
連続騎乗 123,858 10,900 8.8
乗り替わり 60,687 4,179 6.9

騎乗経験数 出走回数 勝利数 勝率
0 198,684 11,531 5.8
1 73,165 5,717 7.8
2 38,067 3,295 8.7
3 22,407 1,909 8.5
4 14,234 1,268 8.9
5 9,681 772 8.0
6 6,761 595 8.8
7 4,872 434 8.9
8 3,579 289 8.1
9 2,667 210 7.9
10 2,015 144 7.1
11 1,567 114 7.3
12 1,170 81 6.9
13 909 58 6.4
14 725 44 6.1
15以上 2,726 149 5.5

騎手所属 出走回数 勝利数 勝率
美浦 182,743 11,719 6.4
栗東 180,883 13,312 7.4
海外 10,938 600 5.5
地方 8,665 979 11.3

▼合成
では、騎手の能力を分解してきたが、以上8項目を組み合わせ、騎手の能力を再度合成してみる。
例として、武豊騎手、45(現実には50歳になられた)が、この集計期間最後に出走したときのデータを示そう。
他の騎手も同じように計算して、予想に用いる。


2014/12/28 中山第10競走の武豊騎手 勝率
直近1年間出走回数 7.3
直近1年間勝利回数LOG 11.3
騎手所属 7.4
直近1年間修正賞金平均LOG 13.5
直近1年間優勝賞金平均LOG 12.4
五輪年齢 9.4
乗り替わり 8.8
騎乗経験数 7.3
単純合計 77.4

このやり方だと武豊騎手という固定値ではないので、加齢にも対応できる。
もはや「武豊騎手」ではないが、「武豊騎手に似たデータ」になる。
さらに言えば、中央競馬で初めて騎乗する人すら(平均的な仮定にせよ)、数値を出すことができるのだ。

これで、騎手だけを用いて予想をした場合(数学的には正しくないが、8要素の勝率を合計した数値)17%弱の単勝的中率を得られるのである。
いつもの申し上げているように20%くらいの単勝的中率を弾き出す予想などいくらでもできる。
とはいえ、レース結果の主たる決定要因ではない騎手だけでそこまでの予想はできないが、17%弱なら上出来だと思う。

▼個別加算
最後に、騎手個別加算について触れておきたい。
前項までの解説で申し上げてきたことは、要するに、さまざまな切り口で平均的な勝率を求めたに過ぎない。
当然、突出した実力者の能力値は低く出てしまうのではないかと疑問に思う人がいるだろう。
わたしも確かにそう思うこともあり、データの豊富な騎手のついては8項目の合計と実際の勝率の差を調べ、その差を加算(その分、騎手によっては減算。全体でプラスマイナスゼロ)する「個別加算」を試みた。
わたしは数量化1類を用いるがこれでいう残差に近いものかと思う。
結果は良好で、1ポイントも改善しないが単勝的中率、連対・複勝的中率は上昇した。
ただ、劇的に変化するものでもなく、敢えて個別加算を設けるまでは要らないかなとは思う。
むしろ、もっと騎手の能力評価を向上させて残差が小さくなるようにしたいと思っている。
残差には、わたしたちに未知の知見が含まれている可能性がある。
或いは、複雑系の深淵かもしれない。
(SiriusA+B)

ブログ アーカイブ