2017年2月23日木曜日

第154夜 コンディションを計測できないものか、わたしの集計の考え方も紹介しつつ考える


▼調子の良し悪しか成長か
競走馬も生き物だから、コンディションによって走らないときもある。
基礎的な能力だけで結果を予測できないからこそ競馬が成り立つのだが、好調・不調を計測することは難しい。
経験を積んでレースを覚えることも、特に若馬では成長もある。
ベースとなるレースさえ、馬場状態やコース形状も一定しないので、走破タイムなどから推定することを難しくしている。
ということで、この際、調子の良し悪しか成長かを考えるのはやめて、「次走で走りそうかどうか」を直接的にアプローチしてみたい。

▼人気と着順
今回は、前走のデータだけを使って考えることにした。
他にも良いデータはあると思うけれど、その捜索作業はいずれの機会に譲り、ここでは前走人気と着順を組み合わせる。
前走で調子の良かった馬は、極短期的には次走も好調を維持するという単純な発想である。
前走の着順はそのままでも優れた指数として利用もできるし、前走の人気も同様だ。
調子のバロメータとも捉えることとする。

問題は組み合わせ方だ。
単純な方法なら、前走人気数18×前走着順数18324通りだ。
わたしはよく、9着以下あるいは9番人気以下をひとまとめにする。
今回もそうしようと思ったのだが、それでも81種類である。
このブログでは2006-2014年の9年分のデータベースを使っているが、「完走馬」は延べ430,278頭である。
324
通りに分けると1種類あたり平均1,300余頭にしかならず、勝利頭数はさらに100頭を切ってしまい、データの信頼性が下がるのだ。
あるいは1種類あたり0.3%と言い換えれば納得いただけるかもしれない。
81
種類でさえ、1%余りである。
これでは「誤差」と大差ないのだ。
81種類かぁ、チョット多いな」
と考えて、「調子の良し悪しの計測であること」を念頭に工夫することにした。
まず、精度の高い前走着順をベースにすることにした。
9
着以下は相変わらずひとまとめにする。
前走人気だが、どう扱うか。
いろいろな方法があるけれど、わたしは前走着順と人気を比較して、「前走着順より高い人気」と「前走着順より低い人気」に分けることにした。
3
着の馬なら、「1-3番人気で3着」か「4番人気以下で3着か」とするのである。
つまり、前走着順を2種類に分ける。
これなら18種類で済む。
記述すれば簡単な話だが、このようにしてデータを加工していくのである。

▼数値にすること
以上の方法で次走の勝率を調べた結果が下表である。
前走が同じ着順でも、結構違うな、という印象であった。
上り調子、下り調子の馬の選別というより、騎手や調教師が悔しくてリベンジを果たそうとする人間の力のほうを強く感じる結果になった。
コンディションはもう少し別の要素で考えたほうがよさそうである。
前走着順
前走人気
該当件数
1着頭数
勝率
1
1人気以上
9,243
1,292
0.140
2
2人気以上
10,753
2,906
0.270
3
3人気以上
11,597
2,270
0.196
4
4人気以上
12,262
1,714
0.140
5
5人気以上
12,965
1,467
0.113
6
6人気以上
13,440
1,222
0.091
7
7人気以上
14,039
1,026
0.073
8
8人気以上
14,571
925
0.063
9着以下
9人気以上
110,869
3,503
0.032
1
2人気以下
19,675
1,602
0.081
2
3人気以下
18,301
3,110
0.170
3
4人気以下
17,336
1,881
0.109
4
5人気以下
16,475
1,305
0.079
5
6人気以下
15,604
817
0.052
6
7人気以下
14,370
610
0.042
7
8人気以下
13,397
409
0.031
8
9人気以下
12,459
262
0.021
9着以下
10人気以下
45,360
624
0.014
前走記録なし
 
47,562
2,987
0.063
全体
 
430,278
29,932
0.070

今回は馬のコンディションを数値にしてみようと考えたが、コンディションだけではなく、予想に使う道具(要素)はできる限り数値化を試みておきたい。
血統、馬格、調教師や騎手のコメントなど、ともすれば「呪文」でも唱えているかのような並べ立てだけで分析していない人もいるように思える。
しかし、分類することで、霧が晴れたように思考が整理される。
1
番、2番と数字にすることには、予想に組み込みやすくなること、判断が固定してブレにくくなること、のふたつの利点がある。
事象それぞれに番号を振り、勝率や連対率を集計してみる。
コメントひとつをとってみても、「強気・弱気」で分類するとか、「放牧あり、なし」とか、「この中間、熱発したが、というコメントを含む」とか、分け方はいろいろある。
分類できたら、あとは結果がどうだったか集計するだけである。
(SiriusA+B)

ブログ アーカイブ