2020年9月20日日曜日

第296夜 競走データを分割する2本の分割線


▼予想計算式を1種類と決めたルールはない
わたしは芝とダートのレースを分けないと言ってきた。
テニスのように、芝のコートやクレイコートで区分しないのと同じである。
わたしはそういう考えを持っているだけで、正しいとか誤りだとか、そうした評価ではない。
傾向が異なる集団毎にデータベースを分割して考えること自体は、あってよいと思うし、分割ではなく抽出は数限りなくやっている。
そもそも、予想理論だってひとつにしないといけない法はないのだ。
中山ダート1200m専用の法則があるなら素晴らしいことである。
「いや、すべてのレースを統合する一般法則をだな」と言うのには男性が多い(個人的印象)が、研究ならどこかの象牙の塔でやってくれ、わたしゃ明日の馬券を買いたいんだ、と本音では思ってしまう。
ギャンブルが成立していることから「正解」はないが、未知のものに挑む冒険心にも似て妙なロマンを掻き立てられる種が男性かもしれない。
だが、徒労に終わる。
ただ、「指数を出す計算式は1種類」と思い込んでいる人がいるようなら、その呪縛から解放されることを願う。

▼分割線を探す
問題は分割方法である。
芝とダートほど分かりやすい切り口はないと思うが、個人的には優れた分割方法であるとは思わない。
分かりやすく、目に見えるものほどトラップである可能性はある。
また、2分割すると思い込んでいる人もいるかもしれない。
競馬場と合わせて20分割する人がいる。
少し分けすぎかな、とは個人的な印象だが、過学習にならなければ問題ないと思う。

わたしの実践している分割方法を紹介するとすれば、3分割である。
・新馬
・同歳戦(23歳限定競走)
・古馬戦
だ。
これには理由があって、「時間軸」という切り口を使った。
分類とは主観的なものである。
人により千差万別だが、時間軸なら共通だし、何より「重複」を避けられる。
大きくは同歳戦と古馬戦だが、馬の成長に従い、3歳秋の一時期を除いて同歳戦と古馬戦の行き来がない(馬がデータベースAとデータベースBで相互乗り入れしないような、するのが稀な状態)
そこが芝とダート、或いは競馬場を使った分割方法と異なる点だ。
さらに同歳戦は新馬を独立させた。
時間軸から言って新馬戦に戻ってこないことはもちろんだが、もうひとつ、新馬戦は「全馬が過去走が無い」という大きな特徴を持っている。
大昔は同一開催で2(以上も可?)出走できたが、今は一度限りだ。
この3系統では馬の能力情報に関する予想材料が大きく違う。
新馬戦は、レースレコードがゼロ、レース実績以外のデータで考える。
同歳戦は、馬の成長曲線がほぼ同じ右肩上がりで、競走成績を比較的そのまま反映できそうだ。
古馬戦は、競走成績を成長する馬、ピークを過ぎた馬で如何に予測調整できるかにポイントがある。

この分類は、3分割で多すぎず少なすぎず、である。
同歳戦と古馬戦で2分割なら思い付く人は少なくあるまい。
新馬戦を分けたのも同様だ。
ただ、この2本の線で競馬を3系統に分けるとはなかなか思いつかないかもしれない。
格好良く「閃いた」とでも言いたいが、実際には長期間の試行錯誤を経て辿り着いた2本の分割線である。
わたしは明快で合理的だと考えている。
予想方法の研究が頭打ちになっている人にはこの分割線がブレークスルーのポイントになるかもしれない。
(SiriusA+B)

ブログ アーカイブ