2025年10月26日日曜日

第537夜 予想オッズは儚く、そのレシピは売っていない

 

通常のPC作業ではないため、本文書式、表などの設定にはご容赦いただきたい。
▼予想オッズ
予想オッズは、鮮度が直ぐに落ちる。
レース予想は、馬券発売の締切と同時に利用価値がなくなる。
予想オッズはこれより早く、主催者がリアルタイムオッズの提供を始めると、その役割を終えるのだ。
その割に、メディア各社は予想オッズを作成して載せなければならない。
載せなければならない、というより、載せることこそ使命と考えていただいている。
素晴らしい情報提供で、たいへん頭が下がる。

馬券の発売開始は、2025年現在、以下のとおりだ。
多くの場合で(G1レースやその他の理由でしばしば変更がある)、即パットでは土曜日のレースが金曜日18時30分、日曜日のレースが土曜日19時30分、Aパットでは土曜日のレースが当日7時、日曜日のレースが土曜日19時30分(必ず主催者発表情報を確認いただきたい)。
発売開始後、オッズが順次公開されるので、ネットで情報提供しているメディアは予想オッズからリアルタイムオッズに切り替えるようだ。
予想オッズの賞味期限だ。
儚い……。
しかも、「過去の予想オッズ」を提供しているメディアをわたしは知らない(あるのだっけ?)。
だが、予想オッズは、賞味期限が早まっても、今なお、有用な情報のひとつだとわたしは思っている。
予想オッズ自体にも利点はあるが、わたしは特に、各社の予想オッズの作成方法に興味がいく。
何を根拠に予想オッズを算出するのだろう、という点である。
・予想記者、予想家などの予想の集計(集合知)
・蓄積された過去データの活用(統計)
・過去データや投票行動の分析(機械学習)
・予想と同じようにファクター分析(予想)
わたしに考えられるのは以上の方法で(目分量という選択肢は除外する)、単独もあれば組み合わせる場合もあるだろう。
隠すというほどでもないのだろうけれど、各社とも独自のノウハウ、ブレンドで作成しているので、当然に、レシピはおろか設計思想すら公開されることはあまりない。
ま、レース予想だってそうだけど。

そうした中で、2024年夏頃のインタビュー記事だったか、netkeibaさんの予想オッズ作成法に関する記事は出物だった。
予想オッズの作成方法を、集合知からAIに切り替えたというのが主旨だ。
たいへん興味深い内容なので、詳細は、当該記事を検索して参照いただきたい。
簡単に言えば、予想家たちの予想を集計するやり方から、機械学習に切り替えましたよ、という内容であった。
以前から、ここは集合知方式だろうな、と思っていた。
予想者を集められるからである。
専門紙やスポーツ紙では、そうはいかない。
参加者を集める機能はない。
したがって、蓄積されたデータを基礎に、記者の予想を加味して算出している(た)とわたしは推定している。
精度は、各社まちまちだ。
予想オッズよりも予想そのものに力点を置くのだし、予想オッズがいかに高精度でも誰も評価しないのだから、仕方がない。
それでも、予想オッズ作成レシピは知りたい。
どんなファクターに重みがあって、重みがないのか。
前走着順? 前走人気? スピード指数? それとも血統?
大方の馬券購入者は予想記者や予想家の強い影響下にあるが、その源流まで辿り着けば、予想の仕方が分かるのではないか。

話が逸れるが、例えば前走人気というファクターがオッズに大きく影響していると分かったら、貴方はどうするか。
「よし、前走人気を中心に馬券を検討しよう」ではない。
前走人気を外して予想しなければ、黒字収支は目指せない。

▼人気順の予想は「青い鳥」
予想オッズ作成方法の解明は前途多難なので、わたしは精度がかなり粗いものの、「かんたん予想オッズ」はよく作成する。
せっかくなのでレシピを示すと、次のとおりだ。
 前走支持率と前走着順に基づく期待勝率をブレンド
いや、実際にはもうちょっと複雑だけれど、簡単に言えばこのようになる。
支持率と期待勝率を一緒にして加減乗除する(基本的にはちょっと工夫して足し合わせる)とは乱暴だな、とわたしも思う(笑)。
だが、これは、「勝率と支持率はほぼ等しい」という経験則があるからだ。
これまでの諸々の情報がぎゅっと詰まった前走の確定オッズに、これを反映していない前走着順情報を加味する。
オッズと着順はそのままでは計算できないから、前走オッズは逆数に、前走着順は過去の膨大なデータ基づき勝率に変換する。
小数点が苦手なら、それぞれ100倍すればいい。
ブレンドした数字を改めて逆数にすればオッズ形式に戻る。
申し上げたとおり、粗いのだが、オッズの目安にはなると思う。
人気順程度でいいというなら、まあまあだ。
わたしのブレンドでは、最も高い数値を出した、つまり指数1位馬と1番人気が同一になる率は48%だ。
ほぼ半分の1番人気を当てることができる。
興味がある人はぜひご自身で試していただきたい、というのがこのブログの常套句だが、今夜は違う。
実は、多くの場合、貴方のレース予想法がそのままオッズの予測に流用できるのだ。
図表537-1は、先程の方法で指数1位となった馬が、今走で何番人気になったかをまとめた(2020-2024年の5年分。前走データのない障害競走や新馬戦を除く)。
これをレース予想だとした場合、同期間で勝率は24%ほどになる(図表の右欄)。
割とふつうの予想だ。
すなわち、貴方のレース予想は、レース予想をしたつもりなのに、人気順を予想したかのように人気順を言い当てている。
灯台下暗し、意外に身近なところに、予想オッズ或いは人気順の予想法が存在する。
さらに、悲しいことに、1着を当てるより1番人気を当てた的中率のほうが高い。
特に、精度を上げれば上げるほど、そうなる。
理由には触れないが、合点がいくと、いよいよ収支黒字を目指せる。
予想オッズの話、競馬予想に要る? と思った人は、もう少し修行を重ねよう。
(SiriusA+B)
(図表537-1) 前走支持率と前走着順に基づく期待勝率をブレンドした予想法での「本命(得点1位)馬」のレース結果(着順)、最終人気順位(2020-2025年)
今走着順、頭数
1着 3,646頭(勝率24.1%)
2着 2,483
3着 1,872
4着 1,344
5着 1,149
合計 15,108頭
今走人気、頭数
1番人気 7,288頭(合致率48.2%)
2番人気 3,237
3番人気 1,750
4番人気 1,017
5番人気 625
合計 15,143頭

2025年10月12日日曜日

第536夜 タイム系理論復活の兆し?


タイム系がフィットしてきた?
若いときに西田式スピード指数に感銘し傾倒していたことは折に触れて述べてきた。
今は、タイム系指数を使うにしてもわたし自身のオリジナルになるが、久しく自分の予想ツールとしては使っていなかった。
しかし、わたしの「巡回点検」では、近年、タイム系指数の的中精度が向上傾向にあると観測されていた。
巡回点検とは、かつて使っていた理論を復活して競馬環境が変わっていないか、時系列にみるのである。
タイム系指数の成績良化は、その過程で再発見された。

(図表536-1)オリジナルタイム系指数の年別成績推移
競走年 オリジナルタイム系指数累積平均1位馬勝率 オリジナルタイム系指数前走1位馬勝率 支持率累計平均1位馬勝率 前走支持率1位馬勝率
2012年 0.209 0.201 0.185 0.205
2013年 0.206 0.202 0.174 0.199
2014年 0.213 0.204 0.188 0.207
2015年 0.221 0.189 0.193 0.209
2016年 0.228 0.208 0.204 0.218
2017年 0.232 0.213 0.203 0.214
2018年 0.239 0.197 0.210 0.214
2019年 0.237 0.205 0.196 0.210
2020年 0.227 0.202 0.189 0.208
2021年 0.227 0.215 0.195 0.211
2022年 0.241 0.222 0.203 0.230
2023年 0.244 0.213 0.198 0.225
2024年 0.250 0.214 0.221 0.231


図表536-1では、わたしのオリジナルタイム系指数による本命馬勝率を年次でプロットした。
新馬・障害競走を除く中央競馬平地競走である。
算出方法を次項に記載している。
オリジナルタイム系指数は、速度に換算しているが、できるだけ元祖スピード指数に近い形をとった。
過去走の取り扱いには独自性があり、過去各走の指数を一本化している。
ただし、一般的なスピード指数の統計的弱点(紡錘形曲線が左側に寄る歪な形)は修正していない。
今回は「一般的なタイム系指数」の例だと考えてほしい。
並列的に前走単体で見たタイム系指数、
累計支持率平均、前走支持率で1位の馬の勝率も載せた。
そもそもタイム系指数が悪くないことを示す好材料である。

開催年によって上下動があることはお分かりいただけるだろう。
グラフを作成すると的中率が波を打つようなダイナミズムを感じられるかもしれない。
近年は、本命的中率が高くなっている。
24%
台を3年間続けて出しており(2024年は24.950で表では四捨五入で切りあがっている)、かなりの良績と判断していい。
タイム系理論が復活してきた、のか。
2025
年も見てみないと分からないが、近年の出走頭数の減少、出走回数の減少、中距離走の増加が少なからず影響しているとわたしは考えている(もっといろいろあるけれど)
外厩でトレーニングを積んで帰ってくれば鉄砲駆けもあり、出走回数も少なく「叩き2走目」の概念も大昔よりは薄れた(気がする)
力の衰えた高齢馬の退場が促進され、走破タイムで予測することにも好影響だ。
要約すれば、紛れの少なくなる要素が増え、タイム系理論に適した環境がやってきた。

トレンド、潮流の変化は、微細なところでも起きていて、通用しなくなったと思われた理論が復活することもある。
騎手に着目した予想法や、血統に基づく予想法は、登場人物・馬の変動によって波がある。
いや、そもそも好不調のない予想法はない。
タイム系理論も、誰も彼も使うようになってオッズに織り込まれ妙味が失せた、と言われた時期もあるとわたしは感じているが、自ら算出するような奇特な人は今も昔もそれほどいない。
専門紙やスポーツ紙でも似たような指標を採用したことで、オッズに影響を及ぼし始めたと思う。
わたしは昔から自分でやるのが好きで、ボーナスで払い切れない高価なノートパソコンを買い、ちまちまと1着から3着の走破タイムを打ち込みながら、スピード指数を独自に計算した。
当時は、わたしの周囲で競馬をする人は、今以上に多かったが、誰ひとりとして、そんな計算をする人なんていなかった。
結局のところ、複雑な数値を使って独自の予想をする人は、いつの時代もかなりの少数派である。
専門紙他予想家予想便乗、簡単予想法、これらが主流で、独自の予想は傍流で、個人がちまちまベットしても影響は極めて軽微だ。

オリジナルタイム系指数の作成レシピを公開
タイム系理論では、さまざまな調整を行なう。
クラス、馬場、斤量、距離に加えて、スローペース補正といったものまである。
それぞれの要素は合点のいくものだ。
実は、今回使ったオリジナルタイム系指数は、これらの補正を施していない「成分無調整」だ(牛乳?)
上手く補正できれば、更に精度を高められる可能性がある。
あるが、一方で、補正をかければ精度が高まるのか、という疑問も、わたしには、ある。

この記事で使用するオリジナルタイム系指数は、次のように作成した。
レース基準速度は、さまざまな理由から、1-4着の平均速度とした。
これで誰でもわたしと同じ数字が算出できる。
[A]
出走各馬の速度=距離(m)/時計(1/10)*36
[B]
レース基準速度=距離/(1-4着時計合計/4)*36
[C]
各馬の競走毎の指数=[A][B]100(ただし、マイナスを回避するため、答えが1以下の場合は、指数は1とする)
[D]
各馬の指数=前走までの[C]累計/完走回数

ある馬Aが、1,600m1382で走れば、
1,600/982*36
58.66km/h
となる(わたしは四捨五入などは最後までしないが、気になるようなら上の例のように小数点第2位未満を四捨五入する)
マイル競走であれば、時計が01違えば、速度は約0.06km/h違う。
このレースの基準速度を59.12km/hとしたら、
Aの当該レースの指数は、
58.66
59.1210099.54
となる。
なお、ご本家に合わせて、10080に代えても差し支えない。
今回の指数では、前走までのすべての成績を足し上げて出走回数で除した、単純平均を当該馬のタイム系指数とした。

以上を手掛かりにご自身で計算いただければ、ほぼわたしと同じ数値を再現できる。
もちろん、小数点の取り扱いや、大差のついた場合の処理方法、同点馬の取り扱い、などによって多少の差異は出よう。
これによる予想精度への影響を織り込んでも、指数1(本命馬)の勝率は、年間で約22%から24%台になるはずである。
無料でここまで公開してよいのかと、ご心配していただく方もいらっしゃるが、お気持ちにはお礼申し上げるとともに、特にわたしに支障はないことをお伝え申し上げる。
算式をご覧の通り、時速何キロメートルかを出しただけである。
さて、ここからは、貴方が推論する。
無作為に1,000人の競馬ファンを集めたとしよう。
・特段、予想スタイルを確立していない人(馬柱を見たり、オッズを見たりして買い目を決める人)は、何人いるか。
・このうち、現状に問題意識があり、自分の予想スタイルを確立したい人は、何人いるか。
・このうち、このブログに辿り着き、本記事の算式をそのまま或いは参考にしよう、という人は何人いるか(最難関)
・このうち、毎週自分で計算し、挫折せず活用する人は何人いるか。
最後の2問のわたしの推定値は、ブログに辿り着くのが0.01%、挫折せず活用は20%である。
0.01%
は過大かもしれないが、20%は当たらずとも遠からずであろう。
結局、どう計算しても、1000人中、1人未満すなわち零点幾らという答えになる。
1
万人や10万人にひとり程度だから、心配ない。
万が一、爆発的に普及しても、オッズに変動はあるが的中率の変化は生じない。

(SiriusA+B)

ブログ アーカイブ