2023年1月8日日曜日

第401夜 予想ファクターのウエイトを自在に


▼レースを分類する
レースのバリエーションに応じて予想ファクターの重要度は変わる。
対策として、レースを幾つかのカテゴリーに分け、ファクターのウエイトを変えたり、ファクターの取捨選択をしたりすることが考えられる、という話である。

レースが「複雑系」であるという前提のとおりだとすれば、たったひとつの説明変数(ファクター)でおおよその予想ができる、ということはない。
例えば、前走の着順で8割は予想できる、というようなことがない。
あるレースでは前走着順のとおり決まり、あるレースでは騎手の技量順に決まり、またあるレースでは血統上の能力順で決まる、ということが起こる。
特に決め手となるファクターが無く、「なんとなく能力上位」の馬で決まるというのも、また多いと思われる。
勝因を分析することは、実は非常に難しいとわたしは考えているが、例えば「前走着順のとおり」決着しやすいレースのカテゴリーがあり、それを活かすことができるとすれば、予想精度は向上するかもしれない。

競馬予想をするとき、馬や騎手などの分析をしても、レースの傾向そのものを検討する人はそれほど多くないとわたしは見ている。
いわゆる展開予想や「この重賞の過去10年」といった予想と似ているが、ここでの話はもう少し拡大して「同じ予想ファクターでもレースによって軽重があり、その軽重
を予想に反映させることができるか」というものだ。
具体的には以下のようになる。


予想ファクターとして「前走のオッズ」を使ってみよう。
わたしは、簡便に1/単勝オッズ×4/5として「前走支持率」に換算する。
 1.1
倍なら1/1.1×4/50.72773
 10.5
倍なら1/10.5×4/50.0768
(扱いやすいように100倍して小数点以下切上)

この前走支持率が今回の(予想したレースの)着順とどれほど相関しているか調べてみると、相関係数は0.37であった。
相関係数はプラスマイナスどちらでも、絶対値が大きいほど相関性が高いことを示す。
今回は分かりやすいように「単相関」すなわち着順と前走支持率だけの相関関係を見ている。
0.37
という数字は絶対的なものではないが、データ期間やサンプル量によるが、長期的には0.37に近いものとなるだろう。
これをクラス別にして、再度、相関係数を求めてみたところ、23歳未勝利戦では0.43と相関が高まるのに対し、231勝クラス以上(オープン競走を含む)では0.27と相関が低くなった。
古馬戦でも同様に、1勝クラスでは相関係数0.352勝クラスでは0.333勝クラスも0.33、オープンでは0.26という結果になった。
同じ「前走支持率」でもこれだけ違うのである。

ここから推定される結論としては、
1)
下級クラスほど「前走支持率」と今回の着順と相関性が高い。
2)
古馬戦よりも、23歳限定戦のほうが相関性は高い。
ということになる。
その原因として考えられることは、昇級・降級の影響である。
未勝利戦では1勝以上した馬の流入はないから、前走支持率の比較が能力の比較に近似していると考えられる。
つまり、「前走支持率というファクターは、未勝利戦では相対的に重要なファクターだが、そのほかのクラスではそれほどでもない」ということなのだ。
また、出走数が少なく、前走経験値のウエイトが高いという可能性もある。

貴方の予想方法は存じ上げないが、前走支持率という予想ファクターを使って、未勝利戦とそれ以外のクラスで同じように予想しているとすれば、的中精度が下がるということを意味する。
それならば、予想ファクターのラインナップを変えない場合ウエイトを変える、或いは、クラス別に予想ファクターを加える/削除する、といった調整は検討に値すると思う。
このブログでは、レースをグループ化するとしたら、「前走成績のない新馬戦」「23歳限定戦(同歳戦)」「古馬戦」に分けるという趣旨の記事を書いたことがある。
今回の記事は、もう少し細分化したバージョンである。

▼レースの分類オプション
前項では、クラス別でレースを分類したが、距離及び芝ダート別、競馬場別など、そのほかの分類方法もある。
わたしの想像も及ばない切り口もあろう。
ただ、どのようなレースのグループ分けであれ、予想ファクターの影響度が、グループごとに違うということは間違いない。
下表には、古馬戦のほうが影響の大きいファクター例として「月齢」「完走回数」を挙げた。
ファクターの取捨選択の参考なれば幸いである。
(SiriusA+B)


(
図表401)着順と4つの予想ファクターの単相関係数
※数字は単相関の計算結果を一覧にしたもので、重相関係数ではない。
2014-2021年中央競馬平地競走で、過去1走以上完走したことがある馬。
※着順は入線順位で、降着・失格確定後の順位と異なる。
※前走支持率は1/前走単勝確定オッズ×4/5×100で小数点以下切上。
※前走上がり3ハロンは、前走上がり3ハロンタイムを順位化したもの。
※月齢は「当該レース日-誕生日」で算出した日齢を30で除し、小数点以下を切上。140か月以上は140か月とした。
※平地完走回数は中央競馬平地競走を完走した数で、競走除外・競走中止を含まない。41走以上は50走、60走と10走単位に切上してまとめた。

同歳戦未勝利 同歳戦1勝以上 古馬戦1勝クラス 古馬戦2勝クラス 古馬戦3勝クラス 古馬戦オープン
前走支持率 0.43 0.27 0.35 0.33 0.33 0.26
前走上がり3ハロン 0.37 0.24 0.27 0.25 0.24 0.20
月齢 0.05 0.09 0.07 0.18 0.22 0.21
平地完走回数 0.15 0.11 0.07 0.15 0.20 0.18

ブログ アーカイブ