2017年9月23日土曜日

第183夜 コースと距離と馬場とレースレベルを調整する必要がない速度偏差値

着順 馬番 馬名 性別 年齢 斤量 時計(秒) 単勝人気 速度 速度偏差値
1 4 ジェンティルドンナ 2 5 55 155.3 4 57.95 62.8
2 6 トゥザワールド 1 3 55 155.4 9 57.92 60.4
3 14 ゴールドシップ 1 5 57 155.4 1 57.92 60.4
4 15 ジャスタウェイ 1 5 57 155.5 3 57.88 57.2
5 13 エピファネイア 1 4 57 155.5 2 57.88 57.2
6 5 ラキシス 2 4 55 155.5 11 57.88 57.2
7 7 ラストインパクト 1 4 57 155.5 7 57.88 57.2
8 1 トーセンラー 1 6 57 155.7 8 57.80 50.8
9 12 デニムアンドルビー 2 4 55 155.7 16 57.80 50.8
10 10 フェノーメノ 1 5 57 155.7 6 57.80 50.8
11 11 サトノノブレス 1 4 57 155.9 13 57.73 45.2
12 9 ウインバリアシオン 1 6 57 155.9 10 57.73 45.2
13 3 ワンアンドオンリー 1 3 55 156.0 5 57.69 42.0
14 2 ヴィルシーナ 2 5 55 156.1 12 57.66 39.6
15 8 メイショウマンボ 2 4 55 156.4 14 57.54 30.0
16 16 オーシャンブルー 1 6 57 156.4 15 57.54 30.0

▼スピード指数で悩むこと
偏差値の概念を用いるこのブログでは、スピード指数を速度基準で作ったほうが良いこと、あるいは偏差値という集計方法があることを記事にしてきた。
スピード指数を使って予想を組み立てる人にはおススメなのだが、体系的にお話をしていなかったので、今夜はちょっとだけ補足してみたいと思う。
最初に結論から申し上げておくと、
(1)
走破タイムを機械的に調整したうえで
(2)
走破タイムを速度に変換し
(3)
レースごとに平均速度と標準偏差を計算し
(4)
出走馬ごとの偏差値を算出する
以上で、計算としてはそれほど難しいことではない。
このブログでは、算出した偏差値を、「速度偏差値」とでも呼称することにしよう。

ところで、スピード指数を自ら作成する際に突き当たる壁というものがあり、なかなか乗り越えられずに挫折してしまう人は少なからずいるだろうと思う。
例えばこんな「壁」である。
500万下や1000万下クラスの平均タイムなどから基準タイムを算出するが、サンプルが少なくて、本当に「基準」になっているのか。
・基準タイムを上位3頭で算出するが、1頭あるいは2頭が飛び抜けて速く、ハイレベルレースに見えてしまうのは妥当なのか。
・ダートのタイム差は芝よりも大きく、指数の比較が難しい。
・短距離はともかく、中距離以上だとスローペースになったタイムをどう扱えばいいのか。
・極端に遅れてゴールした馬のスピード指数が異常値で、どう取り扱うべきか。
・馬場指数の算出が難しい、あるいは馬場の影響なのか、レースレベルが高い/低いのか、その判別が難しい。
などなど。
2014年の有馬記念競走の勝馬ジェンティルドンナ号の走破タイム2354は、同日第7競走で行なわれた芝2500mの勝馬レイズアスピリット号の2338に比べて劣っているが、16もの差をどう評価すべきか」
こんな質問がきた時に、有馬記念出走馬のレベルが第7競走より低かったと返答する人はいないだろう。
しかし、相手を納得させるほどの自前のスピード指数も持ち合わせていない。

わたしはスピード指数を長い間研究してきたので、こうした壁にぶち当たってきた。
その都度、乗り越える手段を模索してきた歴史がある。
ご多分に漏れず、最初のうちは精度が低いのではないかと思いより精緻な数字を求めたり、スローペースに対応した補正を掛けたりしてきたが、どんどん複雑になっていき、スピード指数の森を彷徨うばかりだった。
だが、速度偏差値を作成すると、多くの問題を解決できるのである。

▼レースごとに偏差値を算出することが意味すること
まず、走破タイムを速度に変換することで、データの歪みを解消する。
速度とは、ここでは時速である。
これによって、「1秒の価値問題」を解消している。

これを各コースで集計すると「基準タイム」になるのだが、冒頭に示した「速度偏差値」では、レースごとに集計する。
2014
年の有馬記念を例にとると、出走馬の平均時速は57.79km/hとなった。
16
頭の標準偏差は0.12527で、各馬の偏差値を算出すると表のとおりになる。
勝馬はこの競走の偏差値が62.8となったということである。

そもそもスピード指数は、基準タイムよりどれだけ速いか遅いかを見比べるツールである。
だが、ここで算出した速度偏差値は、そういうことを示していない。
この競走の母集団のなかで、どのような位置付けになったかを表している。
タイム差や速度をそのまま使った場合には速いか遅いかを示すに過ぎないが、偏差値化することで全馬の「分布」的な位置付けになるのだ。
速さではなく、出走馬母集団の中での位置付けを表すので、基準タイムの設定も必要がない。各競走ごとに平均速度を出すのだが、これが一種の基準タイム(基準速度)となるので、芝・ダートの違い、距離の違い、馬場も考慮する必要がなくなる。
スローペースであろうがなかろうが、これも関係なくなる。

なお、極端に遅れてゴールした馬について、どう取り扱うべきか、わたしの解決方法を申し上げる。
あくまでもわたしの考えだが、大差でゴールインした馬には何らかの事情がある。
前半に飛ばし過ぎてばてたとか、鞍上と合わずにレースから逃避しようとしたとか、大きな不利を受けたとか、そもそも調子が悪かったなど理由はさまざまである。
そうした馬のタイムが勝馬より4秒遅れたとか、7秒遅れたといっても意味はないだろう。
ということで、わたしは3秒以上離された馬のタイムを勝馬から3.0秒差でゴールしたことにして速度を計算している。
実際上から言うと、そのままの速度で計算するより精度は良い。

あとは、前走の速度偏差値をもとに、今回の競走条件の変更、例えば馬の成長、コースや距離の変動、出走馬の顔ぶれなどから、どのような速度偏差値になりそうかを検討すればよい。
スピード指数を使うにせよ、ここからが検討の本番なのだが、ここまでで力尽き、予想作業を終わってしまう人も多いようだ。
それじゃダメじゃん、と言いたいところだが、ちなみに、この速度偏差値を前走成績として、出走馬の速度偏差値を並べていちばん高かった1頭は、勝率21.2%(2006年から2014年の平地競走で調査したもの。新馬戦などを算出できない競走を除く)である。
そのまま使っても黒字にはならないが、まあまあ使い方次第である。
1
番人気と被ることも多い一方で、なかなか面白い穴馬を見つけることもある。

この20%を超える勝率は、9年分の検証からも嘘偽りはなく、もったいぶった有料予想や複雑怪奇な指数たちよりは成績が良い。
しかも、この記事のレシピのとおり計算すれば、だれでも同じ指数を算出できる再現性を持っている。
出走馬すべての前走を偏差値化すればいいので、大掛かりなシステムも、膨大な過去の情報も、コースの分類も馬場補正も要らない(すぐに取り出せるようにデータベース化しておかないと夜更かしすることになるけれど)
(SiriusA+B)


ブログ アーカイブ