2016年7月4日月曜日

第97夜 偏差値を使う側になったボクたちは、競馬予想の武器にする

▼偏差値の前に速度
偏差値と聞けば、学生時代の苦い思い出となっている人も少なくないだろう。
わたしもあまり嬉しい思いをした覚えはない。
だが、大人になったわたしたちには無縁だと忘却に任せるのも勿体ない。
わたしたちは偏差値というツールを使う側になったのである。
偏差値が、データの取り扱いに強力な武器であると再認識することもあってよい。

ただ、その話の前に、走破タイムを速度に変換する話を再度記しておきたい。

このブログでは、走破タイムをそのまま使うより、速度に換算することを勧めている。
1000m
600で走ると時速60km(60km/h)である。
1000/60.0*3.6
と計算する。
3.6
とは60秒×60分で1時間に3600秒、千メートルをキロに換算するため1000で割ることを短縮して書いた。
1.000/60.0*3600
でも良い。
サラブレッドはおよそ時速60km、一般道路を走る自動車くらいの速さである。

▼偏差値
走破タイムを時速に変換したところで、偏差値の話に移ろう。
走破タイムをベースにした予想に、偏差値を使ってみるのである。

偏差値とは、ある数値が母集団の中でどの位置にあるのかを示す。
平均点を50とし、標準偏差を10としたものである。
(
ある数値ー母集団の平均点)/標準偏差*10+50
で計算できる。
表計算ソフトであれば、標準偏差はstdevp関数を利用する。
標準偏差とは、分散の平方根である。
ある母集団のデータの散らばり具合を示す。

この偏差値をスピード指数のように使ってみようというのが今夜の主旨である。
偏差値を使って、着差に基づく出走馬間での相対的位置を求める。
レースごとのレベル差は、出走回数を重ねることで調整されると仮定した。

わたしは、2014年の中央競馬平地競走(データのない新馬戦を除く)で試してみた。
出走馬全頭のデビュー戦からの偏差値を算出し、その平均偏差値の最も高い馬を本命馬とするのである。

まず、出走全馬の過去走すべて、走破タイムを速度に変換する。
競走中止馬は除外する。
次に、速度から偏差値を求める。
出走馬ごとに、過去走の偏差値を合計し、出走回数で除す(要するに偏差値の平均を求める)
レシピは以上である。

この偏差値予想法の結果は、単勝的中率22%であった。
単勝回収率も84%とまずまずである。
改良の余地を十分に残したままで、思いもよらない好結果であった。
走破タイムは単純にタイムを用いて、斤量によるタイムへの加減(例えばマイル戦で斤量54kgなら0.1または0.2秒を走破タイムに加える行為)をしていない。
芝とダートも分けなかった(障害競走は除いた)
競走ごとのレベル調整や馬場調整も行なっていない。
こうした調整を行なえば、もう少し的中率は向上する可能性がある。
スピード指数に代表される走破タイム分析型の予想家の皆さんには是非お試しいただけたらと思う。
(SiriusA+B)

ブログ アーカイブ