2017年7月20日木曜日

第175夜 大敗を喫した場合のデータ取り扱い

▼大敗
このブログで何度も触れているように、わたしは走破タイムを利用した競馬予想をしていないのだが、巷間ではタイム理論が主要なツールのひとつであることから、速度理論などの実践的な記事を幾つか掲載している。
今夜は、表計算ソフト等で自ら計算する人が、データ上取り扱いに困る「大敗」について記したい。
意見は色々あるだろうが、ひとつの考え方として参考になれば幸いである。

伝統的なスピード指数、わたしが推奨する時速換算或いは偏差値など、いずれの方法でも実践中に困ることが発生する。
「大敗」である。
人気薄の逃げ馬が直線でバテてやっとゴールするようなシーンを目撃した人は少なくないだろう。
原因はさまざまだが、中央競馬の平地競走でもこうした大敗は珍しいことではない。
たいていの場合、タイムオーバーでしばらく出走しないので、或いはタイムオーバーには至らなくても立て直しはあると思うので、この馬自体は放っておいていいのだけれど、問題は走破タイムが遅すぎるために指数計算に支障をきたすことである。
上位3頭でレースの平均タイムや馬場指数を算出する人には無縁だが、精緻に弾き出したいと全馬のタイムを集計する人もいると思われる。
しかし、80を基準にしたスピード指数で、例えば「15」とか、平均時速60kmのところ「47km/h」とかいった数字が出てくると、レースの平均値が大きく下がってしまうのだ。
以下の例のように、出走馬十数頭で集計するレース毎では、突出して低い数字が1頭でもあると、平均値を大きく押し下げ、上位馬の評価を不当に低くしてしまう。
<図表>
着順 距離 走破タイム km/h 標準偏差 偏差値
1 1,200 73.5 58.78 2.055628 54.2
2 1,200 73.7 58.62   53.9
3 1,200 74.7 57.83   52.3
4 1,200 74.9 57.68   52.0
5 1,200 75.1 57.52   51.6
6 1,200 75.3 57.37   51.3
7 1,200 75.4 57.29   51.2
8 1,200 75.5 57.22   51.0
9 1,200 75.8 56.99   50.5
10 1,200 75.9 56.92   50.4
11 1,200 76.1 56.77   50.1
12 1,200 76.1 56.77   50.1
13 1,200 76.4 56.54   49.6
14 1,200 76.7 56.32   49.2
15 1,200 87.2 49.54   35.2


▼走破タイムさえ操作する発想
困った人は少なくないだろうと思うが、わたしも駆け出しの頃、長く頭を悩ませた。
「走破タイムは絶対的な事実だから、数字を操作できない」
そう思っていた。
ところが、スピード指数に対する疑問が大きくなり、より統計的な手法に傾倒してくるようになると、極めて遅いタイムがいろいろと弊害を生むようになってきた。
「イレギュラーなデータは邪魔だなぁ」とさえ考えるようになった。
そこで、イレギュラーなデータであればクレンジングしてもいいだろうという考えに行き着いた。
例えば、1着から3秒以上の着差をつけられた場合、3秒差に固定する。
それでは正確でない、或いはクレンジングされた馬の予想精度が下がるのではないかと異論を唱える人もいるだろう。
だが、上位馬の評価が正当になされれば不都合はない。
下位馬も能力を十全に発揮したわけでもあるまい。

タイム修正
着順 距離 走破タイム km/h 標準偏差 偏差値 計算上
走破タイム 計算上km/h 標準偏差 偏差値
1 1,200 73.5 58.78 2.055628 54.2 73.5 58.78 0.691428 54.2
2 1,200 73.7 58.62   53.9 73.7 58.62   53.9
3 1,200 74.7 57.83   52.3 74.7 57.83   52.3
4 1,200 74.9 57.68   52.0 74.9 57.68   52.0
5 1,200 75.1 57.52   51.6 75.1 57.52   51.6
6 1,200 75.3 57.37   51.3 75.3 57.37   51.3
7 1,200 75.4 57.29   51.2 75.4 57.29   51.2
8 1,200 75.5 57.22   51.0 75.5 57.22   51.0
9 1,200 75.8 56.99   50.5 75.8 56.99   50.5
10 1,200 75.9 56.92   50.4 75.9 56.92   50.4
11 1,200 76.1 56.77   50.1 76.1 56.77   50.1
12 1,200 76.1 56.77   50.1 76.1 56.77   50.1
13 1,200 76.4 56.54   49.6 76.4 56.54   49.6
14 1,200 76.7 56.32   49.2 76.5 56.47   49.5
15 1,200 87.2 49.54   35.2 76.5 56.47   49.5

この問題は、固定観念を破ることが最大の壁である。
発想はそれほど難しいものではない。
「正確なデータを不正確にする」ということが非常識的、間違えた考え、などと思い込まないで試せるかどうかに多数派との決別点がある。
(SiriusA+B)

ブログ アーカイブ