▼障害競走を分ける理由
芝とダートのデータをつなぐのに、速度という尺度が便利であるという話である。
このブログの記事では、多くの場合、芝とダートを合わせて集計したり分析したりしている。
中央競馬では、芝、ダート、障害競走がある。
データ派の予想家には、それぞれ分けて研究している人が多いように思う。
わたしも障害競走は分けて研究するほうが良さそうだとは思うが、競走形態が違うというより別の理由からである。
その理由とは、障害競走と平地競走では出走馬の交流が極めて少ないことである。
もちろん「障害帰り」の馬が平地競走にエントリーすることもある。
だが、芝とダートのように行き来することはほとんどない。
したがって、平地競走を軸にしたデータを考えるとき、障害競走のデータは地方競馬や海外の競走に出走するくらいサンプルが少ないため「不要」なのである。
だから、分けている、もっと言えば除いているのである。
データクレンジングのひとつとも言える。
一方、芝とダートは頻繁に行き来がある。
テニスの芝コートとクレーコートのようなもので、コート以外の条件、出場する馬や騎手は同じ、ルールも同じだ。
どちらのデータも密接に絡んでいる。
▼速度データでは標準偏差もほぼ等しくて
ところが、スピード指数系の予想理論では、芝とダートを分けて考えることが少なくないと思う。
「皆がそうしているから」とか「別物だから分けるのは常識だ」とかいった思考停止はなしにしよう。
大勢の人が敗ける競馬では、「常識」を疑うくらいがちょうどいいのだ。
芝とダートの競走データを分けると言ったが、分けざるを得ないというのが実情に近い。
スピード指数系では「秒」あるいは「10分の1秒」をベースした指数を用いている。
この指数では、着差などの分布が芝とダートで大きく異なる。
ダートでは、力が要る分、あるいは出走馬のばらつきが大きく、着差が広がりやすい、という。
わたしはこれらの理由を正しいとは考えていないが、分布に違いがあることは確かだ。
分布の形状が大きく異なるものを一緒にすることは、何かと都合が悪い。
だから、分ける。
しかし、速さすなわち速度であれば、芝とダートの速度分布はかなり似てくる。
標準偏差を出すと、両者の数値はかなり近い(芝1.76126、ダート1.76764)。
これなら一緒にできる。
芝とダートの差も、コースの差として調整することができるのである。
▼芝とダートの走破速度分布(2006-2014平地競走完走馬430,278頭)
芝とダートのデータをつなぐのに、速度という尺度が便利であるという話である。
このブログの記事では、多くの場合、芝とダートを合わせて集計したり分析したりしている。
中央競馬では、芝、ダート、障害競走がある。
データ派の予想家には、それぞれ分けて研究している人が多いように思う。
わたしも障害競走は分けて研究するほうが良さそうだとは思うが、競走形態が違うというより別の理由からである。
その理由とは、障害競走と平地競走では出走馬の交流が極めて少ないことである。
もちろん「障害帰り」の馬が平地競走にエントリーすることもある。
だが、芝とダートのように行き来することはほとんどない。
したがって、平地競走を軸にしたデータを考えるとき、障害競走のデータは地方競馬や海外の競走に出走するくらいサンプルが少ないため「不要」なのである。
だから、分けている、もっと言えば除いているのである。
データクレンジングのひとつとも言える。
一方、芝とダートは頻繁に行き来がある。
テニスの芝コートとクレーコートのようなもので、コート以外の条件、出場する馬や騎手は同じ、ルールも同じだ。
どちらのデータも密接に絡んでいる。
▼速度データでは標準偏差もほぼ等しくて
ところが、スピード指数系の予想理論では、芝とダートを分けて考えることが少なくないと思う。
「皆がそうしているから」とか「別物だから分けるのは常識だ」とかいった思考停止はなしにしよう。
大勢の人が敗ける競馬では、「常識」を疑うくらいがちょうどいいのだ。
芝とダートの競走データを分けると言ったが、分けざるを得ないというのが実情に近い。
スピード指数系では「秒」あるいは「10分の1秒」をベースした指数を用いている。
この指数では、着差などの分布が芝とダートで大きく異なる。
ダートでは、力が要る分、あるいは出走馬のばらつきが大きく、着差が広がりやすい、という。
わたしはこれらの理由を正しいとは考えていないが、分布に違いがあることは確かだ。
分布の形状が大きく異なるものを一緒にすることは、何かと都合が悪い。
だから、分ける。
しかし、速さすなわち速度であれば、芝とダートの速度分布はかなり似てくる。
標準偏差を出すと、両者の数値はかなり近い(芝1.76126、ダート1.76764)。
これなら一緒にできる。
芝とダートの差も、コースの差として調整することができるのである。
▼芝とダートの走破速度分布(2006-2014平地競走完走馬430,278頭)
芝コース
|
ダートコース
| ||||
走破速度
|
件数
|
割合
|
走破速度
|
件数
|
割合
|
67km/h
|
6
|
0%
|
65km/h
|
0
|
0%
|
66km/h
|
194
|
0%
|
64km/h
|
0
|
0%
|
65km/h
|
833
|
0%
|
63km/h
|
34
|
0%
|
64km/h
|
2415
|
1%
|
62km/h
|
780
|
0%
|
63km/h
|
9887
|
5%
|
61km/h
|
6287
|
3%
|
62km/h
|
24500
|
11%
|
60km/h
|
20736
|
10%
|
61km/h
|
34288
|
16%
|
59km/h
|
35206
|
16%
|
60km/h
|
47245
|
22%
|
58km/h
|
41010
|
19%
|
59km/h
|
46022
|
21%
|
57km/h
|
46039
|
21%
|
58km/h
|
31818
|
15%
|
56km/h
|
35150
|
16%
|
57km/h
|
13300
|
6%
|
55km/h
|
19400
|
9%
|
56km/h
|
3912
|
2%
|
54km/h
|
7042
|
3%
|
55km/h
|
1054
|
0%
|
53km/h
|
1884
|
1%
|
54km/h
|
294
|
0%
|
52km/h
|
475
|
0%
|
53km/h
|
112
|
0%
|
51km/h
|
119
|
0%
|
52km/h
|
57
|
0%
|
50km/h
|
55
|
0%
|
51km/h
|
22
|
0%
|
49km/h
|
27
|
0%
|
50km/h
|
10
|
0%
|
48km/h
|
9
|
0%
|
49km/h
|
4
|
0%
|
47km/h
|
9
|
0%
|
48km/h
|
5
|
0%
|
46km/h
|
4
|
0%
|
47km/h
|
0
|
0%
|
45km/h
|
7
|
0%
|
46km/h
|
1
|
0%
|
45km/h未満
|
21
|
0%
|
45km/h
|
0
|
0%
|
|
|
|
45km/h未満
|
5
|
0%
|
|
|
|
芝とダートをつなぐ、このようなデータは、速度以外にもあるようだ。
賞金とか着順、人気など時計と関係が薄いデータである。
回廊はひとつではない。
換言すれば、走破タイム分析以外の道なら、芝とダートを合わせて分析しやすいということである。
(SiriusA+B)