2020年5月31日日曜日

第279夜 出走頭数に注意を払う

不思議なデータ
データをいじっていると、ときどき思いもかけない結果になって頭を悩ますことがある。
例えば日齢(年齢や月齢よりも小さいもの)を順位付けするとき、若い順にしたり年長者から数えたりすると、なるほどと思うデータになる。
逆から数えてみると興味深い集計ができることがあるのだ。
ところが、調子に乗って何でも逆から順位付けしていたところ、あるデータで「何だろう」という結果になった。
枠順(馬番)である。
最内枠から1番、2番と付けられていることは周知のとおりだ。
これをひっくり返して大外から1番、2番と付けてみたのである。
例えば13頭立てなら、馬番13番を「1番」、馬番1番を「13番」とする。
出走頭数によって本当の1番は16番になったり18番になったりする。
これで逆番ごとに勝率を集計したのだ。
そうすると下表のように、正規の馬番での勝率と似た右肩下がりのデータに仕上がった。
「大外(逆番1)が最も勝率が高い!
一瞬、目を疑ったのだった。
しばらくの間、謎が解けなかった。

★馬番とその逆番(大外を1番とする番号)の番号別勝率(2006-2018、中央競馬全競走、取消・除外・競走中止等含む)
馬番/逆番 馬番勝率 逆番勝率
1 7.079% 7.442%
2 7.455% 7.112%
3 6.890% 7.175%
4 7.629% 7.003%
5 6.965% 7.157%
6 7.301% 7.263%
7 7.191% 7.362%
8 7.308% 6.991%
9 6.893% 7.354%
10 7.231% 6.879%
11 6.670% 6.670%
12 6.832% 6.550%
13 6.429% 6.783%
14 6.309% 6.303%
15 5.976% 6.443%
16 6.343% 5.823%
17 4.691% 5.438%
18 5.580% 6.195%

もちろん、これにはカラクリがある。
出走頭数を考慮していなかったからである。
馬番・逆番とも、番号が大きくなるにつれ、出走頭数別平均勝率に近づいてくる。
出走頭数別平均勝率とは、12頭立てなら1/128.3%18頭立てなら1/185.6%である。
だから、例えば16頭立て限るなど、頭数を揃えて集計すれば、馬番でも逆番でもちゃんと同じ「外枠不利」になる。
わたしの拙い説明でよく分からない人、詳しく知りたい人はご自身でもやってみるとよく分かる。

★馬番とその逆番(大外を1番とする番号)の番号別勝率算出根拠付
馬番/逆番 馬番件数 馬番勝馬数 馬番勝率 逆番件数 逆番勝馬数 逆番勝率
1 44,894 3,178 7.079% 44,894 3,341 7.442%
2 44,894 3,347 7.455% 44,894 3,193 7.112%
3 44,894 3,093 6.890% 44,894 3,221 7.175%
4 44,894 3,425 7.629% 44,894 3,144 7.003%
5 44,893 3,127 6.965% 44,893 3,213 7.157%
6 44,873 3,276 7.301% 44,873 3,259 7.263%
7 44,795 3,221 7.191% 44,795 3,298 7.362%
8 44,543 3,255 7.308% 44,543 3,114 6.991%
9 43,827 3,021 6.893% 43,827 3,223 7.354%
10 42,552 3,077 7.231% 42,552 2,927 6.879%
11 40,657 2,712 6.670% 40,657 2,712 6.670%
12 38,245 2,613 6.832% 38,245 2,505 6.550%
13 34,824 2,239 6.429% 34,824 2,362 6.783%
14 31,144 1,965 6.309% 31,144 1,963 6.303%
15 26,539 1,586 5.976% 26,539 1,710 6.443%
16 21,330 1,353 6.343% 21,330 1,242 5.823%
17 4,818 226 4.691% 4,818 262 5.438%
18 4,068 227 5.580% 4,068 252 6.195%


このときは大いに悩んだけれど、原因が判明してからは出走頭数にもよく注意するようになった。
スピード指数で基準タイムを3着までで作る場合、出走頭数を加味したほうがいいかもしれないとか、賞金は5着までだが(手当を除く)少頭数でもらいやすかったのではないか、など「上位何頭」というデータには注意している。

馬券と頭数
オッズや馬券の組み合わせでは出走頭数の影響が大きい。

オッズは窪みの話題の中で、頭数別標準オッズを示しているとおりだ。

馬券の組み合わせは数多くのサイトで一覧にしてくれている。
あまり触れられていないのだが、わたしが補足したいのは、頭数別組み合わせの「増加率」に注目してほしい、ということである。
例えば16頭立ての競走で三連単の組み合わせ数は3,360通りである。
全通り買おうとすれば3,360通りだが、貴方に「絶対に3着までには入らない自信のある馬」が3頭いるとすればどうか。
16
頭から3頭を除いて13頭の組み合わせを買えばいいと思うだろう。
13
頭の組み合わせ数は1,716通りである。
3
頭減らすだけで「買い目のダイエット率」は49%、約半分になる。
おそらくこれを利用した買い方で世間を騒がせた1件はピンとくる人がいるだろう。

★馬券券種別組み合わせ数
出走頭数 単勝・複勝 馬連・ワイド 馬単 三連複 三連単
8頭 8 28 56 56 336
9頭 9 36 72 84 504
10頭 10 45 90 120 720
11頭 11 55 110 165 990
12頭 12 66 132 220 1,320
13頭 13 78 156 286 1,716
14頭 14 91 182 364 2,184
15頭 15 105 210 455 2,730
16頭 16 120 240 560 3,360
17頭 17 136 272 680 4,080
18頭 18 153 306 816 4,896
組合せ増加数 単勝・複勝 馬連・ワイド 馬単 三連複 三連単
8頭
9頭 1 8 16 28 168
10頭 1 9 18 36 216
11頭 1 10 20 45 270
12頭 1 11 22 55 330
13頭 1 12 24 66 396
14頭 1 13 26 78 468
15頭 1 14 28 91 546
16頭 1 15 30 105 630
17頭 1 16 32 120 720
18頭 1 17 34 136 816

自分の馬券理論を検証するときには、出走頭数に気をつけたほうが良さそうだ。
思いの外、少頭数のレースしか的中させていないケースはあるかもしれない。
この記事を書きながら、わたしも順位付けした数値を見直してみようと思っている。
(SiriusA+B)

2020年5月24日日曜日

第278夜 競馬とは(このブログについて)

国語の時間?
日本語は難しいと思う。
原因は主語の省略にある。
いや、他にもあるけれど。

競馬とは馬が順位を争う競技、またこれに賭けること、と言えば「そうだよね」となる。
だが、正確には「競馬とは馬を走らせる競技」である。
動詞をキチンと書けば「誰が」という主語が抜けていることに気がつく。
騎手である。
騎手が馬を走らせて順位を争うのだ。
では何のために。
目的語も欠けていることに気がつく人は少なくあるまい。
馬のために争うのかと言うと、確かに生存競争なのだが、それは全体の目的の小さなひとつに過ぎない。
ビジネスの世界で使われることばでいう「ステークホルダー」のためなのである。
調教師や厩務員など厩舎、馬主、生産者そして騎手だ。
彼らのために賞金と栄誉をかけて走らせるのである。
わたしたちは、その闘いをギャンブルにしている。
ギャンブルにしているが、スポーツとしての競馬の本質はそういうもので、市場原理に基づいた立派な経済活動なのである。
厩務員は生活のために馬の世話をする。
オーナーも潤えばまた新しい馬を手に入れられる。
生産者は次の世代の馬を売りやすくなる。
また、日本ダービーを勝つことは名誉なことで、競馬関係者で制したいと思わぬ者はいないだろう。
だから争う。
それが社会の仕組みである。
国語の時間ではなく、社会の時間だった笑。

スポーツとギャンブル
スポーツとしての競馬を理解していないと賭事としての競馬でも本質を見失う。
スポーツとギャンブルとの混合は競馬ファンにとって良い話だと思うが、スポーツとしての魅力とギャンブルの部分を明確に区分できない人は多いように思う。
確かに、血統にまつわるストーリーにはロマンを感じる。
好敵手の争いで盛り上がるG1競走も心踊る。
馬の成長物語には自分の半生を重ね合わせる。
だが、それは、スポーツとしての競馬の魅力である。
ギャンブルとしての競馬は、「どうやって勝つか」を考える競馬人とその所有馬を天秤にかけ勝ち名乗りに乗るものである。
それなのに、多くの馬券投票者が競走馬だけに眼を奪われている気がするのである。
競走馬を育て、仕上げて、カネと名誉を競うのはステークホルダーだ。
馬を走らせるのは人間である。
その割に、馬の能力だけで予想している人は多くないだろうか。

「誰が」という主語を念頭におく。
どうやれば勝つことができるのか、競走している認識すらない競走馬自身が戦略を考えるわけでないだろう。
どうすれば馬を勝たせられるのか、ステークホルダーがレース戦略を考え、騎手が戦術を考えるのではないだろうか。
素人のわたしたち馬券投票者が考える前に、彼らが考えている。
騎手の真似をして考えても仕方あるまい。
むしろ、彼らが何を考えているのか、彼らの競走馬を仕上げる技量はどれくらいなのか、それを考えるのがわたしたち馬券投票者ではないか。

レースも同様である。
主催者がG1競走の馬券で控除率を下げてくれたりするのなら大切だが、わたしたちにとってはローカルの未勝利戦でも価値は同じである。
ギャンブルとしてみた場合、レースの価値はすべて同じなのである。
「いや、大切だ」という反論があるなら、それは誤解である。

その人にとって、大事だと思っている(思い込んでいる)のは、あくまでスポーツの競馬での部分である。

このブログについて
2項は、わたしの考える「ギャンブルとしての競馬の基礎」である。
競馬だから馬をよく見ましょう、というのはその通りだけど、ずっとそこに留まっている人にそんな話をする。
馬のことが分かるようになれば競馬予想で勝てる、という生易しいものではない。
競馬の仕組みを分かっていなければ競馬予想では勝てない、とわたしは考える。

このブログには「自分で予想理論を築きたいひとのための、予想をしないブログです」と書いている。
カテゴリー分けしにくいジャンルかもしれないが、予想ではなく予想理論を考えるブログなのだ。
人間についてはいろいろ問題も生じやすいので、話題は競走馬の統計的な分析や馬券投票者の傾向を中心にしているが、わたし自身は競走馬だけを見ているわけではない。

投資の世界で使う「ベンチマーク」はオッズだ。
このブログは、オッズを超える、オッズに近づく(的中率でも収支でも)材料探しの思索の記録とも言える。
考えをまとめたものではないので、重要なところを太字にしたり下線を引いたりしないし、断定したりこうあるべきだと言う主張も極力避けている。
そういうブログである。
深く調べたい人のために簡単な表は載せても、グラフは読者に委ねている。
グラフにすると理解しやすい半面、思考を誘導してしまうのだ。

わたしのことを理解してほしい、共感してほしい、というブログでないことがお分かりいただけただろうか。
自分の理論や予想を披露したり紹介したりするものではないのだ。
さまざまな理論や考え方を自分なりに考察して書く。
元々、わたしの思考備忘録からスタートしている。
明確な事実誤認を指摘することはあるけれど、基本的に否定ではなく補完するイメージで書く。

わたしにかまってほしい、わたしの競馬理論を聞いて、というブログにするなら、もう少し校正する笑。
話がときどき(しょっちゅう)飛ぶのも放ったらかしなので。

最近少しばかり閲覧数が増えているようなので、これまでお読みいただいている読者にも併せて、このブログの意図を紹介した。
最終回ではないので誤解なきよう。
(SiriusA+B)

2020年5月17日日曜日

第277夜 タイム系指数で成長曲線を描くことは難しい


速度は早々に頭打ち
このブログで繰り返し指摘しているように、競馬はスピードを競うものではなく順位を競う競技である。
「いちばん速い馬が勝つ」は主従逆転で「勝った馬がいちばん速いタイムだった」のである。
したがって、速さを目安とした判断基準は「他に良い物差しが無いから」使っていることを忘れると痛い目にあう。

古典的な血統理論で全兄弟問題が難題であるように、タイム系指数にも難題がある。
わたしがこのブログでよく使う「速度」という尺度でみると、数戦程度経験すれば速度は頭打ちになる。
成長していないわけではないし、競走距離も伸びる傾向である。
速度を維持するだけでも素晴らしいことなのだが、速度から成長を感じることは難しいのだ。
古馬戦の予想はどの手法でも難しいのだが、取り分けタイム系には「頭打ち」問題で苦戦しているのではないだろうか。

下表は完走経験回数別平均速度をプロットしたものである。
平地競走全体、芝とダート別で、(1)競走馬全体(2)中央競馬平地競走で3勝以上した馬(3)46戦以上経験した馬で集計した。
(2)(3)
は長期にわたって中央競馬で活躍した馬を抽出したものと思ってよい。
これに対し(1)は全体であり、デビューしたものの早々に地方転厩や引退をした大量の競走馬を含んでいる。
ぜひグラフにしていただきたい。
(1)
(2)(3)は初期ほど乖離しており、完走回数が増えるつれて速度の差は縮まっていく。
3
種類の線は何を意味するのか。
活躍馬と出走経験豊富な馬の集団はニアリーイコールである、ということ。
(1)
(2)(3)が初期に乖離して次第に近い値になっていくのは、(1)の母集団(全体)1戦ごとに成績の振るわぬ馬の退場によって平均能力が上がっていく、ということ。
したがって、初期のデータからは「母集団の向上」を差し引かなければ成長の数字にはならない。
そう考えると、速度でみる成長幅のなんと小さいことか。
馬場調整で吹き飛びそうである。

出走前完走回数 修正走破速度平均(全体) 3勝馬修正走破速度平均 45走超馬修正走破速度平均 芝修正走破速度平均 3勝馬芝修正走破速度平均 45走超馬芝修正走破速度平均 ダ修正走破速度平均 3勝馬ダ修正走破速度平均 45走超馬ダ修正走破速度平均
0回(初出走) 58.02 58.50 58.79 58.82 59.04 59.28 56.58 57.12 57.03
1回 58.12 58.84 58.86 59.32 59.61 59.57 56.71 57.43 57.08
2回 58.07 58.83 58.92 59.42 59.67 59.83 56.83 57.60 57.30
3回 58.17 58.94 58.84 59.55 59.80 59.81 56.99 57.81 57.38
4回 58.27 59.02 58.68 59.62 59.87 59.76 57.14 57.94 57.17
5回 58.41 59.12 58.81 59.74 59.95 59.86 57.30 58.09 57.40
6回 58.55 59.18 58.70 59.83 60.02 59.80 57.44 58.17 57.30
7回 58.65 59.27 58.88 59.92 60.09 59.98 57.56 58.29 57.50
8回 58.71 59.33 59.03 59.98 60.18 59.99 57.63 58.35 57.79
9回 58.80 59.39 59.24 60.08 60.29 60.14 57.72 58.36 57.98
10回 58.90 59.40 59.21 60.13 60.32 60.12 57.84 58.38 58.00
11回 58.95 59.46 59.26 60.18 60.38 60.20 57.89 58.45 58.10
12回 59.00 59.47 59.40 60.21 60.39 60.36 57.94 58.45 58.05
13回 59.06 59.55 59.24 60.27 60.48 60.21 58.00 58.53 57.94
14回 59.06 59.50 59.12 60.25 60.41 59.86 58.01 58.49 58.14
15回 59.13 59.54 59.47 60.31 60.46 60.40 58.07 58.53 58.25
16回 59.13 59.53 59.39 60.27 60.43 60.32 58.10 58.52 58.22
17回 59.13 59.51 59.45 60.29 60.46 60.49 58.08 58.44 58.06
18回 59.16 59.55 59.42 60.30 60.47 60.32 58.11 58.51 58.15
19回 59.22 59.57 59.44 60.38 60.52 60.29 58.13 58.47 58.18
20回 59.24 59.59 59.42 60.35 60.50 60.31 58.15 58.51 58.16
21回 59.25 59.63 59.42 60.32 60.48 60.35 58.19 58.58 58.20
22回 59.29 59.63 59.57 60.37 60.51 60.46 58.20 58.54 58.33
23回 59.32 59.61 59.49 60.38 60.47 60.32 58.21 58.51 58.32
24回 59.32 59.64 59.51 60.40 60.55 60.37 58.18 58.47 58.29
25回 59.33 59.63 59.54 60.34 60.46 60.43 58.22 58.56 58.29
26回 59.34 59.62 59.50 60.34 60.43 60.28 58.24 58.59 58.40
27回 59.35 59.66 59.57 60.35 60.48 60.38 58.21 58.56 58.40
28回 59.42 59.70 59.53 60.42 60.53 60.39 58.26 58.58 58.30
29回 59.39 59.68 59.55 60.37 60.50 60.49 58.23 58.53 58.20
30回 59.38 59.69 59.44 60.33 60.47 60.33 58.27 58.61 58.24
31回 59.39 59.67 59.65 60.29 60.41 60.57 58.29 58.61 58.38
32回 59.40 59.72 59.51 60.37 60.52 60.50 58.19 58.57 58.16
33回 59.33 59.60 59.24 60.26 60.30 60.26 58.18 58.54 57.84
34回 59.36 59.63 59.40 60.22 60.33 60.22 58.22 58.52 58.25
35回 59.41 59.60 59.44 60.30 60.33 60.23 58.26 58.55 58.36
36回 59.41 59.65 59.43 60.29 60.38 60.26 58.27 58.60 58.28
37回 59.31 59.62 59.45 60.30 60.36 60.31 58.05 58.46 58.21
38回 59.42 59.66 59.49 60.32 60.36 60.34 58.20 58.53 58.30
39回 59.45 59.76 59.49 60.42 60.53 60.45 58.16 58.52 58.13
40回 59.49 59.81 59.58 60.43 60.59 60.53 58.19 58.52 58.24
41回 59.40 59.72 59.40 60.29 60.36 60.30 58.18 58.53 58.13
42回 59.41 59.67 59.42 60.27 60.28 60.22 58.22 58.59 58.25
43回 59.38 59.73 59.38 60.31 60.47 60.29 58.05 58.41 58.10
44回 59.38 59.67 59.43 60.21 60.34 60.25 58.21 58.57 58.25
45回 59.38 59.70 59.38 60.18 60.33 60.18 58.21 58.57 58.21
46回以上 59.50 59.68 59.50 60.21 60.33 60.21 58.20 58.42 58.21
個別にプロットすると更に
特定の馬の競走成績をプロットすると、更に速度が頭打ちになることがはっきりする。
馬場調整など無しに走破タイムをそのまま時速に換算すると最初の数戦を除き、ずっと同じような速さで推移することが分かる。
もちろん凸凹している。
「馬場調整していないからだ」と言う前に、着順や距離を念頭において眺めてもらいたい。
わたしには、着順と距離によって変動のほとんどを説明できそうにみえる。
残った差分を馬場調整とすれば、成長分の要素はほぼない。
スローペース調整、馬場調整、クラス調整など補正を重ねて分かりにくいのかもしれないが、走破タイムをそのままスピード指数や速度に変換すれば競走馬の成長指数を描くことはできない、或いは極めて困難であることが分かるだろう。

積み上げ方式
では、成長や経験値を積んだことを表わす方法はないだろうか。
ひとつの回答がポイントの積み上げである。
経験値ポイントを付与していけばいいのではないか。
デビューした、2着だった、それでは20ポイント与えよう、2戦目は逃げた、ゴール前で粘って勝った、それでは50ポイント与えよう、といった具合にだ。
ポイントは減らない。
出走数が多くなってくれば1走あたりの平均を取ることもできる。
平均であれば成績の下降に連れて下がってくる。
賞金を着順をベースにポイントを付けたり、見どころのあった馬にボーナスポイントを上乗せしたりすれば、走破タイムに代わる武器になろう。
レイティングに似ている作業である。
この記事では割愛するが、ポイントの付け方例をどこかで記事にしたい(覚えていたらね)
(SiriusA+B)

ブログ アーカイブ