2019年11月10日日曜日

第258夜 読んでおいて損はない競馬関連の書籍

▼「簡単に誰でも」という矛盾した書籍
秋も深まってきたら、以前は「読書の秋」と言って本を読むことが多かった。
電子書籍でも同じだが、読書量が減少した昨今では本を読み耽る人を見かけなくなった。
と、メディアでは報じられやすい。
実際には読書量はむしろ増えているようにも思える。
年間を通してネットでの読み物が増えているためだ。
素人でも発信できるため、正確性は今ひとつであるが、手軽に数多くのソースから必要な情報を集めることができる。
減少しているのは、出版社が出した出版物である。
1990年代に2兆円を超えていた紙の出版の売り上げは1兆円そこそこと半減している。
理由を「ネットが便利だから」と片付けないでほしい。
本の需給曲線が動いたのだ。
良書とは言い難い書籍が以前以上に売れないのである。
競馬の予想関連の書籍では「誰でも簡単に」という、詐欺紛いとは言い過ぎだが、少々怪しいものが昔から多かった。
誰でも簡単だと、的中率は軒並み上昇し、人気は偏って競馬が成り立たないし、そんな常勝の予想理論なら公開することがおかしい、と気が付くものだが、まあ多い。
出版社も次々と出版した。
玉石混淆である。
そこから「玉」を推薦しようと思う。
読んでおいて損はないものを選んだつもりである。
新しい書籍でこれというものが少ないこともあるのだが、わたしの推薦図書は絶版かそれに近いものにした。
是非、古書店で探し出してほしい。

▼西田式スピード指数
言わずと知れた西田式スピード指数の教科書である。
1990年代、競馬予想の手法に大きな影響を与えた。
スピード指数そのものも素晴らしいけれど、わたしは「同じ土俵で走破タイムの比較を試みる」という考え方に感銘を受けた。
コース、馬場、クラス、距離、斤量といったものをどのように調整していくか、その解決方法を丹念に読み込みたい内容である。
自分なりの正答を持っているかと思うが、できれば自分西田式を比較しながら読み進めるとより修正ができると思う。
指数を弾き出して予想が終わるのではなく、指数が出揃ったところが予想のスタート地点であることも著書には記されている。
マスターすれば誰でも再現可能な理論である。

▼競馬の記号学 速度理論・数量化理論 分析編
走破タイムを速度に変換し、その上で数量化1類(ダミー変数を用いた重回帰分析)という統計学の手法を使った予想理論の入門書である。
実際に「公式」を使って実践するものではなく、因子が走破タイムに与える影響を示す内容となっている。
難易度でいえばかなり難解な部類かと思うが、AI予想に先駆けたもので、自分の予想に取り入れられればAIより優れた方法になるだろうと思う。
わたしも数量化1類をベースに分析するが、速度を利用しない(何を目的変数にするか)のでかなり異なるものの、参考にさせていただくことは非常に多い。
非常に優れた内容で、何度も読み返しては自分のものにしていただきたい書籍である。
こちらも理解できれば再現は可能だ。
ただし、表計算ソフトやちょっとしたプログラムも書けないと厳しいかもしれない。

▼ハンデキャッパーの方法
予想理論ではないが、JRAのハンデキャッパーやスターターのインタビューを通じてレース運営側の考え方を学べる著作である。
馬のどこを見ているのか、ハンデの付け方、レースの展開など大いに参考になると思う。
特に斤量が示す強さ、格、距離、セックスアローワンスはきちんと頭に入れておきたい。

▼競走馬私論
藤沢和雄調教師の著作で、厩舎運営の考え方を知る貴重な内容が詰まっている。
外厩全盛時代の前時代の話だが、血統に重きを置いた人には調教師の奮闘ぶりに考えを改めるような内容である。
騎手のエッセイや作家宮本輝先生の小説「優駿」も併せてご覧になれば、さらに理解が深まると思う。

他にもいくつか推薦したい本はあるが、カロリーの最も高い、すなわち学ぶべき情報が多い、考え方が参考になるとわたしが思う著作は以上である。
ちなみに、良い本の見分け方だが、「誰でも簡単に」というフレーズの書籍は外せると思う。
(SiriusA+B)

2019年11月3日日曜日

第257夜 平均走破タイムに影響するもの


▼月別走破速度
含水率による馬場状態を気に留める人は少なくないけれど、同じ良馬場でも時期によって走破速度が異なることはご理解いただいているだろうか。
誰でも知っているものと思っていたところ、そうでもないと周囲を見て気付いた次第である。
極端ではないけれど、月別に見れば、まあ違う。
特にダートコースは一定と評されることが多いので、こうした事実を伝えにくいのかもしれない。
或いはご存知の人でも「冬のダートは乾燥してパンパン、力も要る」くらいの認識かもしれない。
わたしもそのくらいの認識である。
だが、もう少し巨視的に調べてみようと思う。
実は、母集団や成長などさまざまな原因が複合して走破タイムは動いているのだ。
それぞれの影響度合いを示すことは未だできないが、どのような要素が平均走破タイムに影響を与えるか知っておくのも良いかと思う。
速度を決定するメカニズムを知る上で役立つことになろう。
わたしのように走破タイムを分析対象にしていない人にとっては瑣末なこととも言えるが、スピード指数やわたしがこのブログで推奨する速度を活用する人には、復習も兼ねて読んでいただきたいと思う。

ダート
速度km/h 完走件数 平均距離m 出走前平均獲得賞金 平均日齢 平均性別 速度km/h 完走件数 平均距離m 出走前平均獲得賞金 平均日齢 平均性別
1 59.05 13,625 1,742 1,521,785 1,431 1.36 1 56.73 21,554 1,517 961,971 1,379 1.35
2 59.13 13,966 1,717 1,444,049 1,440 1.39 2 57.00 18,433 1,535 1,094,103 1,389 1.34
3 58.84 16,434 1,712 1,205,667 1,453 1.39 3 56.78 22,279 1,515 889,354 1,391 1.36
4 59.27 17,494 1,712 1,036,518 1,449 1.40 4 57.06 19,023 1,517 953,206 1,402 1.35
5 59.61 20,486 1,691 914,308 1,458 1.41 5 57.32 17,888 1,539 1,047,099 1,436 1.33
6 59.42 17,323 1,670 872,893 1,439 1.40 6 57.37 16,270 1,527 929,387 1,402 1.35
7 59.43 21,293 1,591 702,833 1,373 1.44 7 57.22 16,373 1,508 914,030 1,410 1.37
8 59.68 22,893 1,581 611,459 1,346 1.46 8 57.20 15,220 1,507 919,719 1,423 1.38
9 59.61 18,665 1,623 775,704 1,334 1.45 9 56.96 15,538 1,515 931,813 1,427 1.38
10 59.70 17,840 1,652 1,054,715 1,385 1.41 10 57.53 15,967 1,518 1,178,438 1,482 1.32
11 59.61 19,331 1,643 1,077,578 1,366 1.41 11 57.47 16,985 1,508 1,226,415 1,450 1.32
12 59.16 16,634 1,697 1,307,526 1,399 1.39 12 56.92 18,764 1,529 1,159,102 1,424 1.33
全体 59.40 215,984 1,663 1,007,197 1,403 1.41 全体 57.11 214,294 1,520 1,015,141 1,416 1.35
3 99.1 7.6 102.9 119.7 103.6 98.6 1 99.3 10.1 99.8 94.8 97.4 100.0
1 99.4 6.3 104.8 151.1 102.0 96.5 3 99.4 10.4 99.7 87.6 98.2 100.7
2 99.5 6.5 103.2 143.4 102.6 98.6 12 99.7 8.8 100.6 114.2 100.6 98.5
12 99.6 7.7 102.0 129.8 99.7 98.6 9 99.7 7.3 99.7 91.8 100.8 102.2
4 99.8 8.1 102.9 102.9 103.3 99.3 2 99.8 8.6 101.0 107.8 98.1 99.3
6 100.0 8.0 100.4 86.7 102.6 99.3 4 99.9 8.9 99.8 93.9 99.0 100.0
7 100.1 9.9 95.7 69.8 97.9 102.1 8 100.2 7.1 99.1 90.6 100.5 102.2
9 100.4 8.6 97.6 77.0 95.1 102.8 7 100.2 7.6 99.2 90.0 99.6 101.5
5 100.4 9.5 101.7 90.8 103.9 100.0 5 100.4 8.3 101.3 103.1 101.4 98.5
11 100.4 9.0 98.8 107.0 97.4 100.0 6 100.5 7.6 100.5 91.6 99.0 100.0
8 100.5 10.6 95.1 60.7 95.9 103.5 11 100.6 7.9 99.2 120.8 102.4 97.8
10 100.5 8.3 99.3 104.7 98.7 100.0 10 100.7 7.5 99.9 116.1 104.7 97.8
※日齢は日数。「出走日-誕生日」。性別は牡を1、牝を2としたときの完走馬平均で、2に近づくほど牝馬の比率が高くなる。下半分の黄色の網掛けは全体を100とした場合の数値。


▼芝とダートで要素の影響度合いは違う
平均走破タイムが変動する要素としてわたしが推定したのは、距離、性別、日齢、出走前平均獲得賞金である。
芝とダートは別々に分けている。
今回分析対象外とした馬体重、開催競馬場の分析は皆さんにお任せしたいが、この分析で結論が大きく変わる可能性もある。
また、性別分析はもう少し詳しく調べれば示唆に富む結果が出るように思う。
データは、少々古いが2006-20149年間の中央競馬平地競走完走馬の記録を用いた。
このあと見ていくが、芝とダートで傾向が違うので注意されたい。

▼季節要因は芝・ダートとも同じ傾向
月毎に集計したデータを速度順に並べると、芝・ダートとも共通するのが季節要因である。
123月は速度が低く、1011月は速度が高くなる。

2月のダートはその他の要因もあり、速度は平均を少し下回る程度なのだが、基本的には時計がかかるとみていいだろう。

また、12月は冬のカテゴリーに入れて良い気がする。
12月から3月までを冬場とみるのも間違いではなかろう。


季節要因は、昔から指摘されていたことではある。
ダートは乾燥してパンパンの良馬場、芝も枯れ、どちらも時計がかかるのは確かだろう。
だが、1011月との対比をしてみて、単純に馬場状態の問題ではないように思えた。
先ず、競走馬自体が不活発である可能性である。
「天高く馬肥ゆる秋」ということばがあるように、体調が良い時期は人間と同様に秋である。
寒くなれば冬毛に変わり、冬支度をするのである。
馬場だけではなく、競走馬自体も「冬モード」になっているものと思われる。
さらに、競走条件の影響も推定される。
出走馬数をみれば分かるが、ダート競走は1月から3月まで多く、下級条件競走が多く組まれる。
出走馬日齢も1月には12月より一気に下がり、3歳馬の競走が増えていることも推定できる。
つまり母集団のレベルも下がっているのではないかという仮定ができる。
実際、フェブラリーステークスのある2月はともかく、13月のダート競走出走馬の出走前平均獲得賞金額は低めである。
一方、芝コースでも速度は低下しているのだが、「下級条件競走がダートにシフトしているのだから、速度は高くなってもおかしくないのでは」という疑問が出る。
春のG1競走に向けて高額条件馬も始動しており、体調面だけを理由にするのは腑に落ちない。
そこで見つけたのが競走距離である。
12月から芝競走は絞られてくるので、上級競走の比重が高くなり、競走距離が伸びるのである。

芝コースの場合、どうやら距離による速度低下は大きいようである。
別の見方をすれば、芝コースでは速度と競走レベルの相関性は思ったほど高くない、すなわち、上級条件競走でも速度がそれほど高くなるわけではない、ということか。
ちなみに、ダート競走は年間を通じて競走距離の差が少ない。
10月、11月に速度が高くなるのは競走の数が少なく、比較的上級条件競走の比重が高いことによる可能性が高い。


▼古馬戦を分けて再度挑戦
ここまで調べてきたのだが、やはりもう少し細かく分類しないと分からないことがあるように思えてきた。
すぐにはできないが、いずれ改めて分析してみる。
(SiriusA+B)

ブログ アーカイブ