2023年7月30日日曜日

第426夜 騎手の「2場3場問題」


▼騎手中心の予想
競走馬ではなく騎手を重点にして予想を組み立てる人がいる。
競走馬を分析することが「正しい」と、予想法を正しい/正しくないという観点で判断する人には信じられないかもしれないが、騎手中心の予想法もまた、理に叶う方法のひとつであるとわたしは考えている。
最大の利点は、1()あたりのデータ数が比較的多いことだ。
2022
年の実績で言えば、平地競走に出走した競走馬の実数は約11,000頭で、1頭あたり平均して5走弱の記録しかない。
生涯出走数でも、ハートランドヒリュの127戦が中央競馬平地競走の過去最大値で、未勝利馬なら10戦、1勝以上馬は20戦すれば上出来の部類だ。
この数で馬場適性や距離適性もあるまい、と思われるのは、おかしなことではない。
膨大な量の糸の山を調べたら、糸屑のように短い糸ばかりであった、という感じか。
一方、騎手は年間200人弱が騎乗し、リーディング上位者は年間600走から1,000走くらい騎乗する。
これくらいのデータがあれば、得手不得手の競走条件も朧げながら分かってこよう。
競馬のデータは膨大だが、1()あたりのレコード数が少ないという特徴を持つ。
だから分析が難しい。
騎手であれば、多少は「長めのデータ」をとれ、分析の困難さを少しでも緩和できるのである。

また、対戦型の分析をするにしても、騎手だけの組み合わせでレースを見れば、「かなり似た顔ぶれ」のレースが散見されるはずだ。
これを応用すれば、例えば、川田騎手とルメール騎手がふたりとも出走するレース、どちらかが出走するレース、どちらも出走していないレース、に分類する分析もできる。

以上のように、「騎手を重点的に予想し馬の優劣で貴方の予想指数ポイントを増減させる」というのは、「馬を重点的に予想し騎手の優劣で貴方の予想指数ポイントを増減させる」よりも精確である可能性もあるとわたしはみている。

23場問題
長い前置きになったが、これを踏まえ、騎手中心の予想を考えるなると、早々に、少々難しい問題に直面する。
調べれば直ぐに分かるが、勝率や複勝率、或いは支持率を騎手ごとに、時系列にプロットすると、これが波打つように上下動するのだ。
騎乗回数の多い上位騎手でも、1か月で50から80回程度の騎乗回数である。
そのため、月単位くらいでは振れ幅が大きくなるので、12か月移動平均をとってみたが、これでも勝率は上下動する。
人に関するデータはあまり載せないが、今回は、参考までに、武豊騎手の勝率移動平均を記事下に掲載する。
長い期間を観察しているので長期的なトレンドを推定できるが、勝率は平坦ではなく上がったり下がったりしていることが分かる。
技術力が短期間に上下動するわけではないことくらいは分かるが、好不調と片付けるのも大雑把な気がする。
この変動要素を突き止めることが精度向上に繋がるのだが、騎乗馬、競馬場や競走条件の得手不得手、乗り替わり、東西北海道遠征など個々の要素はある。
ただ、どうもそれだけでは変動の説明に足りないように思っている。
例えば、「23場問題」とわたしは呼んでいるのだが、同日に開催される数が東西2場なのか、第3場まであるのか、によっても成績が変わることは、あまり資料がない。
武豊騎手の勝率は、3場開催が最も高く、2場開催、(稀にあるが)1場開催の順に成績は低下する。
「有力騎手が分散するのだから当然だ」とは誰でも言える。
実際に集計すると影響の大きさは分かる。
肌感覚では分かっていながら放置しておくのは勿体ない、とわたしは思う。
ここでは割愛するが、是非、ご自身で集計してほしい。
たいへん興味深い情報を得られるだろう。
馬ではこういう現象は起こらない、或いは起こっても大きな影響はなく、騎手でのみ起こるのは、プレーヤーの数の違いが原因である。
すなわち、冒頭に述べたように、馬は実数11,000頭が条件の合う競走に出場するので、3場開催でも影響はほとんどないが、騎手は200人しかおらず、3場開催ではかなり分散する、つまり「手薄」になるのだ(馬の手薄の比ではないということ)
この結果、逆転可能な競争相手が減り、有力馬に乗った有力騎手が「寝首をかかれる」可能性は小さくなると考えられるのである。
G1
競走等による偏りを含め、突き詰めれば、騎手の対戦成績を考慮すべき、という結論になるのかもしれない。
ただ、騎手の対戦成績もまた、一筋縄ではいかないシロモノである。
膨大な量の計算が必要で、器用に処理しないと夜が明けてしまう。
(SiriusA+B)
(
図表426-1)武豊騎手の勝率12か月移動平均(中央競馬平地競走)
201101から201112まで 64勝/635回 10.1% 201601から201612まで 74勝/667回 11.1%
201102から201201まで 67勝/649回 10.3% 201602から201701まで 71勝/636回 11.2%
201103から201202まで 72勝/661回 10.9% 201603から201702まで 70勝/626回 11.2%
201104から201203まで 69勝/683回 10.1% 201604から201703まで 70勝/625回 11.2%
201105から201204まで 68勝/671回 10.1% 201605から201704まで 75勝/625回 12.0%
201106から201205まで 68勝/669回 10.2% 201606から201705まで 73勝/645回 11.3%
201107から201206まで 66勝/671回 9.8% 201607から201706まで 79勝/665回 11.9%
201108から201207まで 70勝/684回 10.2% 201608から201707まで 78勝/664回 11.7%
201109から201208まで 65勝/679回 9.6% 201609から201708まで 85勝/696回 12.2%
201110から201209まで 63勝/684回 9.2% 201610から201709まで 87勝/692回 12.6%
201111から201210まで 55勝/622回 8.8% 201611から201710まで 86勝/663回 13.0%
201112から201211まで 57勝/604回 9.4% 201612から201711まで 85勝/641回 13.3%
201201から201212まで 56勝/591回 9.5% 201701から201712まで 82勝/605回 13.6%
201202から201301まで 52勝/580回 9.0% 201702から201801まで 83勝/610回 13.6%
201203から201302まで 50勝/585回 8.5% 201703から201802まで 84勝/597回 14.1%
201204から201303まで 54勝/565回 9.6% 201704から201803まで 91勝/600回 15.2%
201205から201304まで 60勝/569回 10.5% 201705から201804まで 83勝/574回 14.5%
201206から201305まで 63勝/569回 11.1% 201706から201805まで 80勝/550回 14.5%
201207から201306まで 69勝/577回 12.0% 201707から201806まで 73勝/537回 13.6%
201208から201307まで 72勝/575回 12.5% 201708から201807まで 75勝/519回 14.5%
201209から201308まで 85勝/614回 13.8% 201709から201808まで 72勝/503回 14.3%
201210から201309まで 84勝/601回 14.0% 201710から201809まで 75勝/502回 14.9%
201211から201310まで 89勝/621回 14.3% 201711から201810まで 71勝/486回 14.6%
201212から201311まで 93勝/653回 14.2% 201712から201811まで 73勝/516回 14.1%
201301から201312まで 97勝/649回 14.9% 201801から201812まで 76勝/554回 13.7%
201302から201401まで 98勝/649回 15.1% 201802から201901まで 74勝/563回 13.1%
201303から201402まで 99勝/654回 15.1% 201803から201902まで 82勝/586回 14.0%
201304から201403まで 98勝/678回 14.5% 201804から201903まで 81勝/595回 13.6%
201305から201404まで 104勝/692回 15.0% 201805から201904まで 87勝/604回 14.4%
201306から201405まで 110勝/714回 15.4% 201806から201905まで 94勝/624回 15.1%
201307から201406まで 110勝/720回 15.3% 201807から201906まで 97勝/615回 15.8%
201308から201407まで 100勝/694回 14.4% 201808から201907まで 98勝/620回 15.8%
201309から201408まで 85勝/628回 13.5% 201809から201908まで 102勝/638回 16.0%
201310から201409まで 79勝/628回 12.6% 201810から201909まで 103勝/642回 16.0%
201311から201410まで 81勝/650回 12.5% 201811から201910まで 105勝/652回 16.1%
201312から201411まで 83勝/653回 12.7% 201812から201911まで 110勝/656回 16.8%
201401から201412まで 86勝/672回 12.8% 201901から201912まで 111勝/659回 16.8%
201402から201501まで 89勝/684回 13.0% 201902から202001まで 113勝/656回 17.2%
201403から201502まで 89勝/686回 13.0% 201903から202002まで 113勝/646回 17.5%
201404から201503まで 93勝/683回 13.6% 201904から202003まで 117勝/658回 17.8%
201405から201504まで 89勝/674回 13.2% 201905から202004まで 115勝/672回 17.1%
201406から201505まで 84勝/665回 12.6% 201906から202005まで 113勝/677回 16.7%
201407から201506まで 84勝/649回 12.9% 201907から202006まで 115勝/706回 16.3%
201408から201507まで 90勝/672回 13.4% 201908から202007まで 112勝/696回 16.1%
201409から201508まで 94勝/735回 12.8% 201909から202008まで 110勝/692回 15.9%
201410から201509まで 104勝/749回 13.9% 201910から202009まで 111勝/693回 16.0%
201411から201510まで 107勝/765回 14.0% 201911から202010まで 109勝/666回 16.4%
201412から201511まで 109勝/765回 14.2% 201912から202011まで 112勝/675回 16.6%
201501から201512まで 106勝/763回 13.9% 202001から202012まで 115勝/667回 17.2%
201502から201601まで 112勝/779回 14.4% 202002から202101まで 107勝/641回 16.7%
201503から201602まで 112勝/781回 14.3% 202003から202102まで 101勝/642回 15.7%
201504から201603まで 104勝/758回 13.7% 202004から202103まで 97勝/603回 16.1%
201505から201604まで 99勝/764回 13.0% 202005から202104まで 91勝/544回 16.7%
201506から201605まで 97勝/731回 13.3% 202006から202105まで 89勝/536回 16.6%
201507から201606まで 92勝/718回 12.8% 202007から202106まで 85勝/519回 16.4%
201508から201607まで 91勝/730回 12.5% 202008から202107まで 86勝/530回 16.2%
201509から201608まで 88勝/689回 12.8% 202009から202108まで 84勝/530回 15.8%
201510から201609まで 82勝/685回 12.0% 202010から202109まで 83勝/527回 15.7%
201511から201610まで 82勝/695回 11.8% 202011から202110まで 79勝/538回 14.7%
201512から201611まで 74勝/666回 11.1% 202012から202111まで 78勝/526回 14.8%
202101から202112まで 75勝/521回 14.4%

2023年7月23日日曜日

第425夜 人の褌(ふんどし)で相撲を取る


▼善悪とか、要らないから
できれば時間も労力も節約して儲けたい。
本音では、人は誰しもそう願う。
日頃、競馬の研究に余念のない人は、「それでは身に付かない(から長期的には黒字収支を維持できない)」と思っている。
わたしもそう思う。
思うが、他人様(ひとさま)の予想で馬券を買うのは、いけないことなのか。
これには「ちょっと待った」とわたしは言うだろう。
いけない、との主張には混乱というか混同があると思うのだ。
何も考えず他人の予想に乗ることが「ラクをする」ことである。

この姿勢に苦言を呈すには分かるが、他人の予想を研究し活用するのと切り分けて考えることはできないだろうか、と思っている。

予想は、独力でするか、他の意見を参考にするか、鵜呑みでするか、のいずれかである。
独力でも鵜呑みでも極端で、大勢は他者の意見を参考にすると思われる。
参考にするのは、予想家、予想記者の印や予想会社の提示などがある。
近年は個人も積極的に発信するので、これを参考にする人もいる。
自力でない、という点では、オッズもそうだし、人工知能AIも他者の予想だ。
有料か無料か、プロかアマか、人間かコンピュータか、個人か集団か、違いがあるようでも、参考にする予想という点では一緒なのである。
どれが良くて、どれがダメなのか、善悪で判断する考えは思考を縛り先入観を持ってしまうのでやめておいた方がいい。

▼データ収集
先ず、参考にする予想を選び出さなければならない。
できるだけ、平地競走全レースを予想しているものを探す。
メインレースなど限られた競走のみ公開している予想は除外する。
これらが上手い或いは下手な予想かどうかではなく、単に参考にできる数が少ないためである。
メディアに出てくる著名人の予想は主要レースだけだから、こうしたものは除く。
また、「1日限定数レース」というのも同様だ。

ほぼ全レースを予想しているものを抽出したら、予想の精度を検証する。
これが地味で地道な作業なのだ。
「ラクをしている」と批判されるのは、主にこの工程を省略するのを言う。
ひたすら、データをとっていく。
本音で言えば、1万レース分(ざっと3年ほど)くらいは予想が欲しいところだが、僅か1週の土日で最大72レースの予想は揃うから、とりあえずは、直ぐにでも実戦に投入できるだろう。

予想データ収集は、なかなか骨が折れる。
毎週、おそらく複数の資料やサイトからお目当ての予想印を手に入れる作業をしなければならない。
出走馬データと違い、予想データは予想者独自なので、それぞれ予想先に行かなければならないのだ。
有料のものなら、カネも掛かる。
競馬の結果データと異なり、レース後、直ぐに見えなくなる予想もある。
時間との勝負だが、メディア以外は約束された時間にアップする必要もないので、ギリギリまで予想が揃わない事態もある。
要するに、かなり面倒だということである。
加えて、後述するが、メンテナンスをこまめにやる必要があるし、自分の予想に活用する予想の入れ替えもある。
読者の皆さんには安心してほしい。
このデータ収集段階で8割から9割は断念する。
競合者は少ない。

▼検証する
予想データを収集し蓄積してきたら、印ごとに的中状況を検証していく。
わたしなら、記号ごとに勝率、連対率、複勝率などをまとめる。
ここで、記号とは無印も含む。
例えば、スポーツ紙Xの予想記者Zの印ごとの成績は以下のとおりであったとする。
予想記者Zの印=◎勝率19.6%15.1%12.0%9.0%5.8%
もうひとつ、無印がある。
無印は勝率2.5%だった、とする。
予想記者Zは、本命的中率は高いほうではないけれど、オーソドックスな印を打つ。
夏競馬のシーズンもあまり変わらない成績のようだ。
こういう情報を集めていく。

なお、こんなところでお断りもなんだが、他人様の予想は転載してはいけない。
予想も一種の創作物なのだ。
犯罪かそれに準じた問題であることを承知で転載し、「当たらない予想なんだからいいじゃないの」などという輩がいたら、言い返されないと思っている確信犯の犯罪者であるから言ってやってほしい。
「当たるか当たらないか、は問題ではなく、他人の創作物であることに変わりがない」と。
面白い映画とくだらない映画に海賊版の違法性は変わらないのと同じである。
わたしの、このブログについては、リンクを貼ったり数行程度引用したりするのは構わない。

▼総合する
ひとつの予想に乗るならともかく、複数の予想をまとめたいときはどうすれば良いだろうか。
できれば、複数の予想を合成したい。
あくまで解決方法のひとつだが、以下のようなやり方がある。
なお、勝率を用いるが、小数点を苦手な人もいると思うので100を掛けて分かりやすくする。
先程の◎19.6%なら「19.6点」としよう。
1)
出走馬すべての基礎点を7点とする。
2)
記者Zの印の勝率から7点を引く。なら19.6712.6点である。無印は勝率2.5%だから、2.57=-4.5点である。
3)
他の参考にする予想も一律に、勝率から7点を引く。
4)
出走馬それぞれ、基礎点と予想の点数を合計する。
以上だ。
出走馬中、最も高い点数の馬を貴方の本命とすればいい。
この方法だと、貴方の本命は人気馬になることが多いと思うが、割と安定した成績、勝てないときでも連対したり、3着以内に入ったりするだろう。
もちろん、参考にする予想本数、予想の質による。

▼弱点
「他人の褌予想法」は、実際のところ、素人のわたしたちが馬を見るより余程確かな方法ではある。
少し調べると分かるが、優れた予想家の印なら思わず乗りたいと思うだろう。
ただ、この方法の弱いところは、予想家の好不調やポリシーの変化をまったく読めない点だ。
速度や精度はともかく、人間の脳と人工知能の違いには、「処理能力のムラ」と「計算アルゴリズムの変更」がある、とわたしは思っている。
家事や仕事が忙しくて時間が割けなかったり、スランプ気味でつい手を広げすぎたり日和ったり、といった経験は誰しもあるだろう。
その解決策がスピード指数など、指数系と言われる予想群である。
予想家も、当然ながら、ムラも有ればアルゴリズムの変更も有る。
問題は貴方が制御できない点だ。

こうした「他人任せ」の弱点を補う方法として、投資の世界では、分散がある。
桁を言うのは問題があるので控えるが、資産運用に携わった経験から、分散投資の有用性を認識している。
異なる運用手法のファンドに少量ずつ投資する。
これにより、リスク(想定利回りの上下幅)を抑制できる。
波が打ち消しあって小さくなるイメージだ。
予想でも、できるだけ多くの予想を取り入れることで、何人かのムラもアルゴリズム変更も緩和できるのである。
下表では3予想を組み合わせた例を示しているが、実際にはもっと多くの予想を組み合わせるのが現実的だと思う。

もうひとつは、常に成績をウォッチし、スクラップアンドビルドをしなければならないことだ。
予想家でも人工知能でも、成績が下降すれば貴方の予想からは一旦外して別の予想家に入れ替える。
その後も見続け、成績が上がってくれば再び取り入れることもいい。
ムラ・アルゴリズムのような予想家の変化だけでなく、競馬そのものの変化がある。
毎年同じように見えても、プレーヤーは入れ替わっていくし、ルールも変わる。
例えば、この10年余りでも、騎手の時代、生産者の時代、など勝因分析すれば変化を感じることがあるだろう。
時代に合う予想スタイルもあれば、変化についていけていない予想スタイルもあるのだ。
(SiriusA+B)

(図表1)予想者の最近の成績(勝率)と7%を引いた数の例(単位%)
Z勝率 P勝率 Q勝率 Z平均差 P平均差 Q平均差
19.6 23.1 18.5 12.6 16.1 11.5
15.1 16.8 14.6 8.1 9.8 7.6
12.0 11.1 12.9 5.0 4.1 5.9
9.0 8.3 11.2 2.0 1.3 4.2
5.8 5.2 - -1.2 -1.8 -
- - 3.3 - - -3.7
2.5 2.4 2.6 -4.5 -4.6 -4.4

(図表2)16頭立て競走の他人の予想組合せ例
馬番 Z予想 P予想 Q予想 基礎点 Zポイント Pポイント Qポイント 合計得点 貴方の予想
1 7.0 2.0 1.3 4.2 14.5
2 7.0 -4.5 -4.6 -4.4 -6.5
3 ? 7.0 -4.5 -1.8 11.5 12.2 ?
4 7.0 -4.5 -4.6 -4.4 -6.5
5 7.0 -4.5 -4.6 -4.4 -6.5
6 7.0 8.1 4.1 5.9 25.1
7 7.0 12.6 16.1 7.6 43.3
8 7.0 -4.5 1.3 -4.4 -0.6
9 7.0 -4.5 -4.6 -4.4 -6.5
10 7.0 -4.5 -4.6 4.2 2.1
11 7.0 -4.5 -4.6 4.2 2.1
12 7.0 -4.5 -4.6 4.2 2.1
13 7.0 2.0 -4.6 -3.7 0.7
14 7.0 -4.5 -4.6 -4.4 -6.5
15 7.0 5.0 9.8 -4.4 17.4
16 ? 7.0 -1.2 -4.6 -4.4 -3.2

ブログ アーカイブ