2021年6月27日日曜日

第335夜 原点予想拡充版(4)前走支持率

 

[B] 前走支持率別加減値
前走支持率というと分かりにくいが、前走の単勝オッズの逆数である。
平易にするため、このブログでは、
1/
オッズ×4/5
で算出する方法をよく取り上げている。
実際には微調整する必要もあるのだが、それについてはご自身で研究してもらえればと思う。

ご注意いただきたいのは、今走のオッズではない点である。
発走直前まで動くオッズを追いかけることはたいへんなことだし、そもそもオッズをにらみながら買うということが勝ちにつながらないことは過去の記事で何度か述べたとおりだ。

では、前走オッズをどうして使用するのか、また、どうして支持率に変換するのか、について先にふれておきたい。

先ず、前走オッズを利用する理由だが、前走オッズなら確定したオッズであり使い勝手がよいことはある。
今走のオッズを正確に反映することは物理的に不可能だが、前走のものなら事前に準備できる。
もうひとつ、これが主たる理由だが、「オッズ(の逆数である支持率)と勝率は近似値である」点である。
馬の勝ち負けには無関係だが、オッズは実力をよく表しているのだ。
「それは分かる。でも、メンバーも違う、条件も異なる前走オッズなんて役に立つのか」と思うかもしれない。
ところが実際に調べれば役に立つことが分かるだろう。
中央競馬は勝ち抜け戦なので、ほとんどの馬が連続して同条件に出走する。
ほとんどの馬が前走と同じクラス、同じような競走条件だから、レベルは思いの外変わらない。
「前走2番人気で今回はブービー人気かよ」ということはあまり無いのである。
加えて、極論すれば、どのクラスのレースでも、上位馬は上位で、中位以下の馬のレベルが変動するだけ、ではないかというわたしなりの見立てもある。

今走のオッズでは言わないが、わたしは確定した前走オッズを「オッズコンピュータ」と呼んできた。
精度は低いがこれより良質なデータもほとんど無い。
コンピュータが発達する前には重宝していた。
これを利用しない手はないのだ。

次に支持率への変換だが、オッズは反比例のようになっている。
足し算引き算に向かないのだ。
50
倍と100倍のオッズ、3倍と6倍のオッズは支持率にしたらそれぞれ2倍の関係だが、引き算して503という数字を出したらどうだろう。

使い勝手はよいだろうか。

それだけではない。
前掲の簡単な算式で支持率にすれば、1倍は0.8、ここからどんどん小さくなって限りなくゼロに近づいていく。
ほぼゼロから0.8で表わすことがどれほど簡単か、数字をこねくり回すとよく分かってもらえるだろう。
その出走馬合計は約1である。
頭数にかかわらず、だ。
1
番人気とか2番人気といった数字を使うと出走頭数による影響を受けてしまうが、支持率ならばそれもない。
頭数の考慮はこんなところにも出てくる。

前走支持率加減値の表はないが、計算式と計算例を示す。
(1)
前走支持率の算出(簡便法) 1/前走単勝オッズ×4/5
(2)
前走支持率加減値の算出 前走支持率-平均値([Z]基礎値0.0704)
(
計算例1)前走単勝オッズが2.7倍の場合 前走支持率加減値=0.2259
 1/2.7
×4/50.07040.29630.07040.2259
(
計算例2)前走単勝オッズが16.1倍の場合 前走支持率加減値=-0.0207
 1/16.1
×4/50.0704=-0.04970.0704=-0.0207
(SiriusA+B)

2021年6月20日日曜日

第334夜 原点予想拡充版(3)前走着順降順別

 

[A2] 前走着順降順別加減値
324夜から第326夜にかけて記事にした「原点予想」では、出走(完走)頭数による影響を考慮したものにしていたが、凸凹解消のためかなり無理な調整をしたことが悔やまれた。
記事にして以降、もう少しシンプルで調整の少ない方法はないかと思案していたが、わたしの秘蔵の加工方法を出すことにした。
難しい方法ではない。

簡単に言えば、着順を「ひっくり返す」というものである。
つまり、「何頭に負け、何頭に勝った(先着した)のか」のうち「何頭に先着したのか」でグループ分けした。
例えば16頭立て2着なら「1頭に負け、14頭に先着した」ということである。
負けたところは[A1]の着順ですでに加減値を出した。
18
頭立て1着ならば17頭に勝ったということである。
これで頭数による影響を考慮することができる。
17
頭・16頭に勝ったところはデータが少ないため、[A1]と同じようにちょっとヘンだが、このまま使う。
ちなみに、15頭以下のところで最も高い勝率を示すのが「14頭に先着した」というものである。
このデータがどういう背景になっているかをご理解いただけているなら蛇足になってしまうが、要するに16頭立て2着が多分に含まれているということである。

ここまでで、基礎値、ファクターA1A2をご紹介した。
ファクターA1A2はそれぞれ18区分ある。

全部で18×18324通りだ、と言いたいところだが、実際には3頭立て以下のレースはなかったため、270通りの組み合わせになる(18×15)
それでもまだ、レースの予想をしようとすると同点の馬は少なからず生じる。
レースごとの出走数が適度に分散しているわけではなく、16頭立てと18頭立てが多いからためである。

着順どころか、「頭数」データを予想材料に使うなど思ってもみなかった、という人はおられるだろう。
だが、8頭立てと16頭立てでは単勝の勝率が2倍になるし、馬連の組合せ数も28通りと120通りで4倍近い差が生じる。
頭数は固定的データではなく、「かなり躍動するデータ」なのだ。
もしかしたら「着差」よりも「着順」よりも影響が大きいかもしれない。
極論だが、貴方の予想法の精度が上がらない理由は頭数の要素が加味されていないからかもしれないのである。
ところが、なんとなくは分かっていても、いざ実戦で予想に使用している人は少ないように感じている。
原点予想拡充版では、この後もご紹介するファクターのいくつかで頭数を考慮したものが登場する。
参考にしてもらえれば幸いである。
(SiriusA+B)

[A2] 前走着順降順別加減値

先着数 勝利件数 完走件数 勝率 加減値
17頭 413 3,558 0.1161 0.0457
16頭 843 4,608 0.1829 0.1125
15頭 2,130 19,037 0.1119 0.0415
14頭 4,163 25,187 0.1653 0.0949
13頭 4,206 28,849 0.1458 0.0754
12頭 3,912 32,122 0.1218 0.0514
11頭 3,657 35,118 0.1041 0.0337
10頭 3,554 37,096 0.0958 0.0254
9頭 3,194 38,428 0.0831 0.0127
8頭 2,792 39,336 0.0710 0.0006
7頭 2,457 39,400 0.0624 -0.0080
6頭 1,900 38,963 0.0488 -0.0216
5頭 1,559 38,293 0.0407 -0.0297
4頭 1,211 37,708 0.0321 -0.0383
3頭 1,041 36,812 0.0283 -0.0421
2頭 824 35,567 0.0232 -0.0472
1頭 657 33,879 0.0194 -0.0510
0頭 530 30,694 0.0173 -0.0531
合計 39,043 554,655 0.0704


2021年6月13日日曜日

第333夜 原点予想拡充版(2)前走着順昇順


[A1]前走着順昇順別加減値
最初のファクターは「前走着順昇順別加減値」である。
難解そうな名前で恐縮だが、簡単に言えば、前走の着順別に18種類にグループ分けし、今走でどれだけの勝率を得たかを集計したものである。
オープン競走であれ、新馬・未勝利戦であれ、過去に1走以上走った馬は、このデータベースでは13年分で554,655頭である。
このうち、前走2着で今走に臨んだ馬(で完走した馬)42,089頭いた。
このうち、8,675頭が今走で勝利した。
勝率は20.61%(0.2061)である。
55
万頭を18グループに分けるので、微調整は要らないくらいしっかりしたデータが出てきた。
16
頭立てレースが多く、17頭立て・18頭立てレースが少ないため、17着と18着の勝率が「逆転」しているが、気になる人は「17着以下」として集計しなおしても良いと思う。
ここでは簡便のため、このままとする。

この勝率から基礎値(平均勝率)分を差し引いた値を[A1]の加減値とする。
前走2着の例でいえば、0.20610.07040.1357という加減値が出る。
今回の予想法ではこの前走着順別ナンタラカンタラが予想の核心部分である。
この数値だけでも単勝勝率は20%を少し超えるほどの武器だ。
試しに明日以降のレースで予想紙に書き込んでいけば分かる。
レースの数が増えていくほど、5回に1回は的中することを認識することができるだろう。

「前走の着順だけで予想になるわけがない。そんなのファクターでも何でもない」と思う人は少なくない。
仮にどうしてそう思うのかと聞けば、「クラス、特に昇級したかどうかや、芝・ダートの違いや、惜しい2着とだれ込んだだけの2着では価値が違う」と言うだろう。
また、同じレースで前走2着の馬が複数出走してくる場合もある。
出走馬を僅か18種類にグループ分けだけなら同点の馬が何頭も出てくるではないか、と。
その通りである。
それで[A2]以下10種類程度のファクターを加えていくことになる。

少し横道にそれるが、なかなか的中率が向上しないとき、各ファクターの精度が原因と思ってさらに細かくしていきがちだが、足りないファクターは何かを探してそれを補うやり方のほうがうまくいきやすい。
例えば、このブログでは、走破タイムを速度(km/h)に換算することを推奨しているが、わたしは58.38km/hと小数点第2位未満を四捨五入する。
これを小数点第3位未満四捨五入に変えてもほとんど改善効果はない。
原因は精度の問題ではないのである。
それよりも、速度で足りない要素を探し、例えば位置取りとかあるいはまったく毛色の違うファクター、を加えて調整するのである。
そのほうがうまくいく。
(SiriusA+B)

[A1] 前走着順昇順別加減値
前走着順 勝利件数 完走件数 勝率 加減値
1着 4,246 42,016 0.1011 0.0307
2着 8,675 42,089 0.2061 0.1357
3着 5,933 41,919 0.1415 0.0711
4着 4,468 41,706 0.1071 0.0367
5着 3,261 41,511 0.0786 0.0082
6着 2,685 40,469 0.0663 -0.0041
7着 2,064 39,883 0.0518 -0.0186
8着 1,730 39,198 0.0441 -0.0263
9着 1,400 37,415 0.0374 -0.0330
10着 1,097 35,516 0.0309 -0.0395
11着 909 33,060 0.0275 -0.0420
12着 760 30,340 0.0250 -0.0454
13着 579 27,005 0.0214 -0.0490
14着 508 23,328 0.0218 -0.0486
15着 352 19,408 0.0181 -0.0523
16着 277 13,791 0.0201 -0.0503
17着 51 3,519 0.0145 -0.0559
18着 48 2,482 0.0193 -0.0511
合計 39,043 554,655 0.0704

2021年6月6日日曜日

第332夜 原点予想拡充版(1)基礎値

 

はじめに
324夜から第326夜にかけて前走着順をベースとした予想法について触れた。
前走の結果、特に着順を予想エンジンにするということでいわば「原点回帰」的な予想法として記事にしたわけだが、いざ記事にしてみると少々物足りなく、もう少しファクターを加えて実戦的なものにした方が参考になるだろうと考えるに至った。
正直申し上げると、ファクターを増やせば長々説明することになるから嫌だなと二の足を踏んでいた。
が、世にこれだけ競馬予想のサイトがあるのに肝心の予想方法を明らかにしたころはほぼない(当たり前か)から、「自分の予想法は優れているのかどうか」さえ比較対象がなくて分からないものなのだ。
そこで提供しようとする。
提供するのは、正確には「馬」の要素だけで、騎手など馬以外の要素や血統などの要素を除いたものだが、「走破タイムをベースとしない予想法」としては平均的なものであると思っている。
検証する時間的な余裕がないけれど、教師データとそこから抽出される結論から推測して、「回収率は8割弱と平均的だが、的中率はスピード系指数や一般的な予想サイトよりは高い25-26%程度の勝率」となる。
予めお断りしておくが、「わたしの予想法はすごいでしょ」というものではなく、提示した予想法を見てご自身の予想法の参考にしてもらえればということで書く。
批判的に見るのも良し、自身の予想法を抜本的に変えたいのならまずは模倣してみるのも良し、である。
データを集めれば誰でも再現可能だし、最新のデータを用いることができる。
それでもデータを集めることは骨の折れる作業であり(予想法作成作業の9割を占めると言っても過言ではない)、自分で再現作業をする人はお読みいただいた方の2割くらいであろうと思う。
最新のデータは入っていないが、傾向は大きく変わらないので、数値をそのまま用いてもソコソコの成績は得られるだろう。
なお、原点予想拡充版では競走馬に関するファクターのみを取り扱う。
騎手など人的要素や血統に関するファクターは取り扱わないが、競走馬と同じくらい影響力があるので、余力のある人は研究いただきたい。

これから順次公開していくが、公開について何か裏があるに違いない、と思う方がいるだろう。
ない。
皆さんにとって動機などどうでもよいことだが、法人個人問わず、書物やあちこちのサイトを見るにつけ、いい加減なくらいはともかく、それで食い物にしようとする連中が思っていたよりも多かった。
個人が楽しみ、ときには有料予想したりしても良いと思う。
予想を買うのは邪道などという人がいるが、競馬新聞だって有料予想である、有料予想を買うことだっていい。
中には首をかしげるような理論もあるけれど、楽しんでおられる分には干渉する気はない。
適当に予想したりしたからといって犯罪ではないのだ、競馬は本来楽しむものである。
けれども、あり得ない回収率や的中率を掲げて人を騙す手口は個人的に赦しがたい行為だと思っている。
「調査不足」や「研究不足」「誤認」はわたしも含めて大量にある。
それを責めることはない。
そうではなくて、資金を集めるために虚偽の実績を掲げたり、すごい予想システムと言いながら専門紙の予想をパクったりしているだけの詐欺的行為を堂々とやっていることに憤りを覚えるのだ。
博打には暗い影が付きまとう。
騙されたことを家族にも言えないという人が多いと思われる。
詐欺的行為はそこに付け込んでくる。
この予想法を紹介することによって、予想とはこういうものもあるという具体的なイメージがわくのなら、そして、たとえ少数でも「彼らが言っていることは怪しいかもしれない」と思ってくれる人が増えるなら、と願ってのことだ。
自慢したいわけでもなく、尊敬してほしいわけでもなく、真似してほしいわけでもなく(してもいいけど)

以前も触れたとおり、回収率は予想が浸透してしまえばオッズを下げてしまうけれど、的中率はどんなに相乗りが増えても変化はない。
予想を公開するなら的中率だということである。

算式
先ず、前提を述べておく。
このブログではこの予想法を「原点予想拡充版」と呼ぶことにする。
予想スタイルは、各馬の過去走をもとに予想する方式ではなく、各馬が13種類のファクターでどれに分類されるのかを決め、その予想値を加減する方式である。
加算減算する値を「加減値」と呼ぶことにする。
ファクターは基礎値のほか、次のものを想定している(ブログ掲載中に変更する場合がある)
呼称は硬いが中身まで難しいものは少ないのでご容赦願いたい。
A
は第325夜で紹介した完走頭数別着順を改良したもので、基礎値を別にしたうえ、加減値算出のプロセス上ふたつに分けたため、A1A2になっている(どうでもいいが)
また、Iの文字は表記上いろいろと不便なので欠番にした。

Z

基礎値(全馬共通)

 

A1

前走着順昇順別加減値

前走実績に基づく評価(着順)

A2

前走着順降順別加減値

前走実績に基づく評価(着順)

B

前走支持率別加減値

前走実績に基づく評価(オッズ)

C

(古馬のみ)日齢比別加減値

年齢による経年変化推定

D

今走前走性別加減値

性別による調整

E

今走前走芝ダート別加減値

競走条件の変化による影響推定(芝ダート)

F

今走前走距離別加減値

競走条件の変化による影響推定(距離)

G

平均賞金平均比LOG分類別加減値

デビュー以降の実績に基づく評価(賞金)

H

前走上がり3ハロン順位・前走着順別加減値

前走実績に基づく評価(上がり3ハロン)

J

斤量対前走馬体重比別加減値

馬体に関する評価(斤量、馬体重)

K

枠番・馬番別加減値

競走条件による影響推定(枠順)

L

勝率別加減値

デビュー以降の実績に基づく評価(勝率)

M

勝利数/日齢加減値

デビュー以降の実績に基づく評価(1日あたり勝利数)

予想は、出走各馬がA1からMの項目で該当する加減値を当てはめ、基礎値に合算するというものである。
順不同である。
算式は次のようになる。
出走各馬の予想値=Z+A1+A2+B+C+D+E+F+G+H+J+K+L+M
これで出走各馬の数値が出揃ったところで、最も高い数値を示したものを本命とする。
オーバーフィッティングの問題があり重回帰分析をした方が良いことは確かだが、難しいことはしないことにした。
この方法だと足し算だけだから簡単ではあると思う。
目的が模倣することができることも示したいからである。

各ファクター加減値算出方法と[Z]基礎値
基礎値は0.0704と置くことにする。
100
でも80でも何でもいいのだが、今回は計算に使用したデータから平均勝率を採用した。
すべての馬がまったく同じ能力であれば、出走頭数(完走頭数)から平均して7.04%の勝率ですよ、という意味で用いる。
いつもの、このブログ用のデータベースで算出したものである。

改めて、このデータベースの内容を確認しておきたい。
データ内容 中央競馬平地競走完走データ
データ期間 2006年から2018年の13年間
データ件数 620,722
うち、前走のあるデータ件数 554,655
同着含む1着件数 39,043
この中に障害競走、競走中止・取消、地方競馬出走成績は一切含まない。
前走と言えば、あくまで中央競馬平地競走で完走した前走である。
したがって、勝率は39,043/554,6550.0703915すなわち0.0704だ。
繰り返すが、基礎値は別に何でも構わない。
枠順など一部では前走データのない分も集計対象になり得るので62万件をフルに使うこともある(フルに使わなくてもいいけれど)

各ファクターは、このデータから勝率を集計して、平均値(基礎値)を引き算する。
あるファクターのあるグループが勝率(加減値)12.34%だとすると平均値を引いて、0.12340.07040.0530となる。

ちなみに集計期間が古いからと言って2021年において「数値は最新のものでないから使えない」ということは、あまりないと思っている。
それほど大きく変動するものではないからだ。
集計作業中、教師データの変動をいくつかの期間で区切ってみたが、予想結果に与える影響は個々の数値の変動が相殺されてあまり変わらないような気がした。

基礎値

0.0704

(SiriusA+B)

ブログ アーカイブ