▼はじめに
第324夜から第326夜にかけて前走着順をベースとした予想法について触れた。
前走の結果、特に着順を予想エンジンにするということでいわば「原点回帰」的な予想法として記事にしたわけだが、いざ記事にしてみると少々物足りなく、もう少しファクターを加えて実戦的なものにした方が参考になるだろうと考えるに至った。
正直申し上げると、ファクターを増やせば長々説明することになるから嫌だなと二の足を踏んでいた。
が、世にこれだけ競馬予想のサイトがあるのに肝心の予想方法を明らかにしたころはほぼない(当たり前か)から、「自分の予想法は優れているのかどうか」さえ比較対象がなくて分からないものなのだ。
そこで提供しようとする。
提供するのは、正確には「馬」の要素だけで、騎手など馬以外の要素や血統などの要素を除いたものだが、「走破タイムをベースとしない予想法」としては平均的なものであると思っている。
検証する時間的な余裕がないけれど、教師データとそこから抽出される結論から推測して、「回収率は8割弱と平均的だが、的中率はスピード系指数や一般的な予想サイトよりは高い25-26%程度の勝率」となる。
予めお断りしておくが、「わたしの予想法はすごいでしょ」というものではなく、提示した予想法を見てご自身の予想法の参考にしてもらえればということで書く。
批判的に見るのも良し、自身の予想法を抜本的に変えたいのならまずは模倣してみるのも良し、である。
データを集めれば誰でも再現可能だし、最新のデータを用いることができる。
それでもデータを集めることは骨の折れる作業であり(予想法作成作業の9割を占めると言っても過言ではない)、自分で再現作業をする人はお読みいただいた方の2割くらいであろうと思う。
最新のデータは入っていないが、傾向は大きく変わらないので、数値をそのまま用いてもソコソコの成績は得られるだろう。
なお、原点予想拡充版では競走馬に関するファクターのみを取り扱う。
騎手など人的要素や血統に関するファクターは取り扱わないが、競走馬と同じくらい影響力があるので、余力のある人は研究いただきたい。
これから順次公開していくが、公開について何か裏があるに違いない、と思う方がいるだろう。
ない。
皆さんにとって動機などどうでもよいことだが、法人個人問わず、書物やあちこちのサイトを見るにつけ、いい加減なくらいはともかく、それで食い物にしようとする連中が思っていたよりも多かった。
個人が楽しみ、ときには有料予想したりしても良いと思う。
予想を買うのは邪道などという人がいるが、競馬新聞だって有料予想である、有料予想を買うことだっていい。
中には首をかしげるような理論もあるけれど、楽しんでおられる分には干渉する気はない。
適当に予想したりしたからといって犯罪ではないのだ、競馬は本来楽しむものである。
けれども、あり得ない回収率や的中率を掲げて人を騙す手口は個人的に赦しがたい行為だと思っている。
「調査不足」や「研究不足」「誤認」はわたしも含めて大量にある。
それを責めることはない。
そうではなくて、資金を集めるために虚偽の実績を掲げたり、すごい予想システムと言いながら専門紙の予想をパクったりしているだけの詐欺的行為を堂々とやっていることに憤りを覚えるのだ。
博打には暗い影が付きまとう。
騙されたことを家族にも言えないという人が多いと思われる。
詐欺的行為はそこに付け込んでくる。
この予想法を紹介することによって、予想とはこういうものもあるという具体的なイメージがわくのなら、そして、たとえ少数でも「彼らが言っていることは怪しいかもしれない」と思ってくれる人が増えるなら、と願ってのことだ。
自慢したいわけでもなく、尊敬してほしいわけでもなく、真似してほしいわけでもなく(してもいいけど)。
以前も触れたとおり、回収率は予想が浸透してしまえばオッズを下げてしまうけれど、的中率はどんなに相乗りが増えても変化はない。
予想を公開するなら的中率だということである。
▼算式
先ず、前提を述べておく。
このブログではこの予想法を「原点予想拡充版」と呼ぶことにする。
予想スタイルは、各馬の過去走をもとに予想する方式ではなく、各馬が13種類のファクターでどれに分類されるのかを決め、その予想値を加減する方式である。
加算減算する値を「加減値」と呼ぶことにする。
ファクターは基礎値のほか、次のものを想定している(ブログ掲載中に変更する場合がある)。
呼称は硬いが中身まで難しいものは少ないのでご容赦願いたい。
Aは第325夜で紹介した完走頭数別着順を改良したもので、基礎値を別にしたうえ、加減値算出のプロセス上ふたつに分けたため、A1とA2になっている(どうでもいいが)。
また、Iの文字は表記上いろいろと不便なので欠番にした。
Z |
基礎値(全馬共通) |
|
A1 |
前走着順昇順別加減値 |
前走実績に基づく評価(着順) |
A2 |
前走着順降順別加減値 |
前走実績に基づく評価(着順) |
B |
前走支持率別加減値 |
前走実績に基づく評価(オッズ) |
C |
(古馬のみ)日齢比別加減値 |
年齢による経年変化推定 |
D |
今走前走性別加減値 |
性別による調整 |
E |
今走前走芝ダート別加減値 |
競走条件の変化による影響推定(芝ダート) |
F |
今走前走距離別加減値 |
競走条件の変化による影響推定(距離) |
G |
平均賞金平均比LOG分類別加減値 |
デビュー以降の実績に基づく評価(賞金) |
H |
前走上がり3ハロン順位・前走着順別加減値 |
前走実績に基づく評価(上がり3ハロン) |
J |
斤量対前走馬体重比別加減値 |
馬体に関する評価(斤量、馬体重) |
K |
枠番・馬番別加減値 |
競走条件による影響推定(枠順) |
L |
勝率別加減値 |
デビュー以降の実績に基づく評価(勝率) |
M |
勝利数/日齢加減値 |
デビュー以降の実績に基づく評価(1日あたり勝利数) |
予想は、出走各馬がA1からMの項目で該当する加減値を当てはめ、基礎値に合算するというものである。
順不同である。
算式は次のようになる。
出走各馬の予想値=Z+A1+A2+B+C+D+E+F+G+H+J+K+L+M
これで出走各馬の数値が出揃ったところで、最も高い数値を示したものを本命とする。
オーバーフィッティングの問題があり重回帰分析をした方が良いことは確かだが、難しいことはしないことにした。
この方法だと足し算だけだから簡単ではあると思う。
目的が模倣することができることも示したいからである。
▼各ファクター加減値算出方法と[Z]基礎値
基礎値は0.0704と置くことにする。
100でも80でも何でもいいのだが、今回は計算に使用したデータから平均勝率を採用した。
すべての馬がまったく同じ能力であれば、出走頭数(完走頭数)から平均して7.04%の勝率ですよ、という意味で用いる。
いつもの、このブログ用のデータベースで算出したものである。
改めて、このデータベースの内容を確認しておきたい。
データ内容 中央競馬平地競走完走データ
データ期間 2006年から2018年の13年間
データ件数 620,722件
うち、前走のあるデータ件数 554,655件
同着含む1着件数 39,043件
この中に障害競走、競走中止・取消、地方競馬出走成績は一切含まない。
前走と言えば、あくまで中央競馬平地競走で完走した前走である。
したがって、勝率は39,043/554,655で0.0703915すなわち0.0704だ。
繰り返すが、基礎値は別に何でも構わない。
枠順など一部では前走データのない分も集計対象になり得るので62万件をフルに使うこともある(フルに使わなくてもいいけれど)。
各ファクターは、このデータから勝率を集計して、平均値(基礎値)を引き算する。
あるファクターのあるグループが勝率(加減値)12.34%だとすると平均値を引いて、0.1234-0.0704=0.0530となる。
ちなみに集計期間が古いからと言って2021年において「数値は最新のものでないから使えない」ということは、あまりないと思っている。
それほど大きく変動するものではないからだ。
集計作業中、教師データの変動をいくつかの期間で区切ってみたが、予想結果に与える影響は個々の数値の変動が相殺されてあまり変わらないような気がした。
基礎値 |
0.0704 |
(SiriusA+B)