2021年10月10日日曜日

第350夜 馬柱的個体予想法と統計的全体予想法


個体のデータのみに基づいた予想
馬柱的、と書いたが、アナログ予想を指しているのではない。
データを駆使した予想法の中での区別である。
ここでは、競走馬の個体の、例えば過去走や血統などを調べて予想する方法をいう。
広く一般的な方法とみられるが、わたしがこのブログでいろいろとお話ししている手法とは似ているようで根本的に異なっている。
どうも書き物にして説明するのが難しいのだけれど、改めて説明してみようと思う。

ここに、3頭が出走する競走があるとする(内容は適当である)

馬名

前走速度指数

前走着順

血統評価

A

86

3

5

B

79

3

2

C

81

2

4

馬柱的個体予想とわたしが言っているのは、この3頭それぞれのデータを見比べて、本命馬を決める手法である。
前走で、馬Aは突出した走破タイムで走ったようだ。
しかし、前走着順はAB3着で、C2着だった。
血統評価はAが突出して良いと考えている。
総合すると、馬Aを本命とする、という具合である。
ここでは、算出されたそれぞれの数値を出走馬3頭で比較している。

データ量の違い
他方、統計的全体予想法と言っているのは、それぞれの数値に該当する馬たちがどんな成績を残してきたか、を調べるものである。
実際の数字で言えば、前走3着だった馬は、わたしのいつものデータベース、2006年から2018年の平地競走完走馬データによれば、41,919頭いて、[5,933 - 5,619 - 5,039 - 25,328]だった。
勝率は14.2%である。
この「14.2%」という数字を使うのである。
ちなみに前走2着だった馬の成績は、計42,089頭で[8,675 - 6,694 - 5,227 - 21,493]であった。
勝率は20.6%である。

馬名

前走着順

前走着順別勝率

A

3

14.2

B

3

14.2

C

2

20.6


前者の個体予想法では出走馬の「3着」そのものをよい成績かどうか判断するのに対し、全体予想法では「過去に同じような経歴=3着」で出走した馬がどのような成績を修めてきたかを調べている。
同じようにして、前走の速度指数が86だった馬の勝率や血統評価が5である馬の勝率を求めると出来上がりになる。
ここでは勝率を使ったが、走破タイムや速度指数に変換してもよいし、獲得できそうな賞金額に変換するのも悪くない。
何が違うのかというと、馬1頭の数走しかない経歴で予想するより、4万頭以上の前走3着馬の戦績のほうが安定している(精度が高い)点であろう。
ちなみに、「いろいろな3着があるし、オープンも未勝利も一緒というのはいかがなものか」という人は、分けて集計してもかまわないが、複数のファクターを組み合わせる前提であれば複雑な条件付けはしないほうがいいだろう。
どうしても区分したいとき、わたしなら「前走未勝利戦で今回も未勝利戦に出走する馬」を別に集計したり、「1着と同タイムの3着」「それ以外の3着」と分けて集計したりする。
試行錯誤して成績の良いファクターを残していけばよいのである。
なお、「前走速度指数が863着、血統は5」という馬も62万余件のデータにはあると思うが、ヒットする件数がゼロとかほとんどなくなってしまうとかするので、最後に合成するほうが簡単で安定的であると思う。

「全体予想法ではすべて平均的で、平均より突出した、例えばディープインパクトは数値通りにはならないのではないか」と疑問を持った読者もおられよう。
わたしの答えはふたつある。
ひとつは、複数のファクターを組み合わせるうち真の値に近づくし、どうしてもというなら個体差を算出して別途加減することもできる。
もうひとつは、ディープインパクト級は何年間かに1頭いるかどうかで、予想するレース数から考えてディープが出走したすべてのレースを外してもたかが知れている、レースの数量から言えば未勝利戦で好成績を挙げるほうがわたしにとっては重要である。
である。

やっぱり、分かりにくい説明になった。
申し訳なく思う。
(SiriusA+B)

ブログ アーカイブ