▼時間情報
新しいブログ記事用データベースには、新しい知見に基づいて、新しいデータを付加した。
貴方のデータベースに無いものがあったら、参考にしてほしい。
これまでも、多くの人が収集していないであろうデータを保有していた。
例えば、騎手の誕生日は持っている。
年齢の計算に使用するのである。
それから調教師の誕生日と初出走日(厩舎開業日でもいいのだが)は同様の理由で持っている。
当然ながら馬の誕生日もある。
こちらも初出走日を記録している。
▼関係者情報、賞金
直接競走に関係ないと思われるかもしれないが、馬主のデータも従来から採り入れている。
今回のデータ拡張では生産者を加えた。
競馬関係者は騎手と調教師だけではない。
どのプレーヤーがどのくらい影響を与えているかは調べておいた方がいい。
予想紙や記録データには記載されていないものもあるようだから、しっかり拾っておくことにした。
賞金については「本賞金」と「付加賞」に分解することにした。
従来、クラス分け(条件戦)は不要という見解を持っていたのだけれど、そして今もその考えは変わらないのだけれど、どうしても1着馬の昇級初戦を場合分けする必要が生じたためである。
したがって、1着本賞金額を代用することにした。
なお、以前のブログ記事にて紹介したことがあるけれど、わたしは同着馬の賞金を実際の賞金ではなく「修正賞金」に加工している。
例)3着が同着の場合
(実際の賞金)3着と4着の賞金を合算して折半。このままだと賞金面で「3.5着」という評価になってしまう。
1着 本賞金1,000万円、付加賞28万円=1,028万円
2着 本賞金400万円、付加賞8万円=408万円
3着 本賞金185万円、付加賞2万円=187万円
3着 本賞金185万円、付加賞2万円=187万円
5着 本賞金100万円=100万円
(わたしの修正賞金)本来の3着賞金に合わせる。
1着 本賞金1,000万円、付加賞28万円=1,028万円
2着 本賞金400万円、付加賞8万円=408万円
3着 本賞金250万円、付加賞4万円=254万円
3着 本賞金250万円、付加賞4万円=254万円
5着 本賞金100万円=100万円
なお、JRAクラス分け用の拾得賞金は今でも不要と思っておりデータを収集していない。
▼馬体、血統
馬の成長などを判断するために情報を集めたいのだが、馬体重以外に公開されているものが見つからなかった。
本当は「体長」「体高」が欲しい。
調教データは相変わらず採用していない。
毛色は競走能力と無関係であることも過去の記事で触れた通りだ。
代わりになるかどうか分からないが、競走馬購買価格や一口馬主の価格を拾っている。
ただし、全馬データではないので、果たして使えるかどうかは未知数だ。
血統データは大幅に「削減」した。
このブログ記事では非公開だが、血統情報に代わる影響度の高いデータを採用したことで、分析対象から外していくつもりである。
もちろん重要性が判明すれば復活させる。
▼基準を何に置くか
鍵となる指標、すなわち予想するものだが、スピード指数、速度などいろいろある。
ただ、競馬予想とは順位を競うものである。
走破タイムを予想する、最速馬を探し出す、という予想方式は、あまり適切ではないように思う。
順位を競うということは、走破タイムなど実はどうでもいいのだ。
全馬が歩くなら歩いても1着になるし、賞金を減らされるわけでもない。
いつかの記事にも書いたけれど、馬は「全力」ではあっても「常時全速力」ではないのである。
したがって、着順を予想するのが目的に適っている。
着順を予想するといってもどうすればいいか分からない人もいるかもしれない。
そういう相談を受けたことがあるけれど、わたしなら点数に置き換えればどうかと提案する。
着順の点数化にもさまざまな手法が考えられるが、例えば100で順位を割ればどうであろう。
1着は100点、2着なら50点、3着なら33点、4着なら25点である。
グラフにすると賞金額よりカーブは緩やかだが、実力をよく表しているように思う。
ちょっと計算して、貴方のデータベースに加えてみればいかがだろう。
精度は高くないから、少し応用して、出走頭数やクラスを加味しても面白い。
そのうち走破タイムに囚われない予想を思い付くきっかけになるように思うのである。
(SiriusA+B)