2018年11月11日日曜日

第219夜 アナログ情報を含めたスピード系指数のデータ統合

▼方法が分かれば進むのに、という人はいる
「各馬の能力をひとつの指数で表現して、できれば機械的に買い目を決められるようにしたい」と考える人は多いと思う。
だが、「前走で上がり3ハロンが1番良かった馬」とか「調教や前走で見所ありとメモした馬」という情報を速度指数に上手く組み込めないという悩みを持つ人は、周囲を見回せば少なくないようだ。
既に解法を得ている人から見れば「簡単じゃないか」と言うだろうが、そこがひとつの壁なのだ。
数学の問題と同じで、解法に繋がる着想が得られれば解けるのに、と思うことはよくある。
今夜は、ノウハウというか解法のヒントを綴りたい。
当たり前と思う方は既に分かっていらっしゃると思うので読み飛ばしてもらっていい。

▼単位を揃える
最初にすべての情報をどの単位でまとめるかを決める。
まとめるのは勝率でも連対率でも何でも良いが、片や時速で片や勝率ではデータを結合できない。
その揃え方である。
このブログでアクセス数をみるとスピード指数系支持する読者が多いようなので、わたしがいつも例に出す速度で揃えてみよう。

わたしのブログ用データベース(平地競走9年分、約29,900競走)では、全体の平均時速は58.83km/hである。
例えば「前走で上がり3ハロンが1番良かった馬」を要素に加えたいとしよう。
この場合、該当するデータ、すなわち前走で上がり3ハロンが最速だった馬の合計をとり、平均する。
件数は2万件を軽く超えるので、割としっかりしたデータである。
様々なコース、競走条件はあるが、細分化するより全部まとめてサンプル数を確保した方がいいだろう。
仮に、平均時速の平均をとると59.05km/hとしよう(この数字は適当である)。
基準速度である58.53との差異をみると、
59.05ー58.53=+0.52
となる。
該当馬には+0.52を足してやればいいのだ。
速度に揃えるというのはこういう手順でやる。
「前走2着馬」とか「騎手」「3番人気」なども同様にする。

なお、数学的には各要素の重複を差し引く作業があるけれど、要素の選択でよほどの偏りがなければまあ無視してもそれほど酷い間違いにはならないだろう。

▼アナログ情報を加えるには
では、レースのリプレイを見て「これは見どころがある。次走に期待したい」というような場合はどうするか。
アナログ情報は数値にできない、という人もいるが、継続的にデータに記録することでデジタルデータにすることができる。
「見どころ有り」という項目欄を用意し、該当馬に「1」を立てる。
内容別にしたいとか、凄く見どころ有り、と見どころ有りで「2」「1」と使い分けてもいいけれど、まあ主観的データなのでひとつでいいと思うが好きに決めればいい。
これも該当馬すべての時速を合計し、平均を求めればよい。
あなたの注目馬の平均時速が58.63km/hなら、基準速度との差+0.10を次走出走の該当馬に加えてやればいいのだ。
直接目測で0.2秒足すなどするより良いのではないかと思っている。
自分の「相馬眼」の実力も分かるだろう。
何をポイントに「次走期待できる」と思っているのかも明らかになってくる。
(SiriusA+B)

ブログ アーカイブ