2017年10月30日月曜日

第187夜 一見して無関係のデータで予想検証してみた。勝率20%を達成した


▼馬鹿も休み休みに言え
いつも良いデータはないかと考えている。
予想紙や成績表にはないデータもあるのではないか。
一見して無関係と思われるデータが、実は密接に関係しているということはないか。
わたしは占いや迷信、ゲン担ぎを真面目に信じるほうではないけれど、関係性が証明されていない事象であってもきちんと注意を払うべきと考えている。
意外な関係にあるデータを検証もしないで「馬鹿も休み休みに言え」と一蹴するのはいかがなものであろうか。
たとえば、地震活動と太陽活動・地球潮汐には、一見して関係はないが、科学的な解明がなされていないものの何らかの関連性があるとする専門家は少なくない。確かに玉石混淆であるし、「バーナム効果」(誰にでも該当する曖昧な記述を自分だけに当てはまるものと捉えてしまう心理的な現象)や「確証バイアス」(仮説を検証するのに有利な証拠ばかり集めようとしてしまう現象)に惑わされたものも少なくないだろう。
だが、稀に、驚くべきデータに出くわすこともあるのである。

今夜は、宝石とまではいかないが、そこそこ通用するレベルのデータをご紹介したい。
この指数を仮に「投票対数」と呼ぶことにする。
「投票対数」は競馬予想紙や成績データには記載されているようなものではない。
先日(2017/10/20)に最新の情報を集め、その翌日・翌々日(21日・22)の開催で検証した。
台風の影響で不良馬場もあり、72レースに良・稍重・重・不良すべての馬場が出現した。
あまりサンプルとして良いものばかりではないが、とりあえず検証結果は下表のとおりだった。
1
番人気の動向や複勝率からみれば勝率21%は少し出来すぎではある。
項目 投票対数 単勝1番人気
件数 72 72
順位1位馬が勝利(1着)した競走数 15 28
順位1位馬が2着した競走数 8 11
順位1位馬が3着した競走数 7 10
勝率 21% 39%
連対率 32% 54%
複勝率 42% 68%

▼この「投票対数」とは
さて、この投票対数の正体である。
数字を加工しているので、何のデータかピンときたなら凄い。
実は、keiba@niftyの「お気に入り」の投票数を対数にした()
そんなもの使えるか、とお思いなら、改めてよく見てほしい。
上位にはやはり投票対数上位の馬がくる傾向にある。
落ち着いて考えればわかるのだが、人気と「お気に入り」投票数の差は、出走馬の人気投票か全馬を対象にした人気投票かの違いと、後者は勝ち馬を当てるためだけではないことのふたつである。
したがって、後者の数字は信頼度が低いものの、長期的には活躍が期待される指標になり得るのではないかと思うのだ。
長期的には、ということは、短期的な好不調やレース適性を除いた馬の基礎的な力であるとも言える。
必ずしもお気に入り順位通りの結果にはならないことが多いものの、順位上位馬が勝利や連対する確率は高い。
穴馬探しにも使えるかもしれない。
蛇足であるが、POG(ペーパーオーナーゲーム)情報を利用する手もある。
ただ、血統の要素が色濃く、出走後の情報が反映されないところが多いようだから採用しなかった。

この「投票対数」指標では精度が低いので、使える使えないの判断はともかく、レースに直結しなくてもこのようなデータを探せることを示そうとした。
このようなアイデアをオリジナルデータとして予想に加えることで、他者との予想差が付き、その精度次第で利益をもたらすことができるだろう。
各競走の検証資料は「資料編1」「資料編2」を参照いただきたい。

(SiriusA+B)

ブログ アーカイブ