2019年7月7日日曜日

第243夜 そもそも目的変数が違うのでは



▼走破タイム基準の違和感
これまでのブログ記事にて間接的に申し上げてきたことだが、競馬予想をする上で「目的変数」が違うのではないかとしばしば思う。
目的変数とは数量化1類で計算する際の用語なのだが、求める解と考えてもらっていい。
その計算過程で、いくつかの「説明変数」を使う。
ウェブサイトでよく見かけるものは、大抵スピード指数或いは速度を目的変数とし、前走や馬場状態、血統などの説明変数を用いて「最も速く走りそう」という馬を見つけようとする。
そこそこ的中するようだし、誤った考えとまで断定できるものではないけれど、どうも違和感があるのだ。
パソコンでそれなりに計算して出された結論だから、赤鉛筆を握りしめて予想紙とにらめっこするよりは「ブレない」し、そのことで的中率を維持できているとは思う。
が、スピード指数でもAIによっても「最速で走りそうな馬」を本命視する手法は、「出走馬中最も勝利に近い馬」を選ぶ行為と似て非なるものではないかと思うのである。
初心に返ると、競馬予想とは1(から3)を最大18頭から選び出すものだ。
レース自体も着順を競うものであり、走破タイムを競うわけではない。
出走馬中最も勝利に近い馬≒最速馬、という仮定は分かる。
1着馬は結果的に最速馬なのだ。

因果関係は逆だけど。
何を以って1着になりやすいのか、そこが競馬予想で難しい問題なのである。

▼目的変数の候補
では、勝馬を予想するにあたり、走破タイム以外に適当なものはあるだろうか。
ちょっと視点を変えて、「1着になりたい」という動機を考えてみる。

わたしは重要だと思っていることなのだが、馬自身には動機がない。
競走馬は、1着になりたいなどと思っていないし賞金がかかっていることなど知らないし勝ち鞍の数を数えているわけでもない。
ゴール板を知っているのかどうかは議論の分かれるところだが、速く走ると優しくしてもらえるということぐらいしか理解していないと思う。
そもそも馬自身が自分の走っている速さも分かっていないのではないだろうか。
時速61km/hで走っているな、と思わず、せいぜい「近くにいる馬に負けたくない」と考えるだけだろう。
調教で鍛えられているなんてことさえ馬は理解していない。
「近々レースに出走するから今朝の調教は頑張っておこう」とは思わないし、「今努力すればレースに勝てる」とも思わない。
近日レースに出走する、その雰囲気を周囲の人間から敏感に察知していると思うくらいである。

そうすると、動機があるのは人間である。
1着になりたいのは馬ではなく人間なのだ。

さらに言えば、人間も走破タイムなどどうでもいいと思っている。
どんなタイムであっても着順すべてなのだ。
賞金と、同時に手に入れる名誉が欲しいのである。
「いやいや、この馬には長期的な視点で育て、グレードレースをいくつも勝たせて種牡馬になってもらいたいのだ」という馬主はいるだろう。
だが、これも名誉の一種であり、馬はそんな運命とか宿命とか使命など知らない。

持ち馬を勝たせること、複数勝たせて繁殖に上げて名声を得ること、賞金を稼ぐこと、以上が人間の動機であろう。
このように考えると、着順(1)か賞金を目的変数にすることができるのではないか。

着順や賞金を考えると、馬のことばかりではなく、相手関係や戦術も意識するだろう。
馬場状態やスローペースの補正が必要なのか、精緻なタイム予測が必要なのか、と思うようになるだろう。

問題は、単位をどうするかである。
賞金は円でもいいが着順はどうするか。
着順の場合、わたしは勝率を共通単位にするのも良いと思う。

では、勝率を単位に揃えるとして、どのように予想するのか。
ちょっとだけ触れておこう。
・前走2着だった馬の次走の勝率は?
・ある種牡馬の産駒の勝率は?
・芝からダートに変わった場合の勝率は?
・初騎乗の勝率は?
こんな集計をコレクションしてみると、わたしの拙い説明をご理解いただけると思う。
(SiriusA+B)

ブログ アーカイブ