2021年9月26日日曜日

第348夜 着想が先行しても、エビデンスを求めたい

 348夜 着想が先行しても、エビデンスを求めたい

検証
金融市場モデルとして競馬(馬券での話)を取り扱うことがある。
競馬について、金融市場を参考に考えることもまた可能ではないかと思う。
投資ファンドではSDGsESGといったものが流行しているのだが(用語の説明はご自身で調べてほしい)、ファンドに関わる人から話を聞くたびに馬券予想法とさして変わらないロジックの欠陥を感じることがある。
関連するすべての投資ファンドに当てはまるわけではないだろうが、SDGsESGは財務諸表外、簿外の情報をもとに、その企業がいかに「正しい」振る舞いをしているか、スコア化して投資先とするかどうかを判断する、というのが主流である。
例えば、女性の管理職比率や多様な人材の受け入れ、環境への配慮具合をスコア化したり、兵器やたばこを作る・売る企業を除外したりする。
投資ファンドについては善悪・良し悪しという強い先入観のもとに、債券・株式の投資先を判定することに疑問はあるのだけれど、馬券予想法との共通点として取り上げたいのは「スコア化」という作業である。
アナログ的だが、「敗けたものの、末脚は見所があった」とか、「道中の不利がなければ勝ち負けだった」といった評価をすることは、客観性を担保できれば良い武器になると思っている。
さらにそれを1点とか2点とか、点数化して次の予想に組み入れることができれば素晴らしいと思う。
これをスコア化という(この記事において)
問題は、スコア化したものが、いかに結果に直結しているかを検証していない場合があるということである。
実は、SDGsESGのファンドでも、債券ならどれほどデフォルト率を抑えるか、株式ならどれだけ株価を引き上げるか、といった検証をしていないものがある。
質問すると、怪しげな、関連のないデータを持ち出して信用させようとする者もいれば、「そうおっしゃっても、事実なのです」というエビデンス(証拠)も何もない返答を受けたこともある。
もちろん、株価は財務諸表やその他の信用情報と相まって決まるものだし、馬券だって能力評価が基礎になっているので、結果は複合要因である。
検証はことばでいうほど簡単ではないと思われるかもしれない。
わたしは、絶対とか正確とか言わないが、それでも簡単な検証をする。
今夜は実際に検証例を挙げてみたい。
読み進めるうち、わたしがいつもやっていることと思う方がおられれば、この拙く舌足らずなブログ記事をよく読んでおられるものと思う。

4コーナー通過順位
貴方がレースのリプレイを丹念に見て、「これは次走に期待できる」という馬を探しているものとする。
あるとき、自分自身の「規則性」を発見したとしよう。
どうも自分は最終コーナーの位置取りを起点に馬を見ているようだ、と。
そこで、最終コーナー通過順位の1位を10点、2位通過を8点、3位通過を6点と点数付けすることにした。
スコア化である。
早速これを実戦投入し、能力値に加えた。
なんとなく馬券成績がソコソコ上がった感じがする。
貴方は友人と馬券談義をしているうち、この話をした。
ところが「どれくらい馬券収支が改善したの」と聞かれて返答に窮した。

と、こういうシチュエーションである。
ここで次のような検証を行なった。
前走の4コーナー順位別に着順を集計するのである。
2006
年から2018年の中央競馬平地競走完走馬のデータを使うと、延べ550,526件の有効なデータがある。
前走で通過順位が1位だった馬は延べ40,389頭おり、このうち4,537頭が1着になっていた。

勝率にして11.2%だった。
ちなみに38,839頭の勝ち馬の中で4,537頭が前走通過順位1位の馬であったので、「占有率」は11.7%にすぎない。

ここまで調べてみると、「思ったほどではないな」と思われる方も多いのではないか。
1
番人気馬の勝率が約33%、一般的な予想法で優秀なものが勝率25%ちょっと、という中で、12%の勝率は低いのである。
実際、有効なファクターだが、それほど大きな影響力を持っていないことが分かるだろう。

これが検証の実際である。
このブログで言えば、実は、いつも通う道を反対から歩いているだけである。
いつもはこういうデータがあるから馬券に活かせるかも、と提示している。
今回は「馬券に活かせるかも」と思ったものをあとから検証しただけなのだ。
だが、これが検証なのである。
「騎手が乗り替わった」とか、「前走は進路妨害の被害馬になった」とか、何かを思いついたらまず検証してみよう。
多くの場合、大した結果を得られず徒労に終わる。
これを繰り返すうち、思いがけないヒットを生み出すことがある。
着想が先か、統計が先かはともかく、エビデンスがなければ早々に破綻する可能性が極めて高い。
(SiriusA+B)


前走4角通過順位 1着 2着 3着 4着以下 合計 1着率 2着率 3着率
1位 4,537 3,899 3,321 28,632 40,389 11.20% 9.70% 8.20%
2位 6,228 5,687 5,034 40,776 57,725 10.80% 9.90% 8.70%
3位 4,654 4,425 4,077 33,215 46,371 10.00% 9.50% 8.80%
4位 3,880 3,848 3,663 30,528 41,919 9.30% 9.20% 8.70%
5位 3,247 3,253 3,355 29,471 39,326 8.30% 8.30% 8.50%
6位以下 16,293 17,728 19,394 271,381 324,796 5.00% 5.50% 6.00%
合計 38,839 38,840 38,844 434,003 550,526 7.10% 7.10% 7.10%

ブログ アーカイブ