▼代表値
代表値とは要約統計量とも言い、ある変数を要約したものである。
合計や平均はよく知られ、また活用されているが、このほかに真ん中の数値を表す「中央値」や、最もよく出でくる「最頻値」などもある。
こうした代表値の便利な点は、大量のデータを「ひと言で言えばこうだ」と表現できることである。
競馬予想では、複数の指数を組み合わせて投票する馬を決める手法が多いように思っている。
それぞれの要素に点数を付ける。
その合計や平均を予想とするのである。
▼オッズの決定方法
一方、オッズは多数の投票者により1番人気が形成される点で代表値とは異なる(最頻値と似ている。わたしには上手く説明できないが、ちょっと違う)。
単勝1番人気は勝率約33%だが、投票者でこの勝率を上回る者はほとんどいない。
株式市場でもよく似ていてベンチマーク(日経平均株価や東証株価指数)を長期的に上回るアクティブファンドはほぼない。
投票者それぞれの的中率の低い投票を集めた結果が最も高い的中率となる事実に、不思議な感じを抱いたことはないだろうか。
この疑問の解決には集合知、多数決についての理解が必要なようである。
詳しくは専門のサイトを参照していただきたい。
そう考えると、平均や合計以外の予想方法として、オッズの形成過程に似せた多数決というやり方もある。
複数の方法で予想し、多数決で決める。
ランダムフォレストを使い、こうした予想方法を実践しているものもあるようなので研究してみてほしい。
(SiriusA+B)