2016年6月26日日曜日

第95夜 競馬、数学、統計学


▼はじめにおことわり「わたしは文系」
このブログでは長期黒字を目指すものであり、娯楽としての競馬予想は対象にしていない。
競馬を楽しむことに決別し、黒字収支を持続させる技術や思考法のヒントを掲載するもので、趣味の予想法を批判するものではないことを改めて申し上げる。
また、わたしは数学や統計学が苦手で素人なので、この記事に限らずわたしのブログでの数学的あるいは統計学的な言及については、他のサイトなどで充分検証していただきたい。

▼コンピュータの武器は2
さて、コンピュータである。
過去の記事でも言及しているのだが、予想法を確立するにあたって、コンピュータの使用は不可欠になりつつある。
コンピュータには記憶媒体としての能力と計算力のふたつの力がある。
すでに、予想法はデジタルかアナログかといった議論をする時代ではない。
チェス、将棋、囲碁の世界でも人間の完全敗北が迫っている。
予想理論も、膨大なデータを処理させる能力の争いに移っていると考えてよい。
その能力とは、やはり統計学(やそれを表す数学)の知識とコンピュータ上で計算させる知識ということになる。
では、数学・統計学の知識で何が必要なのか。
わたしは適切な答えを持ち合わせていないが、少なくとも統計学上の正規分布や「べき乗則」は知っておいていいのではないだろうかと思っている。
なお、数学と統計学の関係については議論のあるところだが、統計学は数学と分けて、統計学では絶対真理ではなく、経験則あるいは主張や考えの裏付けに使うツールであるものと、ここでは考えることにする。
統計学者の方には申し訳ないが、門外漢で素人の戯言ということでご容赦いただきたい。

▼世界を記述するコード
競馬から話は逸れるが、自然現象のほか社会現象を観察すると、まるで人間は何かに支配されているかと思うことがある。
例えば、川の長さは河口までの直線距離と比べると3倍を少し超えるそうだ。
それぞれの川でその比率は違うが、平均的には円周率π(パイ)に近いという。
円周率よりずいぶんあとに発見された自然対数の底e(2.718……)と合わせ、偉大な数学者レオンハルト・オイラーの等式、
e^i
π=-1
は、作家小川洋子先生著「博士の愛した数式」にも登場する美しい公式である。
天才数学者ガウスは「もしもこの公式を一見して意味を理解できなければ、一級の数学者にはなれない」というけれど、別の数学者が言うように「我々は理解できないし、どのような意義があるのかわからない」というのが一般的な反応だろう。
しかし、等式は事実であり、証明された真理である。
わたしたちは、こうした数式で構築された世界に住んでいる。
統計学でも、自然現象や社会現象の中に「正規分布」がしばしば現われることが知られている。
正規分布は、グラフを描くと紡錘形を示す。
鐘の形、すなわち「ベル・カーブ」と言われている。
雨粒の大きさ、動植物のサイズなどの自然現象や実験の測定誤差などでは正規分布になることが多いようだ。
「独立した多数の因子の和として表される確率変数は正規分布に従う」(Wikipedia)とされている。
複雑系の問題を取り扱うとき、正規分布は便利なツールなのである。
競馬でも、例えば出走馬の馬体重は美しいベルカーブを描く。
▼中央競馬平地競走馬体重分布
(2006
年から2014年、延べ430,278)



馬体重kg

件数

640

2

630

6

620

5

610

17

600

34

590

79

580

147

570

340

560

923

550

1763

540

3807

530

8316

520

14168

510

22220

500

32794

490

44304

480

54284

470

58207

460

55427

450

46973

440

35911

430

24081

420

14228

410

7229

400

3242

390

1225

380

388

370

107

360

38

350

7

340

2

330

2

330kg未満

2

また、スピード指数では歪むものの、走破タイムや時速も、凡そこの形になる。
▼中山ダート1200m完走速度分布
(2006
年から2014年、延べ16,693頭の成績)



走破秒

時速km/h

件数

69

62.61

23

70

61.71

279

71

60.85

1143

72

60.00

2684

73

59.18

3680

74

58.38

3588

75

57.60

2679

76

56.84

1565

77

56.10

638

78

55.38

243

79

54.68

84

80以上

54.00

87

()表を簡便にするため、走破秒は秒未満を四捨五入した。


また、自然界では、べき乗則や対数正規分布になる現象もある。
べき乗則とは、ある観測量がパラメータのべき乗に比例することをいい、グラフにすると「し」の字に似た線を描く。
ランダムに発生するいくつかの要因が相互に作用する世界、つまり複雑系の世界で、大きな数と小さな数が同居するような場合に、この法則が当てはまる、とわたしは思っている。
自然現象では、地震の大きさと発生頻度の関係がよく引き合いに出されるのでご存知の人もいるだろう。
地震規模が2倍になると、発生頻度は4分の1になる。
競馬の世界でも、べき乗則になっている、あるいはその形に近いものがある。
よく「80-20の法則」と呼ばれる「全体の2割が8割を占有する」というのも、べき乗則のひとつだが、例えば調教師の勝利数や賞金獲得額などを調べると、上位2割くらいが全体の75%から80%ほどの勝利数・賞金額を占めている(2006年から2014年までの平地競走合計)



中央競馬平地競走を完走した馬延べ430,278頭の調教師数

619(上位20%124)

調教師成績上位20%124人の勝利数/全体の勝利数

22,811/29,932勝=全体の76%

調教師成績上位20%124人の獲得賞金数/全体の獲得賞金数

455,127,803千円/585,540,950千円=全体の78%

ただ、統計を取ると、べき乗則になっているようだと説明の補強に使われているケースも少なくない。
この例などは理論というより「調べてみたらそのようになっている」ということである。
例えば、ここには掲載していないが、騎手の場合は上位20%が勝利数・賞金とも93%程度を占めている。
べき乗則のようだが、8:2にはなっていない。
(SiriusA+B)

ブログ アーカイブ