2016年6月30日木曜日

第96夜 斤量と馬体重の比率を調べたら疑問が増えた


▼斤量と馬体重の検証
負担重量すなわち斤量と、馬体重はそれぞれ単独ではあまり勝利との因果関係があるようには思えないが、組み合わせることで注目すべきデータになることが知られている。
馬にも、300kg台から500kg600kg台までおり、55kg前後の斤量が与える影響は馬格により異なるのではないかといわれている。
今夜は、斤量/馬体重指数を使って、2006年から2014年の中央競馬平地競走完走馬と勝利の関係を調査した。

斤量/馬体重指数は、斤量÷馬体重と計算している。
55kg
を背負う馬体重460kgの馬であれば、55/4600.12である(小数点第3位を四捨五入している)
下表をご覧いただければわかるとおり、多くの出走馬は0.110.12に位置し、0.13以上の値になった馬は勝率が大きく下がる。
勝馬の90%0.12以下の馬である。
0.14
以上になると勝率もずいぶん下がる。
▼斤量/馬体重指数別状況



斤量/馬体重

牡完走数

牝完走数

完走数計

牡勝利数

牝勝利数

勝利数計

勝率

占有率

0.08

1

0

1

0

0

0

0.0%

0%

0.09

232

45

277

10

2

12

4.3%

0%

0.10

11368

4022

15390

894

236

1130

7.3%

4%

0.11

100122

46199

146321

8549

3270

11819

8.1%

39%

0.12

125542

81299

206841

9273

4878

14151

6.8%

47%

0.13

27625

30373

57998

1483

1258

2741

4.7%

9%

0.14

1123

2240

3363

33

46

79

2.3%

0%

0.15

10

74

84

0

0

0

0.0%

0%

0.16

0

1

1

0

0

0

0.0%

0%

合計

266023

164253

430276

20242

9690

29932

 

 

※集計期間中、馬体重がわからなかった2頭を除く

 
▼残された課題
疑問もある。
ひとつは、斤量/馬体重指数で0.10以下の馬の勝率が良くないのである。
馬体重に占める斤量の比率が低くなるほど勝率が上がるという結論を出したかったが、そう簡単にはいかないようだ。
サンプル数が少なくなるので誤差も大きいと思うのだが、明確な理由は見出せなかった。
減量騎手ばかりだと思っていたが、かなりの大型馬で斤量比が低くなっている馬もいた。
「減量騎手を乗せているため、騎手の技量が高くないか、あるいは超大型馬は制御しがたいからだろう」といいたいのだが、証拠となる数字が出てこなかった。
また、芝とダート別では、若干ながらダートで斤量の影響が強いことは想定していたが、思ったほどではなかったうえ、ダートの距離が伸びてもあまり勝率に変化がない点も解決できていない。
わたしは、芝の競走ではスピードの制御が利く馬、ダート競走ではスタミナやパワーの馬が勝利に近いと仮定して予想を立てていた。
だから、ダート競走の距離が伸びるほど斤量/馬体重指数が小さいほど有利と見ていた。
うーん、なんだろう。
これについては、もう少し研究していずれ記事にしたいと思っている。
(SiriusA+B)

2016年6月26日日曜日

第95夜 競馬、数学、統計学


▼はじめにおことわり「わたしは文系」
このブログでは長期黒字を目指すものであり、娯楽としての競馬予想は対象にしていない。
競馬を楽しむことに決別し、黒字収支を持続させる技術や思考法のヒントを掲載するもので、趣味の予想法を批判するものではないことを改めて申し上げる。
また、わたしは数学や統計学が苦手で素人なので、この記事に限らずわたしのブログでの数学的あるいは統計学的な言及については、他のサイトなどで充分検証していただきたい。

▼コンピュータの武器は2
さて、コンピュータである。
過去の記事でも言及しているのだが、予想法を確立するにあたって、コンピュータの使用は不可欠になりつつある。
コンピュータには記憶媒体としての能力と計算力のふたつの力がある。
すでに、予想法はデジタルかアナログかといった議論をする時代ではない。
チェス、将棋、囲碁の世界でも人間の完全敗北が迫っている。
予想理論も、膨大なデータを処理させる能力の争いに移っていると考えてよい。
その能力とは、やはり統計学(やそれを表す数学)の知識とコンピュータ上で計算させる知識ということになる。
では、数学・統計学の知識で何が必要なのか。
わたしは適切な答えを持ち合わせていないが、少なくとも統計学上の正規分布や「べき乗則」は知っておいていいのではないだろうかと思っている。
なお、数学と統計学の関係については議論のあるところだが、統計学は数学と分けて、統計学では絶対真理ではなく、経験則あるいは主張や考えの裏付けに使うツールであるものと、ここでは考えることにする。
統計学者の方には申し訳ないが、門外漢で素人の戯言ということでご容赦いただきたい。

▼世界を記述するコード
競馬から話は逸れるが、自然現象のほか社会現象を観察すると、まるで人間は何かに支配されているかと思うことがある。
例えば、川の長さは河口までの直線距離と比べると3倍を少し超えるそうだ。
それぞれの川でその比率は違うが、平均的には円周率π(パイ)に近いという。
円周率よりずいぶんあとに発見された自然対数の底e(2.718……)と合わせ、偉大な数学者レオンハルト・オイラーの等式、
e^i
π=-1
は、作家小川洋子先生著「博士の愛した数式」にも登場する美しい公式である。
天才数学者ガウスは「もしもこの公式を一見して意味を理解できなければ、一級の数学者にはなれない」というけれど、別の数学者が言うように「我々は理解できないし、どのような意義があるのかわからない」というのが一般的な反応だろう。
しかし、等式は事実であり、証明された真理である。
わたしたちは、こうした数式で構築された世界に住んでいる。
統計学でも、自然現象や社会現象の中に「正規分布」がしばしば現われることが知られている。
正規分布は、グラフを描くと紡錘形を示す。
鐘の形、すなわち「ベル・カーブ」と言われている。
雨粒の大きさ、動植物のサイズなどの自然現象や実験の測定誤差などでは正規分布になることが多いようだ。
「独立した多数の因子の和として表される確率変数は正規分布に従う」(Wikipedia)とされている。
複雑系の問題を取り扱うとき、正規分布は便利なツールなのである。
競馬でも、例えば出走馬の馬体重は美しいベルカーブを描く。
▼中央競馬平地競走馬体重分布
(2006
年から2014年、延べ430,278)



馬体重kg

件数

640

2

630

6

620

5

610

17

600

34

590

79

580

147

570

340

560

923

550

1763

540

3807

530

8316

520

14168

510

22220

500

32794

490

44304

480

54284

470

58207

460

55427

450

46973

440

35911

430

24081

420

14228

410

7229

400

3242

390

1225

380

388

370

107

360

38

350

7

340

2

330

2

330kg未満

2

また、スピード指数では歪むものの、走破タイムや時速も、凡そこの形になる。
▼中山ダート1200m完走速度分布
(2006
年から2014年、延べ16,693頭の成績)



走破秒

時速km/h

件数

69

62.61

23

70

61.71

279

71

60.85

1143

72

60.00

2684

73

59.18

3680

74

58.38

3588

75

57.60

2679

76

56.84

1565

77

56.10

638

78

55.38

243

79

54.68

84

80以上

54.00

87

()表を簡便にするため、走破秒は秒未満を四捨五入した。


また、自然界では、べき乗則や対数正規分布になる現象もある。
べき乗則とは、ある観測量がパラメータのべき乗に比例することをいい、グラフにすると「し」の字に似た線を描く。
ランダムに発生するいくつかの要因が相互に作用する世界、つまり複雑系の世界で、大きな数と小さな数が同居するような場合に、この法則が当てはまる、とわたしは思っている。
自然現象では、地震の大きさと発生頻度の関係がよく引き合いに出されるのでご存知の人もいるだろう。
地震規模が2倍になると、発生頻度は4分の1になる。
競馬の世界でも、べき乗則になっている、あるいはその形に近いものがある。
よく「80-20の法則」と呼ばれる「全体の2割が8割を占有する」というのも、べき乗則のひとつだが、例えば調教師の勝利数や賞金獲得額などを調べると、上位2割くらいが全体の75%から80%ほどの勝利数・賞金額を占めている(2006年から2014年までの平地競走合計)



中央競馬平地競走を完走した馬延べ430,278頭の調教師数

619(上位20%124)

調教師成績上位20%124人の勝利数/全体の勝利数

22,811/29,932勝=全体の76%

調教師成績上位20%124人の獲得賞金数/全体の獲得賞金数

455,127,803千円/585,540,950千円=全体の78%

ただ、統計を取ると、べき乗則になっているようだと説明の補強に使われているケースも少なくない。
この例などは理論というより「調べてみたらそのようになっている」ということである。
例えば、ここには掲載していないが、騎手の場合は上位20%が勝利数・賞金とも93%程度を占めている。
べき乗則のようだが、8:2にはなっていない。
(SiriusA+B)

ブログ アーカイブ