2017年2月3日金曜日

第149夜統計データを用いた予想手法例(7)


▼賞金というバロメータでもっと複雑な加工をする
統計データを用いる例示として6種類の要素を縷々説明している。
最後の「要素F」について、今晩は書きとめておきたい。
要素Fも要素Eと同様に賞金を用いた分析なのだが、他のデータより少し手の込んだ計算をしている。
要素Fは、中央競馬平地競走で走った回数別に獲得賞金の平均を出し、それに比べて当該馬が上回っている/下回っている率を出走馬で競う。
ただし、獲得賞金の平均は理論値で、実際の平均値より誤差を生じる(1走目で獲得する平均賞金、2走目で獲得する平均賞金…を積み上げているためである)
例えば、ある馬が過去に5回走り、7,312,000円獲得しているとする。
5
回走った馬の獲得賞金平均は
5,678,144円であるから、この馬は7,312,000/5,678,144=1.29となる。
これを出走馬で比較し、順位付けするのだ。
要素Fの表は順位をもとに連対率を算出し、その全体平均との差をポイント(平均比)にしたもの。
要素Eの平均賞金の順位付けと似ているのだが、平均賞金の単純な比較とはまた違った統計になるようで面白い。
(
出走回数別獲得賞金モデル額、2006-2014年データから作成)



出走済回数別

獲得賞金

件数

出走済回数別

獲得賞金平均

出走回数別

獲得賞金モデル

0

39,540

846,648

846,648

1

36,261

687,942

1,534,590

2

32,033

827,400

2,361,990

3

27,748

948,152

3,310,142

4

23,932

1,092,632

4,402,774

5

20,758

1,275,370

5,678,144

6

17,951

1,450,843

7,128,987

7

15,772

1,501,858

8,630,845

8

13,980

1,693,927

10,324,772

9

12,499

1,713,337

12,038,109

10

11,164

1,782,870

13,820,979

11

10,027

1,841,321

15,662,300

12

9,020

1,812,774

17,475,074

13

8,159

1,988,203

19,463,277

14

7,444

1,978,829

21,442,106

15

6,814

2,054,612

23,496,718

16

6,170

2,177,333

25,674,051

17

5,636

2,017,287

27,691,338

18

5,151

2,006,675

29,698,013

19

4,717

1,953,298

31,651,311

20

4,301

1,975,220

33,626,531

21

3,896

1,930,045

35,556,576

22

3,477

1,845,239

37,401,815

23

3,109

1,889,702

39,291,517

24

2,771

1,748,784

41,040,301

25

2,487

1,611,536

42,651,837

26

2,199

1,435,599

44,087,436

27

1,981

1,668,608

45,756,044

28

1,773

1,475,528

47,231,572

29

1,612

1,292,262

48,523,834

30

1,419

1,370,937

49,894,771

31

1,251

1,557,830

51,452,601

32

1,116

1,678,697

53,131,298

33

987

1,268,344

54,399,642

34

854

1,262,989

55,662,631

35

755

1,295,928

56,958,559

36

653

1,263,360

58,221,919

37

574

1,033,213

59,255,132

38

481

950,478

60,205,610

39

424

1,113,401

61,319,011

40

376

588,452

61,907,463

41

330

792,288

62,699,751

42

283

812,975

63,512,726

43

248

1,005,681

64,518,407

44

225

995,191

65,513,598

45

200

701,265

66,214,863

46

169

1,103,893

67,318,756

47

147

646,415

67,965,171

48

120

545,058

68,510,229

49

101

746,851

69,257,080

50

85

257,282

69,514,362

51

69

521,304

70,035,666

52

60

547,667

70,583,333

53

52

176,250

70,759,583

54

48

988,813

71,748,396

55

38

393,947

72,142,343

56

32

311,500

72,453,843

57

28

872,036

73,325,879

58

20

584,100

73,909,979

59

17

595,706

74,505,685

60

13

161,538

74,667,223

61

11

0

74,667,223

62

10

322,000

74,989,223

63

9

0

74,989,223

64

7

0

74,989,223

65

4

375,000

75,364,223

66

2

0

75,364,223

67

2

750,000

76,114,223

68

2

0

76,114,223

69

2

0

76,114,223

70

2

0

76,114,223

71

2

0

76,114,223

72

1

0

76,114,223

(要素F、出走回数別獲得賞金モデル額の成績順)



順位

件数

連対数

連対率

平均比

1

22,919

8,228

0.359

0.215

2

22,460

5,899

0.263

0.119

3

23,225

4,667

0.201

0.057

4

23,420

3,960

0.169

0.025

5

23,357

3,339

0.143

-0.001

6

22,417

2,807

0.125

-0.019

7

21,771

2,535

0.116

-0.027

8

21,283

2,378

0.112

-0.032

9位以下

133,219

11,338

0.085

-0.059

全体

314,071

45,151

0.144

 

▼合計
これら6要素を算出したところで、今回わたしは単純に合計を出した。
統計学的にはもっと良い手法があるのだけれど、足し算でも掛け算でも平均でも「あまりひどい」ものにはならないと思う。
今回の例では、芝・ダート区分と、前走データ、賞金データを用いた。
ほかにも予想要素はたくさんあり、取捨選択しながら自分の予想というものを確立してもらえればと思う。

長期にわたって綴ってきたものの、単純化すると(1)過去9年分のデータで該当するレコードを選び、(2)データの数値を連対率に揃える、という作業であった。
例えば血統などをどう予想に組み込むか、考えあぐねていることもあると思う。
数字では表せないという人も少なくない。
だが、「スペシャルウィーク産駒のダート」なら、連対率を調べることができ、他の指数と同一の土俵で予想することはできる。
このような手法を一度覚えれば、どのような要素をピックアップするのか、どのような指数に揃えるか(今回は連対率を用いたが勝率でも賞金でも着順でもなんでも良い)、いろいろ応用が利くと思う。
(SiriusA+B)

ブログ アーカイブ