2017年7月23日日曜日

第176夜 自信のあるレースーー馬券の買い方を考える(1)

▼自信のあるレースとは
競馬予想に「自信のあるレース」ということばがある。
予想者が自らの予想に自信のあることをいう。
その自信の根拠を知りたいが、それこそ千差万別、「根拠無き自信」もあれば「自身の本命が圧倒的な1番人気と一致する」というのもある。
少数ながら、独自の判断で本命が勝つ可能性が極めて高いからだという者もいるが、ほとんどは自分の予想結果とオッズすなわち人気との比較による。
問題は、わたしの周囲を見た限りでは、自信があるというものほど予想とオッズが合致しており、旨味が少ないように思う点である。
「やっぱりボクの予想した本命がグリグリの1番人気だね。この馬はくるよ。今日のレースでも1番自信がある」と誇らしげに話していたら、その人は競馬で勝ち組になることはないと考えて良い。
多数派との予想の乖離が収益の源泉であることを理解していないからである。

▼馬券の買い方
衆目の一致する予想が自身の予想と重なるとき、わたしは「引き分け」と考えているので、自信があるというより残念な気になる。
わたしが少額で遊ぶ場合は、購入時にオッズを気にしないので買い方に影響されることはない。
だが、自分の予想に「自信がある」という人に限って、オッズを見て買い増したり、例えば単勝から複勝に切り替えたりする。
長期にわたり黒字を目指すこのブログでは、あまり推奨できる購入行動ではない。
自信があるイコール人気通り、なら、若干的中率が改善するだけで回収率は低下する。
的中率が何ポイントか改善してもオッズが低くて回収額の合計額は少なくなるのである。
厚く買う行為はむしろ赤字を拡大するだけではないだろうか。
少額で勝負する場合で均等買いをしないのならば、賭け方が逆である。
わたしは、買い目のオッズの高いものほど厚く賭けるべきだと考える。

例えば、馬連で1-2(A)、1-3(B)、1-4(C)、2-3(D)と4点買いを決めていたとする。
オッズを見ると、3倍、5倍、8倍、13倍となっている。
手持ちの軍資金は1,000円である。
どう配分するのか。

一般に多い賭け方は、(A)400円、(B)300円、(C)200円、(D)100円となろうか。
本線の1-2でも200円の黒字になる。
外れたら1銭にもならず、最も儲けても600円にしかならないが、それでベストの賭け方だろうか。
例えばこのような賭け方はいかがだろう。
1)どの買い目も期待できるので、(A)300円、(B)300円、(C)200円、(D)200円。
2)最も高倍率の(D)のみ1,000円。(A)(B)(C)は諦める。
3)最も高倍率の(D)に700円。(A)(B)(C)に各100円。
4)上記と近いが、さすがに倍率の低い(A)に200円、(B)(C)に各100円、(D)600円。
このうち、1)はほぼ均等買いのイメージである。
いちいちオッズを見ない人なら均等買い良かろう。
そのほかの3つは(D)以外ではトリガミが設定されている。
わたしはこのいずれかを選ぶ。
オッズを見るなら1)以外を選択するだろう。

▼トリガミは「引き分け」
このようなオッズが低めの4点買いの場合、どれが当たっても黒字を確保しようという行動に出てしまう。
外れてしまえば0になるのに、トリガミを怖れてリスクが取れない。
1)から4)の選択肢は、トリガミを承知の上で(D)が的中したときの払い戻しを極大化する買い方である。
トリガミは「引き分け」で、予想で勝ち配当で負けた1勝1敗だ。
数百円であっても1,000円すべてを失うよりマシな状態である。
きちんとした予想精度を持つなら、この買い方をぜひ検討してほしいと思う。

競馬はリスクとの闘いとも言える。
予想精度を上げようというこのブログだが、馬券の買い方も疎かにはできないものである。
精度を上げることが予想法の目標であるのに対し、購入法は不的中リスクの制御を目標にする。
的中率が100%でない限り、最大の懸案は有限資金の破綻回避なのだ。
どこまでご説明できるか自信はないが、何回かにわたり、馬券の買い方に対するわたしの考えを記すことにする。
下手な配分法ではない、積極的にリスクを取りにいく勇気を持てば、収支を改善する道を拓く可能性は高くなることをお話ししたい。
(SiriusA+B)

2017年7月20日木曜日

第175夜 大敗を喫した場合のデータ取り扱い

▼大敗
このブログで何度も触れているように、わたしは走破タイムを利用した競馬予想をしていないのだが、巷間ではタイム理論が主要なツールのひとつであることから、速度理論などの実践的な記事を幾つか掲載している。
今夜は、表計算ソフト等で自ら計算する人が、データ上取り扱いに困る「大敗」について記したい。
意見は色々あるだろうが、ひとつの考え方として参考になれば幸いである。

伝統的なスピード指数、わたしが推奨する時速換算或いは偏差値など、いずれの方法でも実践中に困ることが発生する。
「大敗」である。
人気薄の逃げ馬が直線でバテてやっとゴールするようなシーンを目撃した人は少なくないだろう。
原因はさまざまだが、中央競馬の平地競走でもこうした大敗は珍しいことではない。
たいていの場合、タイムオーバーでしばらく出走しないので、或いはタイムオーバーには至らなくても立て直しはあると思うので、この馬自体は放っておいていいのだけれど、問題は走破タイムが遅すぎるために指数計算に支障をきたすことである。
上位3頭でレースの平均タイムや馬場指数を算出する人には無縁だが、精緻に弾き出したいと全馬のタイムを集計する人もいると思われる。
しかし、80を基準にしたスピード指数で、例えば「15」とか、平均時速60kmのところ「47km/h」とかいった数字が出てくると、レースの平均値が大きく下がってしまうのだ。
以下の例のように、出走馬十数頭で集計するレース毎では、突出して低い数字が1頭でもあると、平均値を大きく押し下げ、上位馬の評価を不当に低くしてしまう。
<図表>
着順 距離 走破タイム km/h 標準偏差 偏差値
1 1,200 73.5 58.78 2.055628 54.2
2 1,200 73.7 58.62   53.9
3 1,200 74.7 57.83   52.3
4 1,200 74.9 57.68   52.0
5 1,200 75.1 57.52   51.6
6 1,200 75.3 57.37   51.3
7 1,200 75.4 57.29   51.2
8 1,200 75.5 57.22   51.0
9 1,200 75.8 56.99   50.5
10 1,200 75.9 56.92   50.4
11 1,200 76.1 56.77   50.1
12 1,200 76.1 56.77   50.1
13 1,200 76.4 56.54   49.6
14 1,200 76.7 56.32   49.2
15 1,200 87.2 49.54   35.2


▼走破タイムさえ操作する発想
困った人は少なくないだろうと思うが、わたしも駆け出しの頃、長く頭を悩ませた。
「走破タイムは絶対的な事実だから、数字を操作できない」
そう思っていた。
ところが、スピード指数に対する疑問が大きくなり、より統計的な手法に傾倒してくるようになると、極めて遅いタイムがいろいろと弊害を生むようになってきた。
「イレギュラーなデータは邪魔だなぁ」とさえ考えるようになった。
そこで、イレギュラーなデータであればクレンジングしてもいいだろうという考えに行き着いた。
例えば、1着から3秒以上の着差をつけられた場合、3秒差に固定する。
それでは正確でない、或いはクレンジングされた馬の予想精度が下がるのではないかと異論を唱える人もいるだろう。
だが、上位馬の評価が正当になされれば不都合はない。
下位馬も能力を十全に発揮したわけでもあるまい。

タイム修正
着順 距離 走破タイム km/h 標準偏差 偏差値 計算上
走破タイム 計算上km/h 標準偏差 偏差値
1 1,200 73.5 58.78 2.055628 54.2 73.5 58.78 0.691428 54.2
2 1,200 73.7 58.62   53.9 73.7 58.62   53.9
3 1,200 74.7 57.83   52.3 74.7 57.83   52.3
4 1,200 74.9 57.68   52.0 74.9 57.68   52.0
5 1,200 75.1 57.52   51.6 75.1 57.52   51.6
6 1,200 75.3 57.37   51.3 75.3 57.37   51.3
7 1,200 75.4 57.29   51.2 75.4 57.29   51.2
8 1,200 75.5 57.22   51.0 75.5 57.22   51.0
9 1,200 75.8 56.99   50.5 75.8 56.99   50.5
10 1,200 75.9 56.92   50.4 75.9 56.92   50.4
11 1,200 76.1 56.77   50.1 76.1 56.77   50.1
12 1,200 76.1 56.77   50.1 76.1 56.77   50.1
13 1,200 76.4 56.54   49.6 76.4 56.54   49.6
14 1,200 76.7 56.32   49.2 76.5 56.47   49.5
15 1,200 87.2 49.54   35.2 76.5 56.47   49.5

この問題は、固定観念を破ることが最大の壁である。
発想はそれほど難しいものではない。
「正確なデータを不正確にする」ということが非常識的、間違えた考え、などと思い込まないで試せるかどうかに多数派との決別点がある。
(SiriusA+B)

2017年7月13日木曜日

第174夜 AIで競馬予想が変わる日までに

▼AIの目覚ましい発達
AI技術は、チェス、囲碁、将棋の分野で現役最高クラスを凌駕しつつある。
わたしの個人的に最も大きかった衝撃で言えば、将棋の名人が「ポナンザ」に敗れたことである。
チェスで人間が敗北したのは随分前だが、将棋においても人間が敗れることは時間の問題だったと考えていた。
衝撃的だったのは「その日」がわたしの予想より早かったことだ。
AI技術に競馬予想で凌駕されては困る。
凌駕される前に、競馬予想で生活しておきたい(笑)と考えていたわたしには、ほとんど時間が残されていないのではないかと慌てたのである。

だが、光明も見えた気がする。
AI技術の勝利は、ゲームの勝利であるとともに、プログラムの勝利であるとも言える。
わたしが注目したことは、AIによる予測が素晴らしいという以上に、現実世界の多くの事象から主だったものを抽出して予測するプログラムの考え方、作成力である。
競馬は将棋と異なるゲームだが、「あらゆる事象を抽出できないから予測はできない」という考えを改められそうに思えた。

▼例えば決定木
AIと聞けば、なにやら凄いことをしているように思うけれど、そもそもAIとは何か、ということさえ、文系のわたしたちにははっきりしない。
わたしは先日の週刊東洋経済が簡単化してくれたように、最も狭義が「ディープラーニング」、次いで「ニューラルネットワーク」、「機械学習」と広くなっていくように思う。
ディープラーニングはニューラルネットワークを多層化したものという、研究者にはたいへん失礼ながら大雑把なイメージをしている(間違っていたらすみません)。
では、ニューラルネットワークはどういうものかというと、「神経の……」という説明はおいておき、「決定木」というロールプレイングゲームのような幾つかの選択肢で分岐させたツリーを作っている。
牡牝、前走3着以内かどうか、前走上がり3ハロンが3位以内かどうか、という3つの分類なら、それぞれ選択肢を1と2とすると、
111、112、121、122、211、212、221、222
の8つに枝分かれする。
例えばこの8分類別に勝率を求めるのである(あくまで大雑把なわたしのイメージ)。
なんだ、そんなことかと思う人もいよう。
コンピュータが凄いのは、最適な組み合わせ(この3つの分類のように)を人間と比較にならない速さで探し当てることなのだ。
例えば前走3着以内より4着以内が良いとかいったことも調べる。

ディープラーニングでは、複数の決定木を作り、多数決で答えを決める、とわたしは考えている(このあたりはかなり適当なので、鵜呑みにしないように願う)。

あくまで決定木についてだが、コンピュータで難しいことを計算しているといっても人間の想像できるやり方なのである。
優れた計算速度で、人間では不可能な量の仕事をするだけのことなのだ。
ベストな組み合わせでないけれど、決定木を複数作って多数決で答えを決めることは手作業でもできる。
(SiriusA+B)

2017年7月3日月曜日

第173夜 表計算ソフトで偏差値を算出する


▼表計算ソフトで行き詰まる人へ参考になれば
「第97夜 偏差値を使う側になったボクたちは、競馬予想の武器にする」で、数値処理に偏差値を用いるのも良いだろうという話をした。
優劣を偏差値で表わすか、順位で表わすか、百分率で表わすか、どのような方法が適切かについてはそれぞれが判断すべきものかと思う。
ところで、今夜は代表的な表計算ソフト(Microsoft Excel)で偏差値の計算例を示す。
最近、意外に関数を使いこなせない人も少なくないことを知った。
関数は、難しいものを知っているというような「知っている、知らない」のレベルではなく、いかに使いこなすか、が難しい。
かなり実践的な例示なので、関数をよくご覧いただきたい。
ちなみに、仕事でも使える実用的な例である。

 
B
C
D
E
F
G
H
I
J
K
L
M
N
O
2
ID
開催日
地区
競走番号
着順
競走条件
馬番
馬名
人気
速度
平均
標準偏差
標準偏差範囲
偏差値
3
14626-01
2010/5/30
東京
10
1
2400
1
エイシンフラッシュ
7
58.82
58.4565
0.2991
K3:K19
62.2
4
14626-02
2010/5/30
東京
10
2
2400
8
ローズキングダム
5
58.82
58.4565
0.2991
K3:K19
62.2
5
14626-03
2010/5/30
東京
10
3
2400
7
ヴィクトワールピサ
1
58.70
58.4565
0.2991
K3:K19
58.1
6
14626-04
2010/5/30
東京
10
4
2400
13
ゲシュタルト
12
58.70
58.4565
0.2991
K3:K19
58.1
7
14626-05
2010/5/30
東京
10
5
2400
3
ルーラーシップ
4
58.70
58.4565
0.2991
K3:K19
58.1
8
14626-06
2010/5/30
東京
10
6
2400
9
ペルーサ
2
58.62
58.4565
0.2991
K3:K19
55.5
9
14626-07
2010/5/30
東京
10
7
2400
17
トゥザグローリー
10
58.62
58.4565
0.2991
K3:K19
55.5
10
14626-08
2010/5/30
東京
10
8
2400
4
サンディエゴシチー
15
58.62
58.4565
0.2991
K3:K19
55.5
11
14626-09
2010/5/30
東京
10
9
2400
12
ヒルノダムール
3
58.58
58.4565
0.2991
K3:K19
54.1
12
14626-10
2010/5/30
東京
10
10
2400
5
コスモファントム
11
58.46
58.4565
0.2991
K3:K19
50.1
13
14626-11
2010/5/30
東京
10
11
2400
2
レーヴドリアン
9
58.42
58.4565
0.2991
K3:K19
48.8
14
14626-12
2010/5/30
東京
10
12
2400
14
リルダヴァル
8
58.42
58.4565
0.2991
K3:K19
48.8
15
14626-13
2010/5/30
東京
10
13
2400
6
アリゼオ
6
58.30
58.4565
0.2991
K3:K19
44.8
16
14626-14
2010/5/30
東京
10
14
2400
15
メイショウウズシオ
14
58.22
58.4565
0.2991
K3:K19
42.1
17
14626-15
2010/5/30
東京
10
15
2400
10
トーセンアレス
17
58.06
58.4565
0.2991
K3:K19
36.7
18
14626-16
2010/5/30
東京
10
16
2400
11
ハンソデバンド
13
57.91
58.4565
0.2991
K3:K19
31.7
19
14626-17
2010/5/30
東京
10
17
2400
16
シャイン
16
57.79
58.4565
0.2991
K3:K19
27.7
20
14627-01
2010/5/30
東京
11
1
1400
14
ザッハーマイン
1
59.43
58.855
0.42332
K20:K35
63.6
21
14627-02
2010/5/30
東京
11
2
1400
3
ギンザナイト
7
59.43
58.855
0.42332
K20:K35
63.6
22
14627-03
2010/5/30
東京
11
3
1400
5
レッツゴーヒチョリ
10
59.43
58.855
0.42332
K20:K35
63.6
23
14627-04
2010/5/30
東京
11
4
1400
16
アルセーヌシチー
16
59.15
58.855
0.42332
K20:K35
57
24
14627-05
2010/5/30
東京
11
5
1400
8
リバーアゲイン
4
59.15
58.855
0.42332
K20:K35
57
25
14627-06
2010/5/30
東京
11
6
1400
6
グロッキーバルボア
9
59.09
58.855
0.42332
K20:K35
55.6
26
14627-07
2010/5/30
東京
11
7
1400
4
シャドウストライプ
3
59.09
58.855
0.42332
K20:K35
55.6
27
14627-08
2010/5/30
東京
11
8
1400
15
マルタカラッキー
8
58.88
58.855
0.42332
K20:K35
50.6
28
14627-09
2010/5/30
東京
11
9
1400
9
フヨウ
11
58.88
58.855
0.42332
K20:K35
50.6
29
14627-10
2010/5/30
東京
11
10
1400
11
セイウンアスラン
2
58.81
58.855
0.42332
K20:K35
48.9
30
14627-11
2010/5/30
東京
11
11
1400
7
ホットマニューバー
13
58.74
58.855
0.42332
K20:K35
47.3
31
14627-12
2010/5/30
東京
11
12
1400
10
ヌーサ
12
58.54
58.855
0.42332
K20:K35
42.6
32
14627-13
2010/5/30
東京
11
13
1400
1
ミッキーフォルテ
6
58.40
58.855
0.42332
K20:K35
39.3
33
14627-14
2010/5/30
東京
11
14
1400
13
オオヒメ
14
58.40
58.855
0.42332
K20:K35
39.3
34
14627-15
2010/5/30
東京
11
15
1400
12
エイトサンデー
15
58.20
58.855
0.42332
K20:K35
34.5
35
14627-16
2010/5/30
東京
11
16
1400
2
ハクバドウジ
5
58.06
58.855
0.42332
K20:K35
31.2

▼計算式

CELL
計算式
L3
=IF(F3=1,SUMIFS(K:K,B:B,LEFT(B3,6)&"*")/COUNTIFS(B:B,LEFT(B3,6)&"*"),L2)
M3
=STDEVP(INDIRECT(N3))
O3
=ROUND((K3-L3)/M3*10+50,1)

(SiriusA+B)

ブログ アーカイブ