2021年11月28日日曜日

第357夜 加齢による下降曲線

 


血統評価に足りないもの
以前取り上げたことのあるテーマであるが、母馬の加齢に関する話題を改めて書いておきたい。
わたしたちは、グラフで言えば右上に向かう直線・曲線を描く世界の想像は簡単でも、下降局面は苦手のようだ。
すべては時間の経過とともに変化する。
古馬について、加齢による下降曲線の話をしたことがあるが、父馬、母馬でも同様に考えたほうが良いと思う。
特に、母馬については父馬(種牡馬)よりも出産年齢の影響を受ける。

実は、こうした統計の試みは古くからあった。
しかし、サンプル数が少なかったり、分析の手間がひとつふたつ少なくてミスリードしたりしているように感じていた。
何が足りないかというと、競馬では「成績が挙げられず早々に退出するものが多い」という事象である。
これは、競走馬や騎手の年齢別成績などで強く表われる。
母馬でも同様なのである。
下表は母馬出産年齢ではないが、兄弟姉妹順で調査した結果である。

54,487頭もの競走馬を母馬別に調べ上げた。
比較のために、産駒数別にしない兄弟姉妹順データも載せた。
これが、一般的に出回っている情報に近い。

母馬にも、産駒数が12頭というものが少なくないのだ(集計期間中に限る)
全体の勝率平均が7%ほどだから、産駒数が1頭から3頭の場合は勝率が平均を下回っている。
ということは、「3頭目や4頭目の産駒の成績が最も良い」という話にはこの影響があるとみてよい。
産駒数が6頭以上ではサンプル数の問題はあるのだが、基本的には「長子(1)が最も良く、23番目くらいまでは第1仔に近い成績である」というのがわたしの調べた結果である。
母馬の個体差や種牡馬の影響は否定しないし、大きいだろう。
だが、第3仔や第4仔の成績は、第1仔の活躍で、より優れた種牡馬を付ける生産者の行動と母馬の加齢のせめぎあいの結果であることも確かである。

中央競馬平地競走完走経験のある馬のみの母馬産駒数別、兄弟姉妹順別勝率(2006-2018年平地競走、2004-2015年生まれの馬)

兄弟姉妹順 集計期間内に出走した産駒数 該当頭数 完走回数 勝利数 勝率
1 (全体) 18,521 112,915 7,915 7.0%
2 (全体) 12,298 77,192 5,719 7.4%
3 (全体) 8,630 54,669 4,051 7.4%
4 (全体) 5,951 38,020 2,789 7.3%
5 (全体) 3,994 25,465 1,807 7.1%
6 (全体) 2,491 15,699 1,109 7.1%
7 (全体) 1,433 8,805 592 6.7%
8 (全体) 736 4,569 291 6.4%
9 (全体) 320 1,910 128 6.7%
10 (全体) 104 628 41 6.5%
11 (全体) 18 106 9 8.5%
12 (全体) 3 13 1 7.7%
1 1 6,223 35,105 2,236 6.4%
1 2 3,668 21,683 1,209 5.6%
2 2 3,668 21,328 1,234 5.8%
1 3 2,679 16,950 1,089 6.4%
2 3 2,679 16,730 1,113 6.7%
3 3 2,679 16,156 951 5.9%
1 4 1,957 12,297 885 7.2%
2 4 1,957 12,293 863 7.0%
3 4 1,957 12,103 774 6.4%
4 4 1,957 11,632 728 6.3%
1 5 1,503 9,770 782 8.0%
2 5 1,503 9,865 786 8.0%
3 5 1,503 9,577 720 7.5%
4 5 1,503 9,433 619 6.6%
5 5 1,503 9,455 535 5.7%
1 6 1,058 7,069 632 8.9%
2 6 1,058 6,921 642 9.3%
3 6 1,058 7,011 571 8.1%
4 6 1,058 7,020 522 7.4%
5 6 1,058 6,696 479 7.2%
6 6 1,058 6,419 406 6.3%
1 7 697 4,906 484 9.9%
2 7 697 4,871 486 10.0%
3 7 697 4,795 483 10.1%
4 7 697 4,773 398 8.3%
5 7 697 4,532 361 8.0%
6 7 697 4,460 327 7.3%
7 7 697 4,174 257 6.2%
1 8頭以上 736 5,135 598 11.6%
2 8頭以上 736 5,184 595 11.5%
3 8頭以上 736 5,027 552 11.0%
4 8頭以上 736 5,162 522 10.1%
5 8頭以上 736 4,782 432 9.0%
6 8頭以上 736 4,820 376 7.8%
7 8頭以上 736 4,631 335 7.2%
8 8頭以上 736 4,569 291 6.4%
9 8頭以上 320 1,910 128 6.7%
10 8頭以上 104 628 41 6.5%
11 8頭以上 18 106 9 8.5%
12 8頭以上 3 13 1 7.7%

(SiriusA+B)

2021年11月21日日曜日

第356夜 予測の難しさを知る(後編)


実際の投票行動
前夜からのつづきである。
なお、予測や予想の話であって、政治関係の話ではないことを改めて申し上げておく。

さらに、実際の結果も興味深い。
下表は、総務省の公表している得票数をまとめたものである(公表データには小数点がある)
総選挙の間に参院選もあったので併せて掲載した。
総選挙小選挙区・参院選選挙区については各選挙区で全政党が候補者を立てるわけではないため、いずれも比例代表に限った得票数である。
総選挙同士を比較すると、投票率が前回比で上昇して、比例代表は170万票増えた。政党別で増減をみると、「他」が460万票減少し、地域政党から全国区に拡大した政党にごっそり移ったことが分かる。

投票率の上昇で増えた170万票は最大与党と最大野党で分けた。
もちろん、個々に見ればこのような単純な投票行動ではないが、数字をマクロ的に捉えると大きな流れはつかめる。
最大野党は40万票増えているようにも見えるが、中間の参院選の資料から推定すると、もしかしたら共闘した野党から票が流れてきたかもしれない。

これが総選挙の議席数予想に対する「正解・解答」である。
前回総選挙の「他」には東京地域政党から全国区に拡大した政党の旋風が巻き起こっていた。
その政党が「消失」したため、別の地域政党に票が流れただけとも言える。
最大与野党の得票数も得票率も、前回の傾向とは変わっていないのだ。
したがって、出口調査で偏ったサンプリングをしたか、分析に先入観が混じったか、でなければ最大与野党の議席数予想を外した説明がつかないのである。

教訓
今回の総選挙は、大手報道機関がことごとく予想を外す例であった。
わたしは、結果を知ってから話をしているので「結果論」しか言えないのだが、現実にデータを収集しても、予測を誤ることは不可避であることが分かる。
総選挙は死票の多い小選挙区が雌雄を決するが、比例代表のデータだけでも大凡の動きを知ることはできる。
問題は、客観的データを無視したり、バイアスのかかった目で分析したりすると、判断を誤るということだ。
競馬予想でも同じことが言える。
例えば「1番人気の勝った次のレースでは1番人気の勝つ確率は少ない」というのはデータ不足か、客観的なデータの無視か、願望が強すぎて誤った結論を導いているか、いずれかである。
ちなみに、1番人気の勝った次のレースで1番人気の勝つ確率は、1番人気の敗けた次のレースで1番人気の勝つ確率とまったく同じである。
独立事象だから自明である。

2017年第48
総選挙比例代表

2019年第25
参議院通常選挙

2021年第49
総選挙比例代表

得票数

得票率

得票数

得票率

得票数

得票率

総選挙
得票数前回差

自民

18,555,717

33.3%

17,712,373

35.4%

19,914,883

34.7%

+1,359,166

立憲

11,084,890

19.9%

7,917,721

15.8%

11,492,111

20.0%

+407,221

公明

6,977,712

12.5%

6,536,336

13.1%

7,114,282

12.4%

+136,570

共産

4,404,081

7.9%

4,483,411

9.0%

4,166,076

7.2%

-238,005

維新

3,387,097

6.1%

4,907,844

9.8%

8,050,830

14.0%

+4,663,733

11,348,055

20.4%

8,514,513

17.0%

6,727,787

11.7%

-4,620,268

合計

55,757,552

100.0%

50,072,199

100.0%

57,465,969

100.0%

+1,708,417

(SiriusA+B)

ブログ アーカイブ