2021年11月21日日曜日

第356夜 予測の難しさを知る(後編)


実際の投票行動
前夜からのつづきである。
なお、予測や予想の話であって、政治関係の話ではないことを改めて申し上げておく。

さらに、実際の結果も興味深い。
下表は、総務省の公表している得票数をまとめたものである(公表データには小数点がある)
総選挙の間に参院選もあったので併せて掲載した。
総選挙小選挙区・参院選選挙区については各選挙区で全政党が候補者を立てるわけではないため、いずれも比例代表に限った得票数である。
総選挙同士を比較すると、投票率が前回比で上昇して、比例代表は170万票増えた。政党別で増減をみると、「他」が460万票減少し、地域政党から全国区に拡大した政党にごっそり移ったことが分かる。

投票率の上昇で増えた170万票は最大与党と最大野党で分けた。
もちろん、個々に見ればこのような単純な投票行動ではないが、数字をマクロ的に捉えると大きな流れはつかめる。
最大野党は40万票増えているようにも見えるが、中間の参院選の資料から推定すると、もしかしたら共闘した野党から票が流れてきたかもしれない。

これが総選挙の議席数予想に対する「正解・解答」である。
前回総選挙の「他」には東京地域政党から全国区に拡大した政党の旋風が巻き起こっていた。
その政党が「消失」したため、別の地域政党に票が流れただけとも言える。
最大与野党の得票数も得票率も、前回の傾向とは変わっていないのだ。
したがって、出口調査で偏ったサンプリングをしたか、分析に先入観が混じったか、でなければ最大与野党の議席数予想を外した説明がつかないのである。

教訓
今回の総選挙は、大手報道機関がことごとく予想を外す例であった。
わたしは、結果を知ってから話をしているので「結果論」しか言えないのだが、現実にデータを収集しても、予測を誤ることは不可避であることが分かる。
総選挙は死票の多い小選挙区が雌雄を決するが、比例代表のデータだけでも大凡の動きを知ることはできる。
問題は、客観的データを無視したり、バイアスのかかった目で分析したりすると、判断を誤るということだ。
競馬予想でも同じことが言える。
例えば「1番人気の勝った次のレースでは1番人気の勝つ確率は少ない」というのはデータ不足か、客観的なデータの無視か、願望が強すぎて誤った結論を導いているか、いずれかである。
ちなみに、1番人気の勝った次のレースで1番人気の勝つ確率は、1番人気の敗けた次のレースで1番人気の勝つ確率とまったく同じである。
独立事象だから自明である。

2017年第48
総選挙比例代表

2019年第25
参議院通常選挙

2021年第49
総選挙比例代表

得票数

得票率

得票数

得票率

得票数

得票率

総選挙
得票数前回差

自民

18,555,717

33.3%

17,712,373

35.4%

19,914,883

34.7%

+1,359,166

立憲

11,084,890

19.9%

7,917,721

15.8%

11,492,111

20.0%

+407,221

公明

6,977,712

12.5%

6,536,336

13.1%

7,114,282

12.4%

+136,570

共産

4,404,081

7.9%

4,483,411

9.0%

4,166,076

7.2%

-238,005

維新

3,387,097

6.1%

4,907,844

9.8%

8,050,830

14.0%

+4,663,733

11,348,055

20.4%

8,514,513

17.0%

6,727,787

11.7%

-4,620,268

合計

55,757,552

100.0%

50,072,199

100.0%

57,465,969

100.0%

+1,708,417

(SiriusA+B)

ブログ アーカイブ