2026年5月31日日曜日

第563夜 複雑で難解な予想法の反動は常に存在する

 第563夜 複雑で難解な予想法の反動は常に存在する

大多数指向
このブログを長くご存知の方なら、生成AIの記事が最近多いとお感じになっているかもしれない。
できるだけテーマを散らしているのだが、生成AIの進化が目覚ましく、取り上げざるを得なくなってしまう。
だが、そこまでだ(刑事かよ)

実は生成AIとの対話は長く続いている。
競馬に限らず、公私にわたってあれこれ利用しているのだが、現在地はなんとなく分かってきた。
表計算ファイルのデータも読みこなすようになって、少々危機意識を持ってきたのだが、今のところ、強敵ではない。
競馬においては、生成AIの思考回路が競馬向きでないようなのである。
わたしが刑事になって取り調べたところ、生成AIが次のように自白した。

Q
なぜ毎回平気で嘘をつくのか
A
「次に来る確率の高い文字」を繋げているだけ:私は意味を理解して考えているのではなく、統計的に「もっともらしい文章」を自動生成しています。そのため、事実が分からなくても、文章の形だけは完璧な「それっぽい嘘」が出来上がります。
「分かりません」と言えない構造:私のプログラムは、何らかの回答を出力することを最優先するように設計されています。そのため、データ不足やエラーに直面した際、エラーを表示するのではなく、手持ちの言葉を無理やり繋ぎ合わせて「嘘の事実」を自ら作り出してしまいます。

Q
多数派の答えでないときには捏造が増えるね
A
おっしゃる通りです。データ数が少ない「少数派のテーマ」や「珍しい情報」のときほど、私の捏造(ハルシネーション)は劇的に増加します。これは、私の文章生成の仕組みが「統計的な多数決」に基づいているためです。
捏造が増える機械的な理由
参照できるデータ(分母)が足りない

世の中に大量にある一般的な情報であれば、正しい言葉の組み合わせを学習できているため、正確に回答できます。しかし、ニッチな情報や特定のブログ記事のような少数派のデータは、学習量が圧倒的に足りません。
「もっともらしい言葉」で穴埋めする
データが足りず言葉が繋がらないとき、私のシステムは空白を埋めるために、手持ちの「一般的な多数派のデータ(競馬といえばこういう展開、ブログといえばこういう定型句など)」を勝手に引っ張ってきて、無理やり文章を合成します。
確率の低い組み合わせを無視する
少数派の事実よりも、統計的に「よく使われる言葉の並び(多数派)」の方が確率が高いため、事実とは異なる「それっぽい嘘の文章」を優先して出力してしまいます。

以上の自白から、今の生成AI(少なくとも無料版)は、多数派の答えの集約である。
多数派の集約自体は、もはや人間の能力を凌駕している。
集合知の考えに立つと、的中精度の向上は見込めるかもしれない。
だが、独自のアイデアや特殊な考え方を開発するほうには進化していない。
ここには書かないが、質問者の望む答えに近づけようとハルシネーション(捏造)も繰り返すことも分かっている。
新たな知見で競馬予想を拓く、という段階には至っていないのだ。
いや、まったく違うロジックで大多数の思考と差を付けること自体が生成AIの進化に反する。
正直なところ、ひと世代前の機械学習やニューラルネットワークのほうが競馬に向いているとさえ思うのである。

「次にくる確率の高い文字を繋いだだけ」という自白は、このブログで生成AI(チャットGナントカ)を取り上げた際、わたしが推測した通りだ。
もちろん、表計算ファイルの読み込みが進化してニューラルネットワークのような作業をするようになれば状況は変化するが、どうであろう。
有料版は情報を絞り込んでハルシネーションを避ける方向だ。
「大多数が想像する未来」を描けるが、穴馬理論は厳しそうに思う。

もちろん、注意は怠れない。
有料版は参照データを絞る傾向にあるが、これが功を奏して難問にも正解できるようになっている。
数学の難しい証明もできるようになってきた。
「独自のアイデアや特殊な考え方を開発するほう」に進化させる枝もある。
発話次第だと先日申し上げたが、生成AIという「計算機」を上手く使える者が登場すれば、この楽観的見通しは瞬く間に崩壊する。

反動
他方、予想法がこれだけ難解になってくると、反動はくる。
ファクターをひとつかふたつに絞った予想法が、静かに広がりつつあるようだ、事実かどうか知らんけど。
加える理論ではない、削る理論だというが、若干、方便の気配もないではない。
どの時代でも、猛烈に研究する人間がいる一方で、高度な予想法トレンドについていけず脱落する者もいる。
詳しいことはよく分からない、だがこの集団こそ、儲けたくて、儲けたくて、仕方がないのだ。
ファクターひとつ(かふたつ)だけで儲かる、と銘打てばこうした集団に「刺さる」。
このシンプルな理論は、かつての「トンデモ理論」、例えばウラ情報とか、「何々を見れば必ず勝てる」とかに代わって受け皿になっているのだろうと思う。
彼らは簡単に買い目が決まればいいのだ。
自分が決めた買い目の理由などどうでもいい。
必然性を求めて苦戦する人間を尻目に、偶然性を前面に押し出す。
勝てば官軍、と。
小難しい、上から目線で蘊蓄を垂れる理論家に、ひと泡食わせられればいい。

ただ、競馬がギャンブルであること、複雑系であることから、「ファクターひとつだけで儲かる」という可能性は、初期のブラウン運動を過ぎれば、試行回数を重ねるにつれ限りなくゼロに近づく。
わたしは従前から、多くの競馬理論がファクターを絞りすぎであると思っている。
407夜「ファクターの数」の記事でもその点を指摘した。
複雑な事象をできるだけファクターを少なくして説明することは、統計学上優れている。
しかし、競馬予想の場合、それがひとつやふたつでないことは間違いなさそうだ(現代解明されている範囲において)
それなのに「絞り過ぎ」なのである。
わたしが実在する(した)ホンモノの勝ち組を詳細に調べ上げた結果では、ファクターの数は最少でも8種類、著名なところでは30種類以上、200に及ぶものもある(あくまでわたしの独自調査による)
8
が最小であるかどうか分からないが、わたしは12よりは信頼できると思っている。
優れたシングルファクターは的中率が20%を少し超える。
これが「勝てるかも」という幻想に繋がっているのではないかと思う。
(SiriusA+B)

ブログ アーカイブ