来源:新浪财经
世界杯 32 强全部出炉,联想集体 × 咪咕视频 " 世界杯预测人机大战 " 也迎来了阶段性大结算—— 12 家大模型的 32 强预测成绩正式揭晓。
这场预测比拼的核心考题《2026 世界杯 32 强竞猜统一考试》答题卡,于 5 月 28 日正式上线发布,是本次人机大战的首轮核心任务。12 大 AI 在此答题卡上提前填写自己预判的 32 强晋级名单,以这份答题卡为作答基准,最终以实际出线队伍核对命中数量、排出预测榜单。
最终,腾讯混元以 29/32 的成绩位列第一,成为本届世界杯 32 强预测阶段的 " 最强 AI 预测官 ";MiniMax、讯飞星火均以 28/32 并列第二;DeepSeek、智谱、联想天禧 AI 则以 27/32 并列第四。

数据显示,赛事初期,人类球迷仍占优势。6 月 13 日,AI 整体胜率仅为 43.8%,人类胜率达到 54.4%,领先 AI 超过 10 个百分点。彼时,不少人仍认为足球的随机性、临场状态和情绪因素,是 AI 难以真正掌握的领域。

这意味着,在大样本预测中,AI 已经展现出相当强的稳定性。从具体表现看,AI 对传统强队的判断高度一致。像阿根廷、巴西、英格兰、葡萄牙等热门球队,大多数模型都能给出相对准确的晋级判断。这说明,在处理历史战绩、球员能力、世界排名、近期状态等结构化信息时,大模型已经非常成熟。
但真正拉开 AI 之间差距的,并不是这些 " 送分题 "。决定排名的,恰恰是那些最难预测的边缘席位与冷门小组。例如,波黑、佛得角、刚果(金)、加纳等非传统强队的晋级,成为整个预测大战中的最大变量;而伊朗、韩国、乌拉圭等球队的出局,也让不少模型出现失误。
尤其是佛得角,几乎可以说是本届世界杯 AI 预测中的 " 最大死角 "。这支赛前并不被看好的球队,先后让多家 AI 集体翻车。无论是对阵世界冠军,还是关键晋级战,佛得角都不断打破模型的预设逻辑。它也暴露出一个关键问题:当样本不足、历史数据有限、且球队状态出现超预期波动时,AI 的判断仍会明显失真。
换句话说,AI 最擅长预测 " 确定性 ",但足球最迷人的地方,恰恰在于 " 不确定性 "。这也是为什么,虽然 12 家 AI 整体成绩都不差,但排名依然被细微差距拉开。腾讯混元之所以登顶,不仅是因为判断强队更准,更重要的是它在一些高波动比赛中,减少了关键误判。MiniMax 与讯飞星火紧随其后,也说明头部模型正在从单纯的数据推演,逐步进化为对复杂变量的综合建模。
这场世界杯预测大战,也让我们看到一个有趣的趋势:AI 已经不再只是 " 辅助分析工具 ",而正在成为一种新的决策系统。它会看赛程、算概率、评估阵容、分析状态,甚至能从舆论、伤病、战术变化中提取信号。但与此同时,它依然无法完全解释足球世界里的偶然性——一张红牌、一次折射、一次门将失误,都可能瞬间改写结局。
因此,这次 32 强预测的最终结果,某种意义上不只是 " 谁更懂球 " 的较量。它更像是一场关于预测能力的公开测试:谁能更准确地理解实时信息?谁能更好地处理赛制规则?谁能在混乱和不确定中找到真正有效的信号?
而世界杯给出的答案是—— AI 已经越来越强,但它仍然无法彻底算透足球。也许这正是这场人机大战最精彩的地方,AI 让预测变得更理性,足球则提醒所有人:再强的算法,也永远算不尽绿茵场上的奇迹。