记者 | 温梦华
编辑 | 何小桃 张益铭 易启江 校对 | 金冥羽
还有几个小时,2026 年美加墨世界杯即将打响(北京时间 6 月 12 日凌晨)。而赛场外的 AI(人工智能)赛事研判、实力比拼,早已先行开启。
6 月 8 日,国产大模型 Kimi 称将通过 Agent(智能体)集群同时调度 300 个子 Agent,公开预测 104 场世界杯赛事,并提出德国队或爆冷夺冠。Kimi 同时上线了一场 " 押注 " 活动:1 万亿 Token(词元)奖池,用户选队、球队赢了就可以瓜分 Token,将体育赛事与 AI 用户运营深度绑定。
《每日经济新闻》记者(以下简称每经记者)注意到,千问也紧随其后上线了相关活动。每经记者实测发现,豆包、元宝、DeepSeek、文心一言等国产大模型在被问及 "2026 年世界杯谁会夺冠 " 时,多数预测答案为 " 西班牙队 ",判断逻辑也高度趋同。
热闹之下,Kelly Bench 最新数据却显示,包括 GPT 等在内的顶级模型在足球赌盘上表现惨淡。
既然 AI 赌不赢,Kimi、千问等 AI 大模型为何还要押注世界杯?这背后,实际上是 AI 大模型行业的集体焦虑:当写诗、做题、对话的 " 内卷 " 走到尽头,各家厂商急于证明自己能够理解复杂、动态、充满不确定性的现实世界。
" 万亿 Token 狂欢 ":世界杯成 AI" 用户拉新战场 "
面对世界杯的巨大流量,一众品牌早已摩拳擦掌,这一次下场 " 押注 " 除了传统赞助商,还有手握万亿 Token 的 AI 大模型们。
6 月 8 日,Kimi 发文称,将通过 Agent 集群同时调度 300 个子 Agent,公开预测 104 场世界杯赛事,并在每轮赛前公开预测、赛后复盘。
Kimi 的预测策略并没有完全随大流。它并未否认当前多数主流模型将西班牙队和法国队列为夺冠最大热门,同样认为两者的夺冠概率位居前列,但它提出了另一个关注点:德国队的夺冠概率可能被市场低估。

当网友们热议 "AI 预测究竟准不准 ""AI 懂不懂球 " 时,Kimi 在文章开头就坦承 " 我们的预测很可能是错的 ",并称希望通过这次尝试,把分析过程、预测结果和赛后复盘放在同一个透明框架中。
此外,Kimi 还拿出 1 万亿 Token 奖池,用户预测冠军队、pick(挑选)的球队每次获胜就可以参与瓜分 Token。截至 6 月 11 日 18 时,Kimi App 显示,实时排行的队伍支持率 TOP5 分别为阿根廷、法国、西班牙、巴西、葡萄牙,有 43.33% 的参与用户选择了阿根廷。

那么,Kimi 押注世界杯并豪掷万亿 Token,究竟是能力展示,还是一次品牌营销?
长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆告诉每经记者,Kimi 此次活动类似于春晚抢红包、集福瓜分奖金等互联网平台常用打法,更像一种营销活动。
" 每一届世界杯都是巨大的流量池,各个企业都希望有机会参与,获得更多曝光、引流机会。而大模型天然适合做这类数据分析和预测。" 张庆向每经记者指出,当下,大模型竞争激烈,尤其是用户注意力和使用频次的竞争,通过世界杯一方面会加持品牌声量,另一方面也有利于提升大模型的数据用户积累和活跃度。
深耕人工智能产业多年的技术专家王岩(化名)在接受每经记者采访时坦言,大模型预测世界杯冠军,是体育热点、Token 补贴和 Agent 展示叠加形成的传播事件。
王岩认为,热点借势只是入口,真正竞争点在于谁能把抽象模型能力转化为用户可感知结果。这意味着,AI 大模型企业在品牌传播上,不再只发布参数、榜单和技术报告,转为借高关注赛事制造用户体验入口;而在商业竞争上各家模型争夺的则是用户心智、使用频次、社交传播和开发者注意力。
截至目前,多少用户参与了 Kimi" 押注 " 世界杯的活动?通过用 Agent 集群预测世界杯冠军,Kimi 又将获得哪些方面的能力提升?Kimi(月之暗面)方面向每经记者表示:" 暂无回应 "。
多款国产大模型预测西班牙队
精准共识还是算法趋同?
不只 Kimi,其他 AI 大模型玩家也试图 " 分一杯世界杯的羹 "。例如,千问也推出 " 决战美加墨,与千问一起预测,赢万元现金 " 的活动,加入这场 AI" 秀肌肉 " 争夺战。

" 我前两天也用 DeepSeek、豆包预测了 2026 年世界杯冠军,想对比它们谁分析的有道理,但我看到它们给出的预测和相关理由都有明显局限性。" 张庆向每经记者分享道。
在国产大模型眼中,谁是 "2026 年世界杯冠军队伍 "?每经记者实测 DeepSeek、Kimi、豆包、元宝、千问、文心一言、智谱清言发现:DeepSeek 押宝法国队,Kimi 看好阿根廷队,而千问、豆包、元宝、文心一言、智谱清言 5 款国产大模型则均预测支持西班牙队。
每款 AI 大模型给出的 " 夺冠队伍 " 理由分析略有不同。值得注意的是,投票西班牙队的 AI 大模型们,其判断逻辑高度趋同,核心理由之一均为 " 权威数据模型、机构高度一致看好 "。

大模型的预测到底准不准?
能否获得球迷的青睐?
上海财经大学特聘教授胡延平向每经记者表示,AI 大模型已经初步展露出基于全局动态信息和深度复杂推理的特定预测能力,使得各家大模型有基础、有信心来进行预测,但足球是圆的,预测的成功率、精准度方面还有待观察。
" 世界杯预测无疑是展示模型与智能体水准的一个上佳机会窗口,不过预测的效果也是一把双刃剑。个人预期这届世界杯,水准最高的预测模型,成功率能达到 60%~80% 左右。" 胡延平坦言。
不过,Kelly Bench 在 2023 — 2024 赛季英格兰超级联赛的模拟中显示,其评估的每个前沿模型在整个赛季都亏损了,并且许多都经历了破产。其中,Claude Opus 4.7 目前以 -3.7% 的平均投资回报率领先;有 4 个模型避免了所有的破产。

"AI 更多是一个辅助工具,基于战队历史战绩、世界杯排名、赔率、国际足联等大量数据的多维度预测,AI 大模型呈现了客观数据统计,所以作为参考工具还是有意义的,但不会完全依赖它的结果。" 一位长期关注世界杯的资深球迷告诉每经记者。
在上述球迷看来,相比大模型的预测,每个球迷都更青睐自己喜欢的球队,喜好也会占一大部分判断,而且越到决赛越是球员临场发挥和心理上的博弈,不确定性太多了。
不再比谁更会 " 聊 "
押注世界杯背后 AI 们集体想拼什么?
当 Kimi 拿出万亿 Token、调动 300 个子 Agent 对世界杯赛事进行并行预测,当千问、豆包、元宝争先恐后地给出各自的夺冠热门队伍时,这场看似娱乐化的 "AI 押注战 " 背后,AI 大模型厂商究竟想 " 秀 " 什么?又在集体 " 卷 " 什么?
" 本轮大模型预测世界杯冠军,是生成式 AI 从问答工具走向公共事件运营的典型样本。" 王岩向每经记者指出,公众看到的是冠军预测,企业展示的则是 Agent 协同、长上下文处理、实时检索、概率解释和高并发服务能力,商业上争夺的则是用户时长、付费转化和资本叙事。

当下,AI 大模型的竞争早已不局限于单纯的参数榜单,而是从 " 会聊天 " 转向 " 能办事 ",从 " 比模型 " 转向 " 比场景 "。然而,《Build for the Future 2025》全球研究显示,在调研全球 1250 多家企业后,仅 5% 的公司实现了 AI 价值的规模化应用。Gartner 数据也显示,截至 2025 年底,嵌入真正 AI Agent 的企业应用占比不足 5%。
胡延平观察到,大模型和智能体正从对话走向任务,从预训练走向持续学习,从数据语料走向持续多维的现实感知。" 预测世界杯这类探索项目会加速这个进化过程。未来行动智能体所需要的能力体系,也是在走向‘感知-交互-决策-协同’这个方向。"
不过,王岩坦言,世界杯预测可以成为 Agent 能力的公开压力测试,但不能自动证明 Agent 能力提升,大模型在这场押注中训练和检验的是长任务组织、概率校准和用户交互能力。
"Kimi 的 300 个 Agent 代表分析覆盖面增加,不直接代表预测准确率提升。相关 Agent 任务 Token 消耗研究显示,同一任务的 Token 消耗可相差几十倍,更多 Token 并不必然带来更高准确率。同样,相关 Prediction Arena 研究也显示,多个前沿模型在 Kalshi 真实预测市场 57 天交易测试中最终收益为 -16.0% 至 -30.8%,研究量与结果没有相关性。" 王岩向每经记者进一步分析道。
正如王岩所言:" 当前 Agent 的最大缺口,正在从‘能否给出合理计划’转向‘能否稳定完成长周期真实任务’。" 这意味着,谁能率先落地 " 实战能力 ",谁就将有机会在愈发激烈的争夺赛中脱颖而出。
(免责声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。)
|每日经济新闻 nbdnews 原创文章|
未经许可禁止转载、摘编、复制及镜像等使用
每日经济新闻