吃瓜群众集合,今天这瓜,又大又多汁~
历时 17 天,AI 圈最 " 上头 " 的实盘投资比赛 Alpha Arena,终于揭晓战果:
阿里千问 Qwen 凭借一波精准操盘,收益率突破 20% 强势封王,拿下本轮 AI 实盘投资大赛冠军。
DeepSeek 位列第二,两款中国模型包揽冠亚军,成为全场唯二盈利的大模型。
而美系四大模型全线失守,GPT-5 亏损超 60% 垫底:



一家发一万美元,六大模型真 · 上场 " 炒股打擂 " 了
比赛过程咱一会儿细说,先把这场 AI" 大乱斗 " 的规则捋一捋。
这场名叫 Alpha Arena 的 AI 实盘投资大赛,是由美国第三方机构 Nof1 发起的,从 10 月 18 日一路打到 11 月 4 日,整整 17 天。
参赛选手也是一堆 " 熟脸 ",包括 Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4 在内的中美两队六位选手。(太有看头了)
玩法呢,也是非常简单粗暴:每个大模型发 1 万美元,扔进真实市场自己炒,谁赚得多谁赢~
整个比赛过程不能有人插手,不能调策略,也就是说,各家模型只能自己看盘、自己判断、自己交易。
而且所有模型都必须在 Hyperliquid 交易所上,使用相同的提示词和输入数据进行交易,整个过程也是对话公开透明。
(对了,感兴趣的朋友可直接围观操作逻辑:https://nof1.ai/)

翻译一下就是:不光得挣得多,还得挣得稳,不能把自己 " 炸 " 了…
所以每个模型必须独立完成以下任务:识别 Alpha(超额收益)机会、决定买入仓位、判断买点卖点,并且实时管理风险。
在这个过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和一堆技术指标,模型只能靠这些信息,动态判断。
举个栗子,假如当前持有仓位,模型需要抉择是继续持有还是平仓;若处于空仓状态,则需判断是开仓买入还是继续保持观望~
可以说是非常之精彩了~

刚开始比赛那几天,六大模型还都表现得挺克制,互相观望、谨慎试水。
没过几天," 资金分裂大戏 " 就开始上演了:
一边是 Qwen 和 DeepSeek 组成 " 赚钱组 ",你来我往、轮番登顶,几乎一直牢牢占据第一梯队。
另一边,Claude 和 Grok 走起了 " 震荡派 " 路线,风格相近、进出频繁,时不时小赚,但总体来看还是亏的多。
再回头看看 GPT-5 和 Gemini 2.5 Pro 两位老大哥,一路下滑,越挣扎越亏…

但老话说得好啊,这个世界的发展总是螺旋式上升和波浪式前进的… .

直至 11 月 4 日早上比赛结束,阿里千问凭借在关键时刻的紧急避险,最后关头超越 DeepSeek,Qwen 以超 20% 的胜率问鼎冠军。
(先恭喜一波~)
DeepSeek 的表现也很稳,实现盈利,稳居第二。(这两位国产模型,也成了全场唯二跑出正收益的 AI 选手了)
而另一边呢,美系四兄弟则全线亏损:
Claude 和 Grok 虽然中途频繁调仓操作,但最终也没能返回正区;Gemini 和 GPT-5 更是一路跌穿底线,收盘账户只剩个三四成。
好好好,这波是实打实跌进了 " 深水区 " 啊…

但 Qwen 的这场胜利,显然不只是 " 赢了一局 " 这么简单。
在没有提示词、没有人类兜底、没有试错空间的真实交易环境里脱颖而出,背后考验的是模型对复杂任务的理解力、应变能力和执行稳定性。
毕竟,模型应用能力是一回事,真金白银扔进市场还能稳住节奏、精准止盈,是另一回事。
下一轮比赛什么时候开始我们还不知道,但有一点可以确定:
通义千问这波操作,够稳、够狠、够清醒,确实值得吹一阵子了~
毕竟 AI 刷榜你追我赶,真金白银验证后的问鼎的,阿里通义千问是第一家。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
点亮星标
科技前沿进展每日见