本文来源:时代财经
10 月 14 日,蚂蚁集团正式推出万亿参数思考模型 Ring-1T,并全面开源模型权重、训练配方。据悉,Ring-1T 在 " 人类偏好对齐 " 测试 Arena-Hard V2 中,以 81.59 的成功率居于开源模型榜首,逼近 GPT-5-Thinking ( High ) 82.91 的成绩。Ring-1T 在 9 月 30 日开源的预览版 Ring-1T-preview 基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。(时代财经 张照)