前沿科技,数智经济
这个十一黄金周,AI 圈真的很热闹。
10 月 1 日凌晨,OpenAI 深夜炸场,正式官宣新一代 AI 视频模型 Sora 2,并直接上线了一个 AI 版的 " 抖音 " ——一个完全由 AI 来生成视频的短视频平台。
就在 Sora 2 发布之前,这一轮的大模型发布其实已经卷起来了。
黄金周前夕,先是国内大模型公司深度求索宣布推出 DeepSeek-V3.2-Exp 实验版模型,紧随其后智谱 AI 正式发布新一代大模型 GLM-4.6。
中国大模型也引起了图灵奖得主杨立昆的关注。就在 9 月 30 日,蚂蚁集团旗下百灵大模型宣布开源其思考模型 Ring-1T 的预览版 Ring-1T-preview,参数量达 1000B(1 万亿)。" 令人印象深刻,祝贺你们的团队。" 在百灵最新思考大模型发布后,杨立昆在社交平台上也给中国大模型点了赞。
显然,全球大模型进入了一个新的井喷期,各家在大模型产品和技术迭代上,都在明显加速。据不完全统计,仅 9 月全球就有 15 家主流企业 / 机构发布了开源大模型,数量较 8 月激增 70%。
开源大模型的热潮,也是开发者的盛宴。有开发者都在社交媒体上感慨:一天测了 3 个模型,还有一个没测试,这还只是周一 ......
据光锥智能观察来看,这一波 AI 大模型的更新,更聚焦在细分场景中,比如智谱最新大模型在编程方面的能力更加突出,蚂蚁的百灵大模型则聚焦在自然语言推理领域。
更为重要的一点在于,当 OpenAI 开始学字节跳动做产品时,大模型市场的游戏规则变了。如果说,2023 年讨论大模型参数天花板,那么,2025 年,大模型真正的战场则在场景适配与效率革命。
从 OpenAI 的 Sora 2 到蚂蚁的万亿推理模型,新一轮的大模型 " 军备竞赛 " 已然打响,而行业共识则愈发清晰:大模型已从 " 通用能力比拼 " 迈入 " 细分技术突围 " 的深水区。
那么,在这新一轮 AI 大模型竞赛中,后来者又该如何在开源生态中突围?
深度盘点 9 月大模型
AI 大模型 " 百花齐放 "
金九银十的月份,各行各业都在持续加码,大模型赛道也同样 " 卷 " 的不行。
据不完全统计,在刚刚过去的 9 月,全球数十家企业共计发布了 40 多款大模型产品,涵盖基础通用大模型、深度思考推理大模型、编程、具身智能、翻译、视频生成等不同细分赛道。
具体来看,这些模型有的侧重高效推理,如带 "Flash" 字样的蚂蚁集团 inclusionAI 的 Ring-flash-linear-2.0、美团 LongCat Flash Chat;有的则聚焦多模态能力,如阿里通义 Qwen3-VL;也有的针对轻量化 / 移动端,如 Meta AI 发布的 MobileLLM-R1-950M、蚂蚁 Ling-mini-2.0、Ring-mini-2.0 等。
可以很明显看到,9 月份 AI 大模型 " 通用能力、专用场景、部署形态 " 等维度的全面发展,不同厂商、不同技术路线的大模型 " 百花齐放 ",构成了丰富的 LLM 生态。
在这其中,中国大模型产品占据半壁江山,并与海外市场的大模型产品形成了技术分化。
具体来看,相比较此前各家关注的参数规模竞赛,现已经让位于效率革命,MoE(混合专家模型)架构成为绝对主流。
如蚂蚁百灵大模型最新开源的 Ring-1T-preview,其底座 Ring-1T 是一个拥有万亿参数的深度思考模型,该开源模型延续 Ling 2.0 高效 MoE 架构,在 20T 高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研高效强化学习系统 ASystem(其中 AReaL 框架已开源)上进行针对推理能力的 RLVR 训练。
有苹果工程师在单个 M3 Ultra 芯片上运行 Ring-1T-preview,量化的效果接近 GPT-5,还能直接生成《太空侵略者》小游戏。
这种 " 大参数储备 + 小参数激活 " 的范式,解决了 " 性能与成本 " 的核心矛盾,使超大规模模型从实验室走向具体行业场景。
从对开发者开放角度来看,海外阵营中,谷歌 EmbeddingGemma 主打端侧隐私嵌入,Anthropic 开放 Claude Code API,仍停留在工具型开源。
但相比较来说,中国大模型产品更注重场景化能力,比如蚂蚁专攻自然语言推理,腾讯突破小语种翻译,形成 " 场景驱动型开源 "。
这种差异在落地效果上立竿见影。如快手将 Keye-VL 1.5 嵌入审核系统,违规识别准确率达 98.7%;爱诗科技的 AI 插画模型对接电商平台,把详情页制作成本降低 80%。
事实上,中国大模型产品已经在各个细分领域全面开花,比如语音交互中,阶跃星辰 Step-Audio 2 mini 支持语音直接调用工具,某智能音箱厂商反馈 " 唤醒准确率提升至 99.2%";蚂蚁健康管家 AQ 产品识别报告、药盒、皮肤病等医疗图像准确率达 90% 以上,包括对 100 多种复杂多页检查报告的识别与解读。
在翻译领域,腾讯 Hunyuan-MT-7B 在 30 个语种翻译中夺冠,跨境电商卖家实测 " 小语种转化率提升 27%";同时,3D 生成赛道中,腾讯混元 Voyager 可实现原生 3D 重建,游戏公司开发者称 " 场景制作周期从 1 周缩至 4 小时 "。
另外,值得关注的一点是,相比于大模型创业公司的单点输出,聚焦某一个细分行业,中国互联网大厂们正逐渐形成体系化的产品更新,覆盖基础通用大模型、深度思考大模型、编程大模型、多模态大模型、视频生成大模型等多品类大模型产品,典型的产品就是阿里巴巴旗下的通义千问、腾讯的混元大模型、字节跳动的豆包大模型等。
而这种生态优势,也正在转化为全球影响力。据 Hugging Face 最新数据显示,中文开源模型的 fork 量在 9 月增长 180%。9 月 Hugging Face 榜单显示,阿里通义 7 款模型占据全球前十开源模型席位,Qwen3-Omni 登顶榜首,标志着中国从 " 开源参与者 " 升级为 " 生态定义者 "。
而中国大模型的 " 技术普惠 + 商业赋能 " 的开源模式,正在重塑全球 AI 产业格局。
"2023 年我们追着 OpenAI 跑,2025 年在金融推理、中文语音等领域,国外团队开始抄我们的作业。"一位深耕 AI 的连续创业者的调侃,道出了中国开源的新底气。
模型开源竞争激烈
新来者蓄势待发
为什么中国大模型能够如此快速实现赶超?
这背后离不开开源战略的选择。据《全球大模型开源生态报告》显示,中美开发者贡献占比超四成,尤其是中国厂商非常注重以 " 开放策略 " 抢占生态主动权。而就在今年初,始终坚持闭源路线的 OpenAI 也开始走开源路线。
相比较来说,中国最早且始终坚持走开源路线的阿里通义千问,已经在开源生态中占据了领导地位。那么,后来者还有机会吗?
9 月,蚂蚁集团旗下百灵大模型以平均每 4 天一款的速度,密集发布了 7 款大模型:
5 日推出 " 端侧双雄 "Ling-mini-2.0 与 Ring-mini-2.0;12 日上线 MoE 架构的 Ling-flash-2.0,19 日上线 Ring-flash-2.0;26 日推出 2 款混合架构推理优化模型 Ring-flash-linear-2.0 与 Ring-mini-linear-2.0;30 日以万亿参数的 Ring-1T-preview 压轴。
模型刚发布完,Ring-1T-preview 就登上了开源社区 Hugging Face 模型趋势榜第三,第四名也是蚂蚁 inclusionAI 社区的 Ring-flash-linear-2.0。
从阿里、智谱、蚂蚁等身上也能看到,中国的开源大模型尤其擅长 " 组合拳 " —— " 全类型覆盖、全尺寸适配、全链条开源 "。
这种模型版图早已突破语言模型的单一维度,构建起 " 基础通用 + 垂直专业 " 的完整矩阵:
以蚂蚁为例,在语言和推理上,Ling 系列作为基座模型,通 MoE 架构优化实现 " 思考效率跃升 "。最新 Ling-flash-2.0 在 AIME 数学竞赛、CodeForces 编程任务中超越 GPT-OSS-120B 等大模型,尤其在前端研发场景,经 WeaveFox 团队联合优化后,能同时满足 UI 布局功能性与美学需求。而 Ring-1T-preview 更将推理精度推至新高度,92.6 分的 AIME 成绩仅比 GPT-5 低 2 分。
多模态深度融合能力上,Ming-lite-omni 系列实现 " 能看、能听、能说、能画 " 的全感官交互,发布一周内就被社区贡献出消费级显卡可运行的量化版本,其 1.5 版一度登顶 Hugging Face 趋势榜榜首。其创新的视觉增强奖励(VAR)机制,解决前端开发中 " 功能与美学脱节 " 的行业痛点。
显然,这种布局跳出了 " 为技术而技术 " 的陷阱,每个模型都锚定明确的产业价值。
另外,在参数膨胀与落地难的矛盾中,蚂蚁走出了一条 " 全尺寸弹性适配 " 的差异化路径,实现从消费级设备到云端算力的无缝覆盖。
如 Ling-mini-2.0 以 1B 以下激活参数实现苹果设备本地运行,响应速度较同类模型提升 2 倍,可解决隐私敏感场景下的 " 云端依赖症 "。开发者可直接部署轻量化问答、本地翻译等应用。
其 Ling-flash-2.0 仅激活 6.1B 参数,却能达到 40B Dense 模型的效果,在 H20 平台实现 200+tokens/s 的生成速度,部署成本降低 60% 以上。这种 " 以小博大 " 的能力,让中小企业无需重金算力即可享受大模型红利。
而 Ming-lite-omni 1.5 在保持文本、图像、语音融合能力的同时,通过 INT8 量化技术适配消费级显卡,成为短视频创作、智能硬件交互等场景的首选开源方案。
更为重要的是,其 Ring-1T-preview 的开源打破了万亿参数模型的闭源现状,其基于 Ling-2.0 MoE 架构和 20T 语料训练的技术底座,让全球开发者首次能接触到顶尖推理能力的模型权重。
从 " 口袋里的 AI" 到 " 云端超脑 ",蚂蚁用四级尺寸矩阵,覆盖了从个人开发者到企业级用户的全场景需求,这正是其开源生态快速起量的关键。
蚂蚁在大模型赛道异军突起并非偶然,一方面其能够快速把握行业发展趋势,让大模型的迭代不再陷入参数竞赛,而是敢于攻克 " 难而正确的事 "。
深扒蚂蚁发起的 inclusionAI 社区就会发现,他们毫不吝啬的分享了很多在 AI 技术上的关键技术思考和进展。比如,蚂蚁发现了 " 编辑式图像分割 " 这个技术,对于多模态模型的生成和理解的统一有着非常好的作用,堪比关键的 " 催化剂 ",立马就发文分享给所有开发者。
另一方面,当前大模型开源已经进入全栈竞争时代,单纯开放模型权重已无法形成壁垒,蚂蚁通过 ATorch 框架、数据标准、强化学习工具的协同开源,构建了 " 接入 - 训练 - 部署 " 的闭环生态,这有可能成为未来开源竞争的核心护城河。
中国厂商的全维度开源,正吸引全球开发者向中文生态聚集。开源模式将加速模型的迭代,中国大模型产业或将走出一条 " 生态换市场、开放换速度 " 的崛起之路。
场景里的 AGI,中国走在前面
闭源模型更多承担 " 技术标杆 " 角色,但开源模型已成为产业落地的核心载体。
中国大模型生态正凭借对产业的深度理解和扎根具体场景化的能力,正走在全球 AI 产业的前列。
在这个 AI 黄金周,我们看到的不仅是技术突破,更是一种全新的发展逻辑:不追求 " 全能冠军 ",而是争当 " 单项尖兵 ";不止步于模型开源,更聚焦于生态落地。
当全球都在学习 " 场景化思维 ",中国团队早已手握先发优势。
这或许就是国产大模型 " 不止半壁江山 " 的真正密码:AGI 从不是遥不可及的神话,而是在企业 AI 数字员工扎根业务场景,AI 智能客服更具备个性化能力,借助 AI 人人都可以进行编程等场景中,被无数个具体的技术突破汇聚而成的浪潮。
而这股浪潮,正从中国驶向全球。
光锥智能"AI 交流群 "已建立,
感兴趣的朋友可以添加小助手微信(GZZN2019)沟通进群。
联系我们
王一粟
创始人 / 主编
ID:cishicike000
※添加时请备注公司 + 姓名 + 来意