支付宝双飞轮、AI First 和加速全球化是蚂蚁集团的三大战略。事实上,蚂蚁和其他互联网公司一样,近两年一直在 AI 领域进行投入。去年蚂蚁 20 周年时候,蚂蚁集团董事长井贤栋宣布,未来 20 年,蚂蚁要做一家科技驱动、创新驱动的公司。
其中,在 AI First 战略下,蚂蚁推出了金融、医疗、生活服务三款 AI 应用,蚂蚁内部业务也做了很多变革,支付宝、蚂蚁国际等核心业务加速 AI 化,蚂蚁内部也成立了通用人工智能(AGI)部门,开源 2900 亿参数规模的百灵大模型,引发关注。
韩歆毅在 27 日下午的内部技术日活动上首次详解蚂蚁 AI 战略。
他用时三十多分钟,全面清晰谈未来蚂蚁的 AI 战略布局。在韩歆毅看来,中国 AI 大模型赛道竞争激烈,蚂蚁将聚焦 AI 应用侧,利用 AI 基座大模型技术做更强的技术服务能力。
" 今天,我们永远是在 AI 技术突破的边界上做一款 PMF 产品,如果技术路线不收敛,产品很难突破;技术路线收敛了,我们就敢于往里去投、去砸。大家说你聚焦 AI 应用,还要不要做基础大模型,年初讨论的时候我们答案非常坚决,一定要,因为如果基于 AI 做服务和应用,就像训练一个人去做所有的事,追求智能上限,会让这个人更加聪明,能够做更多、更好的服务。我们很坚定去探索 AGI、探索智能上限。" 韩歆毅称,未来,AI 时代将会重新定义一切。
即将开源两款:比肩 DeepSeek-V3 模型和百亿多模态模型
对于 AI 大模型领域来说,蚂蚁最重磅的消息无疑是今年 3 月百灵大模型团队(Ling Team)发布的两款 MoE 开源大模型论文。
今年 3 月,蚂蚁百灵大模型团队开源 2 个 MoE 架构的大语言模型 Ling-lite(0220 版本)和 Ling-plus。
其中,Ling-lite 参数规模 168 亿(激活参数 27.5 亿),Ling-plus 基座模型参数规模高达 2900 亿(激活参数 288 亿),并且在多个算力平台(包括非 Hopper 架构的国产算力)进行训练,预训练阶段将计算成本降低约 20%,每 1 万亿 token 成本达 508 万元,最终实现行业头部模型水平的性能表现,并验证了 300B 尺寸的 SOTA MoE 大语言模型在非高端算力平台上训练的可行性。
同时,蚂蚁强化学习 AReaL 团队还开源了 AReaL-boba,可用 128 张 H800 GPU 在 1 天训练完成 SOTA 1.5B 推理模型训练,256 张 H800 GPU 2 天内完成 SOTA 7B 推理模型训练。
过去几个月,蚂蚁百灵大模型团队进行了迭代,Ling-lite 升级到了 1.5 版本,相比上一代新模型的推理能力有了显著提升,同尺寸 MoE SOTA,仅用 2.75B 激活计算可对标 10B 内 SOTA dense 模型。Ling-lite-1.5 采用分层语料预训练策略和需求驱动的执行优化体系,以更少的语料和更高的质量,性能超过同尺寸下 SOTA 模型,大幅提升数学、代码等推理能力。
具体来说,这是一款以统一架构集成多模态理解、生成和编辑能力的模型,支持将理解和生成模型合在一起调用,也可以单独完成理解和生成任务,带来原生全模态交互体验。
Ming-lite-omni 主要承袭了 5 月初开源的 Ming-lite-omni-preview 和 Ming-lite-uni 这 2 款模型的能力,在此基础上做了更为系统的整合优化。
Ming-lite-omni 基于 Ling-lite-1.5,MoE 模块新增了模态特定路由以缓解模态冲突、增强模态间协同,使得音、视、图、文等模态能够有效统一在一个模型中。同时在图像、语音生成与理解统一方面侧重优化,突破理解与生成相互冲突的难题。至此,Ming-lite-omni 实现了模态统一处理,以及多模态理解与生成在一个模型上的统一,可以处理音频、视频、图像和文本模态的任意组合作为输入,生成与音频、图像或文本输出交织的多模态输出,从而实现先进的实时的全模态交互体验。
团队表示," 我们的目标是逐步开源 Ming 系列多模态模型,这将营造一个协作环境,让研究人员和开发者能够在这些模型的基础上进行构建和扩展,从而推动 AI 应用的创新。我们希望通过与社区的合作,逐步加速 Ming 系列模型开发,推进开发更先进、更实用的 AI 系统,以应对复杂的现实问题。"
蚂蚁百灵大模型负责人周俊(花名:西亭)表示,新开源的 Ming-lite-omni 模型有几个值得关注的创新点:一是真正把生成和理解模型放到一个模型;二是真正意义上的全模态输入和输出,都支持音视频、图文多种形态;三是真正是以 MoE 为架构的模型,中间没有提供其他东西,交互性较强。
蚂蚁百灵多模态大模型负责人陈景东(景东)向笔者进一步指出,目前更多开源的是必要的代码,开源的更多作用是希望大家可以把 Ming 系列模型能够用好。
目前来看,包括蚂蚁、腾讯在内的多家 AI 大模型团队认为,多模态模型正在走向 MoE 架构的 " 全模态 " 模型。包括 Seed1.5-VL 和 Qwen2.5-Omni 为代表的模型现已支持图像、视频、语音、文本及其任意组合的理解,而以 Kimi-VL 为代表支持 MoE 架构;但技术挑战上,支持音、视、图、文全模态交互的公开单模型非常少见,并且图像和语音的理解与生成统一模型鲜有出现,且理解和生成效果难以平衡。
阿里集团副总裁许主洪认为,当下多模态大模型的一大演进趋势,正是用统一的框架做理解和生成,这一领域发展尚处于初级阶段,需要实践验证。而今日蚂蚁开源的 Ming-lite-omni,正是这一领域的代表性实践。
同时,蚂蚁团队还宣布,百灵大模型即将开源一款 Ling-max 模型,模型规模和性能与 DeepSeek-V3" 满血版 " 比肩,追寻跟 V3 差不多的版本进行开源,让更多人基于百灵版本上面调用各式各样的能力。
除了模型更新,蚂蚁三大 AI 管家应用方面也有新进展,旗下 AI 健康管家不久后将上线新版本。
据悉,今年初蚂蚁集团宣布完成收购好大夫之后,3 月首次对外公布了以蚂蚁医疗大模型为核心的 " 一体三端(医疗机构、医生、用户)" 的 AI 医疗布局,成为应用场景与行业共建最深的专业大模型之一。据悉,其面向用户端的应用产品 AI 健康管家,从去年下半年发布以来,通过高质量数据资源、专业标注团队等多方面优化模型,在 AI 就医助理、AI 健康咨询等方面表现出色,充当用户个人日常健康管理与就医咨询的助理角色,上线半年服务超 4000 万用户。而这一 AI 应用产品即将上线新版本,迎来新的产品功能迭代突破。
对于内部 AI 产品使用百灵大模型情况,西亭对笔者表示,站在基础大模型角度看,之所以开源这么多基础模型,主要是不想让大模型成为某些公司的专属,通过将蚂蚁更多探索的 AI 技术公布到开源社区,成为推动大模型往前发展的重要起点。今天从业务和应用角度来说,百灵不会强行做一个非常绑定,因为当前模型还没有达到 AGI 能力,也没有成为社会必需品,所以行业和基础模型两方会持续推进,不会有那么强的耦合。
" 另外,如果不谈技术本身,我更加期待我们合作伙伴,纯粹是因为百灵技术做得好而选用我们,而不是别的应用连接使用百灵模型,这是我们对内和对外的一个非常关键因素。我们希望做的东西能够得到(开源)社区的认可,并且与社区推动 AI 技术进步。这是我们的观点。" 西亭称,AGI 仍处于早前阶段,团队相信通过自己的努力、模型能力进步后,会在合适的时间通过内部、外部使用它。
国内 AI 竞争加剧,蚂蚁发力应用
自 2025 年起,全球 AI 大模型市场 " 内卷 " 加剧。开源模型 DeepSeek 引发全球讨论,基础大模型并未如预期一样放缓迭代,除了 DeepSeek 之外的 AI 行业 Super App 超级应用也未出现。
因此,国内外科技大厂都在 " 内卷 " 模型迭代:OpenAI 发布 GPT-4.5 和 o3;Gemini 发布 2.5 Pro 版本;腾讯混元升级快思考模型混元 TurboS、深度思考模型混元 T1,并发布视觉深度推理模型 T1-Vision 和端到端语音通话模型混元 Voice;字节跳动旗下火山引擎发布豆包 · 视频生成模型 Seedance 1.0 lite、豆包 1.5 · 视觉深度思考模型,并升级豆包 · 音乐模型等。
去年第四季度国内有 49 个大模型更新发布,到今年一季度这一数字增长至 55 个,最多的时候一周有 8 个模型。大模型迭代速度越来越快,模型能力越来越强。正如李彦宏所说 " 大模型厂商卷生卷死。"
所以,对于 AI 这场战役来说,企业如何利用这些强大模型,把 AI 应用做好,让更多人体验到 AI 技术能力,这似乎成为未来的关键点,而国内科技大厂拥有非常强的基本盘产品,并且拥有流量、资源投入以及人才资源,将是国内 AI" 下半场 " 竞争的核心参与者。
" 跟很多创业公司相比,我们的优势不是资源,而是人才,怎么把我们的人才聚集到一起,其实靠的是协作。" 韩歆毅表示,AI 这件事很难,当前蚂蚁是在与全球最顶级的 AI 团队竞争,而且坦白说,这上面人家不光是跑得比我们早,也跑得比我们快。因此,对于蚂蚁来说,目标并不是做一家全球最领先的大模型公司,而是依然聚焦于应用上,仍希望智能上限的探索使得 AI 应用层面有突破," 至少在某几个领域我们要领先。"
展望未来,韩歆毅首次详细阐述蚂蚁新的 AI First 战略:
三大 AI 应用服务—— AI 金融管家、AI 健康管家、AI 生活管家;
四大技术探索——百灵基础大模型、AI 世界的支付与基础能力、科技产业化、开源与开放;
两大行业探索领域—— AI 与物理世界融合(具身智能)、区块链。
谈到基础模型的探索,韩歆毅表示,过去几个月蚂蚁团队投入的探索力量和更多突破,其实在某些方向已具备全球一定的领先地位,但这个领先还是偏单点。今天我们要全力以赴,追求智能上限,并且不断开源开放。另一方面,未来所有应用随着 AI 世界变得更加多样化,蚂蚁的机会在于支付,AI 世界的支付可能与今天完全不一样,因此,蚂蚁需要提供 AI 世界的支付与基础能力。
对于具身智能的探索,韩歆毅指出,这是一个面向未来的开放式探索。今年蚂蚁成立了灵波科技,希望探索 AI 与物理世界的融合,未来还将与哈啰一起探索自动驾驶。
" 人在相当长的时间内,不太可能回到我们的科幻电影中,有一个养生舱躺进去接上我们的虚拟世界、宇宙里面,这个短期内不太可能发生,但至少相当长的时间内,人还是活在现实世界中,现实世界和数字 AI 世界会同时并存,而我们希望帮助大家解决现实 AI 世界问题,这就是为什么我们去探索具身智能、智能驾驶等。" 韩歆毅称。
韩歆毅表示,如果往前看,蚂蚁 AI First 战略是一个 " 顶层框架型 " 的想法,还有一些非常具象的业务和策略依然在探索、摸索过程中,因此,整个过程中,无论是解决当下的业务的具体问题,还是蚂蚁面向未来的探索,其实都需要技术人员的创新与突破。" 因为技术是我们产品、业务快速奔跑的核心能力和坚强后盾。"
韩歆毅强调,蚂蚁希望真正给到用户、合作伙伴一个革命性、代际差体验、核心的竞争优势,所以在面临当下 AI 技术探索、AI 应用的战场上,我们要回到 " 黑客松 " 的精神,源于对技术的热爱。
" 我们源于热爱,成于协同,最后我们终于创新,用创新的方式为蚂蚁未来的 10 年、科技的 10 年打出一片新的天地。" 韩歆毅在演讲结尾称。(本文首发于钛媒体 App,作者|林志佳)