这显然是阿里巴巴预谋已久的一次集团行动。
1 月 15 日,千问 App 宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,在全球首次实现点外卖、买东西、订机票等 AI 购物功能,并向所有用户开放测试。此次升级将上线超 400 项 AI 办事功能,让千问 App 成为全球首个能完成真实生活复杂任务的 AI 助手。
从产品层面看,千问是阿里巴巴最 " 年轻 " 的应用,要调用淘宝、支付宝、高德等 App 的能力,相当于阿里巴巴要将 App 的部分功能打碎,以原子化的方式为千问所用,这必然少不了集团的首肯和斡旋。发布会现场,阿里系 App 各业务负责人也来到现场表示支持。

千问能做什么?
千问想做 Agent,路人皆知。
在 Manus、豆包手机、智谱 GLM 等 Agent 形态产品先后推出的背景下,不同产品也走出了不同路径,各家都在用自己的资源禀赋和产品哲学去定义 "AI 该如何进入真实世界 ",千问的独特性在于阿里巴巴生态的贯通。
Manus 代表的是通用型任务 Agent,它没有什么历史资源和包袱,强调的是跨工具、跨流程的自动化执行能力,把复杂任务拆解为步骤,再通过模型调度工具完成闭环,更像一个 " 数字员工 ",Meta 收购 Manus,看中的也是其想象空间。
豆包手机走的是 AI 原生终端路线,豆包没有把 Agent 看做一个 App,而是嵌入到操作系统和硬件层面,让 AI 接管搜索、拍照、记录、导航、购物等行为,当然目前有一些安全法规等方面的限制。
智谱 GLM 更偏向能力底座 + Agent 平台的方向。它强调的是大模型能力的工程化、组件化,让 Agent 成为可以被企业和开发者自由组合的生产工具。与 Manus 的 " 成品型 Agent" 不同,GLM 更像是在提供 " 造 Agent 的能力 "。

在发布会上,吴嘉现场演示 AI 外卖功能,只需给千问 App 下达一句话指令," 帮我点 40 杯霸王茶姬的伯牙绝弦 ",千问 App 迅速调用淘宝闪购下单,无需任何跳转即在端内完成 AI 支付。这一能力的背后,是千问与淘宝闪购、支付宝原生 AI 支付能力 "AI 付 " 的系统级打通。
就在四天前,谷歌刚刚宣布与沃尔玛等零售商的 AI 购物合作计划,但目前尚未上线。阿里领先于谷歌,成为全球首个实现多品类 AI 购物功能的科技公司。
阿里之所以能领先于谷歌推出 AI 购物,核心在于其独特的 " 模型 + 生态 " 垂直整合能力。与谷歌试图通过 UCP 协议连接外部零售商的 " 开放联盟 " 模式不同,千问 App 依托的是阿里内部庞大且深度的生态协同——底层是 Qwn 大模型,上层直接打通淘宝商品库、支付宝支付体系及本地生活服务体系。这种深度整合有效解决了 AI Agent 落地中最棘手的 " 决策信任 " 与 " 支付断点 " 难题。
千问,拆解阿里巴巴系 App
Agent 形态产品不甚新鲜,行业对此也基本祛魅,但矛盾点依然是日益泛滥的 Agent 和难以解决的真实问题,阿里巴巴也意识到了这些关键点,于阿里巴巴生态体系内,可以最大化做好协同,同时尽可能将体验做深。在做好阿里巴巴内部生态 Agent 的基础上,未来千问走向通用型 Agent 是顺理成章的事。
接入淘宝后,千问 App 可以真正帮助用户解决 " 买什么、怎么选、值不值得买 " 的难题。千问 App 不仅能根据用户的真实需求给出购物建议,更能基于淘宝庞大的商品数据库和评价体系,智能生成具体的商品推荐方案。用户只需一个指令,即可在千问 App 完成从消费决策到交易的闭环。
吴嘉表示,对于消费场景,互联网上的营销信息繁杂、噪音巨大。如何训练模型的理解分辨能力很关键。千问 App 不仅仅依靠世界知识,更能利用阿里巴巴独特的交易和服务数据来增强模型,从而保障 AI 购物功能保持客观和准确。

再如 Agent 调度与工具编排系统,千问并不像豆包手机那样,直接 " 点 " 某个 App,那样就无需做对应 App 的改造,千问是将用户一句话拆解成多个子任务,选择合适的工具并按顺序调用,输出结果馈给用户,其中涉及到任务编排引擎等能力。
这一系列 " 办事能力 " 的爆发,源于千问底层技术的突破:千问大模型 Coding 能力的大幅提升,使其能实时构建工具;全模态理解能力的突破,让千问能够看懂界面听懂声音同时读懂图文报表;最后是超长上下文的处理能力大幅提升复杂上下文的交付上限。
基于这些技术能力突破,千问 " 任务助理 " 功能在 App 和 Web 端开始定向邀测。该功能具备类人化的多步骤规划能力,覆盖应用开发、Office 办公、咨询调研及生活办事等核心场景,支持一键处理报表整理、研报撰写及小工具生成等复杂任务。测试结束后,该功能将面向用户免费开放。(本文作者 | 张帅,编辑 | 盖虹达)