双方围绕语音交互、大模型能力以及 Agent 等核心方向展开全面协同,共同推动高德地图从 " 连接世界 " 迈向 " 理解世界 " 的全新阶段。
全链路语音共建:更精准、更自然的交互体验
作为全球首个 AI 原生地图应用,高德地图 2025 的核心亮点之一,是推出业内首个专精出行生活的智能体 " 小高老师 ",它可基于音频、文本输入等多模态方式,与用户直观交互。
在语音能力上,高德与通义实验室语音团队联合打造了覆盖唤醒、识别、理解、播报等环节的全链路能力,助力 " 小高老师 " 实现了行业领先的识别精度和交互流畅度。
双方构建的新一代语音语义感知系统,由高德导航专用 ASR(语音识别)模型、通用领域大模型 ASR、高德大模型综合理解能力等模型组成,全面覆盖导航、本地生活、日常闲聊三大场景。
此外,全双工语音技术的应用,让用户体验 " 小高老师 " 时可随时打断并发起新指令;抗回声处理则确保用户在复杂声学场景下依然能保持清晰、顺畅的交互体验。
大模型底座加持:通义 Qwen 赋能空间理解
在用户使用过程中," 小高老师 " 能高效调度高德内部近百种工具,将内外部数据资源整合分析,生成最佳回答反馈和地图交互动作。
支撑这一能力的,是高德和通义共建的大模型簇——该模型簇由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型构成。
通义大模型具备全球领先的预训练规模与语义理解能力:Qwen2.5 已在 18 万亿 token 上完成预训练,而 Qwen3 的数据量几乎翻倍,达到约 36 万亿 token。
凭借强大的底座能力,通义大模型已成为全球主流的基座模型之一。综合 Hugging Face、魔搭等社区数据,Qwen 系列大模型的下载量已达 4 亿次,同时衍生模型数量超过 14 万个,位居全球第一。
基于通义 Qwen 模型的底座能力,高德通过 SFT(指令微调)训练,显著提升了其在出行生活场景中的语义理解、上下文感知与响应能力。
智能 Agent 登场:出行决策化繁为简
在 Agent 领域,基于高德自研的 DeepResearch 框架,通义实验室和高德联合开发了地图领域的复杂 POI 推理 Agent,可通过理解多重约束条件、有效使用地图和搜索工具以及整合实时联网信息,为用户提供精准的 POI 推荐与导航服务。
该 DeepResearch 框架融合了强大的规划(Planning)、反思(Reflection)和工具调用(Tool Calling)机制,具备对高德地图全栈工具的深度理解和使用能力,能够智能地拆解复杂任务、评估执行路径并高效协调各类工具。
基于此框架开发的推理 Agent 具备三大能力:
首先,基于双方共建的高德专属推理能力模型,该 Agent 具备了地图领域领先的多维 POI 推理能力,可实现复杂时空需求的理解以及复杂 POI 的解析及处理,支持对事件、地理、参与者、时间、交通、POI 属性等多重约束的综合判断;
其次,该 Agent 为高德预置了专属地图 API、实时天气查询、交通状况监测、POI 数据查询 API 等工具,并能基于 POI 理解自主调度相关工具。同时,它还能轻松集成新的工具和数据源,以适应不断变化的场景需求,无论是新增的 POI 类型、交通方式还是实时数据,都能快速适配并提供相应服务。
最后,该 Agent 可实现复杂场景下的 POI 任务处理,例如多 POI 路线规划、实时约束下的 POI 推荐、定制化 POI 推荐以及长时间旅行规划建议等。
" 模型 + 场景 " 深度融合:AI 能力落地的行业范式
此次合作,不仅是高德与通义实验室技术能力的叠加,更是生态协同共建的深度实践。通义大模型的泛化能力与高德在空间场景上的深度积累,在 AI 原生地图中实现了前所未有的深度融合。
一方面,高德以通义大模型为 AI 底座,构建了具备理解真实世界能力的空间智能,这不仅赋能高德地图 APP 迭代升级,未来还能驱动智能汽车、智能眼镜、具身智能、低空飞行等领域的变革。
另一方面,通义实验室则通过高德地图这一海量用户场景,推动大模型能力的真实落地与验证,加速其在 C 端产品中的规模化应用。
可以预见,高德与通义实验室的合作将成为 " 模型 + 场景 " 跨域融合的行业范式,为 AI 能力在更多真实世界场景中的落地提供可复制的实践经验。