关于ZAKER 合作
手机中国 9分钟前

百度千帆深度研究 Agent 登顶权威评测榜 实现行业领先

【CNMO 科技消息】2 月 4 日,深度研究智能体权威评测榜单 DeepResearch Bench 公布最新结果。百度千帆推出的深度研究智能体(Qianfan-DeepResearch Pro)凭借其卓越的端到端研究能力与极高的报告产出质量,在评测中脱颖而出,荣登榜单榜首。

当前,深度研究正被视为人工智能进化的关键分水岭。它要求 AI 系统能够模拟人类专家,自主执行从复杂需求理解、广泛信息获取到深度洞察产出的多步骤、可迭代认知全过程,远超传统文本生成的范畴。该技术已广泛应用于学术综述、金融投研、商业分析等领域,能将传统耗时数日的手动研究工作压缩至分钟级完成。

作为衡量该领域能力的 " 金标准 ",DeepResearch Bench 填补了通用 AI 评测在端到端深度研究任务上的空白。其由领域专家设计了 100 个博士级别的研究任务,覆盖 22 个学科,并引入严格的 RACE 报告质量评价框架与引文准确性评估,是目前全球最硬核、最真实的深度研究智能体生产力评价体系。

在此次评测中,百度千帆深度研究 Agent 在衡量报告含金量的四大核心维度——全面性、洞察力、指令遵循度和可读性上,均实现了行业领先。

在架构方面,百度千帆采用 " 任务理解 - 规划 - 执行 " 循环机制,实现端到端研究交付。信息处理能力方面,千帆依托百度搜索与 RAG 技术,保障信息获取的广度、可信度与相关性。执行控制方面,千帆通过 " 由粗到细 " 的研究路径以及深度执行规划与实时反思机制,动态评估进展、调整策略,有效避免 " 幻觉 " 与路径偏离,确保复杂任务的高质量完成。

报告生成方面,百度千帆采用独特的两阶段报告渲染机制,首先生成确保逻辑一致性与内容全面性的 "pivot 报告 ",随后可渲染输出 markdown、html、ppt 等多形态最终报告,实现 " 一次研究,多形态交付 "。

目前,该深度研究 Agent 已正式上线百度千帆平台。用户只需输入复杂的调研需求,系统即可在十几分钟内生成附带规范引用的专业级研究报告,真正实现 " 分钟级 " 的深度洞察交付。

此次登顶榜首,也集中体现了百度千帆 Agent Infra 的强大支撑能力。该基础设施提供模型、工具、Agent 开发、数据及运行环境等一站式服务。据悉,千帆平台已累计开发超过 130 万个 Agents,其中以 " 百度 AI 搜索 " 为代表的独家工具日均调用量已达数千万次,为 AI 智能体的高效、可靠运行提供了坚实基座。

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容