【CNMO 科技消息】2 月 4 日,深度研究智能体权威评测榜单 DeepResearch Bench 公布最新结果。百度千帆推出的深度研究智能体(Qianfan-DeepResearch Pro)凭借其卓越的端到端研究能力与极高的报告产出质量,在评测中脱颖而出,荣登榜单榜首。

作为衡量该领域能力的 " 金标准 ",DeepResearch Bench 填补了通用 AI 评测在端到端深度研究任务上的空白。其由领域专家设计了 100 个博士级别的研究任务,覆盖 22 个学科,并引入严格的 RACE 报告质量评价框架与引文准确性评估,是目前全球最硬核、最真实的深度研究智能体生产力评价体系。
在此次评测中,百度千帆深度研究 Agent 在衡量报告含金量的四大核心维度——全面性、洞察力、指令遵循度和可读性上,均实现了行业领先。

报告生成方面,百度千帆采用独特的两阶段报告渲染机制,首先生成确保逻辑一致性与内容全面性的 "pivot 报告 ",随后可渲染输出 markdown、html、ppt 等多形态最终报告,实现 " 一次研究,多形态交付 "。
目前,该深度研究 Agent 已正式上线百度千帆平台。用户只需输入复杂的调研需求,系统即可在十几分钟内生成附带规范引用的专业级研究报告,真正实现 " 分钟级 " 的深度洞察交付。
此次登顶榜首,也集中体现了百度千帆 Agent Infra 的强大支撑能力。该基础设施提供模型、工具、Agent 开发、数据及运行环境等一站式服务。据悉,千帆平台已累计开发超过 130 万个 Agents,其中以 " 百度 AI 搜索 " 为代表的独家工具日均调用量已达数千万次,为 AI 智能体的高效、可靠运行提供了坚实基座。