Token 调用量增长超 10 倍！豆包大模型 2.1 上线，Seedance 2.5 预计 7 月初正式上线

火山引擎连发三款模型，以密集的产品节奏和激进的定价策略向生产级 AI 市场全面发力。

周二，火山引擎正式发布豆包大模型 2.1 系列，包括旗舰版 Doubao-Seed-2.1-Pro 与轻量版 Doubao-Seed-2.1-Turbo，API 即日在火山方舟全量上线。与此同时，视频生成模型 Seedance 2.5 宣布将于 7 月初正式发布，音频生成模型 1.0 同步开启邀测，标志着豆包生态从语言理解向多模态内容生产全面延伸。

豆包大模型 2.1 Pro 定价为每百万 Tokens 输入 6 元、输出 30 元，在 Coding 和 Agent 场景下综合成本降至每百万 Tokens 仅 1.96 元，直接瞄准企业级生产环境。火山引擎同步推出持续迭代版本 Doubao-Seed-Evolving，以每月 2 至 4 次的频率滚动更新，企业无需更换 API 接入节点即可获得最新模型能力。

此次大会上，火山引擎总裁谭待对外披露了最新数据：截至今年 6 月，豆包大模型日均 Token 调用量已突破 180 万亿，较去年增长超 10 倍。与此同时，在中国公有云 MaaS 服务市场，火山引擎以 49.5% 的市场份额位居第一。

上述产品组合将直接影响国内企业 AI 采购格局。豆包大模型 2.1 已接入 WPS、得到、Unity（团结引擎）等合作伙伴，并计划覆盖数亿豆包用户。在多项公认基准测试中，豆包大模型 2.1 Pro 在 Coding 与 Agent 任务上的表现已逼近甚至超越 OpenAI GPT-5.5 和 Anthropic Claude Opus 4.7 等国际顶尖模型。

Coding 能力跨越生产级门槛

豆包大模型 2.1 Pro 在多项业界公认编程基准上展现出对标国际旗舰模型的能力。在 Terminal Bench 评测上，豆包大模型 2.1 Pro 与 Claude Opus 4.7 基本持平，能够在命令行环境中端到端完成完整工程任务；在长程软件开发基准 SWE-Pro 上，其表现接近 GPT-5.5。

在自然语言到仓库级代码转化的 NL2Repo-Bench 评测中，豆包大模型 2.1 Pro 超越 GPT-5.5。在科学计算代码评测 SciCode 上，豆包 2.1 Pro 以 59.8 分超过 Claude Opus 4.7 和 GPT-5.5，该测试覆盖数理化生材五大学科的真实科研问题，是 AI for Science 方向含金量最高的基准之一。

在开发者众测环节，逾六成开发者认为豆包大模型 2.1 Pro 在真实 Coding 任务中的产物质量高于 Claude Opus 4.6。火山引擎还披露了一个芯片设计 RTL 案例：豆包大模型 2.1 Pro 连续运行近 18 小时，经历 9 轮迭代，完成 6 个核心模块、1303 行 RTL 代码的生成，并通过仿真、测试、综合检查等完整工程流程，最终通过手写数字识别验证，完成生产级 Coding 交付。

Agent 能力跃升，覆盖高经济价值任务

在通用 Agent 能力方面，豆包大模型 2.1 Pro 在 OpenAI 发布的 GDPval 基准上获得最高分，该测试集覆盖 9 大行业、44 种职业的真实世界经济价值任务。在 2026 年 6 月刚发布的 Agents' Last Exam（ALE）评测上，豆包大模型 2.1 Pro 超越 Claude Opus 4.7 ——该基准涵盖 13 个行业集群、逾 1000 项高经济价值真实任务，且发布不久难以被定向优化，更能真实衡量模型面对新场景时的泛化能力。

工具调用方面，豆包大模型 2.1 Pro 在 MCP-Atlas 评测集上全面超越 Claude Opus 4.7 与 GPT-5.5，在使用真实 MCP Server 及多类工具时表现更为稳定。火山引擎展示了一个典型应用案例：一位开发者使用该模型调度超过 500 个 Agent 协同作业，累计触发工具调用上千次，最终在单张大地图上完成逾 100 栋造型各异建筑的 3D 城市构建。

多模态理解保持全球领先

图像理解方面，豆包大模型 2.1 在 MMMU-Pro 等多项榜单上全面超越 GPT-5.5、Claude Opus 4.7 和 Gemini 3.1 Pro，达到全球 SOTA。视频时序理解方面，豆包 2.1 Pro 在 TOMATO 与 LVBench 两项业界权威基准上大幅领先 Gemini 3.1 Pro。

GUI Agent 方面，豆包大模型 2.1 Pro 桌面端能力接近 Claude Opus 4.7，移动端大幅领先，并全面超过 GPT-5.5，在全球取得 SOTA。火山引擎展示了一个端到端视频剪辑案例：豆包大模型 2.1 Pro 一次性处理逾两小时长视频，自动完成口语化解说稿生成、精准片段定位、音频合成及字幕输出，全程无需人工干预。

Seedance 2.5 与音频模型拓展版图

据华尔街见闻获悉，豆包视频生成模型 Seedance 2.5 目前已处于内测尾声，预计 7 月初正式发布。新模型支持单段视频生成时长最高 30 秒，镜头连贯性大幅提升；并支持最多 50 个全模态素材联合输入，官方称为全球最多；此外还具备更灵活可控的视频编辑能力，旨在进一步提升创作者效率与成品品质。

同日，火山引擎正式发布豆包音频生成模型 1.0（Doubao-Seed-Audio 1.0），支持文本及参考音频等多模态输入，可端到端生成包含多角色对白、背景音乐和环境音效的完整音频作品，免去传统工作流中多轨剪辑、对齐、混音等后期环节。该模型单次支持 2 分钟音频创作，并可通过参考输入延长音频同时保持音色一致性。API 即日起在火山方舟开启邀测，并计划接入剪映、即梦、番茄等产品。

定价策略与规模化商业布局

豆包大模型 2.1 的定价设计兼顾旗舰性能与规模化部署需求。Pro 版每百万 Tokens 输入 6 元、输出 30 元，缓存命中条件下输入仅需 1.2 元；Turbo 版能力与 Pro 版相近，价格降低一半，更适合高频调用场景。在 Coding 和 Agent 场景综合计算下，Pro 版的实际成本压缩至每百万 Tokens 仅 1.96 元。

在产品集成方面，豆包大模型 2.1 已全面兼容 Claude Code、Codex 等主流 Harness 框架，并已上线 TRAE、TRAE WORK、扣子等开发工具。合作伙伴方面，WPS 表示该模型在 PPT 生成、表格交付等办公核心任务上形成稳定可用链路；得到反映其在业务规则遵循和核心禁令执行上实现零违规；Unity（团结引擎）则认为该模型在脚本逻辑类任务上的单次能力上限高于顶尖模型。火山引擎表示，豆包产品即将接入豆包大模型 2.1 Pro，服务数亿用户的办公与生产力场景。

对话雅诗兰黛集团总裁兼CEO司泰峰：让一家“慢”公司变快，这是他的第一年

36氪 04-13

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

Token 调用量增长超 10 倍！豆包大模型 2.1 上线，Seedance 2.5 预计 7 月初正式上线

宙世代

一起剪

相关阅读

对话雅诗兰黛集团总裁兼CEO司泰峰：让一家“慢”公司变快，这是他的第一年

最新评论

全天候科技

热门推荐

企业资讯