关于ZAKER Skills 合作
全天候科技 1小时前

Token 调用量增长超 10 倍!豆包大模型 2.1 上线,Seedance 2.5 预计 7 月初正式上线

火山引擎连发三款模型,以密集的产品节奏和激进的定价策略向生产级 AI 市场全面发力。

周二,火山引擎正式发布豆包大模型 2.1 系列,包括旗舰版 Doubao-Seed-2.1-Pro 与轻量版 Doubao-Seed-2.1-Turbo,API 即日在火山方舟全量上线。与此同时,视频生成模型 Seedance 2.5 宣布将于 7 月初正式发布,音频生成模型 1.0 同步开启邀测,标志着豆包生态从语言理解向多模态内容生产全面延伸。

豆包大模型 2.1 Pro 定价为每百万 Tokens 输入 6 元、输出 30 元,在 Coding 和 Agent 场景下综合成本降至每百万 Tokens 仅 1.96 元,直接瞄准企业级生产环境。火山引擎同步推出持续迭代版本 Doubao-Seed-Evolving,以每月 2 至 4 次的频率滚动更新,企业无需更换 API 接入节点即可获得最新模型能力。

此次大会上,火山引擎总裁谭待对外披露了最新数据:截至今年 6 月,豆包大模型日均 Token 调用量已突破 180 万亿,较去年增长超 10 倍。与此同时,在中国公有云 MaaS 服务市场,火山引擎以 49.5% 的市场份额位居第一。

上述产品组合将直接影响国内企业 AI 采购格局。豆包大模型 2.1 已接入 WPS、得到、Unity(团结引擎)等合作伙伴,并计划覆盖数亿豆包用户。在多项公认基准测试中,豆包大模型 2.1 Pro 在 Coding 与 Agent 任务上的表现已逼近甚至超越 OpenAI GPT-5.5 和 Anthropic Claude Opus 4.7 等国际顶尖模型。

Coding 能力跨越生产级门槛

豆包大模型 2.1 Pro 在多项业界公认编程基准上展现出对标国际旗舰模型的能力。在 Terminal Bench 评测上,豆包大模型 2.1 Pro 与 Claude Opus 4.7 基本持平,能够在命令行环境中端到端完成完整工程任务;在长程软件开发基准 SWE-Pro 上,其表现接近 GPT-5.5。

在自然语言到仓库级代码转化的 NL2Repo-Bench 评测中,豆包大模型 2.1 Pro 超越 GPT-5.5。在科学计算代码评测 SciCode 上,豆包 2.1 Pro 以 59.8 分超过 Claude Opus 4.7 和 GPT-5.5,该测试覆盖数理化生材五大学科的真实科研问题,是 AI for Science 方向含金量最高的基准之一。

在开发者众测环节,逾六成开发者认为豆包大模型 2.1 Pro 在真实 Coding 任务中的产物质量高于 Claude Opus 4.6。火山引擎还披露了一个芯片设计 RTL 案例:豆包大模型 2.1 Pro 连续运行近 18 小时,经历 9 轮迭代,完成 6 个核心模块、1303 行 RTL 代码的生成,并通过仿真、测试、综合检查等完整工程流程,最终通过手写数字识别验证,完成生产级 Coding 交付。

Agent 能力跃升,覆盖高经济价值任务

在通用 Agent 能力方面,豆包大模型 2.1 Pro 在 OpenAI 发布的 GDPval 基准上获得最高分,该测试集覆盖 9 大行业、44 种职业的真实世界经济价值任务。在 2026 年 6 月刚发布的 Agents' Last Exam(ALE)评测上,豆包大模型 2.1 Pro 超越 Claude Opus 4.7 ——该基准涵盖 13 个行业集群、逾 1000 项高经济价值真实任务,且发布不久难以被定向优化,更能真实衡量模型面对新场景时的泛化能力。

工具调用方面,豆包大模型 2.1 Pro 在 MCP-Atlas 评测集上全面超越 Claude Opus 4.7 与 GPT-5.5,在使用真实 MCP Server 及多类工具时表现更为稳定。火山引擎展示了一个典型应用案例:一位开发者使用该模型调度超过 500 个 Agent 协同作业,累计触发工具调用上千次,最终在单张大地图上完成逾 100 栋造型各异建筑的 3D 城市构建。

多模态理解保持全球领先

图像理解方面,豆包大模型 2.1 在 MMMU-Pro 等多项榜单上全面超越 GPT-5.5、Claude Opus 4.7 和 Gemini 3.1 Pro,达到全球 SOTA。视频时序理解方面,豆包 2.1 Pro 在 TOMATO 与 LVBench 两项业界权威基准上大幅领先 Gemini 3.1 Pro。

GUI Agent 方面,豆包大模型 2.1 Pro 桌面端能力接近 Claude Opus 4.7,移动端大幅领先,并全面超过 GPT-5.5,在全球取得 SOTA。火山引擎展示了一个端到端视频剪辑案例:豆包大模型 2.1 Pro 一次性处理逾两小时长视频,自动完成口语化解说稿生成、精准片段定位、音频合成及字幕输出,全程无需人工干预。

Seedance 2.5 与音频模型拓展版图

华尔街见闻获悉豆包视频生成模型 Seedance 2.5 目前已处于内测尾声,预计 7 月初正式发布。新模型支持单段视频生成时长最高 30 秒,镜头连贯性大幅提升;并支持最多 50 个全模态素材联合输入,官方称为全球最多;此外还具备更灵活可控的视频编辑能力,旨在进一步提升创作者效率与成品品质。

同日,火山引擎正式发布豆包音频生成模型 1.0(Doubao-Seed-Audio 1.0),支持文本及参考音频等多模态输入,可端到端生成包含多角色对白、背景音乐和环境音效的完整音频作品,免去传统工作流中多轨剪辑、对齐、混音等后期环节。该模型单次支持 2 分钟音频创作,并可通过参考输入延长音频同时保持音色一致性。API 即日起在火山方舟开启邀测,并计划接入剪映、即梦、番茄等产品。

定价策略与规模化商业布局

豆包大模型 2.1 的定价设计兼顾旗舰性能与规模化部署需求。Pro 版每百万 Tokens 输入 6 元、输出 30 元,缓存命中条件下输入仅需 1.2 元;Turbo 版能力与 Pro 版相近,价格降低一半,更适合高频调用场景。在 Coding 和 Agent 场景综合计算下,Pro 版的实际成本压缩至每百万 Tokens 仅 1.96 元。

在产品集成方面,豆包大模型 2.1 已全面兼容 Claude Code、Codex 等主流 Harness 框架,并已上线 TRAE、TRAE WORK、扣子等开发工具。合作伙伴方面,WPS 表示该模型在 PPT 生成、表格交付等办公核心任务上形成稳定可用链路;得到反映其在业务规则遵循和核心禁令执行上实现零违规;Unity(团结引擎)则认为该模型在脚本逻辑类任务上的单次能力上限高于顶尖模型。火山引擎表示,豆包产品即将接入豆包大模型 2.1 Pro,服务数亿用户的办公与生产力场景。

全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容