现在的时间是 …2025 年 6 月。
和很多人想的不同,人工智能既没有像元宇宙那样偃旗息鼓,也没有延续年初那种出什么爆什么的疯狂,就像是一股不断发展的数字化浪潮,它已然成为产业海洋里不可分割的一部分。
要我说,这种感觉其实还蛮不错的,毕竟明眼人都能看出现在这一批 AI 工具的实用性,我更是有事没事就会鼓捣这些东西,别说,这么一折腾,什么文字 RPG、小说配图都是手到擒来,就连工作都轻松了不少。
至于近期,国内大模型有啥新闻嘛 ……
哦对了,字节又有新动作, "2025 火山引擎春季 FORCE 原动力大会" 来了。
作为半年一次的大会,火山引擎这次确实带来了一些值得关注的更新,除了豆包大模型家族的全面焕新,还有颇受关注的扣子和 TRAE 的新消息,更有沉浸式展区以及 10+ 场的专题论坛。
想知道火山引擎接下来要折腾些什么新东西吗?跟着我走就对了。
豆包 1.6,来了!
在国产大模型中,豆包的起步确实是相对慢一些的。
但或许是因为技术积累、厚积薄发的缘故,豆包 AI 生态在 2024 年实现了高速发展,现在更是已经做到了后来居上。
根据调查机构 @奇异因子的统计,如今字节已经成为目前拥有最全生成式 AI 模型、最多 AI 应用的技术公司之一,豆包的 MAU 更是遥遥领先,大有把其他同类中文聊天机器人拉一块 A 了的意思。
那么,这次豆包又给我们带来了什么惊喜呢?
首先,万众期待的底层大模型豆包大模型 1.6 正式发布了 !
据火山引擎总裁谭待介绍,豆包大模型 1.6 包括三个大模型,分别是 Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash,均支持多模态输入,并实现 256K 超长上下文。
以 thinking 模型为例,其思考能力得到了强化,面对高考全国新一卷数学,豆包大模型取得了 144 分,在大模型中居全国第一;在海淀模拟全卷考试中,理科拿下 706 分,文科考了 712 分,较前代均有大幅提升。
全新的 Doubao-Seed-1.6,则有点像 Gemini-2.5-Flash,支持 on/off/auto 三种思考模式,让用户可以根据使用场景自行选择,或者是大模型判断是否使用深度思考,这样能在保证体验的同时降低 token 消费。
目前,这些能力都已经上线了大模型应用实验室,方便感兴趣的个人和企业开发自己的智能体。
然后,就像事先预告那样,豆包在这次大会上正式发布了视频生成模型 Seedance1.0 pro。
在视频创作领域,火山引擎及其背后的字节跳动,恐怕是最有发言权的。
抖音在全球掀起的全民视频创作热潮,造就了一个全新的互联网视频时代,正因如此,Seedance1.0 pro 也更关注用户在实际使用时的创作流程和创作效果,并为用户带来了多镜头叙事的底层逻辑革新。
举个例子,用过传统视频生成模型的用户都应该知道,AI 生成的视频经常会因为镜头切换时的空间逻辑断裂导致画面 " 跳脱 ",最好是把内容固定在单一镜头,然后分段生成,手动拼接。
而 Seedance1.0 pro 通过多模态位置编码技术,将文本指令中的空间信息转化为三维坐标系中的运动轨迹,因此能够流畅处理好人物、画面和镜头的关系,从现场展出的样片来看,整体过渡流畅,基本没什么违和感。
对了,还有一个大消息,豆包实时语音大模型也在今天全量上线了。
事实上,无论是此前爆火的 AI 视频通话,还是最近上线的 AI 播客生成,都有用到这个大模型的能力,最终生成的效果确实都很惊艳,字节当然希望更多的开发者和用户能用上这个能力。
在 AI 交互从文字迈向多模态的浪潮中,豆包这一系列新模型的推出,似乎意味着 " 能听、能看、会想 " 的 AI 时代,正在悄然来临。
生态日渐繁荣
" 安全是一切 Agent 的基础。" 火山引擎总裁谭待如是说。
针对大量企业觉得 " 云端不安全、本地不好用 " 的情况,火山引擎在今天的大会上正式发布了 AICC 密态计算和大模型防火墙两款企业级新技术方案。
前者很好理解,其实就是我们常说的 " 数据可用、不可见 ",企业将数据通过密态环境给到机构二,在这个密态环境中,机构二能够使用这部分数据,但并不能够看到这些数据,以此解决企业担心数据泄露的问题。
后者则是为企业级大模型用户提供的安全防护功能,根据官方介绍,能有效抵御算力 DDoS 攻击,降低恶意 tokens 消耗风险 30%,减少敏感数据泄露 70%,控制不良信息输出率在 5% 以内。
怎样才能让企业放心使用云 AI 服务,成为了今年各家服务供应商的共同话题。
很多国内开发者关心的 TRAE,也在这次大会上实现了三大核心能力突破。
在上下文理解层面,Trae 从单纯识别文本内容,进阶至深度解析用户创作意图;MCP 模块赋予 AI 执行能力,使其能够调用外部工具与服务,如同拥有 " 操作之手 ";智能体系统则构建起 " 专家顾问 " 模式,支持针对不同任务灵活定制工作流程。
上述功能的协同运作,尤其是与 MySQL 等数据库的深度集成,有望为开发者开启效率飞跃的新篇章,显著提升开发工作的便捷性与高效性。
作为字节跳动推出的 AI IDE,Trae 确实是一个很好的普惠工具,让更多人可以掌握代码技术,而这些新功能的登场,则让它突破了 "AI 编辑器 " 的范畴,成为了一个能和你并肩作战的搭档。
据洪定坤透露,在字节内部,超过 80% 的工程师在使用 TRAE 辅助开发。
对了,趁着主论坛结束的空档,小雷还去逛了一下展区。
要说里面比较有趣的,一个是基于 Seedance1.0 pro 生成的视频而搭建的观影区域,别说这动画效果还真像那么一回事,就是采用了大量特写这点很显然不符合真实动画的客观规律——没有哪个动画师会愿意去手 K 这么多细节。
另一个产品,这次字节和合作厂商带来了很多很多的产品,手机、汽车、手表、耳机这些比较常见的就不说了,现场还有四处溜达的机器人、语音交互的 AI 玩具和键盘、鼠标等一系列 AI 新品类。
要我说,对比半年前的展区,那可真的是丰富得太多了。
总结
在国内大模型厂商中,火山引擎的成绩是相当亮眼的。
截至 2025 年 5 月底,豆包大模型日均 tokens 调用量已超过 16.4 万亿,在中国公有云大模型服务调用量之中排行第一。
目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,覆盖 4 亿终端设备,如小米、OPPO、vivo、荣耀、联想、三星等品牌;八成主流车企,还有数十家证券基金公司、大量银行、顶级高校和科研院所。
整个发布会看下来,字节跳动 / 火山大模型正在做的事情还挺好理解的:
" 要好用,更要性价比。"
这也是为什么豆包 1.6 会首创区间统一定价的原因,在企业使用量最大的 0-32K 输入区间,豆包 1.6 的输入价格为 0.8 元 / 百万 tokens、输出 8 元 / 百万 tokens,综合成本只有豆包 1.5 深度思考模型或 DeepSeek R1 的三分之一。
视频模型也是如此,Seedance 1.0 pro 模型每千 tokens 仅 0.015 元,每生成一条 5 秒的 1080P 视频只需 3.67 元,720P 视频价格还会更低,为行业最低水平。
还记得 2019 年的短视频吗?当时抖音 / 快手疯狂烧钱,很多人说他们傻。
现在呢?短视频已经成为最大的流量入口。
在我看来,现在的 AI 智能体,就是当年的短视频。字节跳动等不及了,因为他们知道,谁能先建立起 AI 生态,谁就能在下一个时代占据先机。
在今天的大会上,火山引擎 AI 云原生全栈服务升级,发布了火山引擎 MCP 服务 PromptPilot 智能提示工具、AI 知识管理系统、veRL 强化学习框架等产品,并推出一系列 AI Infra 套件。
所有这些内容,都是为了更大幅度地降低开发门槛,提升开发效率,让开发者们可以不用担心模型能力、不用担心模型成本、更不用担心开发工具和平台,可以踏踏实实地做应用,做出真正好的应用。
正所谓,突破性的新技术、伟大的产品诞生之初,往往都是从一些前景不明的实验开始,经过一次次迭代找到与市场需求的契合点,再发展壮大的。
如今,云计算与 AI 服务市场的牌桌上正在发生一场剧变,搅局者正是字节跳动旗下的火山引擎。
在火山引擎打破市场格局的背后,是一场资源、战略与执行力的综合比拼。在内卷加剧的市场中,它不仅做到以低价 " 突围 ",更凭借着豆包、Coze、Trae 等能力快速建立用户认知,撬动着技术能力、生态资源与商业模式的整体跃迁。
或许,这就是火山引擎在 AI 时代云战争中的求胜之法吧。