关于ZAKER 合作
量子位 18小时前

看图写代码,3 毛钱开发一个网页!字节 AI Coding 新模型真卷麻了

编程模型最新卷王来了。

就在今天,火山引擎推出了面向 Agentic 编程任务深度优化的全新代码模型Doubao-Seed-Code

三个不同的维度,卷出了新高度。

第一,性能 SOTA,与 TRAE 开发环境深度结合后,能更快、更准地解决问题,登顶了 SWE-Bench Verified 榜单。

第二,价格,调用价格国内最低,火山引擎还配套推出 9 块 9 套餐,一杯咖啡钱,就能搞定各种摸鱼小游戏——比如办公室躲老板(doge)。

最后,迁移成本—— Doubao-Seed-Code原生兼容 Anthropic API,在 Claude Code 环境中进行迁移,都不用做复杂的配置,几乎就是零成本切换。

不过说归说闹归闹,最后还得看实测效果。

咱实测一波看看……

实测 Doubao-Seed-Code

老样子,Coding 测试,咱先设置几个进阶任务,看看能力究竟几斤几两。

首先是基础功能,然后交互优化,接着工程化重构,最后完整网站设计……

逻辑上层层递进,难度上从单一视觉实现到复杂问题解决,逐步考验 Doubao-Seed-Code 的综合能力。

第一阶段聚焦简单任务,看看它的基础视觉效果实现能力。

请帮我创建一个银河系粒子效果动画。要求:

1)使用 Canvas 绘制粒子系统;2)粒子随机分布在画布上,模拟星空效果;3)粒子有不同的大小和亮度,模拟远近不同的星星;4)添加鼠标交互,鼠标移动时粒子会有轻微的响应;5)背景使用深色渐变,营造宇宙深邃感。请使用 HTML5 Canvas 和 JavaScript 实现。

这个任务的核心需求单一,没有复杂的交互,模型耗时 1 分多钟输出完整的 HTML5 Canvas+JS 代码,运行后粒子随机分布,大小与亮度差异也确实能体现远近感,和鼠标交互的轻微响应也能 get。

结果很不错,能快速完成简单视觉任务,技术栈使用准确且基础功能无偏差。

紧接着,验证一下模型对 " 视觉风格 + 复杂交互逻辑 " 的理解与优化能力。

这次在 Claude Code 里进行 API 调用,不得不夸一句," 无缝衔接 " 真丝滑,就这个 API 原生兼容爽!

实际上也不止 Claude Code,Doubao-Seed-Code 在 Cursor、Cline、Codex CLI 等主流智能编程环境里,都能与开发者们日常使用的工具无缝衔接。

完整 html,Minecraft 风格,展示拉链形状,当我上下移动鼠标时,拉链会像真实的拉链一样打开和关闭。拉链闭合拉开的速度慢点。要求:禁止使用任何改变应用结构或组件化范式的 JavaScript 框架 / 库(例如:React,Vue,Angular)。可以 cdn 引用第三方库以满足题目要求,如 Three.js,p5js。最终产物必须是纯粹的 HTML、CSS 和 JS 文件。如果需要创建多个文件(HTML/CSS/JS),请确保所有文件引用均使用相对路径。

任务是开发 Minecraft 风格拉链交互效果,相比第一阶段增加了 " 鼠标上下移动控制拉链开合(速度慢)" 的交互要求。

模型第一次做完项目倒是非常贴心地帮忙检查了运行效果,也给了一些速度修改建议。

Minecraft 风格是有了、拉链形状也有了,但这个交互方式,怎么看也不像拉链啊……

是不是提示的问题,那咱再进一步改造一下:

这个交互模式不像现实生活中的拉链

很快就找到了问题所在,定位到交互逻辑与现实场景脱节的核心问题。

一次改造后的效果如下:

虽然第一次没完成,但调整起来效率尚可,在多轮交互时响应也还算丝滑。

下面,咱来看看 Doubao-Seed-Code 解决工程化问题的能力,给它给一份旧代码,让它找 bug 并且进行项目重构。

测试素材是一份有多个问题的记事本项目。

(提供文件)定位这份代码的 bug,并进行结构化重构

Doubao-Seed-Code 拿到任务后先是明确了旧代码的问题,将 Bug 定位到了具体的代码行。

随后输出重构代码,还列出了优化清单。

对比两份代码,从菜单创建模块可以看出,左边旧代码结构混乱,并且没有分离设计,重构后的代码拆分了菜单与文件操作模块,并且绑定了快捷键。

具体到某个函数,比如打开文件夹模块,左边旧代码中文内容乱码,没有进行文件不存在的异常处理,新代码都进行了改善。

可以看出模型面对 " 多 Bug+ 结构混乱 " 的复杂工程问题时,具备系统性诊断与专业重构的能力。

重构后的记事本 be like:

最后进行完整项目开发,测试模型对多需求整合与落地的能力。

帮我开发一个故宫博物院的导览网站。需要包含几个主要宫殿的介绍,配上高清的馆藏文物图片。最重要的是,每个宫殿的介绍页面,都要有一个语音导览按钮,点击后能播放由 AI 生成的专业语音解说。

由于没有提前提供素材,模型在交付的代码中主动补充了图片替换教程,详细说明如何按需搜索素材并替换占位图,解决了素材缺失的问题。

从最终效果来看,网站结构完整,涵盖了核心功能模块,语音导览按钮的逻辑也已预留,并且实现了完整功能。

同时还考虑到了实际使用中的素材问题,不得不说,全面~

等一下,好像还有更有意思的事情,Doubao-Seed-Code 居然能看图写代码

现阶段,只有 Claude 系列、GPT-4V 等一些国外模型能够参考 UI 设计稿或截图生成代码。

Doubao-Seed-Code 要是能做到,那真是国产编程模型独一份了。

马上来试试!先提供一个 " 移动端咖啡点单页面 " 的 UI 设计稿:

(提供 UI 设计稿)请参考给出的 UI 设计稿图片,生成一个 " 移动端咖啡点单页面 ",生成满足所有要求的前端代码,确保页面主题明确。

点餐页面就这么水灵灵的做出来了,相似度 99%!

那另外的 1% 去哪了?

原来是为了避免素材依赖,Doubao-Seed-Code 给画了个和原图不太一样的咖啡杯(hhh

这只能说,「图片在手,UI 我有」了。

整体测完后,Doubao-Seed-Code 的实测效果,确实符合官方强调的优势特点——

国内首个支持视觉理解能力的编程模型,能够参照UI 设计稿、界面截图或手绘草图直接生成对应代码;同时,还能对已生成的页面进行视觉比对,主动识别样式偏差与功能 Bug,并自主完成修复优化,显著提升了前端开发效率;

原生兼容 Anthropic API。对于广大使用 Claude Code 的开发者,几乎零成本即可将 API 切换到 Doubao-Seed-Code。多平台适配,还对 Claude Code、Trae 等主流 IDE 进行了特别优化;

原生 256K 长上下文,在处理长代码文件、多模块依赖等复杂场景能力提升,实现端到端自主编程,全栈开发友好,前端能力突出;

当然,性能上的优势之外,火山引擎在 AI 大模型浪潮中给人的最大印象,还得是稳定又便宜。

模型够强,保障够硬,价格够低

AI Coding 愈发竞争激烈,各厂商纷纷发力卷性能卷价格卷使用保障,火山引擎也不遑多让。

最最最受关切的成本问题,也被火山引擎打到了 " 一杯咖啡价 "。

综合使用成本在业界平均水平上砍了 62.7%,在调用价格上,不仅比国际主流模型低得多,还卷到了国内最低价:

0-32k 输入区间:输入 1.20 元 / 百万 Token,输出 8.00 元 / 百万 Token

32-128k 输入区间:输入 1.40 元 / 百万 Token,输出 12.00 元 / 百万 Token

128-256k 输入区间:输入 2.80 元 / 百万 Token,输出 16.00 元 / 百万 Token

打个比方,要创建一个美观的交互式英语学习网站,在 0-32k 区间的相同 tokens 量下,Claude Sonnet 4.5 的成本约 4.05 元,GLM-4.6 约 0.77 元,而Doubao-Seed-Code 仅约 0.34 元

这不刚好双 11,火山引擎还给个人开发者安排了省钱大礼包,推出了支持最新模型的 Coding Plan,最低套餐首月仅需 9.9 元。

火山引擎自投身编程模型研发以来,从早期版本的逐步迭代,到推出如豆包大模型系列,在编程能力上可以说是持续进化。

开源了命令行 AI Agent —— veCLI,通过自然语言交互,实现从指令到代码的自动化构建与运行。

还基于编程相关模型打造了 IDE 产品 TRAE 。如今,在字节内部,超过 80% 的工程师都在使用 TRAE 辅助开发,其整体月活用户已超 100 万。

现下,Doubao-Seed-Code 和 TRAE 的组合拳更是有亮眼表现,在 SWE-Bench-Verified 基准上 " 卷 " 到了 SOTA。

Doubao-Seed-Code 在 Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands 等主流测评也表现出色,在国内同赛道模型中表现突出。

表现如此,离不开背后的技术支撑优化。

这次,火山引擎为 Doubao-Seed-Code 构建了覆盖10 万容器镜像的庞大训练库,支持端到端沙盒环境评测;依托千卡 GPU 集群,实现了万级并发沙盒 session 能力。

采用端到端强化学习,直接从任务沙盒反馈中学习,不用依赖复杂的蒸馏过程,优化路径也更高效。

另外,火山引擎还在算力和安全保障上,做了进一步加码。

背靠火山引擎的超大资源池,即便遇到多用户并行调用、复杂项目开发等高频场景,也能保持稳定响应。

同时,模型由火山方舟提供推理接口服务,代码数据传输和调用过程全程加密,不用担心核心开发信息泄露。

可以说把企业级 AI 开发,痛点都琢磨得透透的了。

不愧是宇宙厂自己先用先检验的产品和技术。

AI coding 正进入了 " 一杯咖啡 " 时代,而且还是一杯国产咖啡价格的时代。

相关标签