市场对生成式 AI 编程助手的兴趣正日益浓厚。
相较于销售、客服等领域,生成式 AI 在编程领域的应用落地速度更快,且代码生成提效赋能开发者的场景已经被实践快速验证。
结合 ResearchAndMarkets 近日公布的调研报告,2024 年全球生成式 AI 编程助手的市场规模在 2590 万美元,预计到 2030 年将达到 9790 万美元,6 年复合年增长率为 24.8%。报告还指出,中国市场的复合年增长率将达到 23.5%,带动 2030 年达到 1490 万美元。
就在刚刚过去的一周,Anysphere 完成 9 亿美元 C 轮融资,OpenAI 以 30 亿美元正式收购 Windsurf,设计公司 Figma 发布类似 Lovable 的 AI 编程功能 Figma Make。
据悉,Anysphere 本轮融资由 Thrive Capital 领投,Andreessen Horowitz、Accel、Benchmark 等知名风投跟投。其估值达 90 亿美元,累计融资金额已超过 1.73 亿美元,年度经常性收入(ARR)在今年 4 月就已突破 2 亿美元。去年 11 月,Anysphere 还成功收购了另一家竞品公司 Supermaven。
而在收购敲定之前,Windsurf 的年度经常性收入在今年 4 月则达到 1 亿美元,这一数字在 1 月还仅在 4000 万美元。期间,Windsurf 还与 Kleiner Perkins、General Catalyst 等投资方洽谈投资事宜。
三大云厂商及一些老牌企业也在抓紧迭代 AI 编程工具,提供的服务功能也基本与 Cursor 和 Windsurf 类似。在此之前,AWS 开发了类似的产品 CodeWhisperer、Q Developer,谷歌拥有 Gemini Code Assist,微软则更早与 OpenAI 合作之初就推出了 Github Copilot。对于云厂商而言,AI 编程工具或许可以提高客户使用自家云服务产品的黏性。
甚至大数据厂商 Databricks 也在拟收购 Neon 无服务器数据库公司。由于 Neon 数据库支持存储 AI 模型所需的向量数据,且支持数据库实例 1 秒冷启动,这对 AI 编程助手的响应速度有重要意义。这举措也被视为 Databricks 在为支持 AI 编程助手的应用场景做准备。
同样在中国市场,这个被业内投资人视为 " 很难有发展较好的创业项目 " 的赛道,仍在不断涌入后来者。国内头部云厂商推出了自己的 AI 编程工具,AI 大模型厂商也推出了微调模型或 AI 代码工具,部分 AI 编程初创公司则在挖掘 Agent 创新应用。本周,腾讯最新推出了一款 AI 编程工具 CodeBuddy。据称,CodeBuddy 已在腾讯内部实现大规模应用,研发提效超 16%,AI 生成代码占比超过 40%。
AI 编程有多热
四大之一的普华永道不久前预估,GitHub Copilot 将企业构建 AI 应用所需时间缩短了 20% 至 30%,同时进一步降低了企业用云成本。软件设计公司 Autodesk 使用 GitHub Copilot 以实现编程自动化,并声称其工作效率提高了近 30%。微软 CEO 纳德拉近期则表示,其公司目前 20% 至 30% 的代码是由 AI 编写的。
事实上,AI 编程作为 OpenAI ChatGPT 的一大优势,也是超过 1500 万人订阅的核心原因之一。而 Anthropic 的 Claude 同样作为一款聊天应用,其软件开发已经占其所有交互的十分之一以上。
值得一提的是,当前另一个名词 " 氛围编程 "(Vibe coding),也几乎被等同于理解为 AI 编程。该名词由 OpenAI 联合创始人 Andrej Karpathy 在今年 2 月提出,因其编码方式类似于对话而命名。
按 Andrej 的说法," 氛围编程是一种新的编程方式,在这种方式下,你会完全沉浸于氛围,拥抱指数级增长,甚至忘记代码的存在。之所以能做到这一点,就是因为大模型的水平越来越高,只需要 SuperWhisper 和 Composer 两款 AI 工具完成繁重的编码工作,从而快速构建软件。在氛围编程中,无需手写任何一行代码。相反,只需表达想要的内容——某程序或功能的 " 氛围 ",然后 AI 就会自动生成代码。"
总结来看,在 AI 编程助手的发展过程中,技术创新和强烈的业务需求起到了重要推力。
首先在需求层面,随着软件项目日益复杂,传统软件的开发时间和人力成本,早已无法满足企业业务的需求。应用开发需求跟上市场节奏,以提高生产力和市场竞争力,这导致企业主动寻求能够减轻开发负担并加快开发进程的辅助工具。
其次,将编程助手集成到云原生开发环境,这与当前容器化和微服务架构的技术环境相契合。同时,开发人员的的行为也在不断演变,越来越多的专业开发者也在寻求更流畅的开发体验。
此外,目前低代码的实践与应用已经有几十年历程,在赋能非专业开发者参与软件开发的过程中,AI 驱动的低代码和无代码的兴起也进一步刺激了这一市场的活跃。
IDC《中国低代码开发平台技术评估,2024》报告此前对低代码 + 生成式 AI 融合场景进行判断:一是开发场景类,即生成式 AI 应用于低代码应用开发或开发流程中;二是应用赋能类,生成式 AI 对低代码开发平台及其所开发的应用进行赋能。
同样是提升开发效率,与一般低代码开发不同的是,目前 AI 编程助手的运作机制背后是由生成式 AI 和大模型技术驱动,这些工具由大语言模型或微调模型如 OpenAI 的 Codex 提供支持,其关键在于,需要精心构建文本输入或 Prompt,以便大模型能生成最佳结果,可生成代码片段、提供调试建议、根据自然语言提示编写完整脚本。这些也是当前 AI 编程助手的典型应用场景。
这种方式其实已经带来了软件开发方式的转变。传统上,开发软件仍然需要开发人员了解编程语言并编写精确的语法,低代码 / 无代码平台则需要预构建组件和模板,而 AI 编程助手则通过自然语言交互即简单的文字描述,即可生成可用的代码。
先驱者 Github Copilot
对于微软而言,早期开发的 Visual Studio 和 Visual Studio Code 系列产品,在全球的开发者群体中的使用和反馈非常良好。到后来的 IntelliCode、Power Platform,微软在编程提效方面积累了大量经验。
这种强大的编程产品和生态能力,也让 Github Copilot 在 2021 年 10 月公布预览后的几年内,迅速成为使用最广泛的 AI 编程助手之一。据悉,目前已有 77000 家组织在采用 Github Copilot,其付费订阅用户已超过 180 万。而 Github Copilot 最大优势在于能够与主流集成开发环境 IDE(Visual Studio Code、Visual Studio 和 Android Studio)集成,其理念是将 GitHub Copilot 深度集成到现有工作流,以 API 插件方式提供给用户。
在定价方面,Github Copilot 同样具有一定竞争力:针对个人用户,每月 10 美元或每年 100 美元(如 Cursor 的订阅价格为每月 20 美元,专业版);同时也会提供针对更复杂协作团队的企业解决方案。
模型层面,Github Copilot 最初依赖于 OpenAI Codex,去年 10 月,Github Copilot 最先接入了 Anthropic 的 Claude 3.5 Sonnet、谷歌的 Gemini 1.5 Pro 以及 OpenAI 的 o1-preview 和 o1-mini 等多个模型,使开发者企业能够跨 VS Code 和 GitHub 等工具选择适合特定编码需求的模型。
目前开发者正在寻求不同的模型来执行代码生成、重构和优化等任务,从而实现跨编程环境的灵活、高效和高质量的编码。比如,Claude 3.5 Sonnet 擅长编码任务,并因其对软件工程原理的出色掌握和应对复杂编程挑战的能力而被开发人员广泛使用。这意味着,AI 编程不仅由多模型功能定义,也由多模型选择定义。
今年 2 月,Github Copilot 推出了 Agent 模式预览版,能够进行任务理解规划、迭代自身代码,并自动修复错误。
可以看到,尽管 Github Copilot 较早普及面世并影响了开发者的使用习惯,但 AI 编程助手的阵营在生成式 AI 广泛影响后才开始得到迅速扩充。目前主流产品基本以 API 插件与 IDE 集成,或基于 IDE 二次改造实现,辅助人类开发者完成各类编码动作的 Copilot(辅助)模式,比如内嵌在编辑器侧边栏,并有迹象进一步向 Agent(AI 代理)模式探索。
Cursor 的开发商 Anysphere、Windsurf(原 Codeium)、Poolside、Souregraph、Devin 的开发商 Cognition、Magic、Codeium、Replit 等 AI 编程初创公司在 ChatGPT 火热之后陆续出场。
后来者的机会
Cursor 是当前 AI 编程领域 Copilot 的代表性产品之一。它在大模型火热之后出现,作为较新的参与者,Cursor 已经获得业内用户相当多的关注,甚至被捧为 "Github Copilot 杀手 "。最新公开信息显示,Cursor 已服务 30000 名客户,包括 OpenAI、Midjourney、Perplexity 等知名企业。
在产品形态上,Cursor 编辑器采用双屏交互设计,左屏显示代码,右屏集成 AI 对话助手,支持开发者用自然语言指令修改代码,并提供智能、手动、问答三种模式提升效率,因而在使用体验上会更加丝滑。
与 IDE 集成模式不同的是,Cursor 作为 VS Code 的分支,是一个独立的 AI 编程助手。这也是 Cursor 在工程层面能够凸显的关键——不对 VS Code 做插件,而是对 VS Code 进行二次改造,在底层兼容多个 AI 大模型,包括 Anthropic 的 Claude 3.5 Sonnet、OpenAI 的 GPT-4o 等。
目前,Cursor 也推出了 Agent 功能,旨在独立为用户完成部分任务,包括跨项目工作、生成多文件代码、执行命令、自动寻找上下文,适合大规模重构和复杂任务的自动化处理。
另一方面,Cursor 的开发商 Anysphere 一直在努力控制成本,包括计算资源方面的支出,如开发基于专家混合架构(MoE)的新型算法以降低计算资源消耗。去年,该公司还推出了自研模型 Cursor-Fast,其代码生成能力据称介于 GPT-3.5 与 GPT-4 之间。据最近透露的信息来看,Anysphere 的最新一轮融资正是用于降低对第三方供应商的依赖,此举或有助于提升其产品利润率和技术自主性。
尽管 Cursor 已经成为其中最引人注目的一匹黑马,但 Cursor 的竞争对手也不算少数,或者说同类型的 AI 编程工具级产品实在太多。站在开发者的视角,会在最熟悉、最习惯的平台上开发工作,但同时也会在多个平台间进行互操作。企业开发环境也在跟随云计算、AI 业务需求的转变保持跟进。
Wing VC 合伙人 Zachary DeWitt 在其专栏中提醒道:" 微软也可能简单地切断 Cursor 和竞争对手与 VS Code 核心 API 的连接或更改条款,使其更难在更新的基础上构建。Cursor 对 VS Code 的依赖显示了建立在他人平台上的不稳定性。"
目前被 OpenAI 敲定收购的另一家初创公司 Windsurf 同样增长迅猛。自 2024 年底发布以来,4 个月内用户数破百万、年度经常性收入(ARR)超过 1 亿美元、企业客户数量超过 1000 家。对需要体验轻松便捷 AI 编程的学生和业余开发者而言,Windsurf 无疑是最优选择。在技术层面,Windsurf 目前同样选择了自己做 IDE,而不是作为 VS Code 的插件。
此外还有 Replit,提供了 Ghostwriter AI,这是一个基于浏览器的 AIDE(人工智能开发环境)。
而在 Agent 功能进展方面。Cursor 和 Bolt 于 2023 年推出了首款 Agent 产品,Replit 和 Devin 则在 2024 年发布了其 Agent 产品。相较之下,Cursor 体积稍大,需要下载,主要面向于专业开发者;Bolt 没有移动端,主要基于网页端,方便初学者轻松上手;Replit 的代理还提供 AI 提示符调优功能,以帮助生成最佳代码,且完全在云端运行。
生产力提升≠效率提升
不过,处在探索期的 AI 编程助手自面世至今也同样备受质疑与挑战。尤其是对于面向的直接使用方——开发者群体而言,AI 编程很容易被视为前端的 " 玩具 ",前端看起来很酷炫,但在一些复杂的代码编程问题中,可能根本使用不了。而更多的用户则关心:
"AI 编程最大的问题在于测试,如何保证代码完全没有问题?尤其是关键数据业务。"
"AI 对于从 0 到 1 的项目是很好用的,但对于老项目,就很难让 AI 理解全部业务逻辑,这导致老项目用 AI 就会很局限。"
" 后台数据库如何管理和保密。从前端的角度来看,只用 GPT 等大模型应用就足够了,单独做一款产品的优势和价值是什么?"
当下的 AI 编程助手背后是由大模型技术驱动,这就意味着仅在 AI 代码生成这一环节依然存在 " 似是而非 "、" 正确的废话 "、" 机制不透明 "、或者代码安全等问题。不少人员反馈,AI 编程助手目前也存在局限性,如经常输出错误结果,或者无法生成与用户意图一致的代码,用户要么自行修复代码,要么只能不断修改 prompt 以期待生成最佳结果。
今年 4 月,Cursor 的客服 AI 出现问题,导致大量用户取消订单。一名 Cursor 用户在 Hacker News 和 Reddit 上发帖称,在切换设备时,账户开始莫名其妙地被注销。出于疑惑,该用户联系客服,却只收到一封 "Sam" 的邮件回复,称根据新的登录策略,账户注销是 " 正常现象 "。 后被证实,该回复是由 AI 完全编造的解释。
除了花大量时间修改 prompt 或创建一个冗长的 prompt,开发者还需要花时间审查 AI 生成的代码。早在去年 10 月,笔者就注意到一则信息:企业将 GitHub Copilot 集成到软件开发平台后,编码时间可减少 50%,但开发者用上 GitHub Copilot 的同时也导致 Bug 增加了 41%。
这意味着,代码提效的问题解决了,但并没有带来 AI 预期的——开发团队的整体生产力提升。
Datasette 创始人 Simon Willison 近日在博客中写道:" 对于软件开发而言,其工作其实远不止于编写大量代码和实现功能。不仅要创建出可演示、可运行的代码,更要保证这些代码具备良好的可理解性,既便于其他开发人员阅读,也利于机器处理,同时要确保代码能够支持项目的未来持续开发。需要综合考虑多个关键因素,如性能表现、可访问性、安全性、可维护性以及成本效益。"
在他看来,倘若开发人员利用生成式 AI 编程,在将生成的代码纳入项目之前,必须进行仔细审阅和全面测试,确保自己能够向非 AI 编码背景的人员解释清楚其工作原理。只有满足这些条件,其工作才能称之为真正的软件开发。
而从需求端来看,当下环境下迫于经济压力,企业 IT 支出哪怕在整体不缩减的前提下,为生成式 AI 等创新应用付费,也意味着将减少其他原有软件的支出。一些在考虑使用 AI 编程的企业软件高管,其关注点是该项技术能不能用于开发 Salesforce、SAP、Workday 和 ServiceNow 等较为昂贵的企业软件的低成本替代品。
趋势上,AI 编程可能也不再局限于自动执行代码重构、版本管理和测试等常规务来提高生产力,而是进化到 " 全流程开发 Agent"。未来最核心的产品变革或突破点可能也在于这一点。
但无论如何,不同 AI 编程助手在开发圈层的影响力还有待进一步扩散。先一步用上 AI 编程的开发者或企业,或许也在暗暗尝试,这种全新的开发体验究竟能走多远。(本文首发于钛媒体 APP,作者 | 杨丽,编辑 | 盖虹达)