关于ZAKER Skills 合作
钛媒体 6分钟前

微软、谷歌都盯上的 Genspark,成了第二个 Manus

文 | 新立场 Pro

Manus 事件后,硅谷 AI 创投圈最常被讨论的问题变成了:谁会是下一个 " 幸运儿 "?其中一个答案指向了Genspark

Agent 入口产品历来稀缺,Genspark 被推到台前,是因为它在商业化维度给出了 AI 应用层少有的硬数据。去年 5 月 19 日,景鲲在 X 上晒出产品上线 45 天 ARR 达 3600 万美元的成绩,付费用户首月留存率稳定在 88% 至 92% 之间,令海外企业震惊,纷纷询问 Genspark 背后的公司是什么。今年 3 月,Genspark 曾放出消息,其 ARR 已达 2 亿美元。

这些数字在当前 AI 应用层创业公司中属于异常值,在没有大额补贴的情况下,Genspark 可以不完全依赖新用户的持续涌入来维持运营。对任何潜在收购方来说,这种 " 资本韧性 " 都比漂亮的月活数字更有说服力。

站在 Genspark 背后的,是一个在当前 AI 产业里颇为罕见的创始人组合。景鲲的履历贯穿搜索、语音 AI 和硬件生态:在微软负责必应搜索亚洲研发,是微软小冰的早期缔造者之一;加入百度后主导小度音箱规模化,出任小度科技 CEO。联合创始人朱凯华曾任谷歌主任架构师,后任小度 CTO,两人在百度共事 11 年,此次是二度联手创业。

这个背景组合的意义不只在于资历背书,景鲲在小度时期积累的核心能力,是在技术尚未成熟的窗口期,快速把模型能力封装成用户愿意持续付费的产品形态,并推动其进入大规模商业场景。这种能力在 Agent 赛道里的价值,远比纯技术背景更直接。

雷锋网此前报道,Genspark 团队刻意在业务和公关层面靠近谷歌,以刺激微软的收购意愿。这种操盘逻辑并不复杂:利用两家巨头在 AI 入口问题上的竞争焦虑,把自己的估值锚定在一个更高的起点上。

但从 4 月 29 日那份合作公告的实质内容来看,微软与 Genspark 之间显然已经不只是普通生态合作。景鲲对老东家的战略价值,正在从竞购筹码转化为产品层面的深度嵌入。离开微软二十年,走过百度,走过小度,景鲲最终还是将自己的产品带回了老东家的生态体系。但相比一个偶然形成的并购故事,这更像是 Genspark 从一开始就为自己预留的战略出口。

AI 应用层的一门硬生意

Genspark 的吸引力,来自它有 AI 应用层罕见的商业数据组合。

融资时间线本身就说明了市场的判断。Genspark 于去年 11 月完成 2.75 亿美元 B 轮融资,投后估值 12.5 亿美元;今年 3 月 B 轮扩展至 3.85 亿美元,估值升至 16 亿美元;ARR 同月突破 2 亿美元。去年 10 月的开发者大会上,Genspark 被 OpenAI 纳入 " 万亿 Token 俱乐部 ",意味着它是少数能稳定消耗超大算力、展现高频复用能力的第三方客户之一。

在 AI 应用层,大多数产品面临的困境是:流量好但付费率低,或付费用户少但 ARPU(每用户平均收入)高。Genspark 的组合是付费留存高、单位经济效益强、资金消耗低,三者同时成立,属于当前 AI 创业公司里的异常值。

这背后有产品架构层面的具体原因。Genspark 的核心架构是 MoA(Mixture of Agents,多智能体混合),同时调用 70 余种专业大模型,通过 Agent Engine 的模型编排与改进循环两个关键机制完成任务执行。CTO 朱凯华将团队理念概括为 " 少控制,多工具 " ——不追求中心化智能,让系统自己找到最优解。

这个架构选择的商业意义在于可扩展性。单一模型架构的产品,其能力上限由所依赖的基础模型决定,MoA 架构则可以随着新模型的涌现不断引入更强的专项能力。5 月 8 日凌晨,OpenAI 发布 GPT-Realtime-2,称其将 GPT-5 级别的推理能力带入语音 Agent;几个小时后,Genspark 即宣布其 Call for Me Agent 已接入该模型,Genspark Realtime Voice 也将随之升级。

模型公司每一次把专项能力往前推一步,Genspark 都可以在不重写产品底座的情况下,把这部分能力转化为用户可感知的功能提升。对企业用户来说,这意味着他们的付费价值不会随模型迭代而迅速贬值,这正是 Genspark 留存率长期高于同类产品的技术层面解释。

产品定位同样清晰。Genspark 聚焦办公自动化、数据分析和文档生成三个高频企业场景,从 AI 搜索起步,2024 年完成向 Super Agent 的转型,几乎保持每周一次的更新节奏。《雷锋网》在报道中披露,Genspark 能在一个月活用户身上赚到约 0.8 美元,退订率仅为 Manus 的三分之一。

景鲲的个人背景是这套商业逻辑不可忽视的变量。在微软负责必应搜索亚洲研发时,他处理的正是搜索算法与用户意图之间的匹配问题;主导小度音箱时,面对的是如何让一个技术还不够成熟的语音 AI 系统,进入千万级家庭并产生稳定的使用习惯。这两段经历的共同主题,是在技术尚未完全就绪的窗口期,快速把能力包装成用户可以接受的产品形态,并推动商业化落地。

小度后来能被资本市场推到接近 50 亿美元估值,决定性因素不只是语音交互本身,也是景鲲在智能音箱这个阶段性入口上,把技术、硬件、内容和渠道压成了一个可规模化复制的消费产品。

相比之下,今天的小度仍在寻找下一个确定入口,闺蜜机、AI 眼镜等新品或许能制造话题,但一个更像被场景预设出来的需求,一个更像对行业风口的跟随,还没有证明自己具备当年智能音箱那种改写用户习惯的开创性。

搜索到 Agent 的转型,是景鲲对 AI 应用层下一个重要战场的主动判断。他在一次内部分享中说,一家 50 人的公司如果每个员工都可以无限使用 AI,已经可以跑赢一家没有这种能力的 500 人公司。这句话描述的不只是 Genspark 的产品理念,也是他对 Agent 赛道价值密度的判断:AI 的价值,是让一家公司以更少的人,承担过去只有更大组织才能消化的工作量。

Genspark 的团队结构以中国人为核心、但配置了硅谷背景成员的混合团队,兼具国内互联网大厂的工程密度与硅谷产品公司的对外叙事能力。这让它既能在短周期内实现复杂功能上线,也能顺畅对接国际机构投资人和媒体。这种双轨能力,在当前 AI 创业公司里并不常见,也是它能以纯硅谷公司身份参与并购谈判的基础条件之一。

交付是护城河,也是天花板

Genspark 的产品价值是真实的,但它目前的交付质量与 "AI 员工 " 的自我定位之间,还存在一段可量化的距离。

从实测体验来看,Genspark 的核心优势是降低从模糊需求到结构化初稿的摩擦成本。用户提出一个复合型任务,比如整理一份行业竞争对手报告、生成一个带数据可视化的分析表格、或者把一份文字会议记录转化为 PPT。Genspark 能够调用顶级模型(包括 Opus 4.7)和多种内置工具,跨步骤完成任务,最终输出一个可以直接使用的文档初稿。用户不再需要分别打开搜索引擎、数据工具和文档软件逐步拼接信息。

但当任务复杂度超过某个阈值,这套系统的局限开始显现。《新立场》实测,处理多变量筛选任务(如按特定条件筛选人员列表并按粉丝量排序)时,Genspark 响应时间明显拉长。

原因在于 MoA 架构本身的结构性取舍,其多模型调度本身有延迟成本:每一层任务拆解、模型选择和结果整合都需要额外调度时间。多模型调度带来了更强的专项能力和更好的结果质量,代价是可感知的延迟,用户会感受到自己在 " 等 AI" 而不是 " 和 AI 协作 "。

排版和结构的问题同样真实存在。此前有媒体报道,Genspark 生成内容的版式有标准化倾向——标题位置固定、布局遵循模板,用户难以在保持 AI 生成内容的同时进行个性化定制。从技术角度,这个问题的根源是模型生成结构化文档时,倾向于选择训练数据中频繁出现的版式模板,因为这些模板在统计上更 " 安全 ",但同时也最缺乏个性化适配能力

因此,郎瀚威团队此前对 Genspark 的测试定位是:初级实习生水平。它能完成结构性框架搭建,输出大致可用的初稿,但最终判断、细节审美和修订仍需人工接手。

相较之下,字节 AnyGen 在《新立场》实测中,交付质量、UI 精细度和单次使用深度上均有优势,免费可用积分也更充裕。这种差距反映的是两种产品的设计取向分歧:AnyGen 在单次交付质量上精耕细作;Genspark 则用更宽广的工具覆盖和更高密度的迭代节奏留住用户,主动以质量上限换取场景覆盖密度。

这个取向差异背后是两种商业逻辑。专注单次交付质量的产品,适合用户基数小、付费意愿高、任务专业性强的垂直场景;覆盖密度优先的产品,适合高频低强度任务的水平扩展,依靠工具丰富度和更新频率建立用户粘性。用户留下,并非因为每次输出都完美,是新模型、新工具不断出现、使得 Genspark 整体价值持续积累而续费。

因此,这种 " 强在交付,短板也在交付 " 的现实,并没有削弱 Genspark 的并购价值,反而强化了它作为技术补充型资产的吸引力。微软和谷歌所需要的,并不是一个能够替代顶尖知识工作者的 AI 系统,是一个能帮助普通知识工作者减少从 " 有想法 " 到 " 有初稿 " 之间摩擦的工具,Genspark 目前的能力边界恰好覆盖了这个需求密度最高的区间。

对潜在收购方而言,一个交付能力已经完美的产品反而不那么有吸引力,它可以独立存在,不需要被并购。真正理想的收购标的,是一个商业框架已经清晰成立、产品价值已经被市场验证、但在打磨空间和整合潜力上仍有明显余地的公司。Genspark 当前的位置,精准地落在这个空白上。

回到微软,可能是早已写好的结局

Genspark 总部位于加州的帕洛阿尔托,创始团队由来自微软、谷歌、Meta 等硅谷科技巨头的资深专家,除了曾在微软的景鲲,朱凯华也曾是谷歌的主任架构师。作为一家有着最纯粹的硅谷基因的公司Genspark在当前地缘政治背景下面临的监管压力和舆论阻力远小于 Manus。但这只是并购成立的前提条件。

利用微软与谷歌之间在 AI 入口问题上的竞争焦虑,把自己的估值锚定在一个更高的起点上,这套操盘逻辑不复杂,但执行需要对双方决策心理的精准判断。谷歌对 Genspark 感兴趣的动机,集中在搜索入口的防御。Genspark 最早便是以 "Sparkpages" 概念切入 AI 搜索,试图用 AI 生成的结构化信息页面直接替代传统蓝链,积累超过 500 万用户之后才转向 Agent 赛道。

微软的逻辑则完全不同。它面临的问题是执行层的空缺。Copilot 本质上是一个嵌入式 AI 助手,可以帮用户修改文档、总结内容、生成草稿,但它缺乏跨应用自主执行复杂任务的能力。用户仍然需要在不同工具之间手动切换,把 AI 的输出搬运到下一个工作环节里。Genspark 的 MoA 架构,恰好覆盖了 Copilot 当前缺失的这个执行层。

《新立场》由此认为,Genspark 团队对谷歌的靠近更多是用来激发竞争对手的收购意愿,微软才是需要被说服的那一方。这是一场目标明确、战术刻意制造竞争紧张感的谈判,并非机会均等的竞购。

4 月 29 日,Genspark 官方公告称,Genspark 与微软建立全球战略合作伙伴关系,其 AI Slides、Sheets 和 Docs Agent 以原生插件形式嵌入微软 365,基础设施全面部署在 Azure,并计划进入 Agent 365 和微软 Marketplace。

微软商业业务 CEO Judson Althoff 在联合声明中的措辞,明确强调了 " 在工作流中感受 AI 价值 ",而非功能演示,这些连接一旦建立,就会产生双向依赖:Genspark 的产品迭代开始围绕微软企业生态展开,微软企业客户开始在日常工作流中使用 Genspark 的能力。从技术整合角度看,这已经具备了并购前深度绑定常见的特征。

景鲲本人的微软背景,是这条路径更容易走通的另一个原因。他在微软负责必应搜索亚洲研发期间,建立了对微软内部决策结构和产品哲学的深度理解。微软对景鲲而言不是陌生的谈判对手,而是他职业路径的起点。这种认知上的对称性,在并购谈判的每一个细节上都会产生效果。

只是,战略上越匹配,产品上的冲突反而越难回避。Genspark 是一家以 AI 为核心的 "AI+" 企业,它的工作方式是用 AI 重新定义任务执行的起点,用户先有 AI,再有工具。微软 Copilot 目前的模式更接近 "+AI":在已有的 Office 工作流里嵌入 AI 辅助能力,软件工具仍然是用户交互的主体,AI 是附着在上面的能力增强。这两种产品哲学的冲突,在并购完成后会直接体现在产品路线图的决策上。

Genspark 当前产品能力,部分依赖于它对 Anthropic 和 OpenAI 等顶级模型调用的灵活配置,进入微软生态后,Azure OpenAI 服务和 Copilot 技术栈会对这种配置自由度形成多大程度的约束,将直接决定 Genspark 能否在并购后继续保持它目前的能力优势。

对一家以 "AI 员工 " 为叙事核心的创业公司来说,这些是并购本身必然带来的代价。历史上,硅谷对 AI 原生产品的收购,结果往往是两种:要么被完整保留独立运营,如 Slack 被 Salesforce 收购后的早期阶段,要么被快速吸收进母公司产品线而失去原有特色。

但也正因为这些代价过于清晰,景鲲仍然把 Genspark 推向微软生态,反而说明这未必是一个被动选择。Genspark 如果继续独立,需要持续承担模型成本、获客成本、企业销售成本和巨头竞争压力;进入微软,则意味着它可以把最难的企业分发、基础设施和信任门槛交给老东家解决。

这也让 Genspark 的并购叙事变得更耐人寻味。它并不是一个先做大、再被巨头看上的标准创业故事,更像是一家公司从产品形态、客户场景到生态接口,都在逐步把自己调整到微软能够接住的位置。

Genspark 并购后的失去独立性、失去部分原有特色、乃至从 AI Native 向微软工作流妥协,并不一定是景鲲没有预料到的结果;相反,它可能正是这条路径从一开始就包含的终点。

* 题图及文中配图来源于网络。

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容