关于ZAKER Skills 合作
IPO早知道 昨天

对话寻酷科技方晨 & 王珏:获千万美元级融资,「视频版 Cursor」的潜力比想象中更大

用户对做出真正好的有故事性和叙事性的长视频有非常大的需求。

本文为 IPO 早知道原创

作者|Stone Jin

微信公众号|ipozaozhidao

5 月 12 日,「寻酷科技 SEEKOO」宣布已累计完成千万美金级别的融资,投资方包括奇绩创坛、Atypical Ventures 和元璟资本。

今年 4 月中旬,寻酷科技上线了 AI 视频创作平台 Anijam.ai。事实上,寻酷科技早在 2023 年就已推出了一款名为 dzine.ai 的产品,海外注册用户数达 500 万的量级,ARR 现约为 1000 万美元。

寻酷科技联合创始人兼 CEO 方晨指出,其认为 video 这个方向的空间非常大,有很多新的增量用户,尤其是那些原来并不知道怎么做视频的用户都会加入进来,所以寻酷科技想去打造一款协助用户完成视频制作的 Agent,这也是 Anijam.ai 诞生的初衷。

据方晨介绍,在上线不到一个月的时间内,Anijam.ai 已收获了数千名全球付费用户,且用户大都通过口碑传播而来。" 这主要得益于通过我们产品制作出来的视频质量比较高,从而具有传播属性。我们看到的一种比较强的增长方式是:Anijam.ai 做出的作品在社媒上,特别是 Instagram 上,形成爆款、形成传播。"

而之所以能在短时间内获得用户的青睐和 " 真金白银 " 的支持,核心原因无疑是 Anijam.ai 较好匹配了市场上尚未满足的需求。

在寻酷科技两位创始人方晨、王珏看来,基于上一代技术(以 GAN 为代表)打造的产品并没有把高质量和容易上手这两件事统一起来;而在新一代技术的加持下,视频内容创作能够实现普惠且天花板非常之高。

" 这个增量市场比想象中大得多得多——之前大家觉得好像有这些需求的人没那么多,实际情况则是他们有需求、但没有好的工具和产品帮助他们完成这件事。一旦有了我们这样的新产品,他们的使用意愿和付费意愿是很强的。" 王珏补充道。

这里不妨补充一点,寻酷科技的两位创始人方晨、王珏在 Adobe、字节跳动、腾讯等大厂工作多年,对专业用户和普通用户的需求洞察颇深————其中,联合创始人兼 CEO 方晨曾就职于 Adobe Research、字节跳动北美 AI Lab 和腾讯北美,拥有达特茅斯学院计算机视觉博士学位。他将生成式 AI 率先落地于 Photoshop 中,并以此打造出抖音历史上使用量排名第二的移动端 AI 特效,对专业创作工具与亿级用户产品均有极深的实战理解;联合创始人兼 CTO 王珏曾担任 Adobe Research 首席科学家、旷视北美研究院创始院长、腾讯 AI Lab 视觉计算中心负责人,是 IEEE Fellow。其博士期间的研究成果直接促成了相关产品荣获奥斯卡技术奖,技术广泛落地于 Adobe 旗舰产品,并在旷视率先推动移动端计算影像技术大规模应用于手机厂商,成为行业标准方案,对从底层研究到工程化、产品化拥有全链路把控力。

某种程度上而言,这样深厚的团队背景是 Anijam.ai 能够真正满足用户需求的重要基础。" 今天去打造一个 Agent 其实并不难,难的是基于在某个领域的专业知识让几个 Agent 协作起来。而如何解决这一块的问题,关键就在于团队的背景。" 方晨坦言。

同时,方晨还透露,鉴于 Anijam.ai 产生的作品时长基本上都是 5 分钟、10 分钟的甚至 20 分钟的视频,因为 token 消耗量非常大,且用户对内容质量以及发布的频率都有比较高的要求。

谈及未来的发展空间时,王珏表示,假设未来寻酷科技能通过 Anijam.ai 把一个创意变成一个非常高质量的电影,某种程度上其实就是世界模型的一种实现。" 因为它理解了这个世界的演进、故事的演进,这就是通往更高层次的智能的一条路径。所以从技术天花板的角度来看是非常非常高的,当然也对我们提出了更高的要求。"

" 我们的愿景是让所有想要去创作创意型视频的人都能用到我们的 Anijam.ai,并且我们期待 Anijam.ai 将是一款在任何地方、任何设备、任何时间都能触达的产品。" 方晨说道。

作为新一轮融资的投资方,元璟资本执行董事任易强调,视频生成行业增长迅猛,用户对做出真正好的有故事性和叙事性的长视频有非常大的需求,而寻酷科技通过在生成模型和 agent 上的技术积累,通过产品帮助专业用户可以快速的构建出高质量的视频;在团队方面,寻酷科技初创团队来自 Adobe、腾讯、字节北美 AI Lab 等顶尖机构,科研与工程落地经验顶尖,长期搭档、深度互信。

" 优秀的产品力正在驱动寻酷科技的用户活跃度持续攀升,元璟资本也将持续陪伴公司成长,期待寻酷科技在全球赋能更多视频创作者。" 任易表示。

日前,寻酷科技两位创始人方晨与王珏向「IPO 早知道」分享了 Anijam.ai 的定位、未来的发展空间以及对 Agent 产品形态的最新理解。

SEEKOO 寻酷科技创始人方晨(右)、王珏

以下系经「IPO 早知道」整理的对话精选:

在新一代 AI 技术的加持下

视频内容创作能够实现普惠且天花板非常高

Q:你们公司的成立时间其实还是比较早的。

方晨:我们从 2023 年底开始做了一款名为 dzine.ai 的产品,海外注册用户数在 500 万左右的量级,目前的 ARR 约 1000 万美元。

Q:为什么今年开始做了 Anijam.ai 这款视频制作的 Agent 产品?

方晨:我们之所以开始做 Anijam.ai,关键在于我们发现了一个更大的新机会—— video 这个方向的空间非常大,有很多新的增量用户,尤其是那些原来并不知道怎么做视频的用户都会加入进来,所以我们想去打造一款协助用户完成视频制作的 Agent。

Q:应该和你们两位创始人的背景比较契合。

方晨:首先,我们两个人之前的工作履历都是服务专业用户,譬如我们在 Adobe 的时候就服务非常多专业的内容制作用户。后来我作为字节跳动北美 AI Lab 最早一批的员工,服务于纯 C 端的创作者。

我们其实观察到一点,普通用户对制作大量精品视频内容、高质量视频内容的需求是持续存在的。举个例子,2022 年春节的时候抖音上线了一款在手机端实时做脸部属性变换(比如性别、年龄等)的产品,15 天之内的发布量就突破了 3000 万,这已经在当时排名抖音特效发布历史排行的前三位了。

只是说,痛点在于技术本身,上一代对抗生成网络(GAN)技术所呈现出的产品效果相对一般,可能也就在及格线的水平。在我们看来,在新一代技术的加持下,视频内容创作是能够实现普惠的,这件事不可阻挡且天花板非常高。

这里我也可以分享一个细节,在我们做上一款产品的时候其实访谈过不少海外用户,其中既有专门从事视频制作的用户,也有很多非专业的,比如网文作家、学生、视频爱好者等等,他们的需求也非常强烈。在技术的加持下,很多原先非专业的用户都会加入到内容创作领域里来。即使是那些专业用户,就算是大牌的导演、制片人,他们也希望有能力孵化一些自己的 IP,而这种项目又没办法高成本地去请一个专业团队来进行制作,所以他们也需要 AI 工具的帮忙。

Agent 对生产力软件的交互是革命性的影响

基于专业知识让几个 Agent 协作起来是难点

Q:为什么选择了 Agent 这个产品形态?或者说 Agent 这个产品形态为什么能解决行业痛点?

方晨:我个人看法的是这样的。在过去,制作一段视频内容是需要一个团队协作完成的,或者至少也是一个内容创作者身兼数职来完成整个过程,是分阶段的工作流程。而这件事情刚好契合了 Agent 这个产品形态,我们的产品相当于打造了一个 "Agent 团队 ",每一个 Agent 都擅长于其中一个步骤,同时 Agent 之间互相有编排。在这个过程中,用户要是觉得哪一个地方不好,系统会自动地让负责那一块工作 Agent 启动去完成修改。一句话总结的话,Agent 能够很好地模拟或者说实现原先一个团队才能提供的服务。

另外有一个比较容易忽视的点,坦白讲今天去打造一个 Agent 其实并不难,难的是基于在某个领域的专业知识让几个 Agent 协作起来。而如何解决这一块的问题,关键就在于团队的背景,我们的团队背景相对来讲就比较深厚,能够真正打造出一个 Agent 团队、满足用户想要的内容。

王珏:我补充一点我的看法。我们在 Adobe 工作了比较长的时间,发现上一代甚至更早的技术往往最后会出现一个两极分化的现象——要么这个工具非常完备也非常复杂,但只有非常少的人能够去学习使用;要么这个工具比较简洁但没法做出来高质量的专业内容。举个例子的话,Photoshop 就是非常复杂的,Canva 就是比较简洁的有大量模板。总之上一代的技术很难把高质量和容易上手这两件事统一起来。

而 Agent 的出现,实际上对设计软件的交付,乃至生产力软件的交互都是一个革命性的影响。在使用 Agent 的过程中,用户不需要花很多的时间和精力去思考下一步要用什么工具、这个工具放在哪、怎么去用它,创作者可以沿着自己的创作思维去思考这个事情,整个创作流程会更加顺畅,门槛会更低,但同时能保证最终的质量还不错。当然,现在也不能马上达到专业用户很长时间做出的产品,但是至少可以做出一个用户相对比较满意的结果。并且,随着 Agent 技术的提升,未来产品的质量必然会越来越高。所以得益于 Agent 的出现,创作的过程和以前已经是一个完全不一样的范式了。

产品面向没那么专业的创作者群体

早期用户大都通过口碑传播而来

Q:Sora 关停了,市场对于视频生成领域的观点褒贬不一,你们和文生视频这类产品的本质区别是什么?

方晨:使用文生视频或是图生视频的用户,他们直接去调用相对底层的模型,模型能够提供给用户的更像是一个渲染器或者说一个打印机,是需要用户把他想要的画面描述得非常清楚,那部分用户可能是非常专业的用户。而我们其实更多面向的是那些制作视频或者动画没有那么专业、不知道怎样使用一些表现手法、不太懂如何叙事、不太擅长使用一些底层剪辑工具的用户。

Q:目前的用户画像是怎样的?

方晨:我们 Anijam.ai 上线不到一个月的时间就已经了数千名付费用户,大致分为两类:其一、做教育类视频的,以 YouTube 博主为主,他们需要有很多的大量的视频去起号、吸引观看;其二、做广告类视频的,主要是宣传自己产品,这些产品的表现手法不一定需要那种写实的视频。有一些大品牌也是,他们通过更加丰富的艺术手法去做视频。

Q:种子用户以及早期阶段的用户是如何获得的?

方晨:我们的用户大都是口碑传播而来的,这主要得益于通过我们产品制作出来的视频质量比较高,从而具有传播属性。我们看到的一种比较强的增长方式是:Anijam.ai 做出的作品在社媒上,特别是 Instagram 上,形成爆款、形成传播。

另一方面,我们的产品是多端的,既有手机端也有电脑端,所以我们看到手机端的这部分用户很好地承接了设备带来的流量,大量的用户是从手机端过来,并且在手机端通过简单的对话,就像跟 ChatGPT 对话一样完成制作。同时,更高质量的内容是在 PC 端进入创作的第二阶段,也就是在 PC 端完成进一步创作,这是我们目前看到的一个趋势。

用户量级和 token 消耗量远比大家想象中大

海外市场有自己独特的发展空间

Q:投资人有对你们的天花板产生过质疑吗?

方晨:首先,就像我之前提到的,用户的量级远比大家想象中大。

其次,付费用户的 token 消耗量非常高,我们 Anijam.ai 这款产品的 token 消耗量远高于我们之前做的那款产品。因为 Anijam.ai 不是帮助用户做时长在十几秒的视频,很多用户做的是 5 分钟、10 分钟、甚至 20 分钟的视频。所以一个视频做下来,对 token 的需求量是非常大的。同时,这种用户会不断持续地烧 token,因为他们对内容质量以及发布的频率都有比较高的要求。

整体而言,我们用户的画像是非常多元化的,各种各样的背景、各种各样的行业、各种各样的需求。我们认为,Anijam.ai 这类产品的天花板远高于 Vibe Coding 类的产品,其实真正 coding 的人并不多。

王珏:我还是想强调那一点,增量市场比想象中大得多得多——之前大家觉得好像有这些需求的人没那么多,实际情况则是他们有需求、但没有好的工具和产品帮助他们完成这件事。一旦有了我们这样的新产品,他们的使用意愿和付费意愿是很强的。

Q:你们的产品专注海外市场有哪些大家容易忽视的想象空间?

王珏:首先,海外用户对个性化的需求比较强。举个例子,我们的动画有角色,他们更倾向使用一些比较容易被人记住的形象,而不是通用的一些形象,这种个性化的需求实际上也会刺激他们的创作。其次,从故事创意的角度来讲,海外用户会有很多很好的创意,整体水平会比较强。

方晨:另外有一点,Anijam.ai 着眼全球化,不光面向欧美。即使在欧美、甚至即使在美国,文化也比较多元,每一种文化都想要去讲述自己的故事,去为自己的文化发声,这个诉求可能是在国内体会不到的。

接下来迭代速度与占领用户心智尤为关键

要让想进行创作视频的人都能用上这款产品

Q:你们 Anijam.ai 这款产品的壁垒有哪些?Agent 产品被诟病的一点在于 " 护城河 " 没有那么深。

方晨:对我们而言,有两件事比较重要:

第一、Anijam.ai 生成出来的视频质量一定要非常高,即我们的 Agent 需要特别聪明,我们前期就已经花了很大的精力去让我们的 Agent 能够达到专业导演的水准。目前我们评估下来,我们的成片质量在行业里最好的,特别是在讲故事这个能力上我们是最好的,我们的目标是长期保持在行业最前沿。

第二、mobile first。我们认为之后的创作会以 Agent 对话为主,那么相应的那些专业的工具都会走到幕后。所以我们从设备平台的选择上,以及整体产品的交互上都会往这个方向去走。目前,我们其实看到海外的一些竞品工具,更多还是以服务为主。我们希望能有足够的差异化,我们要更加面向未来。

王珏:说实话,今天的 Agent 还没有办法像一个高水平的导演一样把这个故事讲得非常好的。也就是说从未来的发展来看,我觉得我们的产品提升空间还是非常大的,或者说可扩展性是非常大的——我们的 Agent 首先要有对故事的理解、对视觉元素的理解、对情感的理解、节奏的理解,某种程度而言我们要把这个 Agent 变成一个真正专业的导演团队。从这个角度来看,技术的发挥空间很大,现阶段我们处于一个比较领先的身位,我们要持续保持领先。

可以设想一下,假设未来我们真的能通过我们的 Agent 把一个创意变成一个非常高质量的电影,某种程度上其实就是世界模型的一种实现。因为它理解了这个世界的演进、故事的演进,这就是通往更高层次的智能的一条路径。所以从技术天花板的角度来看是非常非常高的,当然也对我们提出了更高的要求。

Q:在接下来的产品演化迭代过程中,优先级更高的是什么?

王珏:速度无疑是非常重要的。当越来越多的用户使用我们的产品后,我们也能从用户的使用习惯和使用数据里沉淀出一些更专业的知识,从而把整个飞轮跑起来,反哺我们在技术上能够实现用户最想要的效果。

在 AI 时代,我想很难有绝对的技术壁垒,往往都是暂时性的、阶段性的领先。我们如果做得更早、做得更快,我们就更有机会占领这个用户群体的心智,后续我们发展自然就会越来越好。

方晨:在抢占先机的同时,我们当下非常关键的一点是要获得我们的用户、也就是那些创作者的信赖。如果当这些创作者想要去制作视频的时候,第一时间想到的就是我们的 Anijam.ai,或者说他们心中最便捷的方法就是在 Anijam.ai 上创作,那我想后续无论是其他的大厂或者创业公司,再想把他们转化成自己的用户,这个难度就会比较大。

Q:你们对 Anijam.ai 这款产品的长期期待是什么?

方晨:我们的愿景是让所有想要去创作创意型视频的人都能用到我们的 Anijam.ai,并且我们期待 Anijam.ai 将是一款在任何地方、任何设备、任何时间都能触达的产品。

本文由公众号 IPO 早知道(ID:ipozaozhidao)原创撰写,如需转载请联系 C 叔↓↓↓

小马智行地平线文远知行

蜜雪冰城古茗沪上阿姨

极智嘉云迹科技特斯联

相关标签
IPO早知道

IPO早知道

IPO情报专家

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容