关于ZAKER 合作
钛媒体 前天

字节 AI 聚掌成拳,“可灵们”挡得住吗?

文 | 新识研究所

字节 AI 应用正进入加速时刻。

4 月份,字节 AI 部门 Flow 旗下发生人事变动,并将一些业务重合的应用进行整合。AI 社交应用猫箱原负责人梁琛奇离职,由原 AI 生图应用星绘负责人西原(花名)接任,且星绘团队计划并入豆包,由豆包 APP 端负责人陆游(花名)一起管理。

同一时间,AI 应用开发平台「扣子空间」正式启动内测,依托字节生态,办公场景的结构化任务执行效率更高,一上线便受到玩家追捧,被誉为字节跳动版 "Manus"。

5 月份,剪映推出了新一代 AI 营销内容创作平台「Pippit AI」,悄悄登上周榜第一。又在国内上线了两款 AI 产品,一款是搭载火山引擎的豆包大模型,可以利用 AI 一键剪辑的「剪小映」,可以理解为剪映的 " 傻瓜版 "。

另一款「小云雀」则是一款面向短视频创作者、电商营销人员以及普通用户的 AI 视频和图片创作助手,内容创作能力会更强,更专业。

自 2023 年发布文生图 AIGC 工具「即梦」以来,剪映曾一度沉寂,而近一个月内突发 3 款 AI 创作工具,作为字节 AI 战略的重要一环,到底是适时的 " 秀肌肉 " 还是被对手 " 逼急了 "?

AI 工具三连发,字节能让普通人有手就会吗?

经过新识研究所的实测,上述几款 AI 工具都有自己的强项和可取之处,但需要改进的问题也不少。

「剪小映」的功能非常简单,用户手机的本地相册内只需有拍好的照片和视频,就能根据这些素材智能成片,生成的视频可直接导出文件保存在 APP 里,或者一键分享至抖音、小红书、微信等。

创作界面内,虽然是自由选择素材,但至少要选择 3 个以上的素材才能获得理想效果的视频,AI 会对这些图片进行智能分析,制定出最适合的成片思路,包括模板推荐以及视频主题等,如果不合适,也可以自行提供思路。

像用了三张美食照片的 " 日常分享 " 模板,得到的就是很常规的抖音 vlog 风,配以优美抒情的文字和音乐,每次看到 AI 分析得头头是道,但是成品并没有太惊艳的效果,而且给的方案风格依赖预设模版,成品间不会有太大差异。

若选择的是不同类型的照片或视频,去硬凑成一个视频,剪小映也能实现,我们选取了风景图、艺术照和日常水果,AI 给出的思路就是城市生活多样之美,也算符合要求,但是图片间的关联度越少,生成的主题也会越缺乏逻辑。

不过目前剪小映不支持拍摄功能,仅能处理本地素材,无法修改字幕、配乐、画幅等,无法覆盖用户从拍摄到二次创作的全流程,更像是 " 短视频 " 速成工具,适合普通小白分享日常生活。

如果说剪小映是入门选手,小云雀就是专业选手。

与传统 AI 工具单一通用输入框不同,「小云雀」会让用户先选定场景,分为智能成片、数字人视频、AI 设计、AI 背景四个核心功能,防止生成内容偏离需求。

整个流程分为 " 创作想法 - 理解分析 - 创意脚本 - 剪辑成片 " 四个步骤,可以直接输入提示词,设置相应参数,让小云雀 AI 自己匹配素材,也可以上传本地图片素材,根据你的图片和提示词要求生成。

期间会放出 AI 的思考和决策过程,提供 4 个相关的方案,用户可以在任意环节进行修改,也可以直达最后产出阶段。

产出的海报风格统一,文案生动,视觉效果专业,比较适配电商素材和 vlog 视频,完全可以直接用于商业推广。

其中最具创设性当然是 " 数字人 AI",不仅可以用真人素材,也可以完全由 AI 生成。我们以 " 面霜广告 " 为主题,要 AI 生产一段推广视频,最终得到一段有情绪起伏、前后反差、直击用户痛点的 16 面视频,数字人表情自然,语音清晰,内容条理分明,个别片段真有些 " 以假乱真 "。

不过它也存在明显的缺点,有时候视频中的文字会乱码,生成的字幕风格比较像营销号,水印也不太好去除,还会生成一些不符合客观事实的物体和人物,加上提示词有字数限制,想详细描述场景时比较难。

总的来说,「小云雀」在商业侧强调决策效率,让创作者能够快速将创意转化为成品,在体验侧追求简洁直观,降低了技术门槛,对于电商和视频的从业者提供了一个十分高效的创作工具。

而「扣子空间」更是十项全能,不管是制作 PPT、视频、音频、写代码、生成网页 APP 都信手拈来,目前分成了探索、规划和自由三种模式,探索模式更偏向信息整理,规划模式更偏向执行任务,自由模式则是交给 AI 自己去判断用户需求。

且扣子的内容创作并不是死板的提取信息,它还会自己进行理解并把晦涩难懂的信息用更生动的方式表达出来,提供下载和分享链接。

除此之外,扣子也支持 MCP 协议,并接入了 GitHub、MySQL 数据库、云文档、天气、地图等一系列 MCP 应用,进一步简化大模型调用外部服务的流程。

尽管扣子空间降低了操作门槛,但要准确地定义任务需求,依然考验着用户的 AI 水平,需要投入足够的时间去熟悉和掌握各项功能与使用技巧,才能真正将其潜力充分发挥出来。

可以看出,字节的 AI 工具从面向个人日常到商用设计都有涉猎,争取做到 " 有手便行 " 的傻瓜式操作,对于 C 端用户的争夺可以说势在必得。

字节 AI 战线收缩,好钢用在刀刃上

浙商证券一份报告指出,2024 年字节 AI 资本开支达 800 亿元,接近百度、阿里、腾讯三家总和,其 2025 年预算再翻倍至 1600 亿元,其中 900 亿用于 GPU 采购。这一投入强度远超国内同行,甚至超过不少欧美科技巨头年度 AI 预算。

AI 助手类产品,是当下竞争最激烈,也最能体现基础大模型能力的赛道,国内主要产品有豆包、DeepSeek、元宝、Kimi 等产品,海外有 ChatGPT、Google Gemini 等产品。AI 产品榜数据显示,今年 4 月份,豆包 APP 月活 1.07 亿,位列国内同类产品第二,DeepSeek、腾讯元宝紧随其后,月活分别为 9688 万和 4143 万。

字节跳动一直以来奉行 " 饱和式覆盖 " 的策略,在 AI 领域推出了众多产品,涉及聊天机器人、AI 搜索、AI 浏览器、Agent 平台、AI 陪伴社交、AI 教育等大部分主流应用方向,但尚未在单一产品方向上形成碾压性优势。

其 AI 社交产品 " 猫箱 " 与同类产品 " 星野 " 之间难分伯仲,AI 视频产品 " 即梦 " 与快手旗下 " 可灵 " 在内容创作和商业生态上走向分野,即便是用户数据表现最突出的 " 豆包 ",也被 DeepSeek、腾讯元宝、KIMI 几大强敌环绕,时不时日活被其他竞品超越。

因此,字节开始整合旗下 AI 部门,提高资源利用率,助其找到 AI 战略的突破口。

今年 2 月份,原 Google DeepMind 副总裁吴永辉入职字节,成为 Seed 基础研究负责人,后面字节 AI Lab 全部收归 Seed 团队之下,Seed 大语言模型(LLM)之下的三个团队 Pre-train(预训练)、Post-train(后训练) 和 Horizon 也转为直接向吴永辉汇报。

其后对 Flow 部门旗下产品进行了资源整合,无论是人员变动、战略重心转移,还是内部的精简流程、聚焦主线,字节都在加速向一个以模型为核心、以组织能力为支点的转型方向迈进。

字节此前的综合产品体系,虽然凭借自身技术储备在规模上迅速扩张,但始终无法在细分赛道建立绝对优势,反而容易导致内部资源的分散。于是将自身有限资源聚焦,专注提升基础模型能力,并向豆包、即梦这类表现优异的产品倾斜,是当下字节 AI 发展的策略,这也有助于其找到 AI 战略的突破口。

随着字节 AI 在视觉生成产品上的突飞猛进,高喊要 All in AI 的快手恐成最大输家。

长期以来,快手希望可灵扮演 " 破壁人 " 的角色,通过技术和产品在专业领域的应用示范,吸引并激发 PUGC 和 UGC 创作者加入 AI 生产、消费与互动,实现快手内容生态和商业化场景的维度拓展。

不过从结果来看成效不明,今年一季度,快手线上营销服务的收入为 180 亿元,同比增幅仅为 8%,平均日活与月活用户数分别为 4.08 亿和 7.12 亿,同比增速分别为 3.6% 和 2.1%,虽有进一步放缓迹象,但依旧高于行业的平均值。

可灵虽为公司贡献营收达到 1.5 亿元,以此计算基本上稳超全年 4.5 亿收入目标,但与头部公司相比杯水车薪,特别是剪映和 CapCut 一年近百亿的总收入。

值得庆幸的是,目前可灵 AI 在推理层面已经实现了边际利润转正。随着业务规模的持续扩大,即便未来进一步增加对推理算力的投入,对集团整体利润的影响也将相对有限。同时随着技术迭代,可灵 AI 推理成本也会进一步走低。

总体而言," 可灵 " 目前仍主要依赖 C 端用户作为收入来源,B 端应用尚处于起步阶段。对于视频生成这类尚未大规模落地和普及的 AI 应用来说," 可灵 " 当前所取得的发展成果已属难能可贵。

对快手而言,若希望将人工智能技术打造成推动公司增长的新引擎,一方面要实现收入的持续快速增长,另一方面则需在增长过程中保持健康的盈利水平。

目前," 可灵 " 在技术和行业布局上展现出一定先发优势,未来如何在业务扩张的同时实现可持续盈利,仍是快手亟需破解的课题。

好在一个视频生成模型,显然是无法满足国内海量用户的创作需求的,无论抖音还是快手,虽然业务处境不同,最终都能寻得自己的一方生态位。

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容