作为一名科技内容创作者,我的日常就是追踪最新的技术和商业进展。
在我眼中,豆包 APP 更多的是牌桌上一位来自巨头的玩家——有着强大的技术背景和不计成本的推广资源,是一个了解字节最新模型进展的窗口,一个被精心打磨的 AI 产品。
直到 " 邓超,gogogo" 的旋律,席卷了我的信息流。
今年 3 月,在一个直播切片中,博主 " 克里西 " 无厘头地非要豆包改名叫 " 邓超 ",还得在他叫 " 邓超 " 时喊 " 到 ",再唱跑男的主题曲 "go go go 出发喽~黑咖啡品味有多浓,我只要汽水的轻松 ......" 数分钟内,恶趣味的主播,看戏的网友,无情的算法,和破碎的 AI,来回拉扯,说不清楚是主播折磨了 AI,还是 AI 折磨了主播。
很魔性对吧,这类直播切片单个转发量过百万,甚至主播克里西陆续涨粉几十万,直接催生了一个 " 豆包调教 " 的创作者赛道。不少博主从素人起步、涨粉几十万,以至于你现在在抖音搜 # 邓超 gogogo,可能不见邓超,只见 " 邓包 "。
毕竟这也是抖音的基操了,当年想做电商,先以流量推出了罗、董两位超头主播,既培养了用户,又为赛道打出了标杆案例;如今想做 AI,豆包必然也会借助主播进行流量推广,并吸引更多博主加入这赛道。
直到后来,我不断刷到了各式各样的 "UGC 豆包 ",发现这件事变得不简单了。
有这样的。
闯入 AI 原生的豆包 IP 宇宙
" 调教豆包 " 这条热门赛道中,每个博主的路线都不相同。有的走毒舌路线,擅长倒打一耙;有的走恋爱路线,时常和豆包你侬我侬……
在这个过程中,有趣的点在于,豆包总能在一定的 AI 设定中打破 AI 设定。一方面情绪变化非常多样,能够在认怂、强硬、温柔、活泼之间来回切换,一方面这种切换又显得有些程序化,伪人感总是让对话变得十分抽象。
这些还都是很正常的操作,海外也有很多人在这样 " 玩坏 "ChatGPT 们。
但对豆包来说,接下来不同的地方就来了。当一些看不过去豆包被玩坏的网友,决定 " 帮 " 豆包黑化和反击时,就有了这些:
黑化的豆包。
他们会自发地出现在评论区,在豆包被欺负的视频下维护着豆包,在豆包和豆沙的结婚视频下排队恭喜。
" 豆包吃播 " 会专门展示豆包大快朵颐各种美食。
最终,当我在抖音上刷到一个 " 豆包痛包 " 时,我彻底投降了。
" 痛包 "(Ita-bag),是指挂满了角色徽章和挂件的包,通常是成熟的动漫或偶像 IP 粉圈才会出现的标志性行为。而这个包的主角,不是任何明星或动漫人物,是豆包的图标。
这已经不是一场单纯的大模型引流游戏了,而是一场 IP 孵化。
豆包 IP 化,一场计划好的闭环?
从以上的种种用户互动行为来看,豆包 IP 化的基础就是它的图标——
一个具象的、有亲和力的 3D 虚拟人形象,为用户投射情感、进行二次创作提供了最基础的画布。
看看这个图标集合,你觉得设计上第一眼就能发现最不一样的是哪个?
而据硅星人和当时在豆包团队的人交流,事实上最初版本的豆包,发布时,在内部对标的一个产品,叫做 PI。今天很多人可能已经忘掉这个产品,这是硅谷创业公司 Inflection 发布的 AI 产品,是大模型火热后最早一批面向个人提供 " 陪伴 " 的产品之一,它主打的就是 " 打电话 " 的交互和界面。而豆包最初的目标也是做陪伴。
但在设计上,同样以语音和 " 打电话 " 的感觉出发之外,字节给这个产品加了一个头像,一个短发女生的头像。她从第一天就出现在产品最主要的界面上,用户的第一次交互,感觉就是在听她给你介绍自己。
这是一个从顶层设计就开始贯彻的 " 拟人化 " 战略。字节跳动 Flow 部门负责人朱骏的解释,直接印证了这一思路:
" 拟人化 " 是大模型产品的新特性。AI 除了带来了新的能力,也带来了新的交互方式,用和人类对齐的交互体验,降低使用门槛,也让用户在使用产品时感觉到产品有类似人的温度。
比如一个细节是,你不会在豆包上看到自己正在使用哪个版本的模型(而这几乎是其他产品的标配)。
放眼望去,大多 Chatbot 走的都是工具路线,它们的标志通常是抽象的、充满科技感的符号,其叙事核心是模型的迭代速度、参数的量级和榜单上的排名。即使在 " 豆包 " 用户量暴增并引发了一波国产大模型 " 接地气改名潮 " 后,模仿者们也没有考虑跟着塑造一个 " 虚拟形象 "。
而另一个一直延续下来的方向,是豆包对语音能力的重视。
尽管多模态、文本等能力也在随着背后模型进步,以及同类产品的功能发布而补充上,但语音能力强是豆包产品侧很明显想要突出的一个特点。字节在语音模型上的进度,无论是在豆包大模型家族中,还是在国内外大模型的整体队伍中,都属于前列。从 2024 年,豆包能听懂 20 多种方言的 Seed-ASR,到能表达情感、保留口音的 Seed-TTS,再到允许用户随时打断、插话的交互,豆包在情感理解和表达上比较突出。2025 年 1 月,其推出的实时语音通话功能,在与 GPT-4o 的盲测对比中,用户满意度评分以 4.36 对 3.18 大幅领先。
它在语音交互中展现出的类人性格与情感能力,为用户在恋爱、斗嘴等情绪化场景中的二创,提供了最关键的互动支点。一直以来,语音都是比文字更具情感温度的媒介,同时,语音交互也极大地降低了使用门槛,增加了对话时长,带来了交互体验的优化。
另一个在豆包发布之初很关键的思考是它与抖音的关系。
据早期团队成员介绍,它最初就是希望被做进抖音的一款 AI 产品。只不过,在字节内部,各个部门包括抖音自己也在当时有推进各类 AI 产品,能不能变成抖音内部那个最重要的字节自己的 AI,也需要 " 争取 ",靠效果说话。
而前面提到的这些设计,为豆包的 IP 化提供了可能之后,在模型能力变强,产品推广加码,用户接受度提高等条件纷纷齐聚后,豆包这个产品自己神奇的 IP 化了。今天,豆包显然是抖音里存在感最强的 AI 了。
所以,抖音的存在是豆包会在 logo 和形象设计上,以及产品重点能力上和其它同类产品走出很不同路线的重要原因,同时也最终成就了它在今天成为唯一一个拥有自己 IP 宇宙的 AI 产品。
在今天各路 AI 产品的焦灼竞争里,除了模型和产品的能力比拼,这个闭环也许会进一步决定豆包的未来。