关于ZAKER Skills 合作
娱乐资本论 19小时前

B 站想让 AI 听懂观众笑声,人人都是卡牌设计师

作者 | 咸蛋黄

互联网企业的专利申请背后,往往藏着全新的产品布局思路。这几年,虚拟人、元宇宙、AI 等概念的兴起之前,都伴随着大厂批量申请相关专利的动作。

因此,关注专利的布局方向,有助于外界预测未来 1 至 2 年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效等关系密切。

《娱乐资本论》的月度专利总结栏目,关注互联网大厂每月在专利方面的举动,对视频、音频、游戏、AI 等领域进行相关技术溯源,追踪科技赋能商业的全过程。

音视频相关

01

自动解析剧情,生成高能片段和跳看

专利申请方:腾讯科技(深圳)有限公司

专利名称:剧情解析方法、装置、计算机设备及存储介质

申请进度:2026 年 6 月 9 日申请公布

专利摘要:小娱曾经讲过爱奇艺去年世界大会就发布了会员跳看功能,鹅厂自然也是不甘人后。该专利能自动解析视频中的剧情结构——识别出关键情节节点、人物关系变化和故事推进节奏,并生成可视化的剧情脉络图。对于视频平台的内容运营和推荐场景,系统可以据此自动打标签、生成 " 高能片段 "、甚至为不同观众推荐 " 跳到关键剧情 " 的时间节点,提升长视频的观看体验。

02

用户送礼物改写互动剧情节

专利申请方:上海哔哩哔哩科技有限公司

专利名称:剧情互动方法和装置

申请进度:2026 年 6 月 12 日申请公布

专利摘要:成熟的互动影游应该根据氪金多少决定后续剧情的走向。该专利用于互动视频,用户赠送礼物等虚拟资源时自动推进剧情。它不把礼物和剧情写死在代码里,而是给礼物分配能力标签,叠加贡献分达到门槛就解锁剧情分支。文本优先调用缓存,复杂剧情用大模型生成。和传统硬编码脚本方案不同,新增礼物不用改代码,拓展灵活,解决旧系统剧情僵硬、更新维护成本高、文案产出慢的问题。

03

AI 听笑声自动触发互动

专利名称:基于笑声识别的内容交互方法及装置、设备、存储介质和程序

申请进度:2026 年 6 月 5 日申请公布

专利摘要:B 站这个专利能实时识别视频观看场景中的观众笑声,判断笑声的类型和强度,并据此自动触发对应的互动内容——比如在观众集体爆笑时弹出特效、表情包或互动投票。系统基于深度学习模型对音频流做实时分析,区分 " 会心一笑 " 和 " 哄堂大笑 " 等不同笑点强度。对 B 站来说,这相当于给每个视频装了一个 " 观众反应传感器 ",未来番剧、综艺的弹幕互动可能不再需要观众手动操作。

04

修改视频内的人物表情

专利名称:视频编辑方法、装置、存储介质、设备及程序产品

申请进度:2026 年 6 月 2 日申请公布

专利摘要:这个专利专门用于视频里人物表情的编辑与修改。处理人物闭眼画面,可以自动改成自然睁眼状态。先用稳定面部点位做几何对齐,再用视频扩散模型局部重绘眼睛,只修改眼部、完整保留人脸和背景原图。和普通视频编辑工具不同,它保证前后帧画面不闪烁、人物样貌不变,不用逐帧手动精修,可用于访谈、影视素材抢救,解决人物频繁闭眼导致镜头作废、人工修片成本高、画面不连贯问题。

05

QQ 音乐空间音频新方案

专利申请方:腾讯音乐娱乐科技(深圳)有限公司

专利名称:一种音频渲染方法、装置、设备及计算机可读存储介质

专利摘要:该专利面向空间音频(沉浸声)的渲染场景,能根据用户设备、佩戴方式和听音环境动态调整音频的空间定位。技术路径上结合了声源分离和空间声场重建,区别于传统的固定声道映射方案。对于 QQ 音乐正在推的 " 臻品全景声 " 等沉浸式音频服务,这可能是底层渲染能力的进一步升级。

游戏相关

游戏金币交易不卡顿

申请方:网易(杭州)网络有限公司

专利名称:游戏中的代币交易方法、装置及电子设备

申请进度:2026 年 6 月 16 日申请公布

专利摘要:这款专利是给游戏做代币互换功能的,专门搭一台独立服务器存玩家挂单代币的价格、库存数据。玩家要买代币时,系统直接匹配合适的寄售订单再交给游戏服务器发放。这套方法相比市面上的老方案,可以大幅减轻服务器负担,解决兑换卡顿、加载慢的问题。对于网易旗下《逆水寒》《梦幻西游》等已有成熟玩家经济的大 DAU 游戏,这可能是下一代经济系统的基础设施。

人人都是卡牌设计师

专利申请方:网易(杭州)网络有限公司

专利名称:虚拟卡牌游戏编辑方法、装置、程序产品与电子设备

专利摘要:该专利提供了一个可视化的卡牌游戏编辑器,允许玩家自行设计卡牌属性、技能效果和出牌规则,无需编码。编辑好的自定义卡牌可以直接在对战模式中与标准卡牌混用,系统会自动检测平衡性并给出调整建议。对《影之诗》《阴阳师:百闻牌》等网易卡牌游戏来说,这等于打开了 UGC 卡牌设计的大门,是网易 UGC 战略在卡牌细分品类的延伸。

组队 AI 智能推荐装备

专利名称:游戏中的物资推荐方法、装置、终端设备和存储介质

专利摘要:这个专利是多人联机游戏的物资自动推送工具,玩家搜物资没捡的装备道具,系统会对照队友缺的装备自动发提示弹窗。传统玩法全靠打字、开语音报物资,频繁切聊天打断操作,还容易说漏,大家重复跑同一个物资点浪费时间。这套不用玩家手动沟通,系统自动匹配供需同步物资消息,减少设备运算压力,避免队友重复搜物资,组队配合更顺畅,也降低玩家操作麻烦。

动态个性化游戏新手指引

专利名称:游戏中的引导信息生成方法、装置、程序产品与电子设备

专利摘要:这款专利能自动生成游戏内实时指路标识,系统收集全服玩家停留、对战位置数据,找出大家常去的热门点位,在地图里自动弹出指引提示。传统游戏只有固定不变的静态路标,跟不上玩家真实游玩热点,玩家只能去外部查攻略。这套动态指引跟着玩家行为实时更新,新手不用找外部攻略,直接借鉴前人探索经验,轻松找到打卡、对战关键区域。

游戏关卡难度自动评级

专利名称:虚拟场景的处理方法、装置、设备、存储介质及程序

专利摘要:这个专利解决的是 " 怎么给游戏关卡 / 虚拟场景自动评难度 "。系统先拿到要评估的第一虚拟场景信息,从预先标注好难度的多个第二虚拟场景里找出跟它相似的目标虚拟场景——已标注难度的参照物;然后把目标虚拟场景的难度、和之前评估过的场景信息一起输入难度预测模型,输出第一虚拟场景的难度评估结果。本质是用相似度匹配 +AI 模型自动评难度。

AI 相关

百度 AIGC 视频生成模型专利公布

专利申请方:百度在线网络技术(北京)有限公司

专利名称:模型训练方法、视频生成方法及其相关装置

专利摘要:该专利涉及一种视频生成模型的训练方法,能通过多阶段训练策略提升 AI 生成视频的质量和连贯性。与直接生成完整视频不同,该方案采用 " 关键帧生成 + 帧间补全 " 的两阶段架构,先由模型生成视频的关键画面,再在关键帧之间补充过渡帧,提升生成效率和画面连贯性。与国内竞品相比,百度暂时没有让人印象深刻的视频生成模型,但是在数字人直播互动方面有很强的技术积累。

用大模型做内容分类

专利申请方:北京爱奇艺科技有限公司

专利名称:基于大语言模型的信息类别置信度的确定方法及相关装置

专利摘要:平时我们用 AI 做内容分类,它只会丢出一个答案,没法知道这个结果靠不靠谱,也看不出其他备选标签的贴合度。这套专利就能解决这个痛点,先把长短不同的分类词统一格式,抓取 AI 运算的原始打分数据,单独算出每个标签对应的匹配概率,加权汇总后给出每一类的可信分值。和普通 AI 分类工具不一样,它能量化所有备选标签的匹配程度,做短视频审核、文本归类时,能直观对比结果靠谱度,避免 AI 单一判断带来误判问题。

自动给视频配 BGM

专利申请方:湖南快乐阳光互动娱乐传媒有限公司(芒果 TV)

专利名称:视频智能配乐方法、装置、电子设备及计算机存储介质

专利摘要:芒果 TV 的这个专利能让 AI 自动为视频片段匹配合适的背景音乐。系统先分析视频的画面内容、节奏变化和情绪基调,再从音乐库中检索旋律、节奏、情绪匹配的曲目,自动完成配乐。相比人工一首一首地找 BGM,这套方案可以大幅提升综艺、短剧等内容的后期制作效率。

改编歌曲自动对齐伴奏

专利名称:一种改编伴奏音频对齐方法、介质、设备和程序产品

专利摘要:很多用户在 K 歌或翻唱时会对原曲做变速、变调等改编,但伴奏和人声容易出现错位。腾讯音乐的这个专利能自动识别改编后的节奏和音高变化,重新将伴奏与改编后的人声对齐,保证翻唱作品听起来 " 合拍 "。对 QQ 音乐、全民 K 歌等产品来说,这能大幅降低用户制作翻唱作品的门槛。

数字人、元宇宙

实时生成数字人应答视频

专利申请方:科大讯飞股份有限公司

专利名称:数字人应答视频生成方法及相关装置

申请进度:2026 年 6 月 19 日申请公布

专利摘要:这套数字人视频生成技术不用提前准备应答文字或音频,仅依靠用户提问视频、数字人像图就能实时生成对应回应视频。模型分两阶段完成基础生成、交互能力训练,上线后收集用户互动数据做强化学习,数字人的表情、说话风格会随聊天不断形成专属个性,告别机械复读式回复,大幅提升人机交互的真实感与情感体验。

元宇宙数字资产安全交易

专利申请方:网易 ( 杭州 ) 网络有限公司

专利名称:元宇宙数字内容安全交易方法、装置、电子设备及介质

专利摘要:这套元宇宙数字资产交易系统会结合挂单、历史成交价、市场需求和外部事件算出合理估值,划分正常、监测、异常三档价格管控。高价或低价异常资产禁止上架,支付后临时锁定数字资产规避退款欺诈,通过多节点签名核验完成确权,动态调整资产锁定期,规范市场定价同时保护平台、买家双方资金安全。

公益民生

可自动升降的 HUD 中控屏

专利申请方:小米汽车科技有限公司

专利名称:显示器系统、方法、车辆、存储介质及程序产品

专利摘要:传统车载显示屏多为固定样式,可切换显示形态的设备需手动操作,场景适配性差。小米汽车专利设计可自动升降中控屏,无需额外加装独立 HUD 设备:屏幕升起可直接显示,收纳后能向前挡风玻璃投影成像。车载摄像头采集驾驶员眼部状态自动切换模式,识别到佩戴墨镜时升起实体屏,规避投影亮度不足问题,无墨镜则收起屏幕启用平视投影,节约整车硬件成本,适配各类行车场景,优化驾乘视觉观感。

离线语音识别更优化,手表也能用

专利申请方:阿里巴巴 ( 中国 ) 网络技术有限公司

专利名称:一种语音识别系统的模型配置方法、设备和存储介质

专利摘要:弱网或离线环境下,云端语音识别延迟高,录音上传还存在隐私泄露问题,且不同设备 AI 芯片差异大,语音模型难以通用部署。阿里专利优化人声检测、语音转写、标点恢复三套模型,适配终端本地芯片,整套识别流程全部在手机、车机等设备本地运行,不用把录音传到网上。本地处理保护隐私,内存占用低、功耗小,适配手机、车载、智能手表等各类设备,同时保证语音识别精度稳定。

站着、坐着、躺着都能量血压

专利申请方:华为技术有限公司

专利名称:一种血压检测方法、可穿戴设备及存储介质

专利摘要:该方案应用于华为可穿戴测血压设备,设备内置运动传感器实时捕捉人体姿态,区分站立、坐立、躺卧三种常见姿势。设备会根据不同身体姿势调整血压测算结果,抵消姿势不同造成的测量偏差,不用用户刻意摆正身体,日常佩戴就能测出更准的血压数值,提升穿戴设备健康监测的可靠程度。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容