关于ZAKER Skills 合作
金融界 2小时前

腾讯科技申请模型训练方法专利 , 提高音频合成模型输出的音频与音素的对齐精度

国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为 " 模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品 " 的专利,公开号 CN121963698A,申请日期为 2026 年 4 月。

专利摘要显示,本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取训练样本,并基于训练样本构建输入序列;通过待训练的音频合成模型,对输入序列进行特征提取,得到共享隐藏状态序列;对共享隐藏状态序列进行音频预测,得到音频预测结果,并对共享隐藏状态序列进行音素预测,得到音素预测结果;基于音频预测结果和训练样本对应的音频标签序列,确定音频损失值,并基于音素预测结果和训练样本对应的音素标签序列,确定音素损失值;基于音频损失值和音素损失值,更新待训练的音频合成模型的模型参数,得到训练后的音频合成模型。通过本申请,能够提高音频合成模型输出的音频与音素的对齐精度。

天眼查资料显示,腾讯科技(深圳)有限公司,成立于 2000 年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本 200 万美元。通过天眼查大数据分析,腾讯科技(深圳)有限公司共对外投资了 15 家企业,参与招投标项目 276 次,财产线索方面有商标信息 5000 条,专利信息 5000 条,此外企业还拥有行政许可 641 个。

声明:市场有风险,投资需谨慎。本文为 AI 基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容