关于ZAKER 合作
36氪 刚刚

小米宣布开源声音理解大模型 MiDashengLM-7B

36 氪获悉,小米发布和全量开源了 MiDashengLM-7B 模型。MiDashengLM-7B 声音理解性能在 22 个公开评测集上刷新多模态大模型最好成绩(SOTA),单样本推理的首 Token 延迟(TTFT)仅为业界先进模型的 1/4,同等显存下的数据吞吐效率是业界先进模型的 20 倍以上。在当前版本的基础上,小米已着手对该模型做计算效率的进一步升级,寻求终端设备上可离线部署,并完善基于用户自然语言提示的声音编辑等更全面的功能。

36氪

36氪

让创业更简单

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容