关于ZAKER 一起剪 合作 加入
钛媒体 2021-12-08

百度联合鹏城实验室发布全球最大中文单体模型鹏城 - 百度 · 文心

钛媒体 12 月 8 日消息,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城 - 百度 · 文心(模型版本号:ERNIE 3.0 Titan)。同时,百度产业级知识增强大模型 " 文心 " 全景图首次亮相。

鹏城 - 百度 · 文心大模型发布

鹏城 - 百度 · 文心的关键词是 " 全球首个知识增强千亿大模型 ",该模型参数规模达到 2600 亿,是目前全球最大中文单体模型,在机器阅读理解、文本分类、语义相似度计算等 60 多项任务取得最好效果,并在 30 余项小样本和零样本任务上刷新基准。

据了解,百度文心已大规模应用于百度搜索、信息流、智能音箱等互联网产品,同时通过百度智能云对外输出,例如在金融领域,基于百度文心实现了合同智能解析,能够在 1 分钟内完成对相关合同条款文本的解析识别,速度是之前的几十倍,大大提升了工作效率。百度智能云的智能客服也基于百度文心提升了服务的精准性,目前已经在中国联通、浦发银行等企业应用,拓展到全国各地。

在鹏城和百度的合作中,鹏城实验室主要提供算力系统 " 鹏城云脑Ⅱ ",百度主要依托于飞桨深度学习平台开展工作。" 鹏城云脑Ⅱ " 是国产自主的首个 E 级 AI 算力平台,曾在多个国际性能测试上获得冠军;飞桨是我国首个自主研发的深度学习开源开放平台,研制了端到端自适应分布式训练框架,实现多硬件支持,并行效率高达 90%,有效支持鹏城 - 百度 · 文心千亿大模型高效、稳定地训练。

" 文心 " 全景图

双方联手解决了超大模型训练的多个公认技术难题,使鹏城 - 百度 · 文心训练效率大幅提升,模型效果更优。

中国工程院院士、鹏城实验室主任高文表示," 预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。运用这个工具,可以帮助做很多人工智能的赋能,不局限于某个领域,这对人工智能的发展都是一个福音。"

百度首席技术官王海峰介绍,百度知识增强大模型从大规模知识和海量数据中融合学习,效率更高,效果更好,具有良好的可解释性。从 2019 年 3 月发布文心 ERNIE 1.0,到最新的产业级知识增强大模型文心全景图,既包含基础通用的大模型,也包含面向重点领域、重点任务的大模型,以及丰富的工具与平台,有助于促进技术创新和产业发展。

此外,为解决大模型应用落地难题,百度团队首创大模型在线蒸馏技术,模型参数压缩率可达 99.98%。压缩版模型仅保留 0.02% 参数规模就能与原有模型效果相当,有助于加速产业大规模的应用。

会上鹏城实验室与百度还成立了鹏城 - 百度自然语言处理联合实验室,在自然语言处理前沿研究和创新应用方面协同攻关。鹏城 - 百度 · 文心有望进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题,该模型代码近期会在 OpenI 启智社区开源,依托鹏城云脑Ⅱ对外开放。百度文心也会通过百度飞桨平台陆续对外开源开放。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App

以上内容由"钛媒体"上传发布 查看原文
一起剪

一起剪

ZAKER旗下免费视频剪辑工具

一起剪