关于ZAKER 合作
三易生活 13小时前

时隔六年,OpenAI 方面日前发布两款开源模型

日前,OpenAI 方面正式发布并开源两款推理模型 gpt-oss-120b、gpt-oss-20b。据悉,oss 是 Open Source Series 的缩写,意为开源系列。

对此 OpenAI CEO 山姆 · 奥尔特曼表示,这是该公司耗资数十亿美元的研究成果,"gpt-oss 是一个重大突破……我们相信这是全球最佳且最实用的开放模型 "。

据了解,这也是继 2019 年的 GPT-2 后,OpenAI 时隔 6 年再次推出开源模型。目前这两款模型均以 Apache 2.0 许可证发布,企业在商用前无需付费或获得许可。

而对于推出开源模型的原因,OpenAI 方面表示," 开放模型与我们的托管模型相辅相成,为开发者提供了更广泛的工具,以加速前沿研究、促进创新,并在广泛的用例中实现更安全、更透明的 AI 开发。这些开源模型还降低了新兴市场、资源受限行业以及中小型组织进入 AI 的门槛 "

据悉,gpt-oss-120b、gpt-oss-20b 均基于 MoE(混合专家)架构,并采用预训练和后训练技术进行训练,特别关注推理、效率和在广泛部署环境中的实际可用性。在训练数据方面,OpenAI 方面在一个主要为英文的纯文本数据集上训练了这两款模型,训练内容特别强调 STEM 领域知识、编码能力和通用知识。

其中,gpt-oss-120b 总参数量为 1170 亿、激活参数量为 51 亿,可在单张 80GB GPU 上运行,在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平。gpt-oss-20b 的总参数量为 210 亿、激活参数为 36 亿,可在 16GB 内存的消费级设备上运行,在常见基准测试中表现与 OpenAI o3-mini 相似。

据 OpenAI 方面介绍,这两款模型在工具使用、少样本函数调用、链式思考推理以及 HealthBench 上表现强劲,甚至超越了包括 OpenAI o1 和 GPT 4o 在内的专有模型。,

此外 OpenAI 方面强调,安全性是该公司发布所有模型的前提,尤其对开源模型至关重要。据悉,除全面的安全训练和评估测试外,OpenAI 方面还基于自身的准备框架(Preparedness Framework)对 gpt-oss-120b 的对抗性微调版本进行了测试。相关结果显示,gpt-oss 在内部安全基准测试中的表现与 OpenAI 的前沿模型相当,并提供与其近期专有模型相同的安全标准。

值得一提的是,日前山姆 · 奥尔特曼还预告本周晚些时候 OpenAI 将会发布一项 " 重大更新 "。对此有观点认为,鉴于 OpenAI 方面近期曾多次披露 GPT-5 相关信息,这一 " 重大更新 " 或与其有关。

【本文图片来自网络】

相关标签