【太平洋科技快讯】9 月 18 日消息,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上国际权威期刊《自然》 ( Nature ) 第 645 期封面。
与今年 1 月发布的初版论文相比,本次发表的版本披露了更多模型训练的技术细节,并对发布初期外界对模型蒸馏的质疑作出正面回应。
DeepSeek-R1 成为全球首个经过同行评审的主流大语言模型。Nature 评价道:目前几乎所有主流大模型都还没有独立同行评审,这一空白 " 终于被 DeepSeek 打破 "。