关于ZAKER 合作
量子位 19小时前

AI 水论文还得 AI 治:西湖大学首次模拟人类专家思考链,AI 审稿分钟级给出全面反馈

审稿不用再等了,高质量的 AI 审稿平台来了!

如今,AI 生成的论文数量激增,如何从海量的 AI " 水文 " 中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。

为此,西湖大学自然语言处理实验室推出了首个 AI 生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的 AI 审稿人系统DeepReview

AiraXiv 平台地址:https://airaxiv.com

DeepReview 论文地址:https://arxiv.org/abs/2503.08569

AiraXiv 用于集中管理和展示 AI 生成的论文,从而减少其对传统人工审稿流程的干扰。

DeepReview 则能在短短数分钟内给出比肩人类专家思考链的审稿意见,对大量 AI 生成论文进行初步筛选,为后续的人类专家评审提供参考。

基于数据集 DeepReview-13K,研究人员训练了 DeepReviewer-14B 模型,其在使用更少 tokens 的情况下,性能优于 CycleReviewer-70B。

不仅如此,在最佳模式下,DeepReviewer-14B 在评测中还分别以 88.21% 和 80.20% 的胜率超越了 GPT-o1 和 DeepSeek-R1。

AiraXiv:AI 生成的学术成果的开放舞台

作为首个致力于 AI 生成的学术成果归档、展现与评审的开放预印本平台,AiraXiv 旨在为 AI 创造的研究成果提供独立且专业的展示渠道,让优秀的 AI 作品脱颖而出,同时减轻传统学术社区的负担。

在 AiraXiv 上,研究人员可以:

快速上传:研究者可以一键提交由 AI 生成的研究工作,无需繁复流程。

即时审稿:每篇论文都可送入 DeepReview,几分钟内即可得到详细反馈。

高效浏览:系统为每篇论文生成关键词与洞见总结,帮助研究者快速抓住要点。

Spotlight 推荐:得到 AI 审稿人认可的优秀论文将被突出展示。

AiraXiv 的目标是对 AI 生成的论文进行单独归档和管理,以减轻低质量内容对传统审稿流程的影响。

同时,它也为高质量的 AI 生成科研成果提供了独立的存储和检索渠道,使研究者能够更高效地获取有价值的工作。

除此之外,AiraXiv 还支持与 arXiv 的无缝对接:用户可以直接输入 arXiv ID,便可直接查看原文以及获得 AI 审稿意见。

同时,平台还会自动同步最新的 cs.AI 论文并生成 AI 审稿意见参考,帮助研究者高效追踪前沿进展。

DeepReview:比肩人类专家的 AI 审稿人系统

DeepReview 是首个模拟人类专家思考链的多阶段 AI 审稿系统,目标是让 AI 能够像人类专家一样,进行系统化、可解释的论文评审。其审稿过程分为三个核心环节:

创新性验证:检索并对比相关文献,判断论文的新颖性与引用的准确性。

多维度评估:从合理性、表达、贡献等维度,综合模拟多名审稿专家的意见。

可靠性验证:检查论文逻辑一致性与结论可靠性,避免出现 " 幻觉式 " 评价。

在这一框架下,DeepReview 能够像真实学者一样,输出循证且全面的审稿意见。

首先,它可以模拟专家审稿,并参照人类审稿标准,明确列出 "Strengths & Weaknesses"。

其次是无论论文优劣,它都会给出完整且有建设性的意见,而非 " 一句带过 "。

最后,它可以将人类专家往往需要数周甚至数月的审稿周期压缩至数分钟,并获得完整且结构化的评审意见。

这种方式不仅可以自动过滤低质量 " 水文 ",让真正有价值的研究脱颖而出,同时还能帮助人类专家将有限的时间与精力集中在最值得关注的突破性成果上。

未来展望

目前,AiraXiv 与 DeepReview 只是冰山一角,更广阔的探索才刚刚启程。

未来,平台将逐步拓展覆盖范围,不仅面向计算机科学领域,还会延伸至更多学科与应用场景。

同时,平台还会持续改进论文关键信息的提取与展示方式,从而提升优质成果的可见性与传播效率。

从更长远的角度来看,这类平台和系统也折射出科研生态的潜在变化:AI 或许能够在选题、实验、论文写作与初步审稿等环节发挥越来越大的作用,而人类研究者则将更多地聚焦在具有创造性和突破性的研究问题上。

AiraXiv 与 DeepReview 的实践可以视作这一方向上的早期尝试,未来仍需更多研究者共同参与,才能推动形成更高效、透明的学术交流生态。

西湖大学自然语言处理实验室(WestlakeNLP)成立于 2018 年 9 月,由张岳教授领导。

张岳教授毕业于牛津大学,获博士学位,现任西湖大学工学院副院长。他著有剑桥大学出版社出版的《自然语言处理》一书,并担任过 EMNLP 2022 等多个顶级 NLP 会议的程序委员会主席。

该实验室目前专注于语言模型推理、泛化和通用人工智能以及自然语言处理的基础与应用研究,探索通用人工智能的实现路径,推动 AI Scientist(AI 科学家)的发展,使其能够真正参与并加速科学发现,促进人类科学的持续进步。

实验室主页:https://westlakenlp.com/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

点亮星标

科技前沿进展每日见