牛津大学最新研究：大模型诊断医疗案例准确率达 94.9%

【CNMO 科技消息】近日，牛津大学的一项研究发现，大型语言模型正确诊断医疗案例的准确率达到了 94.9%。这比许多医生都要高。然而，当普通人使用相同的 AI 工具处理相同的情况时，其准确率下降到仅 34.5%。原因是：AI 并不是性能的限制因素，真正可能阻碍 AI 发挥其全部潜力的是我们人类。

CNMO 从外媒获悉，由亚当 · 马迪博士领导的研究吸引了近 1300 名参与者参与，每个人都会收到一个详细的病例情景，包括症状、病史和个人背景。研究的目的是看普通人能否使用人工智能来判断问题所在，并决定寻求什么类型的治疗方式。

参与者要将 AI 视为真正的医生，提问、描述症状并获得帮助。研究人员在实验中使用了三种不同的大型语言模型，分别是：ChatGPT-4o、Llama 3 和 Command R+。

研究人员发现，使用大型语言模型的参与者在 34.5% 的案例中至少能识别出一个相关条件；完全不使用 AI 的对照组表现更好，达到了 47%；而在选择正确行动方案时，大型语言模型用户只有 44.2% 的概率能答对；当 AI 模型独自决定时，正确率为 56.3%。

问题在于：有些人提供的信息不完整或不清楚；有些人忘记提及关键症状；有些人则是遗漏了严重程度或时间点。导致 AI 误解或错过了重要线索。即使人工智能给出了正确的诊断，用户也不一定执行，这部分不是机器所特有的，人们也会忽视医生的建议。

据 CNMO 了解，一些 AI 工具已经在实际的医疗流程中获得了关注。例如，OpenEvidence 被医生用来搜索和验证临床文献。它不是用来取代医生，而是增强他们的能力。

如何定义智能体价值？容错性与自主性为核心考量指标

21世纪经济报道 25分钟前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

牛津大学最新研究：大模型诊断医疗案例准确率达 94.9%

宙世代

一起剪

相关阅读

大厂暗战高考志愿填报，谁是张雪峰平替？

蓝宝石推出PULSE 脉动 B650A WIFI主板：双M.2插槽首发799元

如何定义智能体价值？容错性与自主性为核心考量指标

苹果考虑另起炉灶，用外部人工智能模型来支持新版Siri

直接对标iPhone！魅族22系列本月发布：最强手感小直屏

智能电视新标准发布：保障电视开机直接看直播

荣耀MagicPad 3支持离焦护眼技术：开启25分钟 短暂性近视指标降低13度

抖音会员每月自动扣800元 男子信以为真 被骗70万

科技制造领跑，银河通用完成新一轮融资

车间来了位“新工友”，广东机器人太全能！

海信新款34寸带鱼屏首发1699元：240Hz高刷、双3W扬声器

40 岁的 Windows 蓝屏要完蛋了，我第一个拍手鼓掌

新版评价体系！淘宝天猫正式上线店铺“真实体验分”

就业新赛道！看看哪些人才最受机器人企业青睐？

最新评论

手机中国

热门推荐

热门订阅 换一批

蓝鲨财经社

荣耀MagicPad 3支持离焦护眼技术：开启25分钟短暂性近视指标降低13度

抖音会员每月自动扣800元男子信以为真被骗70万

热门订阅换一批