时隔许久,王小川创立的百川智能公布最新模型技术进展。
8 月 11 日消息,百川智能今天发布一款开源的医疗增强大模型 Baichuan-M2。
具体来说,针对医疗领域用户隐私考虑下的模型私有化部署需求,百川智能对 Baichuan-M2 进行了极致轻量化,量化后的模型精度接近无损,可以在 RTX4090 上单卡部署,相比 DeepSeek-R1 H20 双节点部署的方式,成本降低了 57 倍。针对国产主流芯片的开发和适配,让多数医疗机构利用现有硬件条件可以实现快速部署。
评分上,Baichuan-M2 在 HealthBench 上得到 60.1 的高分,以 32B 的较小尺寸不仅反超 OpenAI 最新开源模型 gpt-oss120b(得分 57.6),超过 Qwen3-235B、Deepseek R1、Kimi K2 等其他开源大模型,略逊于 GPT-5-Thinking。
据悉,百川智能成立于 2023 年 3 月,由原搜狗公司 CEO 王小川创立,团队成员主要来自搜狗、谷歌、腾讯、百度、微软、字节等公司。目前,百川智能已完成三轮融资,2024 年 7 月获得了 50 亿元的 A 轮融资,并将以 200 亿元估值开启 B 轮融资,是中国 AI" 大模型六虎 " 之一。
今年以来,百川智能全面做 "AI 医生 "。
王小川称,医疗大模型是 LLM 皇冠上的明珠,AI 医疗不仅能提升医疗服务的可及性、便利性,还将推动医疗研究范式的创新。在智能时代,我们不是在造 " 工具 " 而是在 " 造人 ",造人代表了知识含量最高,并且需求最广泛,而医疗则是其中最有代表性的行业。神经网络之父辛顿(Hinton)也强调了医疗的重要性,认为 " 医疗行业是 AI 应用中最重要的领域之一,能最大化发挥 AI 的潜力 "。
" 为生命建模型、为人类造医生,是百川的使命。这是第一天就立下的志向。" 王小川曾指出,百川智能是国内唯一一个专注医疗的大模型创业公司。其在 2021 年把搜狗公司卖给腾讯的时候就提到,之后的二十年我会专注生命科学、大众健康。2022 年,他创建了一家做 AI 检验检测设备的公司——五季医学,它和百川智能实际上是姊妹公司。
今年 1 月,百川智能推出国内首个具备语言、视觉和搜索三大推理能力的开源全场景模型 Baichuan-M1-preview,特别解锁了医疗循证模式,可整合实时医学证据进行深度推理,同期开源的 Baichuan-M1-14B 医疗增强模型,在临床评测中表现媲美主流大模型(如 o1-mini)。
同时,百川 Baichuan-M1-preview 内置行业内首发的 "AI 患者模拟器 ",用真实数据构造上万个不同年龄性别症状的 AI 患者,模拟了数百万次诊疗过程。
今年 2 月,以 Baichuan M1 大模型为底座打造的 "AI 儿科医生 " 正式在北京儿童医院上岗;今年 3 月,百川携手北京儿童医院、小儿方健康共同发布 " 福棠 · 百川 " 儿科大模型。
时隔 8 个月后,百川智能发布全新大模型产品,升级患者模拟器并引入模型端到端强化学习(RL)能力。
百川智能表示,面向急诊、门诊等对于交互速度要求更高的场景,相比 Baichuan-M1,基于 Eagle-3 架构优化的 Baichuan-M2 MTP 版本在单用户场景下实现了 58.5% 的 token 速度跃升。
实际上,OpenAI 于 8 月 6 日首次开源两款大模型,主打部署成本超低和医疗能力最强。其中,开源 gpt-oss 系列模型过程中,OpenAI 首次将医疗作为第一重要的评测标准;发布 GPT-5 时,请到现场的唯一使用者是抗癌患者。
据悉,OpenAI 从 HealthBench 整体数据中选出 1000 个特别困难复杂问题作为 Hard 子集,用于验证模型多维度、全景化解决疑难复杂医学问题的能力。今年 5 月这个评测集发布时,世界上所有顶尖模型得分都没超过 32 分,许多前沿模型得分甚至为 0。在 OpenAI 组织的人类资深医生测试中,资深医生撰写的答案甚至未超过 o3。
OpenAI 在 GPT-5 发布时特别强调,其是 HealthBench Hard 评测全球唯一超过 32 分的模型。而百川智能表示,Baichuan-M2 以 34.7 分成为全球第二款超过 32 分的模型。
案例方面,百川智能称,在北京市海淀区卫健委、北京大学第三医院、国家儿童医学中心等合作伙伴的支持下,M2 在真实病例实测中体现出超强能力。例如,一位 51 岁女士近两个月睡眠充足仍感觉困倦、疲惫,脖子轻微肿胀。M2 根据医患对话,详细梳理出持续性疲劳、体重增加等多个支持诊断的关键症状,综合考虑患者用药史、年龄、合并症状等因素,精准诊断出患者最可能病因为甲状腺功能减退症。
事实上,近期,蚂蚁、字节等大厂都在布局 "AI 医生 " 这一前沿产业赛道。
其中,7 月初,字节跳动推出首个 AI 医疗助手独立 App" 小荷 AI 医生 ",主打健康咨询与报告解读功能;而蚂蚁集团也上线独立健康应用 "AQ",加速布局 AI 医疗赛道。
据弗若斯特沙利文预测,中国 AI 医疗市场规模将从 2023 年的 88 亿元,快速增长至 2033 年的 3157 亿元,年复合增长率高达 43.1%。(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)