新闻资讯

百川Baichuan-M4横扫三大医疗榜单：3.3%幻觉率创全球新低，AI家庭医生来了

📅 2026-05-28 12:00 · 👁 8 次阅读

通用大模型的医疗三不达标

5月26日，在AI医疗新范式学术论坛上，百川智能创始人王小川展示了新一代医疗大模型Baichuan-M4与AI家庭医生百小医。王小川直言通用大模型用于医疗存在三大刚性缺陷：低幻觉做不到——医疗容不得编造，一个错误判断可能危及生命；强循证做不到——临床诊断有严格循证路径，不是根据症状猜一个最可能的病；会提问做不到——医生不会在患者说完第一句话就下结论。三条刚需，通用模型一条都不达标。

关键数据：M4的医疗能力突破

三大医疗榜单世界第一：HealthBench、HealthBench Hard、HealthBench Professional同时登顶，全面超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro
3.3%幻觉率：依托原创的事实性感知强化学习算法，将裸模型事实性幻觉率降至3.3%，再创全球新低
1000余条原子化临床路径：将权威医学指南拆解为原子化临床路径，每一条均由顶尖临床专家定义与校验
智能体进化：叠加Harness调度、记忆与自进化能力后，M4从医疗大脑升级为医疗智能体