百川Baichuan-M4横扫三大医疗榜单:3.3%幻觉率创全球新低,AI家庭医生来了
通用大模型的医疗三不达标
5月26日,在AI医疗新范式学术论坛上,百川智能创始人王小川展示了新一代医疗大模型Baichuan-M4与AI家庭医生百小医。王小川直言通用大模型用于医疗存在三大刚性缺陷:低幻觉做不到——医疗容不得编造,一个错误判断可能危及生命;强循证做不到——临床诊断有严格循证路径,不是根据症状猜一个最可能的病;会提问做不到——医生不会在患者说完第一句话就下结论。三条刚需,通用模型一条都不达标。
关键数据:M4的医疗能力突破
- 三大医疗榜单世界第一:HealthBench、HealthBench Hard、HealthBench Professional同时登顶,全面超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro
- 3.3%幻觉率:依托原创的事实性感知强化学习算法,将裸模型事实性幻觉率降至3.3%,再创全球新低
- 1000余条原子化临床路径:将权威医学指南拆解为原子化临床路径,每一条均由顶尖临床专家定义与校验
- 智能体进化:叠加Harness调度、记忆与自进化能力后,M4从医疗大脑升级为医疗智能体
分析:四级诊疗新范式与生态开放
百川提出AI家庭医生构建家庭底座,形成四级诊疗新范式:向上完成疾病初步筛查和主动分诊,向下让三级医院的随访与疾病管理能力直接触达每一个家庭。AI家庭医生百小医能自动为家庭成员建立独立健康档案,在自然对话中捕捉并结构化身体状态、用药历史,识别日常闲聊中的高危信号并主动提醒。
百川同时宣布将M4与百小医的能力底座开放,与药企、保险、智能硬件、医疗机构共建生态。这是一个值得关注的信号:医疗AI正在从模型竞赛转向应用生态竞争。谁能率先跑通从问诊到分诊到随访的完整闭环,谁就将在万亿医疗市场占据先发优势。