将幻觉抑制前移至模型训练阶段，百川智能开源新一代医疗大模型

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

将幻觉抑制前移至模型训练阶段，百川智能开源新一代医疗大模型

2026年01月14日 01:14

来源：广州日报新花城

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　1月13日，百川智能对外开源新一代医疗大模型 Baichuan—M3，其在全球最权威的医疗AI评测 HealthBench 中以65.1分的综合成绩位列全球第一；在专门考验复杂决策能力的 HealthBench Hard 上，也以44.4分的成绩夺冠。这一成绩，不仅刷新了 HealthBench 的最高分，更首次在医疗领域实现了对 GPT—5.2的全面超越。在OpenAI引以为傲的低幻觉领域，M3也实现了超越，幻觉率3.5全球最低。

　　幻觉是这一代大模型技术范式的通病，更是AI进入严肃医疗的“拦路虎”。在大多数场景幻觉只是体验问题，而在严肃医疗场景可导致安全事件。百川M3将医疗幻觉抑制前移至模型训练阶段，在强化学习过程中将医学事实一致性作为核心训练目标之一，将“知之为知之，不知为不知”直接作用于模型自身能力的形成过程。这一新的训练方法将医学事实可靠性内化为M3自身的基础能力，使其在不借助任何外部系统的情况下，依然能够基于自身医学知识进行稳定、可信的作答。

　　通过将事实一致性约束融入训练流程，M3重构了幻觉抑制的训练范式，在不依赖工具或检索增强的纯模型设置下，医疗幻觉率为3.5，超越GPT—5.2，达到全球最低水平。

　　M3还首次具备了原生的“端到端”严肃问诊能力。它能像医生一样主动追问、逐层逼近，把关键病史和风险信号问出来，进而在完整的信息上进行深度医学推理。

　　从1月初OpenAI发布医疗产品ChatGPT Health，到今天Anthropic 推出Claude for Healthcare，AI 医疗正在全球范围内提档加速，竞争也正式进入深水区。在这场竞速中，作为国内唯一专注医疗的大模型企业，百川持续突破低幻觉率、端到端问诊和复杂临床推理等核心能力，已从“跟随者”跃迁为行业“引领者”与新范式的“定义者”，正以硬核实力扛起中国 AI 医疗发展的旗帜。其医疗应用“百小应”已同步接入 M3，面向医生与患者开放相关能力。医生可借助它推演问诊与诊疗思路，患者及家属也可通过该应用更系统地理解诊断、治疗、检查与预后背后的医学逻辑。

（文章来源：广州日报新花城）

文章来源：广州日报新花城责任编辑：73

原标题：将幻觉抑制前移至模型训练阶段，百川智能开源新一代医疗大模型

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈