围困百川:医疗AI会是幻梦一场吗?观点

健闻咨询 2026-02-05 08:53
分享到:
导读

1月13日,百川开源了Baichuan-M3,声称全面超越GPT-5.2,不仅有全球最低的幻觉率(3.5%),还有“显著高于真人医生平均水平”的严肃问诊能力。仅9天后,百川发布了Baichuan-M3 Plus,与上个版本相比,M3 Plus将幻觉率降低至2.6%。

作者/于焕焕  南函彤

编辑/毛晓琼

沉寂近一年后,王小川重新回到了公众视野。他先是到清华捐了栋「百川楼」,又接连开了两场媒体发布会。

1月13日,百川开源了Baichuan-M3,声称全面超越GPT-5.2,不仅有全球最低的幻觉率(3.5%),还有“显著高于真人医生平均水平”的严肃问诊能力。仅9天后,百川发布了Baichuan-M3 Plus,与上个版本相比,M3 Plus将幻觉率降低至2.6%。

医疗是深渊,AGI是天堂。在过去的一年半里,DeepSeek横空出世,智谱和MiniMax上市,阶跃星辰和月之暗面官宣了新一轮融资。而百川从堪称“世纪之光”的通用AI转到了一眼望不到头的医疗,洪涛、陈炜鹏、李施政、焦可、谢剑、邓江……过去8个月里搜狗老将一个个离开百川。

媒体称王小川是“惨王”。

不过,渡劫归位的王小川依然是媒体钟爱的“暴论输出机”,三次露面就贡献了三个引爆眼球的话题:做医疗AI,不能跟正常医生走得太近;张文宏拒绝将AI引入电子病历系统是由其立场而非事实决定;以及,医生成长不应以患者为代价。

混迹医疗圈十几年的管理顾问贺滨说,这段交锋再次暴露了IT界和医疗界的语言不通问题,双方活在思维、逻辑不同的世界里。

互联网是市场经济的硕果,有与之配套的繁荣生态,消费者主权决定企业成败。人们习惯将成功归于企业满足了消费者或用户的需求,以及企业家的认知和判断力,归于技术,归于投资人慧眼识珠,归于更懂用户的产品设计,归于更聪明的商业竞争策略。

医疗行业则不同。全世界的医疗行业都是某种程度上的威权式服务体系,消费者主权受到削弱。中国亦不例外。这套体系与互联网行业去中心化的市场逻辑天然不兼容。

贺滨评价“无知无畏”的王小川,身上有种真诚而不自知的傲慢,如果是公关策略还好,若一号位真这么想,仅从这些公开发言来看,“百川连医疗的门都还没摸到”。

但医疗是百川的唯一。金融、教育、娱乐是被“裹挟”的、身不由己的包办婚姻,只有医疗是敝帚自珍的真爱。不管多少人说前边是火坑,王小川就是觉得做医疗好——人生的前三十年给了互联网,接下来的二十年要给医疗。

1月,在发布会后的媒体沟通中,谈起做医疗,王小川依然会像幸运地在无人区发现一座金矿一般,他说“巨头不对医疗做重投入,所以机会留给了我”,而且做医疗后“开心了许多”。

百川做医疗,像是在写一封冒天下之大不韪的情书,虽然医疗系统还不太买账。

贺滨赞赏和敬佩王小川希望改善医疗行业的情怀,但他说有情怀而缺认知是很可惜的,王小川现在就面临三道关:第一是自身的傲慢;第二,就算放下傲慢,和医疗行业的沟通也存在体制鸿沟。语言和逻辑的差异,限制了沟通的有效性;第三,就算迈过前两关,也难找到深刻了解行业逻辑和需求,且能与技术人员有效沟通的合伙人。

“这三道关摆在这,别说王小川,就算马云来也难做”。

贺滨见过许多IT界人士折戟医疗,“医疗和互联网、AI交叉这么多年,至今没有一个能叫响的产品,原因就在这,不是单一道坎,而是层层壁垒,全部迈过去的可能性太小了”。他坚持自己的判断,“百川智能,如果不做出根本性的反思和调整,几乎必死无疑”。

贺滨特意叮嘱,关于百川的这篇稿子,如果营造出任何让王小川觉得过去或现在做得还不错、未来有希望的迹象,都可能是在害他。

医疗领域的确吸引过无数英雄进场却又使其折腰。一位业内人士曾对《健闻咨询》评价某医疗AI硬件企业时说,随着公司从研发走到商业化阶段,这位科学背景出身的创始人,已经变成了为商业化而罔顾科学与事实的大仙。

或许根本没有人在意毫厘之差的所谓科学。事实根本不重要,披上一个公益性的好故事会让买单的人、用设备的人和这家企业里的其他员工都开心。

在这里,尽管失败会被归咎于创始人的判断力,差劲的技术、不佳的用户体验和不当的竞争策略,但真正的难处从来不是技术和愿力。不论这个产品是药耗、器械、技术还是服务,几乎没有人愿意相信一个产品能仅凭其质量、价格就收获医患双方的芳心。

如果有一个名利双收的产品,人们下意识地会更愿意相信它是渠道、资源、人脉的胜利。

站在医疗的大门前,一个必须要做的决定是,从今往后是要忍受它,加入它,改变它,还是逃离它。

贺滨不理解的是,以王小川的能力与可撬动的资源,他可以轻松地在除了医疗之外的任何一个领域大放异彩,“为什么非要舍身炸粪坑呢?百川现在最需要做的,就是及时止损。

死磕医疗,很可能是场悲剧,而悲剧,往往是凄美的”。

1

极客

王小川对中国医疗的复杂并非一无所知。仅公开可查的报道中,百川接触过多级卫健、医院人士,获得了至少是口头、文件政策层面的支持。

在一次公开论坛中,清华大学万科讲席教授、南方科技大学全科医学院院长梁万年称与百川合作开发了一款名叫AIGP的人工智能全科医生,未来“我们会把这种产品放大到老百姓家里去”。

类似AIGP,百川在某专科领域也有一款To C产品,预计今年投产售卖。渠道合作方李鸣(化名)介绍,这款产品目前已在与三大运营商及多家大型物流公司洽谈合作,借渠道做市场推广,“会有个亲民价”。

2025年8月,王小川接受媒体采访时说,产品进院过程中,“使用技术、支付方,医生机制、接受度都是问题。我认为今天做医疗,核心是从院外开始切入,而不是从院内”。

王小川在发布会上称未来会出海。《健闻咨询》了解到,百川有一款To B产品计划卖给一带一路国家,目前正在解决语言问题。这类产品在中国基层的部署模式为硬件白送,视地区、医院发展情况收维护费,偏远地区免费。

李鸣曾与地方医保商讨能否收取挂号费,得到的回复是,目前医学AI产品众多,很难有一致的评价标准,会继续研究相关政策。

在中国,一些又苦又累又不挣钱的科室不再是医学生的好选择。在北上广以外的许多地区,很多医院陷入了没有好医生就吸引不来病人,没有病人就培养不出好医生的恶性循环中。

这些年,医疗领域的钱越来越难挣了。在一个越来越难挣钱的领域,机器就能挣到钱吗?

在百川断臂求生、嘲笑王小川缺乏人情世故成为潮流之前,人们愿意相信王小川身上有一种叫“真诚”的美德。

《人物》2024年10月的文章中记录了陈炜鹏和王小川一起跑业务的故事:在一次极难促成的合作沟通中,王小川一上来就非常直白地表达了他对合作的担忧,把百川的缺点、合作的风险最先说了出来。

陈炜鹏对此感到后怕,说“彼此不熟悉的合作伙伴之间,很难确定这里是相信真诚的人多,还是相信利益的人多”。

而今,不拐弯的语言习惯成了麻烦。

如果把那三句“暴论”还原到当时语境中,除了那句“屁股决定脑袋”很不礼貌之外,王小川并没有说错什么。他指出的问题的确存在,而且是在医疗界见怪不怪、本身已经不觉得是问题的问题。

比如,为什么要告诉想做医疗AI的年轻人不能跟正常医生走得太近呢?他的原回答是:

最不应该做的事情,是和正常医生走得太近。这里不是说不合作,而是不要被牵着走,需要有变革性想法的医生。

现实情况是,大多数医生对AI技术的理解其实是比较浅的,他们提出的很多需求,并不一定是技术上“最正确的方向”。我见过不少情况。比如医生希望你帮他用数据做模型、申课题、发论文;AI公司希望借助医院的名头、数据和背书,去融资、去讲故事。

双方各取所需,但真正对“产品是否走在正确道路上”这件事没人负责。结果往往项目看起来很专业,技术也不差,但路线已经悄悄走偏了。

所以我的判断是和医生合作是必要的,但不能围着医生转,更不能用医生的需求来定义技术方向。真正合适的合作伙伴,其实是非常难找的。

一位医生评论说,百川给出了一副财大气粗、任人白嫖的架势。大家心知肚明:互联网企业有钱,现在来抢占医院资源,将来也是要挣钱的。羊毛出在狗身上,此时不薅更待何时?甚至有人评论,这还不如那些出来卖(软件)的,人家办事至少收钱。

13日发布会上,有媒体问“如何看待张文宏拒绝将AI引入电子病历系统”,并举起了手机拍摄。王小川回答说,“我觉得他有他的道理,只是他屁股决定脑袋的位置,本质上你最后得为患者服务,这是根本的问题。”

张文宏也是AI的使用者,短期内要处理大量复杂的病历。他让AI 先看一遍,但作为复旦大学附属华山医院感染科主任,凭借多年经验,他“一看就知道AI哪里错了”,但年轻的医生看不懂,张担心AI改变了医生的训练方式,年轻的医生会知其然而不知其所以然。

尽管百川并不是华山医院的合作方,王小川当时也并未完整理解张文宏的隐忧,但反驳的话还是脱口而出了。或许是意识到了口不择言,在九天后的第二场发布会上,王小川谨慎地准备了一大段回复:

前几天我完整地看了视频,也许还不能完全理解张文宏的本意,但我也有一些深度思考,跟大家讨论两个观点——

医生和患者都认可患者利益优先的原则,因为AI发展非常迅猛,部分场景下,AI+医生已经明显优于单个医生,小医生+AI就跟大医生一样了,这是符合医学科学规律的。要是因为担心阻碍医生成长而限制使用AI,可能就限制了最有利于病人的医疗措施。要是AI能够实质性帮助患者,就不应该拒绝使用,换句话说,医生的成长不能以当下的患者作为成本。

使用方法也有很大的提升空间,因为不是AI本身,而是AI用法需要探索,如何用好AI是重要课题。要是担心医生能力退化,是否可以换一种用法?年轻医生上岗不是要求医生给AI纠错,而是倒过来,可以让AI对于医生临床思维进行提醒,也给诊疗结果进行校验,这样才有机会降低误诊、漏诊和风险。不是医生给AI挑错,而是AI给医生保驾护航。在这种情况下医生成长了,患者也受益了。

这段话被媒体总结为“医生的成长不能以当下的患者作为成本”。

贺滨据此判断,王小川是一位不够成熟的掌舵者。张文宏的话虽然也不严谨,但起码在他所描述的层面上并无明显错误。而从商业逻辑来看,医生、医院是百川的潜在客户,公开指责可能的合作伙伴不是好的策略。

在李鸣看来,眼下种种关于AI医生的争议,不过是短期利益与长远价值的取舍。眼睛若盯着近处,便是满脑子为什么无法快速赚到钱;若盯着未来,便会看到不食不寝不拿工资的AI或许能补上“人”的空缺。

他鼓励王小川“这些东西都是暂时的,希望我们还能够想不同的办法来度过这个困难,信心很重要”。对外界批评,李鸣说即便不理解王,也“不要给他泼冷水”。

在清华百川楼启用仪式后的圆桌上,王小川说,医疗AI是为患者造矛,为医生造盾,要在不改变医患信任的前提下让AI参与医学决策。

百川有一款是To B产品是双屏电脑,一面朝向患者,患者可以看诊疗记录是否得当,一面面向医生,用于提供医疗建议。

一位使用百川产品的医院工作人员告诉《健闻咨询》,目前他们用的这套系统,“功能比较基础,医生比较忙时,系统会提醒可能漏掉的检查项”。

李鸣还是觉得王小川有远见,有思想、有智慧,有家国情怀,而且很执着。为“执着”做注脚的,是“百川智能聚焦医疗垂类大模型时,公司内部很多人反对,不少人离开了他,但他始终没有后悔”。

“我不因为这事难受,我只是觉得大家没有信仰,很遗憾。”王小川说。

2

幻觉

即便局限在中国视野内,王小川也不是第一个尝试通过AI取代医生的人。

AlphaGo问世的上一个十年,一批先行者曾通过深度神经网络学习方法造数字医生:在影像领域,大家用合作医院的数千精标样本使机器拥有了识别肺结节、骨折、冠脉、脑卒中等疾病特征的能力;在文本领域,有企业尝试用NLP构建问诊能力但因技术限制无疾而终。

彼时,公立医院迟缓的信息化进度、割据的信息孤岛使得数据成为了行业桎梏。

倚赖上述技术路线做出的产品精确度高,而且可循证,多个产品拿到了三类器械证。可它们只能回答单任务的具体问题,比如哪个位置有结节。在应用推广上缺乏跨院、跨地区的泛化能力,同时行业由于过度内卷也未探索出规模化的商业模式。

可以理解语言的大模型的确又让未尽的梦想死灰复燃了。

上一代AI从封闭的标注数据中获得特征识别能力,而Transformer结构的大模型基于无标注训练,通过大量的猜测、概率分析作无监督学习,暴力拆解了自然语言之间的关系。

用王小川的话说,语言变成了数学,算法有了“智力”。他认为,语言是智慧的中轴,造医生就等同于造AGI。

具体地,百川会更聚焦在文本语言中。理论上,医学场景中,人类可用文本语言描述的、创造的、判断的,AI亦可。

医疗某种程度上没有被通用大模型拆解完毕。联影智能副总裁高川告诉《健闻咨询》,有标注的医疗数据基本都是封闭数据,不可能出现在公开数据库里。据他们测算,通用大模型的语料中,至少99.9% 都是非医疗语料,所以在推理过程中,真正有用的医疗信息占比连 0.1%都不到。

但诸如豆包、千问、元宝这样的通用模型巨头,不会把主要精力放在医疗业务上;而医疗垂类赛道原住民们的模型技术、人才密度和资金储备又比不上百川。于是,在这个生态位的缝隙里,百川看起来的确抢了一个入场的身位。

百川这个模式看起来“护城河不高,但也没人做”,一位行业人士说,“在中国就是这样的,一旦有人跑出来,大家就开始踩踏,但路没蹚出来前,大家都不太愿意投入,我们也在观望,百川到底能走多远”。

一个技术圈的小范围共识是,医疗数据在质不在量,关键是要让模型学习到高阶医生的临床思维。李鸣介绍说,百川会从合作医院获取专家临床经验、近五年教科书内容,以及国际上前沿的诊疗知识,而且坚持数据“精准比多更重要”。

在13日的发布会上,王小川亦称数据的量没有那么重要,百川的核心优势是算法和评测体系。百川智能拥有30 余位来自三甲医院的全职医生,负责数据标注管理与医学专业指导,还有150 多位一线临床医生搭建评测体系。

高川认可百川的技术路线,因为“一是有证据锚定,训练语料可循证、可追溯;第二是医学大模型比通用大模型尺寸会小十倍以上,模型比较精准、部署成本低且可实体化”。

百川的Baichuan-M3,在架构上设计了病史采集、鉴别诊断、检验检查、精确诊断四个模块,整体导向诊断准确性的训练目标,并叠加了一道事实后验降低幻觉率。

理论上,这个工作流程算力消耗极大,而通用模型用户量大,记忆存储受限,不太可能配置最优的模型。但医疗场景的需求,即便是To C也比较低频,整体算力消耗量低。 

而在医院端部署,则需要考虑硬件情况。高川告诉《健闻咨询》,未来的医疗AI 模型,不是医生在工作站连外网查询的模式,而是在医院内、单科室本地化部署的模式,“我们的判断是,10B 参数以下的模型,就具备本地化安装的能力了,县医院都能部署,现有条件完全满足”。

使用Transformer 架构做模型始终无法避免幻觉,大模型也有泛化问题,但这依然是一个在蹒跚向前的行业。

做问诊,文本是目前ROI (投资回报率)最高的模态,百川是业内最佳,但文本大模型并不孤独。其他如联影的后背是影像,讯飞医疗的后背是音频。

高川认为“将来医疗AI是四个模态混合包括,文本、影像、语音和视频。其中,视频指的医疗手术视频,影像指CT、磁共振、超声、病理这些影像,文字就是医疗所有文书,音频包括医生和患者之间的对话、医生对设备的操控语音”。

《健闻咨询》了解到,行业里,有To B企业规划用大模型做调度、小模型做诊断并搭建面向医生的agent平台;有To C 企业用大模型做泛健康管理;有To G企业单子接到手软;也有企业尝试使用其他架构规避幻觉,做出了声称面向疑难杂症的、具备严肃问诊能力的AI 医生。

在中国,顶层的好设计落到地方执行上往往是各省找自己的企业“分蛋糕”,一位行业人士告诉《健闻咨询》,“一提分蛋糕就不是技术和用户体验的问题了,是渠道和资源的比拼”。渠道和商业化运营能力不会是目前的百川作为一家创业公司擅长的。

正如贺滨预设的那样,技术优势在医疗系统内的确不是决定性因素。前述行业人士说,百川需要一个像安徽扶持讯飞一样的支持者,“这个行业只要会玩,也不难。”

尽管未公布全部布局,且透露在儿科、肿瘤、慢病、硬件领域有涉猎,但短期内,百川的产品策略还是坚定地选择院外、选择To C,“医生与患者都是C,除了百小应,还会发布C端产品”,IT界总是有技术平权的执念,他们想让“患者把病看明白,让大家知道每个人的健康状况是值得更认真对待的”。

李鸣提到了一个因缺乏医学知识而延误治疗的悲剧:一位检测出感染甲流的孩子,持续高烧,家长给孩子吃上了奥司他韦,没想到要去医院,结果孩子感染三天后抢救无效不幸去世。他相信,有一个AI家庭医生放在家里,能更好地观测孩子的状态,也能提醒家长及时就医。

To B的渠道、资源之争会让人失掉技术信仰,“行业就烂了”,前述业内人士说,更直接的To C领域,或许会有好技术、好产品,但关于行业前景和竞争格局,现在下判断还为时尚早,医疗是个坑,但坑也在变浅,行业里不止百川一家抱着“医疗AI必成”的信念。

不过,与互联网快而猛的阵地战不同,医疗行业更擅长时间和消耗战,就像“医疗信息化赛道熬了30年也还没熬出头,所以不急,边走边看”。

3

边界

AI的上限或许比人们想象的要高。

三甲医院医生张牧(化名)告诉《健闻咨询》,目前有科室使用AI进行疑难病、罕见病诊疗,他说,“模型给出的诊断、需要做哪些检查与自己的判断是基本上一致的,但和治疗的建议不完全一致。

模型相对保守,比如在肿瘤患者的治疗建议上,模型会说该患者肿瘤周边神经血管密集,手术风险可能非常大,建议暂时不做手术。但这个手术在我的能力范围内,我可能需要把10%的希望、90%的风险跟家属沟通清楚,并在家属同意下实施手术”。

王小川与张牧讨论过,在基层,尤其是简单的全科场景中,能否让AI独立诊断、开处方,张牧的回答是,否。他说,AI的存在让基层医生敢于且有能力看病了,但毕竟“法律没有给大模型医生处方权”,处方权在医生手里,保持“双医生制”是一种兜底。

张牧也不赞同真人医生会因AI的存在而失去判断力的说法,“如果这位医生是完全的无知者,无法判断AI的对错,那他不会取得医生从业执照,有了AI能让他更自信、敢看病”。

人们总是高估现在而低估未来。

高川认为,五到十年后,AI至少能取代首诊,或者说能够帮助医生做很多工作了。但医生们不会被取代,只会从这些基础繁杂的工作中解脱出来。“没有人会接受AI或机器人给自己看病,AI也好,机器人也好,只是人的工具。最终承担法律风险的一定是人”。

北京大学医学人文学院医学伦理与法律学系研究者徐靖仪认为对包括手术机器人、医疗AI需分场景讨论不同责任人可能面临的侵权责任,关于临床诊断这一场景,她认为:

关于诊断的医疗服务是一种行为义务而不是结果义务……由于临床诊断的复杂性与专业性,事后对相关侵权行为进行证明存在着较高的难度。临床诊断情况下,原则上由软件开发商承担基于过错的侵权责任,并由医院承担医疗服务责任,例外时由软件开发商对异常违法损害承担产品责任。

北京至普律师事务所律师李圣解释说,机器人或软件厂商未告知机器人可能存在的缺陷,并告知用户审慎判断,也就是说各方都忽略了机器人的缺陷而造成医疗事故时,应该各方分担责任。

若企业尽到了缺陷告知义务(比如加了免责声明)但患者依然采信AI的错误诊断意见未到院就诊而耽误了诊治,那“患者可以向厂商主张权利,是否胜诉看各方证据”。

若医生无判断力根据AI结果出具了错误的诊治意见造成误诊或患者死亡,“那是医院的责任,医院承担赔偿,医生是职务行为,医院赔偿后可以向医生追偿;医生和医院认为机器人或辅助软件有问题,可以向厂商追偿”。

没有人能在此刻看清医疗AI的未来。但在技术与商业狂奔之时,法律界也在织造新的缰绳。他们随时准备着为患者维权,同时也憧憬技术与立法的演进,思想伦理的松动通常是文明的车轮向前滚动的声响。

张牧是坚定相信未来会更好的体制内建设者。在他看来,体制内家长式的爱可抵御商业对集体健康的侵损,得坚持。他相信未来人们的素质和生活品质会提高,彼时大家需要更好的医疗条件,但现实是领域里的医生越来越少,人会消亡,但AI学会看病的逻辑之后,经验将永存。

他曾用“国策”“一张蓝图绘到底”的政治话语鼓励王小川,说“投资人也应该多些家国情怀”。

科学太确定了,人太不确定了,作为人体修理工的医学就像是在二者之间摇晃的钟摆。中国医学科学院肿瘤医院副院长李宁在百川楼启用后的圆桌讨论上说,医学更像是一部分科学、一部分艺术、一部分人文……而AI最大的价值,不一定是替代医生,而是推动医学本身向更可验证、更可推理的方向演进。

百川现在以药厂的身份与医院合作,通过算法做患者陪伴以提高药效,还注册了Clinical Trial。百川的技术理想派仍在期待,期待着与中肿、北儿更深一步的合作,期待着能取得医疗系统的信任,期待着能找到更适合医疗的算法架构,“那时候可能有更大的价值”。

大声地谈论理想,已变成滑稽可笑的事。可理想本就是虚空,又不会死掉。

百川在做的事最终不一定能取得商业上的成功,但就算失败,价值感也不会湮灭,光是曾为医患“知识平权”冲锋陷阵过就足以令人雀跃。其道也不孤,技术同道者们在给予沉默的支持。

为什么做医疗呢?2025年1月的两场发布会上,我都问出了这个问题。

王小川给出了他在为《复杂:诞生于秩序与混沌边缘的科学》中文版作序时、在接受晚点等媒体采访时、在与许知远对谈时说过的、几乎倒背如流的、颇具浪漫主义气息的答案:

物理和数学能解释和预测世界上大多数的自然现象。数学中的“三体问题”和天气预报中的“蝴蝶效应”,即便显露了复杂现象背后的不可计算性,也并没有动摇过我对世界的数理认知。

直到研究生时参与了基因测序的拼接算法研究,看到DNA、细胞、生命展示出了超越复杂性的更深层次的有序性,我的固有思维被击穿了。物理世界如此精确可计算,但终究走向“熵增”;生命世界复杂不可计算,竟然能够通向“熵减”。

大模型把语言变成了数学,而我希望做的是生命的数学模型。我认为大模型能帮助我们更好地通向更远的生命世界。

可以描述宇宙星辰如何运行的人类,却唯独不能解释渺若尘埃的自己如何存在,于是席地而坐开始解剖自己。

向前、向后、向左、向右看似都有人在呼唤,但究竟谁才会通向真正的未来呢?人们太擅长解构成功与失败、历史与未来了,以至于任何人试图建构新逻辑都会举步维艰。

不论是星星与宇宙,还是细胞与机体,亦或是人与社会,宏观的秩序无法捆绑微观的意志。在新秩序到来前,人们享有此刻混沌带来的、相信自己的孤独与自由。

王小川 百川
分享到:

1.TMT观察网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.TMT观察网的原创文章,请转载时务必注明文章作者和"来源:TMT观察网",不尊重原创的行为TMT观察网或将追究责任;
3.作者投稿可能会经TMT观察网编辑修改或补充。