刚刚,GPT-5.5被星火医疗大模型V3.5反超了!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
刚刚,GPT-5.5被星火医疗大模型V3.5反超了!
9351点击    2026-06-14 12:52

刚刚,医疗大模型赛道的魔咒,终于被打破了!


过去两年,医疗大模型是AI落地中关注度最高的赛道之一,也是公认最难啃的一条。


几乎每家大厂都会端出一个「会看病」的LLM:发布会上对答如流,PPT里指标霸榜。


然而,一旦把它放进诊室,医生用两次就默默关掉了。


归根到底,「能上台演示」和「能下场干活」之间的那道坎,真正迈过去的屈指可数。


但这几天,剧情迎来了反转。


刚刚,GPT-5.5被中国纯血AI反超了!


飞利浦最新发布的《2026未来健康指数》里,藏着一个极具画面感的数据。


27%的临床医生承认,就在过去九十天里,屏幕里那个曾经被嫌弃的AI,已经至少三次帮他们揪出了潜在的医疗差错。


但故事还没完。


就在这几天,一家中国公司直接把一份更为硬核的答卷拍在了桌面上。


星火医疗大模型V3.5


医生采纳率91%


6月9日,讯飞医疗正式发布——星火医疗大模型V3.5。


生成病历医生采纳率91%、书写时间缩短52%、累计辅助诊断超12亿次。


这一连串的数字,直接把医疗AI「最难用的门槛」踩在脚下。


要理解此版本发布的分量,先得理解它跨过的那道门槛到底有多高。医疗是所有AI落地场景里最苛刻的一个,原因有三。


  • 医疗场景容错率近乎为0


在教育、营销、客服领域,大模型偶尔「一本正经地胡说八道」,代价是一次返工。


但在诊室里,一个错误的用药建议、一处遗漏的影像征象,关乎的是人的健康乃至生命。


这意味着医疗大模型,不能只是「大概率正确」,它必须做到可验证、可溯源、可问责。


  • 真实场景远比Demo复杂


发布会上的「AI问诊」,往往是安静房间里、一个人对着麦克风的清晰口述。


可真实诊室是什么样?


多位医生、患者、家属同时说话,远场嘈杂,方言夹杂,病情陈述断断续续。


能在录音棚里转写得完美的模型,一进诊室就「失聪」。


刚刚,GPT-5.5被中国纯血AI反超了!


  • 医生的工作流不容打断


医生最稀缺的是时间,一个需要医生反复修改、二次校对的AI工具,本质上是在增加负担。


它必须无缝嵌进医生既有的工作流,让人「用了就回不去」,才谈得上真正落地。


这三道坎,过去鲜有医疗大模型能同时跨过。


而星火医疗大模型V3.5最大的价值,恰恰在于它在临床最刚需的几个场景里,同时把三道坎踩在了脚下。


医生愿不愿意用


才是唯一的标尺


实际上,「实用门槛」的定义很朴素:


医生在真实的临床场景里,拿到AI生成的结果,愿意直接采纳。


这个标准下,星火医疗大模型V3.5在三大核心场景下,交出了硬数据。


病历生成,时间砍半


病历书写,是临床医生日常工作中最耗时、最痛苦的环节之一。


很多医生白天看完门诊,晚上还得花两三个小时补病历。


星火医疗大模型V3.5,在病历场景实现了全维度技术升级——


突破了多源医患远场识别、多角色定向语音增强、医疗语音识别非自回归架构等多项核心技术。


在医生和患者对话的过程中,星火医疗大模型V3.5通过远场多说话人语音识别,实时抓取对话内容,端到端自动生成结构化病历。


结果,端到端病历生成合理率达到80%。


刚刚,GPT-5.5被中国纯血AI反超了!


落到真实临床,在多家头部三甲医院的应用中,生成病历的医生采纳率达到91%,病历书写时间缩短52%。


有一组数据很扎心:一位门诊医生日均要接诊100位患者,边接诊边手写录入一份高质量病历,平均需要2.5分钟。


100位患者,意味着每天有超过4个小时耗在「码字」上。


医生这个职业,正在被文书工作活活拖垮。


而用AI病历生成系统,医患对话结束后30秒,一份同等质量的规范病历自动生成——一天下来,就能省出2.8小时。


正因如此,91%的病历采纳率才显得分量十足——


AI生成的病历,超过九成医生看一眼就能直接用,几乎免修改。


星火医疗大模型V3.5精准砍掉了那一半的文书负担。那些本该属于病患的时间,现在终于可以还回去了。


AI读片,采用率75%


影像辅诊是医疗AI最早被寄予厚望、也最容易「翻车」的方向。


放射科医生看一张CT或MR,要在多个序列间来回对照、结合临床信息判断,再用规范医学语言写成报告。


星火医疗大模型V3.5靠多序列联合空间建模和影像-文本跨模态推理,把识别和报告生成打通成一个动作——输出的不只是「片子上有什么」,还有「意味着什么、下一步怎么办」。


结果,X线、MR报告生成的医生采纳率达75%,影像质控达到专家会诊水准。


75%初看不如91%亮眼,但影像报告的专业性和复杂度远高于文字病历,这是全球医疗大模型首次在真实临床场景跨过这道线。


刚刚,GPT-5.5被中国纯血AI反超了!


刚刚,GPT-5.5被中国纯血AI反超了!


循证诊疗助理智能体,一个随身的「医学图书馆」


如果说前两者解决的是「效率」,那么循证诊疗助理智能体解决的是「决策质量」。


做过临床决策支持的人都知道,医生最怕的不是AI「不够聪明」,而是AI「太自信地错」。


星火医疗大模型V3.5循证诊疗助理智能体,采用了「证据对齐—反思校验—专家强化」的技术路径。


核心是,每一个诊疗建议都能追溯到权威医学文献,支持多步推理和深度反思。


它覆盖了病历内涵质控、智能用药审核、全科和跨专科辅助诊断等多个刚需场景,背后接入了大量权威诊疗指南和专家共识,同时兼容中国诊疗规范和中西医双诊疗体系。


刚刚,GPT-5.5被中国纯血AI反超了!


如果要找一个国际对标——大洋彼岸的OpenEvidence,现估值已达120亿美元。


其凭借循证AI深度嵌入医生工作流,短短时间覆盖了约45%的美国执业医师、服务超过一万家医院。


讯飞的循证诊疗助理智能体做的是同一件事,但有一个OpenEvidence不具备的差异化优势:


它要做的,是最懂中国医疗体系的那一个。


打开引擎盖,里面全是国产的


星火医疗大模型V3.5跨过实用门槛,靠的不是单点取巧,而是底座和算法的硬功夫。


这一次,它在两大工程上拿下了硬突破。


第一件,全国产算力底座上的长文本高效训练。


医疗是天然的长上下文场景:一份完整病历、一段长程随访、一次多轮问诊,动辄上万token。


长文本一长,推理成本和延迟就指数级飙升,这是所有LLM部署进医院都要撞的墙。


在国产算力平台上,星火医疗大模型V3.5率先跑通了DSA(动态稀疏注意力)与MTP(多Token预测)的长文本高效训练。


这两招叠加,直接让医疗长上下文推理吞吐量提升4.5倍。


这意味着,医院和区域医疗机构本地化部署,跑得动、迭代得起。


第二件,16亿人次数据飞轮,转起来了。


如果说算力是发动机,数据就是燃油。而在医疗AI领域,数据的稀缺性和获取难度远超其他行业。


为什么通用大模型做不好医疗?因为它们没有「行医多年」的经历。


而讯飞医疗,恰恰有。


支撑星火医疗大模型V3.5持续迭代的,是一座体量惊人的医疗数据基座:


16亿人次脱敏医疗语音、12亿次真实诊疗沉淀数据,并且平台每日新增超过220万份语音、影像、病历等跨模态真实医疗样本。


这串数字背后,是一套别家难以复刻的飞轮。


海量真实数据训练出更强的模型,更强的模型在医院和C端被更广泛地使用,使用又沉淀出新的高质量数据,反哺下一轮训练。


更重要的是,这些数据让星火医疗大模型V3.5实现了,语音、影像、语义真正融合的医疗多模态。


过去的医疗AI大多是「偏科生」:要么只会语音转写,要么只会看片子,模块之间各干各的。


星火医疗大模型V3.5把医疗语音识别、影像辅诊和医学语义理解的多模态能力做了一次全面升级,实现语音、影像、病历文本的跨模态对齐——


模型能把医生说的话、看的片子、写的字串成一条完整的临床逻辑链。


正是这种融合,让「听完即生成病历」「看片即生成报告」成为可能。


官方测试显示,在多项关键任务上,星火医疗大模型V3.5的综合能力显著超越GPT-5.5、DeepSeek-V4-Pro、Qwen3.7-Max等主流大模型。


刚刚,GPT-5.5被中国纯血AI反超了!


通用大模型再聪明,也补不上医疗场景里那些只有泡在临床里才懂的细节。


这正是垂直医疗大模型的价值所在,也是星火医疗大模型V3.5在国产算力上实现从0到1突破的底气。


双料第一,不是自卖自夸


说到「超越GPT-5.5」这种话,行业里的人第一反应通常是——「又来了,哪家不说自己第一?」


所以,第三方评测的价值就在这里。


第一张成绩单来自IDC。


IDC发布的《中国医疗大模型技术评估 2026》中,讯飞星火医疗大模型综合实力位列行业第一。


15项核心指标中,12项拿下第一。


报告特别指出,该模型在产品落地性、安全性、规模化应用能力上表现最优。


要知道,IDC这份报告采用任务型实测,考的是住院病历生成、检验检查解读、临床病例分析这些真刀真枪的临床任务——


拿下12项领跑,等于在「实用性」这门主科上被裁判盖了章。


第二张成绩单,来自上海人工智能实验室MedBench智能体评测


这是覆盖医学语言理解、复杂医学推理、医疗安全与伦理等五大维度的中文医疗大模型权威评测体系。


星火医疗大模型V3.5正式发布的前一天,星火医疗大模型以综合得分98.9的成绩登顶。


尤其是,循证推理、安全校验、多智能体协作等关键能力权威排名领先。


刚刚,GPT-5.5被中国纯血AI反超了!


当然,跑分第一不等于产品第一,实验室领先不等于市场领先。


但权威评测综合第一,叠加真实临床91%的医生采纳率——


评测和落地对上了账,这在国内医疗大模型赛道上是头一次。


806个区县


藏着一张别人织不出的网


最关键的问题来了,讯飞医疗大模型究竟谁在用?用了多少?


这是很多医疗AI公司最不愿意被追问的问题。


因为一追问就会发现,很多「行业领先」的产品其实只在几家合作医院里做了试点,距离规模化落地还很远。


讯飞医疗的数据是:覆盖全国806个区县、7.7万余家基层医疗机构,累计辅助诊断超过12亿次。


在医院端,讯飞携手600余家等级医院,其中涵盖50余家中国百强医院、7家十强医院。


这些头部三甲的落地验证完成,等于产品已经过了最严苛的临床检验——如果北京协和、华西这个层级的医院都愿意用,二三线城市的医院会更容易接受。


不仅如此,C端也不能忽视。


讯飞晓医APP下载量突破3000万,稳居国内AI健康管理应用第一梯队


星火医疗大模型V3.5同步升级了面向居民的能力,多模态咨询(拍照识药、拍检查单解读)、健康档案动态记忆管理、精准个性化咨询。


刚刚,GPT-5.5被中国纯血AI反超了!


更妙的是,B+C的双向协同,依托G+B端多年实战积淀,院内成熟的临床能力、基层服务经验全面赋能C端,在体检报告解读、慢病管理等核心场景打通健康管理闭环;


在此之上,讯飞医疗还搭建了集居民端、医生端、管理端于一体的区域健康管理平台,并完成规模化落地一-扎根现有医疗体系,做区域健康管理的新基建。


把这个闭环放进时代背景里看,确定性还会被进一步放大。


国务院《关于深入实施“人工智能+”行动的意见》已明确提出,到2027年,新一代智能终端、智能体等应用普及率超70%,2030年超90%。


政策红利、进口替代、自主可控,三股力量正同时为国产医疗大模型铺路。


短期看院内成熟产品放量,中期看循证智能体与大模型调用的新模式,长期看C端健康生态的流量变现。


一条从「源头技术创新」到规模化营收的路径,已经清晰可见。


医疗AI的「可用元年」


回到最初那个朴素的问题:医生愿不愿意用,并签上自己的名字?


91%的采纳率给出了答案。我们或许正在见证一个临界点。


在此之前,医疗大模型是一场关于未来的精彩演示;在此之后,它开始变成诊室里一件具体、可靠、医生敢用的工具。


从「能演示」到「临床敢用」,看似一步之遥,却是医疗AI从概念走向产业的惊险一跃。


星火医疗大模型V3.5,正是迈出这一跃的国产标杆。它证明了一件事:在全国产算力的底座上,中国完全有能力训练出世界一流、且真正能落地的专业医疗大模型。


当AI开始真正减轻医生的负担、补齐基层的缺口、守护更多普通人的健康,技术的价值才算落到了实处。


这,或许才是医疗大模型这个故事,最该有的方向。


文章来自于微信公众号 “新智元”,作者 “新智元”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md