商汤分拆了一家AI医疗公司,半年内迅速跻身准独角兽行列。
刚刚其高管天团首次同台亮相,一揽子发展规划与业务布局随之揭晓:
要以医疗大模型驱动的“未来医院”设计者与赋能者为目标,构建医疗领域的世界模型,实现对医疗场景的全面感知与深度理解,塑造可自主学习、持续进化的未来智慧医院。
今年年初,商汤医疗获得美的系盈峰控股、人民卫生出版社集团旗下人卫科技发展公司的战略注资;之后又完成了数亿元融资,由联想创投、联创资本、九弦资本、申冉投资等机构参与。
其A轮融资现也已正式启动,短短半年内累计融资规模已达10亿元。
商汤集团董事长兼CEO徐立强调:
商汤医疗是集团“1+X”战略生态的核心延伸,集团将作为其最稳固的技术后盾与最坚定的战略伙伴。

先看技术架构。
整体来看,商汤医疗的AI体系走的是一条“通专融合”路线——上面一个“大脑”,用以理解用户需求,统筹调度下面覆盖病理、影像、内镜等不同医学图像的多模态基础模型群,并结合医学专病知识库及工具集,构建起系统化、场景化的能力平台。

这个“大脑”,就是其自研医疗大语言模型“大医®”。
据官方介绍,在覆盖医疗长文本处理、医学知识问答、数值计算、复杂推理、指令遵循、伦理安全等八大维度、共13191道题目的专业测试集上,“大医®”的整体表现位居第一,超过DeepSeek满血版、GPT-5等通用模型。
技术方面,团队透露了更多细节。
一是数据基座。团队构建了超250B tokens(约4000亿汉字)、覆盖100+医学学科的高质量语料库,并持续跟踪高价值语料的新增与既有语料的效果变化,不断优化训练数据结构。
二是检索增强能力。团队搭建了面向医疗场景的工业级RAG框架,让“大医”在生成回答前先做证据溯源和知识校验,从源头降低“幻觉”,提升输出内容的可靠性和实际可用性。
此外,他们还对模型进行了一系列专项训练,强化了其临床思维能力:
为让“大医®”这一中枢与多模态基础模型群高效协同,团队开发了“双中台”——
一个是大医®Bots智能体开发平台,负责语言和逻辑层面的智能应用孵化。平台融合了零代码智能体编排、私有知识库一键转化、多模型统一调度和跨角色协作开发等功能,并且支持无缝接入“大医”及业界领先的通用模型。
在该平台基础上,商汤医疗团队已研发了“大医智健”、“大医智研”和“大医医助”三款标准化产品。
另一个是多模态基础模型应用生产平台,专为医学图像打造,集成医学通用算法库与深度学习框架,提供多模态数据标注、训练到测评的高质量路径,实现零代码全生命周期AI应用生产。
“大医®”中枢+双中台,形成了“数据-模型-场景-产业”的完整闭环。
另外,商汤医疗进一步打造了由医疗大模型底层驱动的“SenseCare®智慧医院”综合解决方案,包含智慧诊疗平台、智慧就医平台、智慧医学科研平台、智慧医疗云平台。

据了解,在临床诊疗侧,商汤医疗已上线40余款AI模块,针对肺、心脏冠脉、头颈血管、肝脏、肌骨等十余个临床方向开放应用。
以病理科为例,SenseCare®智慧病理AI辅助诊断系统帮助科室工作效率提高30%-50%,肿瘤检出敏感性接近100%,良性排阴可达80%。
在智能决策方面,SenseCare®智能手术规划系统基于医学影像,利用人工智能算法自动完成三维重建,自动检测并精准定位病灶,为医生提供多种术式方案选择,并通过实时交互模拟分析,全面辅助医生进行个性化精准术前模拟与术后评估。
例如,商汤医疗联合北京清华长庚医院董家鸿院士团队推出了全国首个肝脏智能决策多模态智能体“IDEAL”,实现覆盖肝脏手术规划全流程的智能AI辅助。

在患者端,“大医智健”集成了导诊、预问诊、云陪诊、AR导航、诊后随访等全流程服务。新推出的健康管理小程序“商汤大医”,可在移动端实现用药咨询、体检报告解读、检验结果分析、健康档案管理等功能。
在科研支持方面,“大医智研”智能体应用涵盖智能选题、文献解读、全文翻译、智研问答、样本估算、论文写作、统计图表、模拟审稿、全文润色功能,帮助医生从繁琐的信息处理中解放。
在商汤医疗新征程启航盛典上,CEO张少霆、CMO钱琨、COO申田、CFO赵都、CSO尚海龙、研发副总裁王睿首次公开集结同台亮相。

作为商汤“1+X”创新业务版图中的重要一极,商汤医疗当前团队规模100人左右,产研人员占比超过70%。
团队成员多毕业于斯坦福、哈佛、港中文、清华、北大、上海交大等海内外顶尖高校,具备人工智能头部企业和互联网巨头落地经验。团队中还汇聚了一批医工结合背景的高层次复合型人才。
商汤医疗一众高管在采访中透露了其在市场落地与商业化进展、核心差异化优势、技术布局及未来发展规划等最新思考与实践。
在谈到商汤医疗差异化优势,CEO张少霆提到:
整个医疗软件业的发展分为三个阶段。第一阶段是项目实现人力信息化,第二阶段是产品可复制,这些普遍是基于深度学习解决高频问题。
而3.0时代是拼模型能力的时代,核心在于基座模型要具备强大的泛化能力,使得我们能够将庞大的医疗知识体系解构成多个专业模块(即“垂类切割”),在每个细分领域都做到足够的深度。
在他看来,如果没有经过2.0阶段的长期积累,直接跳到3.0,大模型往往只能停留在问诊、健康咨询、导诊等浅层应用,在医院场景里做不深,就很难真正体现商业化价值,更难赢得客户的认可。
软件类、AI类并不存在绝对的技术壁垒,即便具备先发优势,也会被人追赶上来。因此,持续领先的关键在于速度、前瞻性的技术布局和平台化能力。
在商业落地层面,商汤医疗亮出了一系列成果。
他们与上海交通大学医学院附属瑞金医院联合,共同打造了“瑞金医学数字人”。
基于该数字人孵化的“SenseCare®肝脏智能手术规划系统”,能在2-5分钟内全自动完成肝脏三维重建,支持流域切除、曲面切除等术式模拟,辅助医生完成超400例复杂肝切除手术,提升手术精度与安全性。

他们还与罗氏制药合作,将医疗大模型能力深度嵌入科研任务流程,搭建小罗智多星平台——自试运行以来,已覆盖全国90个城市、700家三甲医院,帮助4000余名医生落地科研项目600余项,累计节约科研工时超过2万小时。

上海申康医院发展中心联合商汤医疗,共同建设以临床应用为导向的国内规模最大的医疗大数据训练设施。
该项目构建了“算力-算法-数据”一体化的AI模型生产平台,支持医疗机构在低代码/零代码环境下自主孵化AI模型。
除此之外,商汤医疗全线产品还已经入驻了联想SSG(方案服务业务集团)全渠道,正与联想各类硬件产品进行适配;为美的集团旗下顶级私立医疗机构和祐医院成功部署“SenseCare®智慧诊疗平台”,上线15款AI辅助诊断应用……

并且市场的边界,还在持续外扩。
CSO尚海龙透露,目前全球在“AI大模型+医疗”上形成系统性布局的国家还不算多。东南亚、中东以及日韩等地区对AI医疗的需求较为迫切。
商汤医疗已经在这条路径上迈出了几步关键棋:
已拿到新加坡的第一张人工智能+医疗的医疗器械证(新加坡卫生科学局颁发的首张人工智能胸部CT辅助诊断医疗器械注册证),并且在新加坡的医院中落地,同时在印尼也达成了首单业务。

最后谈及未来的“世界模型”,张少霆表示这是下一步的关键跃迁:
现在AI大多停留在“你说我答”的文本层面,但真实的医疗是一个动态的、充满因果关系的复杂世界。我们想要构建的,就是一个能模拟这个世界的数字基座。
比如,在我们的“医学数字人”项目里,它不光是静态展示解剖结构,更能够在数字临床环境中呈现人体的动态过程:包括在还原病灶与周围组织的空间关系、重要血管的分布基础上,模拟术前术后可能出现的灌注及血流变化;同时还能模拟不同因素干预下人体代谢行为和生理指标的变化,让模型具备预测风险与评估治疗影响的能力。这相当于在医院里建立一个“数字实验室”,让AI从“回答问题”进化到“模拟结果、辅助决策”。
2025年,商汤持续深化“1+X”战略。
根据官方解读,“1+X”以生成式AI与视觉AI作为“1”的核心业务,亦是双引擎,而“X”代表的X创新业务板块以孵化创新生态为核心战略,聚焦智能驾驶、智慧医疗、家用机器人、智慧零售等赛道。
在商汤发布的2025年中期业绩中,商汤通过“1+X”战略,正持续向核心业务,尤其是生成式AI聚焦。

值得一提的是,在现阶段讨论热度较高的空间智能领域,商汤也早有布局。
就在最近,商汤团队还联合新加坡南洋理工大学等发表最新研究——
提出模型Puffin,首次将相机几何无缝融入统一多模态模型,通过“Thinking with Camera”机制填补了相机与视觉-语言间的模态适配空白,实现了相机理解与生成的协同优化,为机器的空间智能提供了更通用、鲁棒的框架。
这项研究的核心方向——视觉与多模态理解,也正成为全球顶尖学术会议的重点。
本文作者Chen Change Loy与商汤医疗CEO张少霆,将共同担任CVPR 2026的Program Chair,大会主席则由张少霆的导师、知名学者Dimitri Metaxas出任。这一来自学术界与产业界的核心组织阵容,预计将推动包括生成模型、医疗影像及空间智能在内的前沿议题,成为明年CVPR的热点。对于相关领域的研究者而言,这无疑是一个值得关注和参与的关键舞台。

文章来自于“量子位”,作者 “嘻疯”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。
项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales