医疗大模型的准确率已从80%提到95%,但真正的下一站不是更准的模型,而是智能体驱动软件重构。IDC最新实测揭示:通用大模型与医疗大模型的差距正在收窄,未来的分水岭在于——谁能用智能体重塑长流程业务。
本文核心观点来自IDC于2026年4月发布的两份最新研究报告,为医疗机构及软件厂商提供技术选型、产品演进与市场策略的参考。
医疗大模型技术的价值初步得到认可
从通用大模型到部署垂直医疗大模型,2025年大模型在中国医疗体系中的应用进程被显著加速。医疗机构对这一技术的态度从被动向主动合作转变,部分机构展现出了付费意愿。2025年AI+医疗应用软件市场规模达到35.4亿元人民币,预测到2030年市场规模将达到140.0亿元人民币,渗透率达44.7%,成为医疗应用软件市场的重要增长来源。
医疗大模型实测:头部厂商的模型实现从性能到质量的综合能力提升
医疗大模型作为重要基座,其能力将影响智能体在医疗场景的能力,因此继2025年3月的第一次实测之后,IDC展开了第二次医疗大模型实测工作,此次收录的医疗大模型厂商包括百川智能、东软集团、福鑫科创、浪潮云、讯飞医疗、卫宁健康(按名称首字母排序)等发布了医疗大模型的厂商。设计了目前医疗机构最为广泛采用的医学知识、健康咨询、门诊病历生成、辅助诊断、病历分析、检验检查解读、诊后管理及随访场景实测。经过实测,IDC 有以下发现:
●模型在场景中的表现较去年显著提升。在任务场景表现方面,厂商的准确率较2025年有明显提升,尤其是客观选择题方面正确率从80%提升至95% ,集中在了案例类的题目;在分析类场景中,头部能够全面考虑给出的信息,引用给定的信息和出处,多模态融合决策分析,给出全面性、可循证的信息。
●医疗大模型之间呈现梯队化差异。相较于第一期的测试,头部厂商的大模型,如东软集团、讯飞医疗、卫宁健康等(按名称首字母排序)在各类场景中的准确率、专业度、可解释性明显提升,呈现出专业医师的水平,同时其模型性能、生成质量、模型数据显著改善。
●服务及落地能力形成了明显差异。基于厂商的基因不同,厂商在AI方面的人才结构、业务和客户资源、对产品的理解能力不同,部分技术厂商在向医疗领域切入时,会发现其能力方面表现较好,但是在落地应用、产品开发及验证、客户拓展等方面与头部厂商形成了明显差异;同时,医疗背景厂商在技术表现上较优,但对其AI方面能力的认可较低。
未来,以医疗领域的大型模型为基础,加速软件向AI原生化革新,重塑业务流程
在本次实测中,IDC同时纳入通用大模型,根据结果发现,头部的医疗大模型和头部的通用大模型在一些标准化程度较高的病历生成、检验检查解读,以及这些单点化场景的结果差异并不显著。因此,相对于发展全科的医疗大模型以及外挂的单点智能体,行业发展将从以下两点展开:
●医疗大模型需持续提升模型的性能及生成质量,同时深入肿瘤、妇科、儿科等专科的数据训练,完善门诊到住院的长流程的场景化模型训练,从而为智能体奠定基础;
●从单点的医疗软件+智能体的形式,转变成Agent原生的软件体系,从而发挥出大模型的推理、决策,以及智能体的自主、执行等能力,切入更长流程的业务,打造更灵活的业务流程。

适配技术发展,厂商所须具备的能力也需要对应提升
短期,跑马圈地,通过高频场景的Agent占市场先机。软件+AI形式仍将是短期内大模型技术进入医疗机构的重要落地形式,也成为了厂商产品进入医院市场的重要方式,厂商需要从高频的病历生成、检验检查解读等场景切入,尽快完善医疗软件+AI的产品及服务能力,尤其与HIS、EMR等主流软件的融合,加速验证该类产品的成熟度,从而快速抢占医院的AI需求,从而为后续的增值扩展合作建立基础。
中长期,重构软件,储备全栈式智能体能力切入长流程场景。厂商需要拓展更面向复杂的手术、住院的医疗场景,从而形成差异化竞争。厂商一方面需要重新构建由智能体驱动的软件体系,储备从全域数据平台建设、数据治理、数据标注、模型开发训练、智能体开发等综合技术能力,另一方面也要深入医院实际工作和业务系统,加深对长流程业务场景的理解。
配套按量、按需、按效果等多元化付费模式。近年来医疗机构的信息化预算收缩,而大模型及智能体的广泛应用需要配套软件及硬件的全面升级,面对高昂的费用支出,医疗机构将会望而却步。因此,厂商需要调整合作模式以适配用户的需求,包括按照分期付费、调用次数付费、按照资源消耗付费、按照使用效果付费模式等的前期探索也是厂商取得成功的关键。
(刘立庆 图/文:IDC中国市场部)

举报