你的扫描背后的科学:理解 MedGemma 1.5
在 ReadYourLab.com,我们的使命是让 CT、MRI 等复杂医学影像更容易理解。为此,我们采用了当前最先进的开源医学 AI 模型之一:MedGemma 1.5。
MedGemma 由 Google 开发,是一种专门面向医疗场景的“医学语言与视觉模型”。你可以把它理解为一位经过高度训练的数字助手,它“阅读”过大量医学文献和病历,也“看过”大量复杂的 3D 扫描。下面我们会更透明地解释这项技术如何工作、它擅长什么,以及它目前仍然存在的局限。
大多数 AI 模型主要在平面的 2D 图像上训练,例如普通照片。但人体并不是平面的,影像扫描也不是。一次 CT 或 MRI 实际上是一个“体积”数据集,由数百张切片叠加形成三维图像。
MedGemma 1.5 的突破在于,它原生就是在这些 3D 体积数据集 上训练的。它不会只逐张查看切片,而是同时分析整个体积。其训练内容包括:
高维医学影像
学习了大量去标识化的 CT 与 MRI 体积数据,掌握三维人体解剖“地形图”。
海量医学知识
在医学教材、研究论文(PubMed)和临床问答数据集上进行训练。
临床记录
在电子病历(EHR)上训练,以理解症状、化验结果与影像发现之间的联系。
我们重视透明度。AI 很强大,但并不完美。Google 使用严格的基准来评估 MedGemma 1.5。以下是它在我们处理的影像类型上的表现:
MRI 解读
64.7%
在 10 类 MRI 异常中识别特定疾病相关发现的准确率达到 64.7%,相比上一代约 51% 有明显提升。
CT 扫描准确率
~61%
在 CT 内部基准测试中,模型对关键异常的识别准确率约为 61%。
临床推理
~70%
在美国医师执照考试(USMLE)风格问题中接近 70%,展现出较强的医学常识推理能力。
说明:这些百分比反映的是模型自动识别复杂模式的能力。这也是为什么我们始终强调,AI 结果应作为与你医生沟通的起点,而不是终点。
MedGemma 1.5 特别擅长识别具有“空间性”的异常,也就是占据空间、随时间变化,或需要三维关系判断的发现。常见可辅助识别内容包括:
病灶与肿块
识别跨越多个三维切片的异常增生或占位。
解剖定位
更准确地判断器官位置及其形态、大小是否发生变化,相比早期版本定位能力有显著提升。
长期追踪
MedGemma 最有价值的能力之一,是将当前扫描与既往扫描进行对比,判断病情是在改善、稳定还是进展。
尽管 MedGemma 1.5 是重要进步,但每位用户都应清楚它仍然存在明确局限:
“起点而非终点”原则
MedGemma 属于基础模型,适合辅助分析和生成初稿报告,但并不是能替代认证放射科医生的临床级诊断系统。
细微差别与罕见情况
对于极少见的疾病,或由运动等因素造成的细小伪影,AI 有时仍然会判断困难,而人类专家可能更容易识别。
上下文非常关键
AI 擅长分析扫描中的像素信息,但它对你的完整病史、症状与个体背景的掌握,仍无法与主诊医生相比。
我们对你的承诺
在 ReadYourLab.com,我们使用 MedGemma 1.5 为你提供清晰、自动化的影像“第一眼”解读。我们的目标,是让你在下一次就诊前对 AI 识别到的内容有更明确的初步了解,从而更有准备、更有信心地与医生沟通。