跳转到主要内容

你的扫描背后的科学:理解 MedGemma 1.5

在 ReadYourLab.com,我们的使命是让 CT、MRI 等复杂医学影像更容易理解。为此,我们采用了当前最先进的开源医学 AI 模型之一:MedGemma 1.5

MedGemma 由 Google 开发,是一种专门面向医疗场景的“医学语言与视觉模型”。你可以把它理解为一位经过高度训练的数字助手,它“阅读”过大量医学文献和病历,也“看过”大量复杂的 3D 扫描。下面我们会更透明地解释这项技术如何工作、它擅长什么,以及它目前仍然存在的局限。

1. 训练方式:三维视角

大多数 AI 模型主要在平面的 2D 图像上训练,例如普通照片。但人体并不是平面的,影像扫描也不是。一次 CT 或 MRI 实际上是一个“体积”数据集,由数百张切片叠加形成三维图像。

MedGemma 1.5 的突破在于,它原生就是在这些 3D 体积数据集 上训练的。它不会只逐张查看切片,而是同时分析整个体积。其训练内容包括:

高维医学影像

学习了大量去标识化的 CT 与 MRI 体积数据,掌握三维人体解剖“地形图”。

海量医学知识

在医学教材、研究论文(PubMed)和临床问答数据集上进行训练。

临床记录

在电子病历(EHR)上训练,以理解症状、化验结果与影像发现之间的联系。

2. 验证方式:我们如何衡量表现

我们重视透明度。AI 很强大,但并不完美。Google 使用严格的基准来评估 MedGemma 1.5。以下是它在我们处理的影像类型上的表现:

MRI 解读

64.7%

在 10 类 MRI 异常中识别特定疾病相关发现的准确率达到 64.7%,相比上一代约 51% 有明显提升。

CT 扫描准确率

~61%

在 CT 内部基准测试中,模型对关键异常的识别准确率约为 61%。

临床推理

~70%

在美国医师执照考试(USMLE)风格问题中接近 70%,展现出较强的医学常识推理能力。

说明:这些百分比反映的是模型自动识别复杂模式的能力。这也是为什么我们始终强调,AI 结果应作为与你医生沟通的起点,而不是终点。

3. 它能识别什么?

MedGemma 1.5 特别擅长识别具有“空间性”的异常,也就是占据空间、随时间变化,或需要三维关系判断的发现。常见可辅助识别内容包括:

病灶与肿块

识别跨越多个三维切片的异常增生或占位。

解剖定位

更准确地判断器官位置及其形态、大小是否发生变化,相比早期版本定位能力有显著提升。

长期追踪

MedGemma 最有价值的能力之一,是将当前扫描与既往扫描进行对比,判断病情是在改善、稳定还是进展。

4. 需要理解的局限

尽管 MedGemma 1.5 是重要进步,但每位用户都应清楚它仍然存在明确局限:

“起点而非终点”原则

MedGemma 属于基础模型,适合辅助分析和生成初稿报告,但并不是能替代认证放射科医生的临床级诊断系统。

细微差别与罕见情况

对于极少见的疾病,或由运动等因素造成的细小伪影,AI 有时仍然会判断困难,而人类专家可能更容易识别。

上下文非常关键

AI 擅长分析扫描中的像素信息,但它对你的完整病史、症状与个体背景的掌握,仍无法与主诊医生相比。

我们对你的承诺

在 ReadYourLab.com,我们使用 MedGemma 1.5 为你提供清晰、自动化的影像“第一眼”解读。我们的目标,是让你在下一次就诊前对 AI 识别到的内容有更明确的初步了解,从而更有准备、更有信心地与医生沟通。

免费获取你的 AI 放射学报告

相关文章