你的位置:兰花雅韵 > 新闻 >

AI支持会诊的幻觉问题是源自数据忽略

AI支持会诊的幻觉问题是源自数据忽略

在医疗会诊范畴,东说念主工智能时代的应用正日益普及,但其准确性和可靠性仍然是公众和专科东说念主士良善的焦点。本文真切商酌了AI支持会诊中存在的挑战,卓著是AI怎么冲破东说念主类医师会诊准确率的“天花板”,以及怎么识别和哄骗那些可能被东说念主类医师冷落的荫藏特征。

前段时期读了杰罗姆·格鲁普曼的《医师怎么想考》(How Doctors Think)。这本书我以为任何承袭过蜿蜒颐养的东说念主齐应该读一下,它会透顶改造你对医师的意见。书里提到一个让我战抖的事实:即使是通过委员会认证的辐射科医师,他们大致有 15% 的时期会对我方的会诊意见不一致(要是没记错的话)。

让我景仰的是,既然东说念主类医师齐有这种纵脱,那咱们奈何让东说念主工智能的会诊准确率比东说念主类高?

现在的形态,比如辐射科医师的会诊,准确率可能在 95% 傍边。要是咱们用这些准确率惟一 95% 的形态来考验 AI,那么 AI 奈何能冲破这条“天花板”?它需要一些咱们还没顽强到的常识来提升到 99.999% 的准确度,但这些常识咱们我方却并不知说念它们是什么。

举个顶点但形象的例子。假定有种叫红流感的疾病,患者脸上会出现红点,这点全球齐知说念,但更少东说念主防护到的是,这种病可能会在发病前四周让脚趾甲变紫。东说念主类医师可能遥远不会发现这个细节,但 AI 可能会自动发现两者的关系。问题是,咱们怎么主动找到这些“紫脚趾甲”式的荫藏特征?

更复杂的是,咱们的数据自己可能会欺骗 AI。拿肺癌来说,考验数据相对浅易。咱们不错只用活检证据过的癌症患者的 CT 和 XR(而不是那些辐射科医师怀疑有癌症但未确诊的样本),这么考验出来的 AI 特异性委果是 100%。明锐性怎么?这很难说,但实质上东说念主类医师的明锐性也莫得明确的步调。

但要是是肺炎,情况就完全不同了。肺炎莫得像活检相似的“金步调”来考据,会诊通常依赖 XR 上的特征和医师的教学判断。考验数据不成幸免会掺杂噪声,这种情况下,AI 的特异性一定低于 100%。

不外即便如斯,AI 的一致性可能让它在实质发扬中仍然优于平均水平的医师。即便考验数据并不完整,AI 也有可能接近顶级辐射科医师的发扬,这比世俗医师要好得多。

然而,AI 还有一个问题是它的“黑箱”属性。咱们不知说念它在检测癌症时究竟看到了什么,忽略了什么,也无法完全认知它的有缠绵经过。就像医学自己更像一场概率游戏相似,AI 也并非十足细则的器具。

本文由东说念主东说念主齐是居品司理作家【罗福如】,微信公众号:【罗福如】,原创/授权 发布于东说念主东说念主齐是居品司理,未经许可,抑制转载。

题图来自Unsplash,基于 CC0 契约。