研究发现|AI在新冠检测中失灵了?研究发现647款AI工具不适用于临床


研究发现|AI在新冠检测中失灵了?研究发现647款AI工具不适用于临床
文章插图
智东西(公众号:zhidxcom)
编译 | 健恩
编辑 | 高歌
智东西8月2日消息,自新冠疫情爆发以来,世界各地的研究团队开发了各种人工智能(AI)工具来帮助检测新冠病毒或者对新冠病毒的感染情况进行预测。但是很不幸,来自荷兰马斯特里赫特大学和英国剑桥大学的两个研究团队分别独立对232种和415种AI工具进行测试,发现这一共647种工具没有一个适合临床使用,有些甚至还会有害。
产生这个结果主要与训练AI模型的数据质量有关。开发者采用的数据集里面往往掺杂了一些无效信息或错误信息,导致AI工具学会了错误的判断方法。而开发者往往不具备医学的专业知识,这使他们很难发现其中的错误。
有专家认为,只有通过开发者与临床医生的通力合作才能尽可能的避免这种错误产生。另外,还有专家呼吁对于此类全球突发的卫生健康事件应该做好“数据共享”,以便各国能够充分应对。
一、共647种AI工具被测试,均不适合临床使用2020年3月,COVID-19开始袭击欧洲,但那时的人们人们对此知之甚少,这让欧洲的医院陷入了一场危机。荷兰马斯特里赫特大学流行病学家Laure Wynants一直在研究流行病的预测工具,她说:“医生真的不知道如何管理这些患者。”
不过新冠疫情在欧洲爆发之前,就已经在中国肆虐了一段时间,因此有许多来自中国的数据可供欧洲使用。专家们认为机器学习算法能够根据这些数据进行训练,并帮助医生对患者做出诊断,那么将会有大量生命被拯救。Laure Wynants称:“在这件事上AI可以证明其实用性,我对此抱有希望。”
世界各地的研究团队加紧进行研究,尤其是AI社区紧急开了发各种软件。许多人认为这些软件可以让医院更快地诊断或分诊患者,为抗击疫情的前线提供支持。但是,数百种检测工具被开发出来,却没有一个真正的产生作用。
今年6月,英国国家数据科学和人工智能中心图灵研究所发布了一份报告,总结了其在2020年底举办的一系列研讨会上讨论的内容,这些研讨会中达成的一项明确共识是:AI工具在抗击新冠疫情的战斗中几乎没有产生任何实质性的影响。两个研究团队围绕着这些AI工具分别进行的两项研究得到的结果支持了这个结论。
Laure Wynants和她的同事研究了232种用来预测或诊断新冠肺炎患者的算法,结果发现都不适合临床使用,只有两个算法可能在未来会对临床上的检测有所帮助。这项研究结果以一篇评论文章的形式发表在英国医学杂志(British Medical Journal)上,到现在这篇文章仍在随着新工具的发布和研究者对现有工具的测试而进行更新。
对于这样的结果Laure Wynants说道:“这十分令人震惊。我带着这样的担忧开始了这项工作,但是这个结果超出了我的预想,让我非常恐惧。”
研究发现|AI在新冠检测中失灵了?研究发现647款AI工具不适用于临床
文章插图
荷兰马斯特里赫特大学流行病学家Laure Wynants
剑桥大学机器学习研究员Derek Driggs及其同事进行的另一项研究结果也得出了相同的结论。该团队利用深度学习模型诊断新冠肺炎,并让AI通过胸部X射线和CT扫描来预测患者的患病风险。他们研究了415种已经公开的AI工具,但是结果和Laure Wynants的发现一致,没有一个工具适合临床使用。
这项研究结果被发表在Nature Machine Intelligence上,论文题目为《使用机器学习通过胸片和 CT 扫描检测和预测 COVID-19 的常见缺陷和建议(Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans)》。
论文链接:https://www.nature.com/articles/s42256-021-00307-0
Derek Driggs正在研究一种机器学习工具,希望能够在新冠疫情流行期间帮助医生,他说:“这次的疫情是一次对AI和医学的重大考验,不过我认为我们没有通过这个考验。”
尽管结果如此,Laure Wynants和Derek Driggs仍相信AI有潜力为医生提供帮助,同时他们也担心以错误的方式构建的AI工具不仅不会产生帮助甚至还会有害,因为这样可能会使医生做出错误的诊断或低估患者的病情。
Derek Driggs称,关于机器学习模型以及它的作用有很多炒作,人们对它们不切实际的期望促使这些工具被提前投入使用。Laure Wynants和Derek Driggs研究的数百种AI工具中的一部分已经被一些医院所使用,而有些正在被私人开发商四处兜售。“我担心他们可能伤害了病人。”Laure Wynants说。
新冠疫情让很多研究人员清楚的看到他们需要改变AI工具的构建方式。Laure Wynants谈道:“新冠疫情的流行让这个问题成为了人们关注的焦点。”