DeepGestalt首先识别患者面部的五官,然后将图像裁剪成100×100像素大小的区域。接下来,使用深度卷积神经网络对这些区域进行评估,分析每个综合征的概率。然后它综合整个图像的数据给出一个预测。
如今,人工智能在各个领域迅猛发展。新的研究表明,在医疗领域,人工智能可以帮助诊断罕见疾病。
约有8%的世界人口受到遗传综合征的困扰,此类患者往往具有可识别的面部特征。然而,遗传综合征的诊断过程却出奇陈旧,大多数时候需要医生手工测量面部特征之间的距离。1月7日,总部位于波士顿的人工智能公司FDNA发布了一项最新研究,他们发现,通过数万张真实患者面部图像的训练,人工智能能够以较高的准确度从人脸照片中识别出罕见遗传综合征。
“这是人们期待已久的医学遗传学突破,终于取得了成果,”凯伦·格里普在一份声明中说,她是一名医学遗传学家,也是这篇新论文的合著者。“通过这项研究,我们已经表明,在临床工作流程中添加一个自动的面部分析系统可以帮助实现早期诊断和治疗,有望改善生活质量。”
AI医生的“诊断”过程
训练算法
每年全球出生的儿童中约有6%患有严重的遗传综合征。早期发现这些综合征有助于治疗,但准确诊断往往是个漫长而昂贵的过程。部分问题在于基因综合征有数百种,其中许多非常非常罕见。正确的诊断和早期治疗,常常依赖于医生的经验以及他们以前是否遇到过类似案例。但是机器学习可以改变这种情况。
格里普和她的同事们想创造一种人工智能,能够通过病人面部图像识别基因综合征。为此,研究小组建立了一个名为“DeepGestalt”的深度学习算法,它可以分析面部特征,找出特定遗传综合征日前发表在《自然医学》杂志上的新研究报告称,他们使用了一个包含15万多名患者的数据集来训练这种算法。
DeepGestalt算法首先识别患者面部的五官,例如眼睛、鼻子和嘴巴,然后将图像裁剪成100×100像素大小的区域。接下来,该技术使用深度卷积神经网络对这些区域进行评估。深度卷积神经网络是一种机器学习技术,已经成为自动图像分类的领先模型。对于每个面部区域,DeepGestalt分析每个综合征的概率,然后它综合整个图像的数据给出一个预测。
打败专家
当格里普和她的同事对DeepGestalt进行诊断测试时,它的表现优于临床医生。在一项测试中,他们对DeepGestalt进行了一系列的训练,给它展示了600多张科妮莉亚德兰格综合征(一种导致发育迟缓和生长缺陷的遗传疾病)患者的图片,以及大约1100张非患者的图片。研究人员报告说,DeepGestalt以接近97%的准确率识别出了该综合征患者。相比之下,65名专家在面对类似的诊断测试时,准确率只有75%。
在另一项测试中,研究人员使用17000多张、涵盖了200多种不同基因综合征的患者图像对这一算法进行了训练。经过训练,在一项包含502张新图像的测试中,DeepGestalt成功地以91%的准确率列出了排名前十的综合征。
“不断增强的标准化描述(病人特征)的能力,打开了未来研究和应用的大门,”FDNA公司首席技术官、论文第一作者亚龙·古罗维奇说,“它展示了一个可以成功地应用先进的算法,如深度学习,一个具有挑战性的领域。”
AI医生的“培养”过程
发布App收集海量数据
要研发这样的深度学习算法需要相当大的训练数据集。FDNA通过出版物和公共数据集收集了这些数据,也通过向临床医生发布一个名为“Face2Gene”的应用程序来收集数据。
去年秋天,FDNA首席执行官德克尔·盖尔布曼是这样介绍Face2Gene的:这款应用实际上是一个平台,可以通过移动应用商店和网络访问。
使用这款应用,医生需要拍摄病人的照片,然后将照片上传到App上。DeepGestalt扫描了这张照片,并从该公司的专有数据库中为医生提供了一份兼容诊断的排名表。这款应用还可以帮助医生解答问题,添加更多特征的表型数据,进一步完善结果。如果可能的话,医生可以通过增加一个最终诊断来结束这个循环。
医生输入的数据,在盖尔布曼口中所称的“良性循环中”训练了深度学习算法。盖尔布曼说,Face2Gene的使用一直在增长,许多用户在涉及基因部的临床数据或病历时,已经开始依赖该应用程序。
据FDNA公司介绍,他们用了三年的时间在Face2Gene平台上收集了15万名患者的面部数据。这次研究的17000多张面部图像正是出自这个数据库。
关键是要使用幼儿图片
西奈山伊坎医学院教授Bruce Gelb博士指出,这篇论文只使用了一组幼儿的图像,这一选择可能为算法的成功奠定了基础。
“面部特征在蹒跚学步的儿童或幼儿身上最为明显,这种特征在青春期就会逐渐消失——在进入成年期之前。”他说。
不过,他承认,该算法的成功率令人印象深刻,对于那些对特定遗传特征没有高度专业知识的临床医生尤其有用。
“使用FDNA这样的工具可以让临床医生知道他们应该让实验室检测哪些基因。”古罗维奇说,“如果你正确地考虑表型,你就能增加诊断的几率。”
他说,人类做不到这一点。“有些遗传学家尝试过这样做。他们不能,我们可以。”
隐私顾虑
除了令人刮目相看的结果和新的潜在用户,论文作者还强调了一些注意事项和关注的领域。这些实验的基本假设都是病人确实患有综合征,如果是正常人,那应当另外处理。
他们还警告了滥用这项技术的风险。“表型数据是敏感的患者信息,基于此的歧视受到反基因歧视法的限制。与基因组数据不同,面部图像很容易获取。减轻滥用的有效监控策略,可包括通过区块链技术向使用DeepGestalt应用程序的用户添加数字足迹等。”
确实,人脸图像是敏感且容易获取的数据,若使用不慎,看脸识疾病的技术将引发歧视等伦理问题。如果面孔能够揭示基因的细节,那么雇主或保险公司等就可以秘密地利用这些技术,歧视那些可能患有某些疾病的人。
三年前,上海交通大学教授武筱林训练出了可以看脸识罪犯的人工智能系统,准确率达到86%。当时,这项研究引发了广泛争议,也遭受了纷至沓来的批评。不少学者认为该研究充满了歧视和误导,将给无辜的人们带来巨大的麻烦。
也许是因为这样的前车之鉴,FDNA最新研究的作者指出,应防止DeepGestalt技术的歧视性滥用。古罗维奇说,这个技术只开放给临床医生运用。
格里普说,出版论文的重要性在于激发想象力,而非其他。
“最重要的是,这是人工智能如何应用于病人表型的一个例子。这个工具将变得越来越有价值。这个仅是观察面部特征,但对病人来说还有很多。你可以用类似的工具来观察X光片或视网膜的照片。”她说,“这只是一个例子。人工智能方法还可以为下一代表型带来许多其他功能。”
据《信息时报》报道
(免责声明:本文仅代表作者观点,并不代表品潮时尚网立场。)