吴文俊人工智能科学技术奖
医疗人工智能与大健康

《管窥医学人工智能》

2021年05月20日   来源:中国人工智能学会     

8200


2021年4月10日-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业年会在北京和苏州同期圆满成功举办。浙江大学健康医疗大数据国家研究院副院长吴健受邀在苏州工业园区希尔顿酒店,2020中国人工智能产业年会—医疗人工智能与大健康专题论坛上发表主题报告《管窥医学人工智能


以下为演讲实录:


大家好,非常高兴跟大家汇报我们在医学人工智能方面做的一些工作。我的汇报有四个方向医学人工智能之势、医学人工智能学术界进展、医学人工智能产业界现状、浙大睿医人工智能所做的工作。


首先介绍医学人工智能趋势,新一代人工智能成为国家发展战略,人工智能在医疗里面主要应用有语音录入病例、医学影像分析、综合性诊断、身体健康管理等等,在医疗场景当中会有诊断、治疗、医疗辅助,用到的技术是图像识别、语音交互、语音转写等等。在健康领域当中主要场景是生活方式的评估、慢病风险评估,主要应用技术也是图像识别、语音交互、三维重建。医学人工智能领域的投资非常多的聚集在辅助诊疗、基因检测、病灶识别、结构化病例。这些产品目前放到中检院检测,大概会有智能影像负责诊断,细胞病例、智能放疗、语音电子病历等等的产品。最成熟的还是医学影像辅助诊断。


其次给大家介绍医学人工智能学术界进展,2016年12月份Google发表了一篇文章《糖尿病视网膜病变辅助诊断》,由此开始人工智能大量进入医疗领域。2017年2月份Nature发表了一篇文章讲了Stanford皮肤癌的诊断,当中提到在三组试验当中人工智能击败了大部分职业医师。2018年2月Cell发表了一篇文章,讲的是眼病和肺炎两大系统的AI诊断,我们只用一套模型能不能在两个不同疾病上一起用?可以的。2019年2月份新英格兰发表了一篇文章Machine Leaning in Medicine,说医学人工智能未来可期。2019年2月在Nature子刊发表了8篇文章讲深度学习在医疗当中的应用。第一篇讲深度学习如何学习影像;第二篇讲人工智能诊断心律不齐;第三篇讲了高效医学,人类与机器融合,可以更好的计算;第四篇讲用深度学习做遗传疾病的面部表情识别;第六篇讲糖尿病病人的慢性肾病早期预测;第七篇讲医疗大数据时代的隐私问题,GDPR、HIPPA等法规能够很好的控制住一部分数据泄露,但它只是保护冰山上的一角,下面还有很多的问题没有保护住;第八篇讲心脏功能障碍发病之前跟正常人一样,发病之后可能很危险,用人工智能早期预测来预防发病。这一篇是2019年4月份讲的人工智能儿童疾病的诊断评价,当中说我已经给这些儿童做了那些诊断,我们把他检查检验的数据拿过来,把最后的治疗数据拿过来看,你当时诊断的是否为对的,那么这里也是拿人工智能评价一下。还有2019年8月份左右发的一篇文章,它讲的是临床级的AI,它拿了4万分病例片,然后说准确率超过98%,可以到临床当中应用。


下面看一下产业界现状,FDA批准了中风预警应用;在2017年批准了心电图分析平台;在2017年1月批准了心脏病、肺病、肝病的平台;2018年2月批准了儿童自闭症的诊断工具;2018年4月11日批准了IDx-DR分诊糖尿病视网膜病变;我国NMPA批准了QFA,这是做定量血流分数计算的;Airdoc和硅基拿到了糖尿病视网膜病变;联影拿到了骨折三类证;深睿和推想拿到了肺结节的证。我们现在也在报证。


最后给大家汇报一下我们浙大睿医人工智能研究中心进展。我们工作主要集中在医学影像辅助诊断。医学影像智能分割经过多年探索已经积累许多成果,但仍存在三个重要挑战:1)少标漏标等问题困扰建模和训练;2)3D影像特征复杂计算成本高;3)多模态数据信息未充分利用。


目前这一代的医学人工智能是有多少人工就有多少智能,机器需要学习非常多的医生标注数据。CT影像层数多、单张病理图像大、勾画区域复杂等问题,使得全量标注训练数据成为合作医生的巨大负担。标注数据存在的少标和漏标两大弱标注问题与深度学习模型所需要的大量精细标注数据存在矛盾,是影响分割效果的重要因素。我们提出基于对抗学习的影像分割模型解决少标问题。提取大量相似任务分割特征迁移到少量特定疾病标注影像的训练任务中,提升分割效果;同时设计对抗网络将大量特定疾病未标注影像也利用起来。应用在非增强型腹部CT肝内胆管细胞癌分割任务中,取得较好效果。漏标和阳性区域混合极易导致模型过拟合。我们提出基于无监督与半监督的漏标检测模型,通过无监督聚类方式发现漏标样本,并使用一个自监督学习框架不断寻找高置信度漏标病灶区域。


3D影像通常存在:影像质量不高目标与背景难以区分、目标边界不清晰形态差异大、3D分割模型参数量大计算成本较高等问题;我们针对上述问题,关注3D影像中的复杂特征提取、致力降低模型计算复杂度。我们提出基于3D级联框架和级联解码器的分割模型,在粗检测识别出目标所在大致区域后再开展精细分割。我们提出基于深度异构特征聚合的3D分割模型,使用非对称的3D卷积核和池化操作,从矢状、轴向和冠状三个方向来捕捉特征,充分提取并行编码中的异构特征,充分利用多角度的互补信息。针对实际应用中难以获得高质量的3D图像用于分割问题,提出利用双平面X-rays图像实现CT图像重构。通过设计生成对抗网络实现维度提升、知识迁移与特征增强,最终模型能够有效处理2D图像中模糊、叠影等质量较差部分。


CT、病理、PET、不同序列的MRI等不同模态的影像数据通常突出病变的不同方面,存在一定的相互关联补充,共同指示最终的病灶语义,因此如何实现多模态医学影像有效融合是病灶分割的一大挑战。我们设计了在各模态特征提取融合的注意力相互增强模块,捕捉多模态图像间的共同特征,促进各模态的特征学习。以临床诊断实际出发,提出宫颈阴道镜醋酸图像碘图像基于特征级融合的相互辅助模型,融合后的特征可以抑制一些可疑但不是病变的紫色噪声部分,同时更关注两种模态表现出的高置信度红色病变区域。我们还构建了一种基于交叉连接的特征融合模型,围绕多模态影像病变区域特征的位置对应关系,提出在特征提取阶段多次交叉连接,促进特征多次融合,显著提升了分割效果。


我们还做了很多工作,比如白内障分级可以做到70%左右的准确率;圆锥角膜分类,在做飞秒激光之前都要判断一下是正常角膜、圆锥角膜、还是亚临床,我们大概可以做到90%左右的准确率;还有胰腺癌生存时间分期,拿到胰腺癌患者的CT影像和性别、是否抽烟、是否喝酒等等一些值,通过这些进行分类,预期一年、两年、三年和三年以上生存,目前分类准确率达到了80%左右;我们还做了慢性肾病的筛查,带有纹理卷积的网络可以做到90%左右的准确率和敏感度。我们还参加了MICCAI 2019的印戒细胞比赛,拿到了第一名,在胸腔分科竞赛中我们也拿到了第一。我们还做了一个气管拔管失败的预测,这是2018年底301医院和MIT组织的比赛——数据马拉松,我们拿到第三名。医学人工智能是非常有意义的领域,希望大家一起共襄盛举,谢谢大家。

组织机构

主管单位
中华人民共和国科学技术部
国家科学技术奖励工作办公室
主办单位
中国人工智能学会

奖励资质