9150
2021年4月10日-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业年会在北京和苏州同期圆满成功举办。深圳大学计算机与软件学院教授李坚强受邀在苏州工业园区希尔顿酒店,2020中国人工智能产业年会—医疗人工智能与大健康专题论坛上发表主题报告《人工智能医疗研究与应用探索》。
以下为演讲实录:
今天我第一个是起抛砖引玉的作用,因为后面有很多大咖的报告,我简单汇报一下我们团队在做的探索。我来自深圳大学,我们有一个领域是使用物联网手段或者数据分析、人工智能手段在上面做一些探索,这里我主要介绍一下这部分。
学院基本情况
首先介绍一下我们团队的情况。我来自深圳大学,它的地理位置比较南,去哪里都要做飞机。深圳大学是相对比较年轻的学校,1983年建校,今年快38周年了,近年来也在不断的做高水平探索,目前学校里面拥有两院院士14名,在各项指标上也在努力。因为深圳大学是一个市属高校,所以我们的各项指标只能不断的努力。比如我们2019和2020年的国家基金,在2020年我们有370多项,对于深圳大学来说已经非常不容易了。
我们学院是计算机学院,学校给我们的定位是研究型学院,我们首任院长是陈国良院士,目前有教师110多名。这个跟今天比较相关,我们有一个大数据国家工程实验室,还有十几个省级平台。因为我们定义为研究型学院,近年在研究方面学校对我们的压力也比较大,我们近年在某些指标上还可以,比如国家基金,我们在2018年学院拿到了30项,人工智能方面拿了10项,项目数从全国来说也还可以,2020年我们拿了28项国家自然科学基金。
因为我们地处深圳,深圳还有一个点比较好,周围的产业环境比较不错。这里我们还跟腾讯成立了人工智能学院。腾讯的创始人团队有五个人,四个毕业于深圳大学,所以我们跟他专门成立了人工智能学院。我们也在不断努力的探索过程中,这是我们学校学院的介绍,因为我在学院里面分管教学,所以这是一个宣传的PPT,目前我们学院有两位院士。在前期发展过程中还是稳步发展,最近一些年得到了比较快速的发展。比如我们教学方面有两个国家级平台,科研方面有一个国家级平台。这里是几个代表性校友,比如马化腾、周国辉。
刚才介绍了我们有100多位老师,60-70%都具有海外经历,基本都有博士学位。这是我们的科研平台,一个国家级大数据工程实验室及十几个省级实验室,这里不多展开。我觉得对深圳大学、教学科研来说,非常重要的一点是依托了深圳的地理位置,深圳大学在南山区,围绕我们周围的是科技园,在科技园里面就有超过160家上市公司,这个在全世界来说都是非常集中的。比如腾讯大厦、滨海大厦、阿里巴巴大厦等等,这是我们周边的整个环境氛围。
另外深圳市也给了我们非常大的压力,深圳市经常说的一句话是深圳大学的发展速度跟不上深圳市的速度或者深圳大学的地位跟不上深圳市的地位,我们也在想怎么结合那么好的产业做自己的能做的工作。接下来介绍一下我们团队在医疗上的探索,这个是我带的团队,当中有二十多个老师。这也是依托学校的平台,同时我的研究是围绕人工智能和物联网,我们想通过这些方法,一个在医疗上,还有一部分用在机器人感知上。我做的很多工作是从感知的角度,再去做医疗。2020年我带着团队获得了国家中联发计划项目,还有国家基金6项。
这个是另外一个方向,从感知的角度,也是我主持国家自然基金的项目,目前用在了各类检测上。这个是比较大范围的,通过空地机器人的检测,当前我们正在做核反应堆的安全壳检测。我们现在是用无人机把核反应堆安全壳巡一遍,把问题检测出来,这里面也是一个小目标,我们的身体检测指标其实一些小数据,我主要做这一块的工作。
人工智能+医疗背景
接下来进入正题:人工智能医疗。这里我面向了两个领域,一个是慢病领域,一个是妇幼领域。现在进入老龄化,这个项目也是我在前年拿到吴文俊一等奖的,这里是我前面10年在做的工作。慢病大家都很了解,因为现在中国进入了老龄化社会,妇幼方面的出生缺陷比例是比较高的,2014年统计数据为5.6%,也就是100个孩子出生就有5个孩子有问题,当然现在的出生率也在下降。在最高峰的时候每年有2000万新生儿,如果一个家庭孩子有问题,首先会给家庭带来非常沉重的负担,其次对社会也是很大的负担。这里无论是国家,还是各级政府,各方面制定了非常多的政策,所以这里不多展开。
这个规模是很大的,我们主要是想通过检测把健康做好。这里所面临的也有很多挑战,首先我们去医院看病可能等了两个小时看五分钟就回去了,但出问题的时候,比如各类脑梗或者其它危险状态的时候。比如有做妇幼的孕妇,胎儿在肚子里面出问题,这种大部分时间是在家里,我们在想能不能通过物联网或者穿戴式的终端把这个工作做起来。另外在建立起来之后,我们的终端和网络端怎么更好的把机制建立起来。在有了这些数据之后,其实我们跟深圳市医院都有合作,这里我们学校专门设立了交叉学科人工智能+医疗的硕士点,这是我们跟深圳医院、腾讯一起做的。这里的需求非常大,医院对数据的分析非常大,后面有专家介绍图像的,这里我们想怎么把数据拿过来更好的分析,这就是目前我们想围绕的三个板块。
这里是做转化应用,因为深圳的产业链很好,我们先期结合做了一些成果转化,后面给大家汇报一下。这里讲到物联网,我们现在一直在提这个,但古代已经有了,那个原理我不是很熟悉。比如古代医生拿一根线就可以号脉,我们想在检测过程中怎么通过网络把数据更好的传送出来,中医博大精深,一根线就可以把脉搏的信息传递过来。但如果现在有一些穿戴式或者设备能够把数据更好的传递,这也是我们想做的一些探索工作。
前期我们得到了各类项目,这一块从2008年到最近一直在做的工作,一个是有各类项目的支持,其次我们自己也孵化了两家企业在做成果转化,这时间年来一直在做这部分的探索。这个是我们在前面做的工作,深圳大学一个是国家工程实验室,一个是孵化两家企业,一家是给中兴全资并购,那是针对慢病板块的。这是我们自己在孵化的,专门针对妇幼板块的工作。因为这里的氛围比较好,成功转化体系也好,它在2015年就被收购了。当时我们发现妇幼方面通过信息化手段还是非常有价值的,后面就孵化了妇幼板块,这个也是2014年孵化的。后面在社会上,在医院各个方面也真正的用了起来。
人工智能+医疗探索
这个是我们整体做的工作,刚才提到我们在做重点人群的检测过程中,这里有几个问题:
1.出问题的时候不在医院,无论是慢病,还是妇幼领域,在医院里面有各种各样的大设备,所以我们第一个想做的就是通过穿戴式设备,这里能不能做一些工作随时监测?刚才主持人提到的超声,超声我们也做了一些,但今天我没有细讲。因为医院各个科室都想做工作,我们超声做的是机器人,现在因为有职业病,用机器人就可以把超声的检测做完。
2.网络怎么建?医院数据涉及到隐私问题,只要数据泄露那就是大事件。深圳出现过好几次数据泄露,但这很多事人为的,而不是黑客做的,更多是人为把数据拍下来,一条数据卖500元,它是这样出去的。这说明了怎么更好的计算起来,还有这个数据的安全传输。
3.怎么做进一步的分析?我们基于三这个问题做了成功转化,这是我们团队在前面做的工作。首先是刚才提到的各类设备,一个是怎么做小,因为医疗涉及到环境和医生,但我们要做一些小的,做各类检测的时候涉及到环境噪声、不确定性。但我们又想把它做小,但医院里面的所有设备,比如手环等等不能拿来做医疗用。这也不是说没有用,而是拿来做医疗达不到,拿医疗器械证就需要非常严谨的流程,所以我们在前期过程中也在做一些探索,满足穿戴便携的同时达到医疗标准,这个就是我们团队在早期硬件出发做这一代的工作。
这是我们在前期设计的小云诊箱,目前依托中兴做的非常不错,不仅在国内,在非洲地方也在使用。这里我们团队在前期做了一些探索的工作,比如软硬件的协同,这里怎么把噪声去掉,这里还涉及了各类滤波器,同时要把一些特征值提取出来。这里不多展开,因为后面发了论文。我们再把它设计到硬件上,这个是我们前期在发的各类论文。因为在学校里面,我们做出来的这些都是实实在在的,后面还带着学生参加比赛,也拿到了特等奖。这个是基于硬件的,当然这里的前期工作也得到了一些认可,后面有些国内外学者在跟着我们往下走。
这个是网络方面,它的问题是什么?云端和终端之间也就是边缘计算的问题,这是我们在2015年发现这样的问题,穿戴设备在云端用的过程中,特别涉及到无线网络的时候怎么跟网络匹配,终端设备要跟云端怎么把计算资源进行有效的优化?哪些方面终端算,哪些方面云端?我们在云端的计算能力非常强大,但如果网络不好或者涉及到动态过程的时候怎么进行有效的分割?这个是我们在做网络。
此外这里涉及的医疗数据敏感,那么在网络过程中怎么保障安全可靠传输?那我们要把院内外的数据打通,我们在探索过程中真正发生作用的时候,只靠院内数据不行,只靠院外的数据也不行,我们只要把院内外的数据溶聚在一块。比如分析一个人的时候,这个时候我们在做第二块工作,但这里一个是针对云端协同优化计算,提出了多目标下的动态混合模型进行优化策略,把它进行有效分割,特别是根据动态网络进行分割。其次院内外数据进行了有效分离,这里不多展开。
我们这里要保障前后端的数据安全性,我们也知道从安全的角度,像我们开会也好,现在疫情期间,如果在保障安全的情况下那么就会守卫森严,那守卫森严就会出行不方便,但这里我们的医院数据怎么在安全情况下和优化性能结合起来?我们团队有一个原来是中兴安全首席科学家,我们制定了一个国际标准,不同敏感对象的差异化安全策略。比如我们在保障安全的时候,针对不同用户数据、不同病种设定不同的安全级别,以此达到性能整体优化。在前期过程中还是得到了比较好的保障,比如简单的,一个是得了艾滋病或者感冒,那这两个人的隐私保护肯定是不一样的,那我们就赋予不同的安全策略,有效的保障优化性能。这是对性能提高,既保障了这个,又保障了性能提高。这里不多展开。
后面我们再做一个数据分析,因为后面很多数据分析,所以过一下我们做的情况。我们讲是把这些用起来,但数据分析用起来是分析最重要。在医疗大数据里面会面临什么?数据很多,同时面临小数据。比如用的过程中,在分析的过程中发现脑卒的数据非常少,但中风是非常需要关注的。有一类数据非常多:高血压,现在我们就把高血压迁移到脑卒中里面,我们通过深度学习有效提高准确率,这个在深圳南山医院后面取得了非常好的效果。
这里一个工作是各家医院的数据用起来,但因为的数据是相对比较封闭的,我们现在用联邦学习把各家医院数据,既保证用到各家医院数据,同时能够把数据隔离开。前面主要是前期在做,现在我们在做的过程中发现把疾病更好的分析好,这里我们也有专家,把基因数据结合上去。这是我们发布的论文,把基因结合进来,然后分析遗传关系,这对后面的用药也是很有关系的。这是我们做的一些工作,这里不多展开。
我们把前面所做的东西做了一些转化,首先是穿戴式的设备,把它真正的用出去。这个是我带的团队难了国家医疗器械证,因为真正要用起来后面要有器械证才能用起来。这个是妇幼的,这里不多展开,这是在各个环节里面的使用。这个是我们在中兴用的,这个是我带的学生,当时平台获得了创客全国大赛冠军。当时李克强总理来到深圳双创周的时候我们获得了这个。
我觉得最大的意义是通过这个一方面保障面慢病,这个是在中心统计回来的数据,把高血压的概率降低了非常多,慢病这块大家比较熟,但我觉得还有一个要用在妇幼板块,我们曾经挽救了一个胎儿,我们提前发现他有问题,马上送院剖腹。如果不是通过穿戴式设备就会出现孩子没了,要么就是脑瘫,无论是哪一个结果都对家庭非常不可承受。这个案例我们会经常拿出来,领导也说这是功德无量的事情。我们后面加上了自动分析、预警,我们是搞计算机,能够结合做一些事情是很有意义的。
我们前面也得到了一些肯定,比如我牵头拿了吴文俊人工智能科技进步奖一等奖、省进步奖。在疫情期间已经常态化,其实很多需求是医院给我们提出的分析,我们也知道疫情期间医生都穿着口罩,戴着口罩没有办法听诊分析。钟南山院士当时在深圳设了一个团队,他过来说能不能做一些工作,因为当时医生全副武装,但不可能天天到CT,把听诊这一块做成智能听诊,他说能不能把这些听诊信号引出来。
进一步探索
我们现在做的是把肺炎引出来证明他是什么肺部问题,比如现在新冠数据比较少,当时我觉得把新冠和各个哮喘病分开。现在我们可以做到分疾病,还在做分病情的发展状况。
去年的时候我们刚好空了一个名额出来,报了一个国家基金,直接就批了。现在做出来我们已经在医院使用试用这种工作,我们把它做成了一个小的,提取后分析。现在我看到还有一些学者在做咳嗽判断新冠,这个难度还是比较大的。上面也涉及到可解释性的问题,医疗人工智能的可解释性?这个我们也在做一些探索。
这个是刚才提到的,医疗数据跟基因相关,每个人的健康跟基因都有关系。这是我去年牵头做的国家研究计划项目,那能不能在基因上面做工作?前面是我们前面做的,现在我们想把基因结合起来,用人工智能方法,因为基因数据量很大。比如这里提到的,一个是噬菌体,这个是跟华大一起做的。最近肺炎不断用药后会出现耐药菌,现在我们在做噬菌体,而且吃掉耐药菌。这个组合是海量的数据,我们现在就通过对抗网络和分析的方法做出来,因为时间关系我的内容就到这里,谢谢大家。