吴文俊人工智能科学技术奖
INNOVATION TEAM
创新团队
首页 > 创新团队 > 正文

强化学习理论与应用

2018年01月24日   来源:中国人工智能学会     

1612

高阳,教授,博导。1972年生,江苏淮安人。2000年毕业于南京大学计算机系并获博士学位。目前任南京大学计算机系副主任,国家自然科学基金委创新群体成员。2008年当选为南京大学中青年学术带头人, 2009年入选江苏省“333高层次人才培养工程”第二批中青年科学技术带头人,2010年入选教育部新世纪优秀人才计划。

  专家简介

  高阳博士,教授,博导。1972年生,江苏淮安人。2000年毕业于南京大学计算机系并获博士学位。目前任南京大学计算机系副主任,国家自然科学基金委创新群体成员。2008年当选为南京大学中青年学术带头人, 2009年入选江苏省“333高层次人才培养工程”第二批中青年科学技术带头人,2010年入选教育部新世纪优秀人才计划。2017年,获得“中国智能科学技术最高奖”——吴文俊人工智能自然科学奖二等奖。

  高阳博士从1997年开始从事强化学习、多Agent系统、图像和视频分析等方向的学术研究,是国内最早从事强化学习研究的主要研究人员之一。作为负责人主持国家自然科学基金重点项目一项,国家自然科学基金面上项目三项,青年项目一项。主持科技部国际合作专项一项,江苏省973项目一项。在国际杂志、国际会议和国内一级刊物上发表学术论文数100余篇,获授权专利10项,国际PCT专利1项。

  高阳博士目前担任中国人工智能学会理事,中国人工智能学会机器学习专业委员会副主任,中国人工智能学会粗糙集与软计算专业委员会副主任,中国计算机学会大数据专家委委员,中国计算机学会人工智能与模式识别专业委员会常务委员,中国计算机学会南京分部副主席,江苏省人工智能学会常务理事。

  项目简介

  强化学习是机器学习领域的重要分支。近年来,随着Deep Mind的AlphaGo在围棋等领域的成功应用,强化学习技术与应用引起了国内外同行的广泛关注。强化学习技术着重研究在系统模型未知的前提下,学习如何求解各种复杂的决策问题。

  我们团队是国内首个系统性研究强化学习理论和应用的团队,先后六次承担强化学习方面的国家自然科学基金面上项目。在长期研究工作中,创新性地提出平均奖赏强化学习算法、基于元博弈的多AGENT 强化学习算法、提出多种基于神经网络函数估计的强化学习算法、基于核选择的在线强化学习算法、结合遗传算法的学习分类系统等;并将其应用到群控电梯调度、在线爬虫、自适应软件中间件、交互式游戏非玩家角色设计中。

  本项目针对大规模问题中强化学习速度慢、多agent系统中强化学习不稳定、实际场景中强化学习应用受限等三大难题,做出了一系列具有国际影响力和国内开创性的研究成果,多篇论文成果得到国际国内同行的正面评价。并获授权专利4项。

  实验室简介

  计算机软件新技术国家重点实验室是在南京大学计算机科学与技术系和计算机软件研究所多年进行软件研究的基础上于1986年底通过专家论证,1987年开始筹建,1990年建成,并通过国家验收,被批准向国内外开放。1993年通过第一次评估,1997年通过第二次评估,2002年通过第三次评估,2007年3月通过第四次评估,并被评为信息科学领域优秀类国家重点实验室,2012年3月通过第五次评估,再次被评为信息科学领域优秀类国家重点实验室。现任实验室主任中国科学院院士吕建教授,学术委员会主任中国科学院院士杨芙清教授。

  高阳教授目前领导计算机软件新技术国家重点实验室推理与学习研究组(R&L Research Group,Reasoning and Learning Research Group),主要研究方向包括:人工智能、机器学习、多智能体系统、大数据分析和图像视频内容分析。研究组是国内较早从事强化学习、多智能体系统研究的团队之一。研究组针对大规模问题中强化学习速度慢、多agent系统中强化学习不稳定、实际场景中强化学习应用受限等三大难题,展开长期深入的研究,取得了一系列的创新性理论研究成果;并将强化学习应用到游戏机器人、资源调度、网络爬虫、数据分析和自适应软件中间件等领域中。

组织机构

主管单位
中华人民共和国科学技术部
国家科学技术奖励工作办公室
主办单位
中国人工智能学会

奖励资质