吴文俊人工智能科学技术奖
INNOVATION TEAM
创新团队
Home > 创新团队 > 正文

基于迁移学习的下一代机器学习平台

2016年11月25日   来源:中国人工智能学会     

2746

戴文渊多年来致力于迁移学习领域的学术研究和产业推广工作,在学术界发表多篇国际顶级学术会议论文,并获得PKDD 2007最佳学生论文奖,也是多个学术会议期刊的审稿人。戴文渊在迁移学习领域论文引用数世界第三,他还是全世界第一个提出非监督迁移学习、跨领域迁移学习及迁移学习通用框架的学者。

  专家简介

  戴文渊,第四范式创始人、首席执行官。 “迁移学习”全球领军学者,机器学习全球商业领军人物,国际大学生程序设计竞赛(ACM-ICPC)世界冠军(2005年)。

  戴文渊多年来致力于迁移学习领域的学术研究和产业推广工作,在学术界发表多篇国际顶级学术会议论文,并获得PKDD 2007最佳学生论文奖,也是多个学术会议期刊的审稿人,如AAAI、KDD、IEEE TKDE、IEEE TNN等。戴文渊在迁移学习领域论文引用数世界第三,他还是全世界第一个提出非监督迁移学习、跨领域迁移学习及迁移学习通用框架的学者。目前迁移学习领域内的学者,很大一部分都在沿着戴文渊当年开辟的道路前进。

  同时,戴文渊也是人工智能工业应用的杰出代表。他曾帮助百度建立了全世界第一个深度学习广告系统,共计影响5亿用户,使得百度的变现能力4年提升8倍;并一直致力于将迁移学习技术应用到互联网搜索、广告、金融、电信等领域,让人工智能技术应用(满足迁移学习应用条件时)对于样本量的需求从千万级下降到十万级,降低了人工智能对数据的依赖,拓宽人工智能的应用场景,累计带来超过千亿级别的经济收益。此外,戴文渊还积极参与了多项公益项目,运用迁移学习技术突破糖尿病诊疗和古籍识别现在面临的瓶颈。

  目前,他创办的第四范式建立了第一个面向非专业人士的人工智能通用平台,旨在打破人工智能的高门槛,突破人工智能只解决专业化的特定问题的局限,规避科技巨头对于人工智能技术的垄断,真正让人工智能走向各行各业。

  项目简介

  “基于迁移学习的下一代机器学习平台—戴文渊”

  人工智能领域的研究进展与海量数据涌现密切相关,如何合理地对这些数据进行组织并从中分析、挖掘出潜在、有用的信息已经成为数据挖掘研究者所关注的热点研究课题。然而,传统机器学习框架仅限于相同领域和相同任务的学习,这存在较多的问题与挑战:

  1、新的领域(从传统的新闻、到网页、再到博客、播客、微博、微信、自媒体等等)不断涌现,而新领域中的训练数据难以获取。

  2、对于某些没有完整标定数据的新领域而言,其很多相近领域已经具备丰富的标定训练数据,而这些历史标定数据由于应用场景变更而无法使用。

  3、大量富余的非标注数据存在并快速增长,这些数据包含了丰富的知识,却由于没有标注而无法用作训练数据。

  迁移学习(Transfer Learning)与过去的机器学习方式相比,可将从一个环境中学到的知识用来帮助新环境中的学习任务,从而更接近人类学习的行为。迁移学习近年来受到机器学习领域的广泛关注,正逐步成为人工智能和机器学习研究领域的主流方向之一。

  本成果在迁移学习理论方面做出了世界领先的成绩:

  (1) 完成了迁移学习的基本理论与算法研究;

  (2) 提出了全球首个非监督迁移学习算法;

  (3) 世界范围内首次提出通用迁移学习框架。

  戴文渊作为迁移学习学术领域的杰出代表,在2007年到2016年期间,共发表14篇国际顶级的高水平迁移学习学术论文,其中,单篇论文引用数排名世界第二。

  本成果的特点还在于理论研究与产业应用的深度结合。戴文渊将迁移学习技术应用于百度凤巢在线营销系统、百度大脑等多个重量级核心产品,大幅提升了业绩,由此成为百度最年轻的T10科学家。此后,戴文渊帮助华为建立起迁移学习的人工智能能力,完成了迁移学习在运营商领域的第一次落地。2015年,戴文渊创立了第四范式公司,其主导研发了基于迁移学习的下一代机器学习平台—“第四范式.先知”,该平台致力于将以迁移学习为核心的人工智能技术,以产品化、平台化的方式呈现,惠及更多企业。基于本成果在产业界的应用,戴文渊共主导或参与了17件发明专利申请、1件实用新型专利申请和8件软件著作权登记。

  团队介绍

  第四范式是国际领先的人工智能技术与服务提供商、数据科技驱动行业应用的创新者。由第四范式创始团队开创的“迁移学习”被业界认为是“下一代的人工智能技术”,第四范式在迁移学习领域保持着全球绝对领先的优势。被新华社等权威媒体称为是“中国追赶发达国家的重要契机”。

  第四范式具备国际顶尖的机器学习技术和经验,能够对数据进行精准预测与挖掘、揭示出数据背后的规律,从而帮助企业提升效率、降低风险,获得更大的商业价值。

  第四范式团队目前已为金融、电信、互联网等多个行业成功打造了百余个人工智能行业应用,是人工智能工业应用的引领者与践行者。团队汇聚了成功开发中国最大机器学习系统的架构师、成功上线世界第一个商用深度学习系统的数据科学家团队,他们将尖端的人工智能技术转换成可落地的人工智能产品及解决方案;此外,团队成员还包括来自高盛、德勤、Bloomberg、招商银行的行业专家和资深顾问,把对行业的深厚理解和对人工智能技术的娴熟运用相结合,打造紧贴应用场景的解决方案,解决各行各业的实际问题。

组织机构

主管单位
中华人民共和国科学技术部
国家科学技术奖励工作办公室
主办单位
中国人工智能学会

奖励资质