9154
2021年4月10日-12日,吴文俊人工智能科学技术奖十周年颁奖盛典暨2020中国人工智能产业年会在北京和苏州同期圆满成功举办。中山大学微电子科学与技术学院教授虞志益受邀在苏州工业园区希尔顿酒店,2020中国人工智能产业年会—边缘智能芯片设计新进展前沿论坛上发表主题报告《下一代智能处理器芯片的电路与架构》。
以下为演讲实录:
非常荣幸有机会和大家探讨,包括几个部分,简单探讨一下处理器芯片挑战和潜在一些方向,重点讲三个话题:
新互连:高效的片内网络+片间互连 。
新时钟:数据驱动异步电路 。
新器件:基于非易失器件的处理器。
处理器的性能和功耗面临的挑战主要包括两个层面,第一个是摩尔定律或者工艺器件的进步碰到了技术和成本双重压力,另外一方面是微处理器设计本身一些技术也相对都已经到了成熟或者极限的地步。首先看摩尔定律制造工艺已经突破5纳米。传统微处理器设计技术包括流水线,超标量还有存储阶层,包括多核也基本上都已经接近成熟,能够挖掘的地方越来越少了。
下一代处理器形态可能存在几个形态,第一个基于互联网络,大规模阵列,应该会有多个芯片组成,每一个芯片会是大规模计算阵列,这个阵列又是有一个相对比较高效互联网来构成。
第二个形态会是一个类脑,基于存算一体结构,包括神经元组成的。下一代微处理器有很多关键技术,从纵向来说会是以架构和电路为主体,往上上升到一些新算法和新的应用,往下会下触到一些新的器件,今天很多话题都在聊电路和架构层面,包括互联,包括时钟,还有AI加速为代表领域专用的加速器,还有存算一体。
算法来说包括深度学习,类脑算法。新的器件包括新型3D封装等等,我今天探讨一下互连、时钟和非易失器件。为什么互联很重要呢?现在无论是比较传统的多核架构,还是非传统阵列也好,它的制约条件通常不在计算本身,计算所占的面积和功耗通常只有百分之几,不超过10%。大部分花费在互连,存储和数据搬移。这些从某种意义上都是互连,所以互联制约着处理器性能和功耗效率,必然会成为下一代处理器的一个关键。
我们在互联领域有蛮多工作积累,提出了一些新的技术。针对人工智能或者人工智能神经网络也需要一个特定互联网络,因为他有一些特殊需求。人工智能网络模型日益复杂,规模日益庞大,所以它需要一个适合神经网络流量特殊互联,第一个规模不断扩大,第二流量具有很强局部性的特征,所以需要相对比较特殊的片上互联网络。另外一个从单芯片互联转到多芯片互联,互联不仅仅是单芯片,也包括多芯片。单芯片具有很好性能和功耗效率,但是也有几个缺点,第一个灵活性比较差,第二成本比较高,而且现在应用越来越复杂,所以很难用一个单芯片实现。
如果能够用多芯片,多芯片之间用一个高效互联,高效封装形成就能够得到灵活性和成本有效统一,所以我们在这里面也做了一些工作。这是单芯片和多芯片互联的Demo,我们做了多核芯片,然后做了存储芯片和加速芯片,这三个是未来微处理器的核心。它们之间分离在不同芯片里面,然后封装来构成,这样能够获得一个灵活性和功耗效率的统一。
现代芯片99.9%用的是同步电路,因为同步电路具有非常的特点和优点,主要易于设计,能够适合大规模的设计和制备。但是同步电路也有它的缺点,首先可以看到高性能芯片里面功耗占比可以达到30%,甚至40%,这是一个非常大的数字。另外一个,同步电路其实是基于最差环境的,基于最差条件进行设计的,必须在它最差情况下面也要能够工作,所以这两个点我觉得是一个蛮大的缺点。数据驱动异步电路有望“新生”,现在还没有成为主流所以叫新生。
从应用层面也是一个推动,比如说类脑。类脑理论上,严格意义上来说做类脑必须做异步,否则就不是一个很精准的类脑。我们讲边缘计算,边缘AI是一个数据驱动的,需要低功耗,所以边缘计算里面异步电路也有可能获得很好的应用。异步电路为什么现在不流行呢?主要原因在于设计流程不成熟,因为现在设计工具他们都是针对同步电路的。所以要做异步电路就要从流程上考虑,用一个新的语言和新的流程去做,这是一个工作量很大的事情,但是有人在做。
国外有一些大学提出一些新的语言和新的流程,我们也尝试做了一下。感觉现在还不成熟,如果这个能够成熟这会是一个非常具有颠覆性的一个技术。另外近期而言,相对比较近的,用一个现有工具,用同步电路工具做异步电路是可以做的。我们也用异步电路搭了一些芯片,这是异步AI处理器,单元就是用异步矩阵乘法,包括数据和参数缓冲。
另外形成一个阵列,是一个可易扩展,具有层次化矩阵乘法阵列。另外也实现异步流水,数据到达开始计算,所以是一个数据驱动的工作。功耗效率应该比同步电路做的更好。最后聊一下新器件,非易失器件为什么很重要,能够带来更极致的电压管理,电压关了可以继续保持数据有效。
我们做了一个微处理器,或者简单的微处理器,不算一个很严格意义上的微处理器。主要是磁性器件和CMOS集成,用在微处理器里面,在不工作时候或者工作量不大时候可以关闭,带来极致管理。左边是芯片版图,右边是CMOS和MTJ制备,两者怎么结合,我们做法是先去中芯兴国际完成CMOS制造。这个是可以实现低功耗,低面积的特征,有望在边缘计算里面得到应用。欢迎大家到我们学院任职,谢谢大家。