曦智科技发布光子计算处理器,PACE超过3080百倍!

西智科技(Lightelligence)发布了其最新的高性能光子计算处理器PACE(PhotonicArithmeticComputine,光子计算引擎)。然而,持续增长的模型显然受到计算能力底层的限制,限制了人工智能的进一步发展。

随着纳米工艺的不断推进,摩尔定律已经衰落了近50年。人工智能、5G、物联网等新兴领域的蓬勃发展推动了全球数据的爆炸式增长,对计算能力的需求长远高于摩尔定律预测的计算能力供应增长,传统电子芯片只能通过增加面积和功耗来完成更多的计算,逐渐不能满足日益增长的数据处理和节能要求。

在探索超越摩尔定律的道路上,先进的工艺已经开始发挥作用。同时,由于其高通量、低延迟、低功耗的特点,用光代替电解决部分计算也是突破现有瓶颈的途径之一。以前只存在于实验室的光子芯片最近取得了新的进展。

近日,西智科技(Lightelligence)发布了其最新的高性能光子计算处理器PACE(PhotonicArithmeticComputine,光子计算引擎)。

Xi智科技创始人兼首席执行官沈亦晨博士表示:PACE的发布具有里程碑意义:它成功验证了光子计算的优势,为集成电路行业提供了新的发展路径。

西智科技成立于2017年。自成立四年以来,公司总融资额已超过10亿元。它在波士顿、上海、杭州、南京等地设立了办公室和实验室。全球员工近200人,中国员工100多人。核心研发团队来自麻省理工学院,70%的芯片设计师有超过10年的半导体经验。

2017年,沈亦晨博士作为第一作者和通讯作者在《自然光子》杂志上发表封面论文,开创性地提出了光子人工智能计算的新途径。正是因为这篇论文,吸引了十几家初创公司相继成立。

2019年4月,西智科技推出了世界上第一款AD22286光子芯片原型板卡,成功地将当时占据半个实验室的整个光子计算系统集成到常规尺寸的板卡上,验证了用光子代替电子进行高性能计算的开创性想法。当时原型板卡上集成了100个光子器件,运行系统时钟只有100kHz。

两年后的今天,这次发布的PACE集成了1万个光子器件,运行系统时钟达到了1GHz。他们是如何跨越几个数量级的性能提升的?

电子芯片存在的三大瓶颈

自2012年以来,神经网络和计算模型的大小开始爆炸性增长,计算模型的大小平均每3到4个月翻一番。然而,持续增长的模型显然受到计算能力底层的限制,限制了人工智能的进一步发展。

沈亦晨博士认为,电子芯片的发展遇到了三个主要瓶颈:计算能力、数据传输和存储。其中,计算能力瓶颈主要来自摩尔定律故障,以及由于工艺过程接近物理极限而导致的功耗和加热问题。

随着晶体管的尺寸越来越小,晶体管上的电子隧道越来越严重,因此即使晶体管更小,单个晶体管的功耗也无法进一步降低。在此前提下,行业有两种解决方案,单芯片面积增加或多芯片互联。

然而,随着面积的增加,需要更长的铜线进行数据传输,铜线的热损失与长度成正比,即芯片面积越大,加热越大,功耗越高。

同样,多芯片互联也存在一些问题。首先,片间互联带宽有限,即互联效率低。其次,铜导线仍会增加系统功耗。例如,通过电连接100个芯片或板卡后,计算能力可能只比单个板卡增加10倍左右。

因此,沈亦晨博士认为,光是最适合解决这些困难的底层技术方法。首先,在数据处理方面,光已经充分证明了它在光通信领域的领先地位和优势。目前,包括数据中心在内的所有长途通信,服务器和服务器之间的数据都是用光纤代替铜线进行的。我们也认为,光进入芯片帮助操作是必然的方向。

曦智光子计算的三大技术

前面说过,光是解决当前电子芯片计算能力、数据传输和存储三个瓶颈的底层技术方法。从大数据、人工智能等应用的角度来看,越来越多的计算能力需求来自线性计算,而西智发明的高效线性计算方法是光芯片的重要优势之一。

西智将其技术分为三个部分:OMAC(矩阵乘积累计算)、ONOC(光网络)和光网络。据沈亦晨博士介绍,OMAC是一种模拟计算,通过光模拟信号代替传统电子进行数据处理电子进行数据处理。数据可以加载在光的强度或相位上,并通过在波导中的传相互干扰。主要实现方法是采用与当前电芯片制备工艺CMOS兼容的硅光工艺平台,采用光电协同设计进行光矩阵乘法。

这里的优点是,首先,光矩阵乘法具有更强的并行能力,可以以更高的通量计算。同时,它的能效可以与甚至优于当前的电子芯片相媲美,因为光在传播时不会发热。此外,完成矩阵操作所需的时间较少,即延迟远低于电子芯片。最后,硅光工艺对工艺工艺的要求相当低。例如,65或45纳米的CMOS工艺线可以满足当前光芯片和光计算的所有要求。硅光未来的技术迭代不需要对工艺有特殊要求,而是从主频、波长等其他方面进行技术迭代。

ONOC,即电影照明网络,主要通过用波导代替铜线在电影上传输数据,包括实现电影之间的光通信。还有大芯片照明总线的通信,在光芯片上构建一个固定的通信网络拓扑,通过光连接实现基于电影照明网络的数据交互。最后,使用一些波方式传播数据,其优点是带宽更大,能耗更低,延迟将远远优于铜线,对距离不敏感。

最后一个片间光网络将进一步扩展到多个板卡和更多服务器之间。芯片芯片通过光纤直接连接,芯片之间的数据通过光传输。

全球唯一展示光子优势的,PACE超过3080百倍!

Xi智认为,光电混合计算最重要的技术演进点是不断增加单个光芯片上的设备集成度。事实上,从最早的4x4乘法器到64x64乘法器,再到目前的2.5D光电混合包装,Xi智在四年内实现了一万个光设备集成在一个芯片上。

由于集成度的突破,PACE是西智科技目前可以展示最新可操作的计算处理器。它是世界上已知集成度最高的光子芯片,也是世界上第一个展示光子优势的计算系统。在一些具有商业应用前景的算法中,它可以比当前电子芯片提高数量级。

那么光子计算的优势能体现在哪些领域呢?NP-CompleteProblem(多项复杂性不确定性问题,NPC)可以说是世界上最难解决的数学问题,如生物信息中蛋白质结构的预测、物流交通调度、芯片设计、材料研发等。但目前NPC没有多项算法,只能用穷举法逐一检验,最终得到答案。但如果能有效解决其中一个问题,也可以映射到其他问题上。

由于光子芯片的特性,PACE可以通过重复矩阵乘法和巧妙利用受控噪声组成的紧密回环来实现低延迟,因此PACE在计算NPC问题时可以比GPU快几百倍。因此,PCAE在解决NPC问题方面具有更大的商业应用前景。

据了解,与英伟达RTX3080GPU相比,PACE同时运行相同的循环神经网络算法所需的时间不到3080GPU的1%。

基于现有生态的光电混合结构

事实上,PACE的结构由光芯片和电芯片组成。电芯片主要用于数据存储和数模混合调度,光芯片主要用于数据计算。这里可以理解为光芯片只是底层的硬件支持,信息转换和软件相关的电芯片用于数字处理。所有指令、编译和软件都将在数字电芯片上。因此,与现有的数字芯片生态一样,光芯片只在底层计算端被替换。

作为光电混合芯片的设计,有些人可能会担心在工艺上很难大规模生产。事实上,沈亦晨表示,硅光芯片采用CMOS工艺,可以解决90%的核心问题。由于硅基CMOS工艺基本采用,包括模拟在内的电学、热学等成熟软件都可以直接使用。

在包装层面,PACE采用芯片堆叠,即类似HBM的2.5D和3D包装方案。目前唯一不同的是,在包装方案中需要添加一个接口,将光源导入光芯片

光芯片商业化还有多远?

在谈到该技术的商业前景时,沈亦晨博士向记者强调,光计算不仅仅是光芯片。在可预见的未来,它将是与电子芯片深度结合的光电混合计算。与电芯片相比,光芯片更多的是承担主要任务的处理器,主要是线性计算和数据网络。然而,电芯片指令的一个好处是它与现有的市场环境和软件环境兼容。

此外,需要注意的是,Xi智能的光电混合芯片不能用于消费者熟悉的领域,如PC、手机、编解码芯片等。同时,这也不是Xi智能技术考虑的范畴。在选择应用场景时,Xi智能技术将首先切入大数据,包括云计算、智能驾驶、金融量化交易、生物药物研发等场景。

沈亦晨表示,作为一项颠覆性技术,它必须经历一个漫长的商业化过程。他透露,在第一阶段,即2022年初的一到三年内,计算能力、延迟等痛点特别强的应用场景开始实施,包括金融、大型云服务、非人工智能方向优化、高性能计算等。

第二阶段,随着产品的实施,在不同的应用场景中反映光计算优势后,将投资于更大规模的团队进行人工智能培训市场。

西智将在第三阶段延伸到GPU,包括车载芯片等市场。

这些都是我们认为对计算能力的巨大需求,但我们需要更成熟的硬件、软件系统和进一步的市场。因此,沈亦晨认为,技术商业化将是一个漫长的过程,需要不断改变,尝试不同的应用场景和行业。

本文来源网友上传,不代表hdxin.com蝴蝶芯城立场,如有侵权或其他问题,请及时联系我们举报

上一篇: 数字功放芯片推荐DSP数字功放芯片

下一篇: 为什么主机厂纷纷下场造芯?宿主工厂的自研芯片是否真的需要?