曦智科技推出世界第一个光子芯片原型板
在当前AI领域,硬件体系结构都是基于传统的数字电子体系结构,尽管很多厂商已经准备跳出冯诺依曼体系结构的局限,例如开发神经形态加速器。但是他们不能跳出电子传输速度的局限,因此,处理器的主频还受到限制,要想达到百亿亿级甚至上亿级的算力,也只能从系统规模上做起。
基于这一困境,由光子学提出的方案正不断出现,使得CMOS技术能够生产出高度集成的光子芯片。基本原理是利用马赫-曾德干涉仪(MZI)制作的光子芯片,BQ3055DBT利用光信号进行线性计算,不仅不需要复杂的逻辑门,而且传输上的能量消耗也远远小于电信号。
近几年来,许多研究者发表了光学计算上的重大突破,也有几家公司朝这一方向努力,打算用一种全新的架构跳出这些局限,让AI更好地应用神经网络,甚至打破传统的摩尔定律。
Lightmatter以AI光子芯片为核心的初创企业Lightmatter今年推出了第一款通用AI光子加速器,并对Mars的原型芯片进行了改进。这种加速器与光电系统相结合,在其芯片结构上也显示,它包括除光子核之外的图形处理器.RISC内核和SRAM。 Envise支持INT8.INT16和bfloat16三种数字格式,并且还支持ReLU.GELU和sigmoid等神经网络中常见的激活功能。
Envise服务器结构/Lightmatter
根据Lightmatter提供的数据,4-U服务器由16块Envise芯片和2块AMDEPYC7002组成,由于功耗只有3kW,在Resnet-50模式下,推理速度要比英伟达DGX-A100高4倍,而DGX-A100在6.5kW的最大功耗范围内。
Lightmatter同时还推出了Passage,以解决扩展性问题。 Passage是一种晶圆级可编程光子连接技术,使异构芯片能高能量地高带宽地相互通信,支持CPU.内存和专用加速器。 Lightmatter声称,Passage的速度是现有芯片连接方案的数百倍,而芯片间最大传输延迟只有2ns。
启智科技CEO沉亦晨在去年的EmTechChina会议上说,由于光子芯片不太依赖制程,所以即使用28nm芯片也能达到7nm的性能,也能达到7nm。由此看来,光子芯片或许也是一条摆脱限制制程的重拳。据该公司官方网站透露,该公司目前正与早期用户密切合作,有望于2022年正式部署光学AI加速技术。
光子卷积加速器
一月份,几位澳大利亚研究者在《自然》杂志上发表了一篇名为“用于光学神经网络的11TOPS光学卷积加速器”的论文。卷积神经网络(CNN)灵感来源于生物视觉皮质,该神经网络可以提取原始数据的层次特征,大大降低了网络参数的复杂性,提高了预测的精度。 CNN已广泛应用于计算机视觉、语音识别和医学诊断等领域,但仍然受到电子结构的性能限制。
在本文中,研究者展示了一种通用的光学矢量卷积加速器。这种加速器结合了大量由克尔光频梳提供的波长通道,达到11TOPS的运算速度,并可同时产生8-bit分辨率250,000像素图像卷积,足够进行人脸识别。利用同一硬件,依次构成10个输出神经元的深度光学CNN,对500幅MINIST手写数字图像进行识别,精度达88%以上。
结语
除上面提到的一些公司和研究之外,市场上也有一些刚开始涉足光子芯片的公司,例如LuminousComputing,是由比尔盖茨投资的,但该公司CEOMarcusGomez在2019年接受采访时表示,该公司的产品预计将在2022年到2025年之间推出。今年,英特尔还推出了两项相关专利,其中一项就是将光子加速器与Xeon核的异构结合。
现在光子芯片仍然走光电结合的方向,光计算主要是用于加速神经网络等应用。由于受光器件,特别是马MZI的布线特性的限制,要实现MZI的互连,很难同时兼顾大小,所以全光子的方案在扩展性上还是差一点。而且我们平时接触的数字信号也离不开光电转换的过程,所以光子芯片的成功说到底还需要光电工程师的共同努力。而对于什么时候通用计算机可以使用光子芯片,还不清楚。曦智科技推出世界第一个光子芯片原型板。
下一篇: 人体感应雷达模块智能摄像头感应技术
热门资讯
- MAX32670是一款超低功耗、高性价比、高可靠性的32位微控制器,在实现复杂的传感器处理设计的同时不会影响电池寿命
- MAX32550嵌入式安全方案采用多重先进的物理安全机制保护敏感数据,提供最高等级的密钥存储安全保护
- MAX28200是一款低功耗、16位MAXQ®微控制器(µC),设计用于智能电话和消费类电子等低功耗应用
- DS5003安全微处理器集成了最先进的加密功能,包括一套专门设计的安全机构,能够抵御各种级别的威胁,包括监测、分析和物理攻击
- ADUCM331集成了所有在各种工作条件下对12 V电池参数(如电池电流、电压和温度)进行精确智能监控、处理和诊断等必需的功能
- ADUCM350是一款可配置的阻抗转换器和恒电位仪,具有电流和电压测量功能,适合电化学传感器和生物传感器
- ADA4558 是用于桥式传感器的完全集成的传感器信号调节器 IC
- ADUCM320具有低功耗ARM Cortex-M3处理器和一个32位RISC机器,峰值性能最高可达100 MIPS
- ADUCM363自带一个片内32 kHz振荡器和一个内部16 MHz高频振荡器
- ADUCM3027微控制器单元(MCU)均为集成电源管理的超低功耗微控制器系统,可用于处理、控制和连接