游客,您好,欢迎您进入科技信息监测服务平台! 登录 | 注册  帮助中心
您当前的位置: 首页 > 编译内容

编译内容

编译服务: 光电情报网信息监测服务平台 编译者: husisi 编译时间: 2023-11-8 点击量: 12

近日,清华大学自动化系成像与智能技术实验室和电子工程系智能感知集成电路与系统实验室联合提出一种纯模拟光电融合计算芯片,国际上首次实测光电计算可以在系统层面,达到高性能GPU算力的三千余倍,能效的四百万余倍,证明了光子计算在诸多AI任务中的优越性。

现今主流计算性能提升仰赖的准则:摩尔定律,增速已放缓近十年甚至面临失效。电子晶体管大小逼近物理极限。计算平台算力和能效的提升迫在眉睫,全新的计算架构成为破局的关键突破口。其中光电计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的有力竞争方案之一。数年来,海内外知名科研团队相继提出多种光电计算架构,但目前光电计算芯片要直接替代现有电子器件实现系统级应用,仍然面临几个关键瓶颈:

一是如何在一枚芯片上集成大规模的光计算单元(可控神经元),且约束误差累计的程度;二是如何实现高速高效的片上非线性;三是为了兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的单次模数转换所需能量,比光计算每步乘加运算的功耗高出多个数量级,掩盖了光计算的性能优势,让实际场景应用下的光计算芯片难以真正发挥竞争力。

为了解决这一国际难题,该团队创造性地提出了模拟电融合模拟光的计算框架,将进行视觉特征提取的大规模衍射神经网络,和基于基尔霍夫定律的纯模拟电子计算,集成在同一枚芯片框架内。绕过ADC速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个关键瓶颈。

在三分类ImageNet等任务上实测表现下,所提出的ACCEL芯片系统级算力达到4.6 Peta-OPS, 是现有高性能光计算芯片的400余倍,模拟电计算芯片的4000余倍。同时系统级能效ACCEL达到了74.8 Peta-OPS/W,比现有高性能光计算、模拟电计算、GPU和TPU等架构,提升了两千到数百万倍。

光电计算芯片ACCEL的计算原理和芯片架构

更进一步,真正的自动驾驶等超高速视觉计算任务中,超高计算速度必然伴随着每帧图像极短的曝光时间,也就是超低的曝光能量。研发团队对此提出了又一个系统级解决方案:基于光与电模块物理本质上的优势互补,联合设计。光模块高并行地提取特征的同时,非监督地学习到将光强汇聚到某些特征点的编码方式,在总光强极低的情况下,提升局部光强,从而提高对应光电二极管的信噪比。同时利用电模块便于可重构的特性,开发自适应训练算法,让接续的电模块能够对于前面多层光模块的加工误差和对齐误差进行有效纠正。并且在训练时引入对弱光噪声环境的建模。文中结果表明,ACCEL芯片比单一光计算或模拟电计算模块,在各类光强尤其是弱光下的准确率有了显著提升。

此外,论文中还演示了使用非相干光直接计算交通场景,判断车辆移动方向的实验。非相干光计算由于缺少相位关系,精度更易受噪声影响,因而此前大量使用相干光的高性能光计算未能在自动驾驶、自然场景感知等实际场景中直接应用。而ACCEL芯片创造性地提出了利用噪声鲁棒性实现非相干光计算的思路。可以在手机手电筒等非相干光照明下进行计算,并进行了视频演示。

光电计算芯片ACCEL在不同任务和曝光强度下的性能

这项工作不仅提出了一种性能瞩目的颠覆性芯片架构,给出了当前光计算落地过程中尤其掣肘的一系列瓶颈问题的工程级解决方案,并且独辟蹊径地指出光计算的未来发展未必是一味追求“全光”架构,而是真正实现光计算与数字社会的深度融合,相得益彰。让光计算芯片从理论上的高算力高能效,真正有望走向实际复杂视觉场景的系统级应用。

 
来源机构:
原文来源:

提供服务
导出本资源