超大型光学神经网络架构概念图。研究团队供图
本报讯(记者朱汉斌)中山大学教授蔡鑫伦团队与加拿大不列颠哥伦比亚大学教授Lukas Chrostowski团队等合作,基于铌酸锂薄膜光电集成技术,创新性地把光的波动性和电子的粒子性结合起来,在光学神经网络芯片领域取得新进展。相关研究成果近日发表于《自然-通讯》。
人工智能(AI)正以惊人的速度发展,其所消耗的计算资源每3至4个月翻一番,计算芯片的性能提升速度已难以跟上算力需求的增长速度。在此背景下,多种框架结构的张量核心应运而生,其中光学神经网络芯片可以弥补传统微电子计算芯片在速度、延迟和能效等关键指标上的短板,被认为是提升AI算力的重要发展方向。
论文第一作者、中山大学副教授林忠劲表示,近年来,虽然光学神经网络芯片领域不断有新的技术突破,但是受光损耗、单元器件密度、波长通道数等因素的限制,人们对光学神经网络芯片能否高效地处理大型数据以及能否在模型训练方面具有优势一直不确定。
研究人员提出了一种简洁的光学神经网络芯片框架结构,实现了一整层的神经网络,计算速度达到120 GOPS,同时输入和输出的数量能够被灵活调整以应对多种AI任务。该光学神经网络芯片还支持快速原位训练,权重的刷新速度达到60 GHz。研究人员首次在光上实现了负数与负数的乘法,为聚类AI任务的训练提供了新方案。
该研究突破了铌酸锂薄膜光芯片的光子引线键合封装工艺,实现了铌酸锂薄膜光芯片和激光器的混合集成。激光器和铌酸锂薄膜光芯片之间通过聚合物三维光波导连接。由于光探测器不能直接在铌酸锂薄膜材料平台上制备,因此通过倒装焊的方式实现铌酸锂薄膜光芯片和光探测器之间的连接。
基于上述光学神经网络芯片,该研究还提出了首个端到端、纳秒级延迟、无须数字处理器辅助的超大型光学神经网络架构。理论上,该光学神经网络可以实现500TOPS的计算速度,并且能在纳秒级别完成高维度数据的处理。
利用该光学神经网络芯片,研究人员实现了AI系统性能的提升,以原位模型训练的方式,实现了112×112像素的数字图像识别(监督学习)和聚类(无监督学习)AI任务。
相关论文信息:
https://doi.org/10.1038/s41467-024-53261-x
《中国科学报》 (2024-11-29 第1版 要闻)