导读
多波长光信息处理系统常用于光子神经网络和微波光子领域。然而,其效能通常由于制造、传输和环境因素带来的频率选择性响应而受到影响。为缓解该问题,国防科技大学江天研究员团队开发了一种通用的深度强化学习校准(DRC)方法。该技术成功实现对三类典型的多波长光信息处理系统的高效校准,为光子芯片的规模化应用提供关键技术支撑。
该研究成果以“Multi-Wavelength Optical Information Processing with Deep Reinforcement Learning”为题发表于Light: Science & Applications。
研究背景
多波长光信息处理系统因其宽带、低能耗和抗电磁干扰等特性,在计算加速和宽带信号处理领域具有广阔应用前景。然而,制造工艺误差、传输损耗和环境因素导致的频率选择性响应是制约该技术实用化的关键因素。例如,色散光纤系统中的光梳幅度不均、微环阵列中的谐振峰偏移、马赫-曾德尔干涉仪(MZI)阵列中不同波长的响应变化等,直接影响了系统计算精度。
传统的校准方法通常针对特定架构设计,缺乏通用性且迭代周期较长,限制了系统的实际应用效果。针对这一技术难题,研究团队创新性地将深度强化学习技术引入光子芯片校准领域。
研究亮点
研究团队开发的DRC方法建立在深度确定性策略梯度的基础上,结合预训练和自适应优化,通过实时采集系统反馈数据持续优化策略网络,有效累积校准经验。根据系统的校准目标,DRC方法通过迭代优化参数实现对系统响应的调整。该方法的显著优势在于其高效性和通用性,同一套算法框架能够适用于多种不同类型的光信息处理系统。
图1(a)展示了基于色散光纤的多波长光信息处理系统的校准链路。系统以克尔光频梳为光源(光谱如图1(b)所示),光梳之间的不平坦导致系统计算的结果产生误差。图1(d)对比了不同算法在使用不同梳齿数量情况下的校准迭代轮次,DRC相较其他传统方法的迭代效率超过66.8%。图1(e)-(f)展示了系统在校准前后的输出对比,易观测输出误差明显降低。

图1:基于色散光纤的多波长系统校准链路及其效果
图2(a)展示了基于微环阵列芯片的多波长系统,由于微环制作工艺不够理想,不同微环响应存在一定的偏差。基于DRC方法控制微环阵列的电压,能够使其迅速达到期望响应状态。图2(b)展示了在使用不同微环阵列时不同算法的校准迭代周期,DRC方法性能远超其他方法。图2(c)和(d)分别展示了基于DRC方法校准和PID方法校准过程中不同通道输出的结果,DRC方法迭代的周期更短,且不同微环之间响应的误差更低。

图2:基于微环阵列的多波长系统校准链路及其效果
图3(e)展示了基于MZI阵列的多波长系统对应的校准链路。图3(b)-(d)分别展示了DRC、并行随机梯度下降算法(SPGD)和遗传算法(GA)在校准过程中不同通道的输出情况,易发现,DRC方法在21轮迭代周期内使得系统输出到达期望状态,而GA方法则需要迭代上千次才能达到期望状态。

图3:基于MZI阵列的多波长系统校准链路及其效果
综上所述,相较于GA、SPGD和PID等传统方法,DRC方法在校准速度与精度上均展现显著优势。即使系统存在非线性响应的复杂情况,DRC方法依然能够实现线性化校准目标,展现出较强的适应能力。
前景展望
该研究所提出的DRC方法在多波长光信息处理系统的校准应用中具备通用性和高效性,为光子芯片在实际应用场景中的部署提供了关键支持。通过将深度强化学习与光子芯片的创新结合,该研究不仅推动了光子芯片技术实用化进程,也展现了跨学科融合研究的巨大潜力。(来源:中国光学微信公众号)
相关论文信息:https://doi.org/10.1038/s41377-025-01846-6
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。