清华大学在智能光计算领域取得突破

电子计算芯片的算力增长支撑着AI模型规模的不断发展,然而其高能耗亦带来了前所未有的能源挑战。 继构建智能光计算的通用传播模型、研制全球首款大规模干涉—衍射异构集成芯片“太极”后,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组在智能光计算领域获得新突破:首创全前向智能光计算训练架构,成功研制“太极-II”通用光训练芯片。该芯片填补了智能光计算在大规模训练这一核心拼图中的空白,将与初代“太极”一起合力为AI大模型的训练、推理注入算力发展的新动力,构建光算力的新基座。相关成果以“光神经网络...


电子计算芯片的算力增长支撑着AI模型规模的不断发展,然而其高能耗亦带来了前所未有的能源挑战。

清华大学在智能光计算领域取得突破

继构建智能光计算的通用传播模型、研制全球首款大规模干涉—衍射异构集成芯片“太极”后,清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组在智能光计算领域获得新突破:首创全前向智能光计算训练架构,成功研制“太极-II”通用光训练芯片。该芯片填补了智能光计算在大规模训练这一核心拼图中的空白,将与初代“太极”一起合力为AI大模型的训练、推理注入算力发展的新动力,构建光算力的新基座。相关成果以“光神经网络全前向训练”为题,于近日发表于《自然》期刊。

人工智能大模型的迅猛发展与广泛应用,使得算力成为重大的战略抓手与基础设施。长期以来电子计算芯片的算力增长支撑着AI模型规模的不断发展,然而其高能耗亦带来了前所未有的能源挑战,新兴智能计算范式的建立与发展迫在眉睫。光具有干涉、衍射等多维计算模态,以光为计算媒介,以光的可控传播构建计算模型,光计算以其高算力低能耗特性打开了智能光计算的新赛道,展现出了巨大潜力。

研究组介绍,训练和推理是AI大模型核心能力的两大基石,缺一不可。通用智能光计算芯片“太极”的问世首次将光计算从原理验证推向了大规模实验应用,为复杂智能任务的推理带来了曙光。然而,初代“太极”尚未释放智能光计算的“训练之能”。

据悉,“太极-II”光训练芯片以物理光学特性为启发建立了新型的光训练架构,克服了计算精度差、训练速度慢、能量效率低的瓶颈,支撑多尺度复杂光学系统的高效高精度在线训练。

系统实测结果表明,“太极-II”智能光训练架构在大规模神经网络训练、计算成像等方面均表现出卓越性能。它突破了计算精度与效率的矛盾,将数百万参数的光网络训练速度提升了1个数量级,代表性智能分类任务的准确率提升40%。在非视域等复杂场景成像应用中,实现了千赫兹帧率的计算成像,成像效率提升2个数量级。这些成果表明,在同等参数规模下,相较于图形处理器(GPU),“太极-II”有望能以十分之一的时间完成AI大模型等大规模网络的训练进程,大幅节省时间与能源开销;并能实时解析复杂场景,为医疗诊断、工业检测、环境监测等领域提供高速精准的解决方案。

据悉,在原理样片的基础上,研究团队正积极地向智能光芯片产业化迈进,在多种端侧智能系统上进行应用部署。

“智能光计算平台将逐步登上AI算力舞台,将能以更低的资源消耗和更小的边际成本,为人工智能大模型、通用人工智能、复杂智能系统的高速高能效计算开辟新路径。”戴琼海说。

随着5G、云计算、大数据、人工智能等新型信息技术的迭代升级和普及应用,全社会数据流量和算力需求迎来爆发式增长。同时,传统电芯片性能的进一步提升面临摩尔定律演进失效的问题,算力供需矛盾日渐突显。光芯片以光为信息载体,是与电芯片平行发展的器件集成体系。光芯片通过对光的处理和测量实现信息感知、传输、存储、计算、显示等功能,因其具有速度快、稳定性高、工艺精度要求低和可多维度复用等优势,有望打破电芯片的发展禁锢,为芯片发展带来新的契机。光芯片技术多体系并存趋于多维融合。

区别于电芯片相对单一的材料体系,光芯片可通过硅系、玻璃、聚合物、二维材料、Ⅲ-Ⅴ族半导体等多种材料平台实现。因此,光芯片需依据拟适配的器件类型、功能方向和应用场景来选择材料体系。从市场规模和产业落地情况看,Ⅲ-Ⅴ族光子集成体系、硅基光子集成体系和平面光波导(PLC)光子集成体系将在未来的光芯片产业中具有较高的经济价值。

Ⅲ-Ⅴ族光子集成体系起步较早、潜力较大,但进一步发展仍有问题待研究解决。Ⅲ-Ⅴ族光子集成体系是以磷、铟、砷、镓等Ⅲ-Ⅴ主族元素材料为主体的集成技术体系。依托原子直接带隙的物理优势,Ⅲ-Ⅴ族元素材料可兼容无源和有源光器件,成为理想的光学集成体系。该体系研究起步较早,成熟度相对较高,在传输、感知、显示等应用领域已占据市场主导地位。当前,Ⅲ-Ⅴ族光芯片正向小型化、兼容化、多功能化的方向发展。但是,受晶圆尺寸和加工制备等因素限制,系统进一步提高集成度在技术研究和加工工艺方面仍有问题待研究解决。



相关资讯