电子产业一站式赋能平台

PCB联盟网

搜索
查看: 186|回复: 0
收起左侧

硅基光电子技术在深度学习加速中的应用:CrossLight介绍

[复制链接]

978

主题

978

帖子

9715

积分

高级会员

Rank: 5Rank: 5

积分
9715
发表于 2024-9-4 08:00:00 | 显示全部楼层 |阅读模式
引言随着深度神经网络(DNNs)在各种应用中变得越来越复杂和普遍,对高效硬件加速器的需求比以往任何时候都更为迫切。在后摩尔定律时代,传统电子加速器面临着基本限制,在带宽和能效方面造成瓶颈。硅基光电子技术应运而生,可为深度学习加速提供节能、超高带宽和低延迟的解决方案。
; W" W9 y+ Z6 c9 c  t本文介绍CrossLight,新型硅基光电子神经网络加速器,通过跨层设计方法解决光计算中的关键挑战。将探讨光计算的基础知识、CrossLight的架构以及与最先进加速器的性能比较。
1 j% _- z6 W( @! E9 r* F
- u4 D/ g; k, C: x& y
光计算基础
2 _3 k, W: O; q2 t. o8 [) `2 Q; J在深入了解CrossLight之前,让我们先了解深度学习光计算的基础知识。光加速器通常使用广播和权重(B&W)配置来执行矩阵-矢量乘法,这对DNN中的卷积(CONV)和全连接(FC)层都是必不可少的。1 @' f) x5 E) H/ D) E

vndjbb4wr4k6405695118.png

vndjbb4wr4k6405695118.png

4 Z2 C7 [) X, I) I- Z$ O+ H& V  o7 a8 `: j图1显示了基于非相干广播和权重(B&W)的光电子神经元配置。
% I7 f. z; A" p4 X. T3 |在此配置中,输入值通过调制器印刻在不同波长的光上。然后,这些波长被合并并分成多个分支,每个分支由微环谐振器(MRs)加权。加权信号通过光电探测器求和,完成矩阵-矢量乘法运算。
- v1 G5 s- D9 H9 C这种设置中的关键组件是微环谐振器(MR)。MR可以调谐以改变特定波长的能量,有效地在光域中实现乘法运算。: N$ X& b7 F6 s2 F' J
CrossLight架构% w; o% ?1 G. B4 }# c% Z4 W4 R
CrossLight采用跨层方法优化光加速,解决设备、线路和架构层面的挑战。# N4 i$ H! L# ~9 X7 F- @$ l9 V

rcw4xofdo3b6405695218.png

rcw4xofdo3b6405695218.png

# d; R0 G# _. y4 W( t图2展示了CrossLight非相干硅基光电子神经网络加速器的高级概述。/ n8 @& F2 P2 ^( U9 o7 o% d
设备级优化在设备级别,CrossLight引入了优化的MR设计,对制造工艺变化(FPVs)更具弹性。通过全面的设计空间探索,研究人员发现,使用400纳米的输入波导宽度和800纳米的环形波导宽度可以将由FPV引起的不期望的谐振波长偏移减少70%。! Z! z! [' H% S! Q
线路级优化为解决紧密排列的MR之间的热串扰问题,CrossLight采用了结合热光(TO)和电光(EO)调谐的混合调谐方法。与传统的仅TO调谐方法相比,这种方法可以实现更快的操作速度和更低的功耗。4 f: h* v. l0 N) R8 k  Q
此外,CrossLight采用了称为热特征分解(TED)的方法,可以集体调谐MR组中的所有MR,有效地以较低的功耗消除热串扰效应。( F# D/ ^7 V3 ]* _0 I: |2 x' G  O5 _

a1mbmdzge1b6405695318.png

a1mbmdzge1b6405695318.png
' b+ [% e/ j# a( K1 o. _! u
图3显示了10个制造的MR块中相邻MR对之间距离可变时的相位串扰比和调谐功耗。- Y' K$ a+ j  J, n# B
架构级优化CrossLight为CONV和FC层加速引入了单独的矢量点积(VDP)单元,认识到这些层的不同计算需求。这种分离允许更高效地处理这两种类型的层。6 }0 T: {" V) v) a' d: g) y3 a- @
该架构还在VDP单元内实现了波长重用策略,减少了所需的激光器总数,从而降低了功耗。通过将较大的矢量分解为较小的矢量,并在VDP单元内的多个分支上执行并行计算,CrossLight在并行性和激光器功率需求之间实现了平衡。
0 @% U6 N- ~4 ]) e性能分析为评估CrossLight的性能,研究人员使用四个不同复杂度的DNN模型进行了广泛的模拟。# @2 W; w: _9 T
分辨率分析CrossLight的一个主要优势是能够实现高分辨率计算。虽然一些光加速器限制在2-4位分辨率,但CrossLight可以为其MR组实现高达16位的分辨率。
# N( h$ K/ }1 S* l( L' G

ajq0l4vbmzq6405695418.png

ajq0l4vbmzq6405695418.png

1 ?9 ^; M( F0 |7 c$ |+ |  y图4演示了四个DNN模型在权重和激活的量化(分辨率)范围从1位到16位时的推理准确性。
5 B3 Y( Q" }8 V, ~) U这种高分辨率对于维持模型准确性很重要,特别是对于在具有挑战性的数据集上训练的复杂模型。8 I9 N; \" D3 [3 {. n9 c
敏感性分析研究人员进行了敏感性分析,以确定CrossLight的最佳配置,改变CONV和FC层加速器的VDP单元的数量和复杂度。
8 D% [+ E& G; x' Z

yipnw3evhz36405695518.png

yipnw3evhz36405695518.png
5 [, B' t6 X/ ~
图5是散点图,显示了各种CrossLight配置的平均每秒帧数(FPS)与平均每比特能耗(EPB)与面积的关系。9 x/ [1 a8 w6 {4 b% f/ U+ t
最佳配置是基于最高的FPS/EPB比率选择的,平衡了性能和能效。
0 V* k3 B1 {# t, [) s7 E4 [" W
与最先进加速器的比较CrossLight与两个著名的光加速器(DEAP-CNN和Holylight)以及几个电子加速器(包括GPU和CPU)进行了比较。
! b3 g6 B8 ^% K

mtx404baupp6405695619.png

mtx404baupp6405695619.png

' v3 G6 l# K. C( n图6比较了CrossLight各变体与光电子和电子加速器平台的功耗。
5 [- y# C1 M& K# q. Y/ m3 ^3 b结果显示,CrossLight,特别是在优化配置(Cross_opt_TED)中,实现了比其他光加速器和传统CPU/GPU平台更低的功耗,尽管功耗仍高于一些专用电子加速器。; H# c3 k. y; n5 m3 g; O
- W* n# u) o1 i3 o" _" P5 \# n

1gbbpwqp4hk6405695719.png

1gbbpwqp4hk6405695719.png
6 }. B8 x3 d& u
图7比较了光电子DNN加速器的每比特能耗(EPB)值。6 ?0 k% H; ^+ ~' u# ~+ C, d
在能效方面,CrossLight显著优于其他光加速器,平均比DEAP-CNN和Holylight分别低1544倍和9.5倍的EPB。
- P) T4 B, z' E0 jCrossLight的性能优势源于全面考虑了光系统中的各种损耗和串扰,以及在设备、线路和架构层面采用新方法来减轻影响。
- q( p3 I9 n9 O1 I
结论CrossLight展示了光电子神经网络加速器中跨层优化的潜力。通过解决硬件栈多个层面的挑战,与最先进的光电子和电子加速器相比,在能效和每瓦性能方面实现了显著改进。
0 M# X- l" V* _1 y2 v8 S9 X, @随着硅基光电子制造工艺的不断成熟,我们可以期待设备调谐成本、损耗和激光器功率开销进一步降低。这一趋势可能会加强光域加速器在深度学习推理任务中的地位。
7 v& z6 \5 }& k! ]- r) B4 pCrossLight的成功突出了在设计下一代硬件加速器时采用全面、跨层方法的重要性。随着我们推动人工智能和机器学习的边界,这种创新架构将在实现更高效和强大的计算系统方面发挥关键作用。0 F' m& ^/ \- T8 ~- b- z: J! P
参考文献[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
2 X! j( s, W4 A% K* M" W- END -
" B" A* ]! B# }' e3 F+ Q2 S* K: v* B  |
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。9 }+ ?4 l2 S8 t7 j
点击左下角"阅读原文"马上申请1 M& ?* U* t% _2 b( h: v5 p& d3 o

( Z, F4 m$ R4 T6 o; q欢迎转载
8 F0 ^! l+ \) H* \2 a& j1 z9 m8 T& d( P
转载请注明出处,请勿修改内容和删除作者信息!
5 R/ O) j3 I  f9 i* t5 I. e
. }* Z" N0 o" E# @% \; K; ?  l$ b% D. g
# [2 k# ^1 i- O" h# u( v- e

* j' i  I" w5 ]6 K- @) V

i04sdcaxjtp6405695819.gif

i04sdcaxjtp6405695819.gif
' Q6 j, b1 t: {' z" A+ R: N+ g
$ P# o3 V, ?( ~% H& n; f- v% A) B
关注我们
! A! h& O- J: F( W8 [
6 c/ p% B/ L9 w  Y" Z0 D% j" S
. ~; Z! d3 x! V6 M* {& `. K

fhdji2uy4fr6405695919.png

fhdji2uy4fr6405695919.png
4 e" j! @( }7 g: ]3 ?  t- D! f# D
' }2 E3 h; w" ?3 `! o

toe11bamh4p6405696019.png

toe11bamh4p6405696019.png
( t2 O& s2 @/ B/ T$ B6 P
* `* t: V7 R0 o( E) _1 Y/ c/ s: L

wyfszhdjarq6405696119.png

wyfszhdjarq6405696119.png
) t8 u0 ^5 t4 E: i) _$ b
                      * x1 g$ z  f1 i3 q9 D, y7 U5 p

! W3 N% N+ A& Q& W+ d

0 R7 [* N% \( R/ A- A1 m3 X+ u# T" ^. @7 x+ J1 O
关于我们:$ V, Y' ^4 F+ P4 Y8 g1 ~
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。" J* y7 @; u  \; i  ~8 P& B
1 C( J& c9 l& ]5 \8 y: }
http://www.latitudeda.com/
- v4 I: P0 q3 @0 T- X) u(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表