电子产业一站式赋能平台

PCB联盟网

搜索
查看: 187|回复: 0
收起左侧

硅基光电子技术在深度学习加速中的应用:CrossLight介绍

[复制链接]

983

主题

983

帖子

9792

积分

高级会员

Rank: 5Rank: 5

积分
9792
发表于 2024-9-4 08:00:00 | 显示全部楼层 |阅读模式
引言随着深度神经网络(DNNs)在各种应用中变得越来越复杂和普遍,对高效硬件加速器的需求比以往任何时候都更为迫切。在后摩尔定律时代,传统电子加速器面临着基本限制,在带宽和能效方面造成瓶颈。硅基光电子技术应运而生,可为深度学习加速提供节能、超高带宽和低延迟的解决方案。6 |$ N" q+ G$ P$ F
本文介绍CrossLight,新型硅基光电子神经网络加速器,通过跨层设计方法解决光计算中的关键挑战。将探讨光计算的基础知识、CrossLight的架构以及与最先进加速器的性能比较。" y6 u6 R- d8 Q; Q4 I' s) P  a
8 j. o3 k8 D2 L5 V& E# w4 l
光计算基础
" r/ B' i! z$ m- g* z% @, [在深入了解CrossLight之前,让我们先了解深度学习光计算的基础知识。光加速器通常使用广播和权重(B&W)配置来执行矩阵-矢量乘法,这对DNN中的卷积(CONV)和全连接(FC)层都是必不可少的。
; F9 Q! F) L. S4 |6 ]+ p5 d

vndjbb4wr4k6405695118.png

vndjbb4wr4k6405695118.png
# {4 @( s0 v, X" ]& l7 V7 @  C: A
图1显示了基于非相干广播和权重(B&W)的光电子神经元配置。$ X, a0 i, O& W+ I
在此配置中,输入值通过调制器印刻在不同波长的光上。然后,这些波长被合并并分成多个分支,每个分支由微环谐振器(MRs)加权。加权信号通过光电探测器求和,完成矩阵-矢量乘法运算。2 z* ]& {% d' [
这种设置中的关键组件是微环谐振器(MR)。MR可以调谐以改变特定波长的能量,有效地在光域中实现乘法运算。0 M) F' L9 \, B) ?7 u
CrossLight架构
3 c: ~, y* ?4 S& D9 A  wCrossLight采用跨层方法优化光加速,解决设备、线路和架构层面的挑战。
/ D' p- _6 P  A9 L

rcw4xofdo3b6405695218.png

rcw4xofdo3b6405695218.png
' W2 B' x" j( Y4 Z1 S
图2展示了CrossLight非相干硅基光电子神经网络加速器的高级概述。: _& o& i) a) p/ H9 @
设备级优化在设备级别,CrossLight引入了优化的MR设计,对制造工艺变化(FPVs)更具弹性。通过全面的设计空间探索,研究人员发现,使用400纳米的输入波导宽度和800纳米的环形波导宽度可以将由FPV引起的不期望的谐振波长偏移减少70%。4 F7 w) ^+ Q6 q5 a+ i
线路级优化为解决紧密排列的MR之间的热串扰问题,CrossLight采用了结合热光(TO)和电光(EO)调谐的混合调谐方法。与传统的仅TO调谐方法相比,这种方法可以实现更快的操作速度和更低的功耗。2 V* H- k# @1 S1 M
此外,CrossLight采用了称为热特征分解(TED)的方法,可以集体调谐MR组中的所有MR,有效地以较低的功耗消除热串扰效应。
2 N1 w: }0 o& }# D0 P! ]2 ~

a1mbmdzge1b6405695318.png

a1mbmdzge1b6405695318.png
4 Y) x& R( N4 m: t
图3显示了10个制造的MR块中相邻MR对之间距离可变时的相位串扰比和调谐功耗。- o" m1 a( X& k( `: G, y
架构级优化CrossLight为CONV和FC层加速引入了单独的矢量点积(VDP)单元,认识到这些层的不同计算需求。这种分离允许更高效地处理这两种类型的层。% w( J1 ?- |8 i2 t: \3 s/ X1 J
该架构还在VDP单元内实现了波长重用策略,减少了所需的激光器总数,从而降低了功耗。通过将较大的矢量分解为较小的矢量,并在VDP单元内的多个分支上执行并行计算,CrossLight在并行性和激光器功率需求之间实现了平衡。. d, Z" Q5 [: g, O. \+ ~* r
性能分析为评估CrossLight的性能,研究人员使用四个不同复杂度的DNN模型进行了广泛的模拟。+ U, Q3 \+ I0 F: p  |5 G
分辨率分析CrossLight的一个主要优势是能够实现高分辨率计算。虽然一些光加速器限制在2-4位分辨率,但CrossLight可以为其MR组实现高达16位的分辨率。! ~/ H4 s2 _) C# \8 [  l" b9 [

ajq0l4vbmzq6405695418.png

ajq0l4vbmzq6405695418.png
, b! Z5 P4 ]: @/ T( P+ h
图4演示了四个DNN模型在权重和激活的量化(分辨率)范围从1位到16位时的推理准确性。
! k  V4 N3 j3 b, X9 X9 k这种高分辨率对于维持模型准确性很重要,特别是对于在具有挑战性的数据集上训练的复杂模型。
3 e' w& a: a) F9 i# H
敏感性分析研究人员进行了敏感性分析,以确定CrossLight的最佳配置,改变CONV和FC层加速器的VDP单元的数量和复杂度。8 z5 ]/ I! ]* i, e7 ]

yipnw3evhz36405695518.png

yipnw3evhz36405695518.png
$ o# y. X3 I5 J3 W9 F) b
图5是散点图,显示了各种CrossLight配置的平均每秒帧数(FPS)与平均每比特能耗(EPB)与面积的关系。$ t7 D+ F- W$ Y  e9 D7 ?- ~
最佳配置是基于最高的FPS/EPB比率选择的,平衡了性能和能效。
8 w8 z( z5 _2 |, @
与最先进加速器的比较CrossLight与两个著名的光加速器(DEAP-CNN和Holylight)以及几个电子加速器(包括GPU和CPU)进行了比较。# q5 P* p6 M# [" J; V4 n% L( n) u

mtx404baupp6405695619.png

mtx404baupp6405695619.png

/ d( s/ R' v3 r, k8 d9 z图6比较了CrossLight各变体与光电子和电子加速器平台的功耗。# M; f6 o% k! m" S& u% K8 C
结果显示,CrossLight,特别是在优化配置(Cross_opt_TED)中,实现了比其他光加速器和传统CPU/GPU平台更低的功耗,尽管功耗仍高于一些专用电子加速器。2 }. L, y# _+ c) W' N0 B0 w
5 `! N3 v+ Z  N/ E& c

1gbbpwqp4hk6405695719.png

1gbbpwqp4hk6405695719.png

/ U5 F# O+ T+ i" k# Y; e图7比较了光电子DNN加速器的每比特能耗(EPB)值。
1 U+ w: a7 u1 I9 Y" p9 E7 E* i在能效方面,CrossLight显著优于其他光加速器,平均比DEAP-CNN和Holylight分别低1544倍和9.5倍的EPB。+ T% D+ B3 x' q# ?, p8 u4 M3 v
CrossLight的性能优势源于全面考虑了光系统中的各种损耗和串扰,以及在设备、线路和架构层面采用新方法来减轻影响。) u( V' f: K' D3 X# L% h/ L
结论CrossLight展示了光电子神经网络加速器中跨层优化的潜力。通过解决硬件栈多个层面的挑战,与最先进的光电子和电子加速器相比,在能效和每瓦性能方面实现了显著改进。  @$ X8 S+ N/ s' M
随着硅基光电子制造工艺的不断成熟,我们可以期待设备调谐成本、损耗和激光器功率开销进一步降低。这一趋势可能会加强光域加速器在深度学习推理任务中的地位。
8 \/ v) {+ w2 Z5 G1 O  mCrossLight的成功突出了在设计下一代硬件加速器时采用全面、跨层方法的重要性。随着我们推动人工智能和机器学习的边界,这种创新架构将在实现更高效和强大的计算系统方面发挥关键作用。
$ D, F1 \$ ]# ~" j  U6 M+ }$ Y0 _参考文献[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
: m" r7 F% T. L4 `- END -
/ Y8 L9 d. f, c2 M& X
6 N( b$ Z; U$ N" Q- v* c9 J软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
: X: P1 R, A/ B5 _点击左下角"阅读原文"马上申请$ t- i6 }. E0 F1 h; u
7 M. g1 r" S, N$ Q; w. f# j/ O; D5 W
欢迎转载
) ?0 @! e! ^3 Z3 i7 i
4 P! }1 K& |2 `& ?9 Y/ ]转载请注明出处,请勿修改内容和删除作者信息!4 ~  C' j- K+ C4 l1 h7 e1 w9 }

) q8 F% R! M: f! m! Z8 q' D7 b' J1 S% H1 i
/ V* l3 _- V0 F; G+ o. Y' b  T$ ]; b

i04sdcaxjtp6405695819.gif

i04sdcaxjtp6405695819.gif

$ W+ y4 i6 ~4 E5 c3 d6 I
; l8 ~7 R$ L8 r) ?关注我们9 ]1 j7 r% W; Q& M) r0 K0 {: |
5 v* E2 N: X/ B8 k3 \4 o1 K

* t* d4 R$ r1 y% `& `9 q

fhdji2uy4fr6405695919.png

fhdji2uy4fr6405695919.png

6 S. p( T- v# R9 U/ L2 k: R
3 N( _# @" i( E) w. h

toe11bamh4p6405696019.png

toe11bamh4p6405696019.png
7 A; S+ V) ?5 w0 t. J

& I* G" l, @1 S7 E8 G6 H8 X

wyfszhdjarq6405696119.png

wyfszhdjarq6405696119.png

2 `* S: [( @: c9 E* G+ I8 [1 l' A
                      , N6 J4 w( y8 F
+ r. _; Z5 g( b% V1 E8 q

* B  {5 \. Q+ O1 w
2 y+ D7 j7 n! E" w  v3 b% |) r关于我们:  j  B5 c  [  t. B. |6 ?
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
4 b2 F, ]4 g) }& C; A7 b
* r  _; z& ~8 d; [' Dhttp://www.latitudeda.com/
! [* }# |+ d) y) J% t: {$ O- b(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表