电子产业一站式赋能平台

PCB联盟网

搜索
查看: 197|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

978

主题

978

帖子

9715

积分

高级会员

Rank: 5Rank: 5

积分
9715
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言
) d3 q9 g8 i  \' Y& N* s2 t3 y: v随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。
, h1 Y2 L8 A0 O# j1 C9 i1 O1 ^& m. L9 W  R& W5 \; Q* U
本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。, k/ m5 Q1 ~$ K1 _5 I

0 u5 E8 w% z3 ]+ _7 ^

% N) e1 @/ L: T" A背景- V2 j+ L! J& v. y6 Z# L
光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:
' n* t) G* u- K; s* _: z! Y
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号
      m- n1 B' y* S5 }

    5 _8 i9 f  q& N( W光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。
    & A8 V7 u! `, F5 W; e: M8 E! X
    + {$ @! }" x1 A: B  u# M7 e) D7 r) [为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:
    . }: U& R) v3 Y" B( W8 ], }0 U4 d, H& F
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络: J; d. N# g& p

    % Y# X- w; |# R; b$ f" B0 J让我们看看为不同类型处理器提出的一些具体方案。
    0 Z' [# H" T! G2 T9 X. [5 f
    5 D9 s7 X9 T. k7 Q- Y/ D0 Y多核CPU设计中的激光调制方案, ~! ?/ a( t5 R8 L5 n3 q
    Probe1 `' I. V- C& @% W) q2 c
    最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。9 M1 [- L' V6 S; ]' T/ p0 i& @# l

    5 a6 c+ C% \( lProbe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表1 A; j) h6 x0 w- A5 m+ D1 i
    [/ol]
    1 V' _; l. |9 F% U& Y/ B9 O, ^锦标赛预测器根据最近的准确性在两者之间选择。( p" F1 x9 o- X6 G9 M8 w+ @

    ( Y4 h! m7 l. F/ }3 I! dColdBus
    , R; ?; v6 ?9 K# O0 u% oColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。
    ! L; o3 X+ k$ ^# }4 y( a
    ! x* g$ y# H" d$ Z5 e5 C4 C3 b使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。
    , g5 \# I! G0 K: i
    , f( i' p: h# H$ u  b( DColdBus还引入了一个"额外波导",为需要的站点提供应急功率。
    $ P+ `; K# D1 V1 ~" S& {9 l3 p& ^
    PShaRe
    6 ^* }0 Q4 W6 XPShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐/ |- p# ~$ s3 K) U( _' K
    [/ol]* R( X& s# ?' ?+ X1 E0 I8 ~
    图1显示了整体架构:$ A" G8 r% Y" L" z7 v$ C8 Q
    # n1 x. U" k# Q, }! O

    v0i132opydn64034878813.png

    v0i132opydn64034878813.png
    ! @9 `! h$ k3 E8 |
    图1:PShaRe架构,显示连接光学站点的功率和数据波导。
    # w+ E4 o7 A* E. J" p5 Z) {9 s: }3 O8 _" m  p
    神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。
    3 ]" @9 b7 o; p% @. T
    6 k* x! X( r/ LBigBus
    . {' U  }8 s/ ~* ~对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。
    + G* a9 {1 s; d. t" k9 q
    + J, L; l$ j3 }9 O图2说明了BigBus设计:. u' @! w& ^! B$ U0 ~
    $ C9 [8 P2 t8 k8 }7 E% ]$ X% @! Q" h

    2lsssyofp4g64034878913.png

    2lsssyofp4g64034878913.png
    , b. T  ^+ V. O  S" r2 A* k# R
    图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。
    - Q  [" c3 `& U- X
    , ^7 a8 c2 P4 Q4 v$ k% u; s: DBigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合' x; A/ [' q% F9 O' Y# a4 |
    [/ol]
    4 N9 ^+ b8 J1 p/ u' t$ w这允许在当前条件的响应性和稳定性之间取得平衡。: w/ m- q9 I% o6 {2 o9 N
      c4 b+ l5 g0 u$ w) K6 d
    4 @) ]" A1 v! }8 W* l" f( {
    多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案5 ~0 i; s2 J* D
    对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。0 |3 D9 Z% \  Q2 Q

    2 u; |0 V4 f  T& E! x片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件7 ^, S0 A9 r: w
    [/ol]2 Q: q5 i. m& S' y
    功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。
    " f5 D: Z2 N' C3 a+ R) Z3 `* K) ~9 |: z7 q  _2 V
    GPU设计中的激光调制方案4 Z5 O: M& u1 @1 m4 ]/ v" M
    由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。
    5 V) g" J- D* S8 G, G1 f. B9 a2 ]. F, @
    图3显示了GPUOpt的整体架构:# x: Y: \" c) m

    + R  p! u' Q- H9 k. v, q6 n: E

    m5tbfrm3byw64034879013.png

    m5tbfrm3byw64034879013.png
    " A- k. u: N$ x! ?( }
    图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。; o% T; v5 j! {2 M1 x: h

    1 B: K+ B+ |0 s8 G+ PGPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:
    ( i& l" n9 t; S7 G; f1. SM站点使用基于以下因素的受限预测器(Restr_Pred):& I. t1 x8 f- J  C. B
  • 接收的消息
  • 发送的消息
  • 等待时间& }2 O* ^; a* s1 w
    + f& O5 Z- }0 r0 t
    2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):  K2 h) H0 x+ K) K
  • 接收的消息
  • 发送的消息
  • 待处理事件6 x/ T3 o* T" F" l3 \3 N
    + G; r; ?6 }8 D& `
    激光控制器将这些预测结合起来,确定整体功率需求。
    # Q- `4 B# o. ^8 f+ G  L: x& j
    8 ?2 n' x2 k; s$ a
    5 B2 `4 C* _9 w
    关键概念和趋势+ _' R5 i( n# X, W) w8 r3 a0 u
    虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:
    8 `6 ?8 ~0 p/ x% \' c1 k8 ^( [) {$ y
    1.将时间划分为固定时期进行预测和重新配置$ V8 U1 U( I2 i5 r. Y: H* U
    2. 使用多个输入指标:' z; Y4 c8 v1 T+ y' [4 V" b4 k( N5 ^
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件
    # ~3 w) B' R. e1 \5 y
    3. 将当前指标与历史数据结合
    : g/ g! n+ @& N  k3 |* W5 o4. 使用非线性预测函数(如神经网络)捕捉复杂关系
    3 m. d1 N0 a7 }5. 对不同流量类型进行单独预测(如一致性与非一致性)
    9 p# E, T0 N" a6 W* b6. 分层设计以实现可扩展性
    . o' r# B3 O" W7. 尽可能重用未使用的光功率
    " _' j- Q2 f4 x5 E) x, M8. 为特定架构经验性地调整预测参数8 q9 T- U- l6 M  w2 t
    # j$ u. J$ t8 @
    图4说明了有效激光调制可能带来的功率节省:
    0 ]9 z. E  R# H3 {& Q1 {
    % S8 S3 x$ h& N- e- a- _

    om02xkr3dhc64034879113.png

    om02xkr3dhc64034879113.png

    ( ^7 [" h4 n/ D8 b  u图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。
    - K5 e& \8 ~9 z3 M1 T3 x! E* O' T5 Z/ f' b
    # V" s' h6 ]( P+ G* j
    未来方向2 i7 K, T+ r% }- d  ^9 O! X) d
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:
    / i3 H, v% O( ?, g$ M; H! x! B# u6 q
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化
    9 Z  Y  l& e$ Y8 F" p
    % _$ v8 ~$ ~; r* W3 X9 r9 n# a2 n
    $ U( `- w$ Z2 n  \
    结论5 m. x, u* t/ @4 s
    有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。) _/ z& L: [+ _& O9 Z
    - |! S- T* o, M

    , `% g( w4 x' z( E参考文献1 S/ r5 b  }! K2 E8 |
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.0 s/ o; \4 y2 N: D# D3 e5 V
    5 g8 D) n' n( _1 s0 I
    - END -* F  s& Z0 _- h. B" C

    3 U, p, A0 o+ M2 C, b软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    ' d( t# Y4 _! M* S点击左下角"阅读原文"马上申请
    : T# f( u" ^" j$ s& j: |6 @8 g% |% v# I( d, _  Q
    欢迎转载# o& _7 y+ _- E

    , i  c6 C, c) }  g转载请注明出处,请勿修改内容和删除作者信息!1 Q8 s  v/ z3 @- `% R
    8 p0 ]2 E; m6 U3 T: {# I" v4 c
    * K4 I* U' ?! T
      V  k2 R0 K: ^0 L. H; |+ }

    tlesfwadvw464034879213.gif

    tlesfwadvw464034879213.gif

    $ |! M" b6 o$ A7 X2 u2 ?7 F$ w# n) e# G6 {6 k; l1 E; {' g$ v+ Z
    关注我们& I! c& T& U- k4 Y3 F

    8 w+ ~, e4 V$ e% v$ e& R; y7 ^

    : e6 t5 b5 P: N, l1 p

    0rzxntnecf364034879313.png

    0rzxntnecf364034879313.png

    # f' |2 L5 k( `) P- z" u8 s5 _
    9 m+ ?& L. C" L9 z9 A

    wklhaednp3g64034879413.png

    wklhaednp3g64034879413.png
    , l/ J' d1 r5 B  }* G/ ?' e
    $ M# g! a0 N" o# q+ |& R

    v05awecejyj64034879513.png

    v05awecejyj64034879513.png
    4 e) p. j: }2 H% x
                         
    0 h! b0 }5 C2 S. s9 [. w, x. z7 n8 G9 a$ P) d- O
    : E! m3 a& ^) Q& Y

    % a+ S  J& y8 G* X# H( j关于我们:
    - u( n( \  v$ ^2 Y5 j  i' G1 M. ^深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。( [# _4 n9 H3 G2 m- u) t

    # e3 k; A* k) |' U0 Vhttp://www.latitudeda.com/" b+ i4 d" O  I. V  s" A; ]8 L- ?" T3 e
    (点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表