电子产业一站式赋能平台

PCB联盟网

搜索
查看: 89|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

670

主题

670

帖子

5775

积分

四级会员

Rank: 4

积分
5775
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言/ k. j. X. X/ S+ R
随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。) x3 F) u9 j: R

& w- z2 c' z* g9 s! P7 C; s本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。; ~+ e: R$ U: @- G
# l3 x& N8 X: l2 u8 B" s  m
1 a, E+ C' U$ Q5 [3 N( K* M& p3 ]
背景
8 @0 T) \/ J9 s9 H: Z' s光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:7 S; Q- S6 x1 D4 S' \
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号
    6 N4 z! F+ Z! I" _* n( N8 p. o1 Q+ V
    ) w! D, D* ^  T) [: G9 q' s
    光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。
    * s) w, I; `+ E. j% J; [5 L) }% \0 h; E
    为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:
    ) ?7 @% t# K( m2 l. C
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络
    ; I8 g5 u/ C9 M1 \

    1 a- t9 i2 H! Q让我们看看为不同类型处理器提出的一些具体方案。5 p7 u8 t, n8 X7 a5 o( X

    7 ]& U8 k3 W3 s) i0 m9 I, Y. z多核CPU设计中的激光调制方案
    5 D9 O6 \2 i5 o7 I' A$ r# q. X9 w0 ?Probe( G& x" _# ?4 h. @+ j
    最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。7 l! W4 N8 c- \: @) `! o9 n

    . g: F, R4 G( X$ Z2 w3 PProbe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表
    0 x( J" i6 |# A9 [# ]8 S[/ol]( l# P/ V* i/ o" F" y, A
    锦标赛预测器根据最近的准确性在两者之间选择。5 C; {* q& j9 Q' b+ m2 o
    7 I2 @0 `& P& h) x
    ColdBus* i* O* K+ |, W: G' W
    ColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。% S4 \% `$ a; t, s
    0 U. [6 v" T) b  x2 x  L9 O
    使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。& ?% C* D3 E: m3 @( P7 n

    ! [. E+ F  h' E* tColdBus还引入了一个"额外波导",为需要的站点提供应急功率。2 Z0 g  o) }6 m9 X* a( r  t
    ; y  P8 u  a! a) w8 a8 F1 a
    PShaRe
    5 ^3 `6 g0 r& C. T; \4 ?) ?PShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐
    4 i4 P$ V1 ], f. _" c' d[/ol]* x; l1 r7 h2 b& ~
    图1显示了整体架构:4 ^- Z( S7 A$ r! o/ U
    : e* d4 E+ N/ }/ Y/ i- `

    v0i132opydn64034878813.png

    v0i132opydn64034878813.png
    + _1 [; M' n4 Q: p1 L& \
    图1:PShaRe架构,显示连接光学站点的功率和数据波导。
    " a2 J# S$ c# F
    ; S1 S2 B0 Z1 @神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。
    4 N& [* X7 j% {: z7 j9 U7 |' I- H# f# p7 k& n; \+ R, ]0 U
    BigBus1 ?5 z: W, b3 i' L& e9 @& [5 X
    对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。
    $ ]) ^& _' e, ]+ ], ~9 {! X  r, F* r1 v# \4 W$ K
    图2说明了BigBus设计:
    " s  {: e) n' j3 |) D' l
    ; t" T0 w8 a8 P6 M) A$ [3 E1 k

    2lsssyofp4g64034878913.png

    2lsssyofp4g64034878913.png

    ; u9 d9 N# i( \! s: n* c6 I! P图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。
    1 f! _6 B, K) }$ e3 [6 H
    7 w' o1 ?* \  U) @6 a! `5 B/ aBigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合4 v8 B% R  d$ K2 [5 E/ u
    [/ol], G$ j3 P! o7 H% k9 H9 t
    这允许在当前条件的响应性和稳定性之间取得平衡。3 B2 W7 C# M. W! r7 s* I

    8 m+ Y. Y- Y9 Z  W; O

    6 j+ T  U8 i' ^6 P' c% M多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案
    & D- n7 t" p7 @% {3 R对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。. O7 l- e4 F( g! Y% @3 v* L

    ! v  X# V4 r  N3 t" N$ o& `0 ?片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件
    ) [0 B. A6 G* |, \; S1 u[/ol]
    " p, z8 L3 L6 D; i' p0 N! @功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。2 l1 U9 d; q' E$ P

    ; c% f; O: L0 vGPU设计中的激光调制方案
      K. S3 z* x4 j, {3 I1 I0 ~4 K1 M由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。  N/ w7 \2 t1 p7 |: ^, Z  u
    5 a% Y$ c( F3 C; [
    图3显示了GPUOpt的整体架构:. [0 c% {* f' D, Y$ \8 V* E
    , i; s1 u  N" p/ h% t6 n

    m5tbfrm3byw64034879013.png

    m5tbfrm3byw64034879013.png
    7 {2 Y  ^* J' @  d; |
    图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。5 `; v  K+ t6 ~: H1 [$ U
    ( j0 A/ k6 P- @) c# A
    GPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:
    $ R2 u0 [! Y" ^3 A  y$ A1 z, f  [  l1. SM站点使用基于以下因素的受限预测器(Restr_Pred):- H+ G& R. }7 W( E
  • 接收的消息
  • 发送的消息
  • 等待时间6 P5 F8 [0 Q$ F! O4 Y5 e* I

    % r, Q. G* e, |5 e2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):
    . y3 x# I: j! v, P* `$ B, l) k
  • 接收的消息
  • 发送的消息
  • 待处理事件8 S3 Y. J. C, m" y' Z
    ' v' X# E1 q) s
    激光控制器将这些预测结合起来,确定整体功率需求。
    , c3 v5 y" ]9 e2 O- u' ]# T3 C5 @9 [0 _
    # i: p  U, H" i/ n) p. y2 V
    关键概念和趋势
    ; _% {! e: }4 a0 ^虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:% k% m$ @" `) p$ e' F; {

    6 r) t" A, m- ~! {7 N1.将时间划分为固定时期进行预测和重新配置  O6 [: `4 H3 ~$ N( |
    2. 使用多个输入指标:
    + O7 w6 w0 Z$ o# {: C( h4 S: S
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件
    7 z8 |* M7 j* A7 y7 r) H6 q
    3. 将当前指标与历史数据结合7 `. d: `* {* u  g% K/ r
    4. 使用非线性预测函数(如神经网络)捕捉复杂关系
    $ o' p  T- x' {$ W+ K8 L1 |! n5. 对不同流量类型进行单独预测(如一致性与非一致性)
    3 g' O4 n! Z  X+ `! c: z4 ]6. 分层设计以实现可扩展性  N1 t6 `( B/ K( Q' d
    7. 尽可能重用未使用的光功率
    4 H2 a5 P) f+ Y0 _' z, w8. 为特定架构经验性地调整预测参数
    " n5 q% T9 I  m5 o  @! N" @/ P# U  a3 |% Q
    图4说明了有效激光调制可能带来的功率节省:
    : f5 U( }( v: o. P5 D4 w1 C: Q5 A& Y% }# _, n3 b) v) z

    om02xkr3dhc64034879113.png

    om02xkr3dhc64034879113.png
    " ?6 I& D( u' w" p6 o
    图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。3 @9 y7 b6 _2 m
    ( N( {- G- x6 R& D  C9 R
    7 ^( Z, ?* k  z& @, f( x
    未来方向3 B2 B8 ]9 y" t& ~6 b' ^) @5 A
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:
    # Q" q$ i" z9 R( I; i
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化
    6 y6 ]6 @0 m# c9 e5 t
    7 r$ k* l( V  u, }; d

    , z( H' P' u5 t' B0 S0 p- n结论
    4 y# y: R  c: \5 ^/ P' [6 s有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。
    / u3 q( X& c8 l7 I0 D5 w6 A' c) }/ E4 t2 s6 F7 [- S' q4 H

    2 V6 X, C. Z. F$ Z$ `  t参考文献3 F2 F1 A: _* n2 }: M- k( n
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    6 x  V0 Y( F4 t0 R1 n3 Z& U% G* k8 l# L
    - END -* A$ l* M. [) C  L, y
    ( I: i: K. V& P: x% q
    软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。0 T! J# r" x9 t
    点击左下角"阅读原文"马上申请6 q$ t# M+ q/ d/ W% h7 F
    . [) K" {5 Z, z9 s3 @( {1 f
    欢迎转载, `; j# i3 {3 w7 x

    % \1 K6 |8 A; ~) h- u, Y7 D转载请注明出处,请勿修改内容和删除作者信息!
      N6 N( v4 I( O9 G! P
    + i5 l" I. L* @  g3 V5 t4 C1 c9 o  L8 h& a

    ( [7 F7 M. r7 k

    tlesfwadvw464034879213.gif

    tlesfwadvw464034879213.gif
    ) b0 r/ r0 W, u' q% \: ^- A
    6 v5 l5 b, `; @  L& @' k( W; ~
    关注我们
    # j' P+ [% c7 y( m/ o6 {0 ~' t9 A, ]. C3 [& U8 u7 ^& ~% r
    1 S% d- l3 D/ L6 z) E- W5 ]

    0rzxntnecf364034879313.png

    0rzxntnecf364034879313.png

    * L* h% {* z. j
    0 H& f: Y8 G  F1 d

    wklhaednp3g64034879413.png

    wklhaednp3g64034879413.png
    * b$ f6 t' p8 N6 C
    0 d( w/ O/ `. I8 x6 r7 q6 D

    v05awecejyj64034879513.png

    v05awecejyj64034879513.png
    ) G! @( S( |( T
                          + F, }  o% M$ U+ M$ C$ ]* ~

    . d  {: o' ]! ~4 J# F% U. b

    " F5 Z; @3 q, J1 Q7 Y1 T. w& z& p" |' L+ s# i) h
    关于我们:
    ! T: M: M% T* @( O" |# B/ [深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    5 o- c4 u; X  z; z
    ( E' U' x; K  G$ Z) u* T( N, chttp://www.latitudeda.com/" b/ Q) h+ h  N5 V
    (点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表