电子产业一站式赋能平台

PCB联盟网

搜索
查看: 79|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

670

主题

670

帖子

5775

积分

四级会员

Rank: 4

积分
5775
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言
0 H9 f% R; U- J2 d' z1 {随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。- o9 f: B8 n+ w/ ~

# j7 A* M7 r8 {% b本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。
  v& m; N: {6 e& @  t
% [% }( I' ^# b8 i
# v  u, P/ y$ K( k$ I
背景
! P5 |; F5 h: g) I5 v4 f* T光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:
3 K* Z+ O+ R# w" z3 q
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号
    $ u8 c% v+ a& q  ], `- r! {

    ; l, S. o9 b; Y# C光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。) {* j. ?5 ]$ j; j+ x

    . x+ w) P' z2 s$ u" X为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:" n# C# g" K; h/ t7 V; q
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络$ A; Z  O* {* H" ?1 D" K7 W

    + N9 _* ^% _+ k- Y/ K: W( {1 h( `, B让我们看看为不同类型处理器提出的一些具体方案。. e! o2 q! x; x4 |

    / R4 `% b/ H7 C# d: r2 v多核CPU设计中的激光调制方案
    , u: k% M- ~; h3 _+ N7 FProbe) P: q, E. N0 l- s7 J. I
    最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。% h3 D, P9 W4 W/ u( g

    : c/ Y& U& `# M3 [# E3 |Probe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表; Q8 y" x; D. ]- g) A3 l3 C8 Z
    [/ol]
    $ T! U6 l: C# A* \锦标赛预测器根据最近的准确性在两者之间选择。3 m( W0 ?  \2 E2 J8 e% H6 x: c  E
    # v" @2 j2 Y# P+ G/ k
    ColdBus$ l' i2 w6 j7 g+ {1 T/ y# i
    ColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。
    7 m1 |0 u' L1 s4 V7 [+ Y' O. z' ?" X# z2 R5 [
    使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。
    # ~$ W6 f2 Z7 Q. J& l* D* \$ `: S' F+ }# U* Q  j" U
    ColdBus还引入了一个"额外波导",为需要的站点提供应急功率。
    - \* u$ t5 C+ b) O5 R4 }. h& c' y
    PShaRe( f7 f4 M, K; d) U. m  L" Z* ~1 l
    PShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐
    ) B/ T/ {4 v$ A" H4 s5 b/ n$ A2 ^5 |[/ol]
    * w; _% N* e! K% n3 F" N图1显示了整体架构:
    ' L# y! q4 h- [& D
    ! k+ D+ B0 f1 m/ X/ g

    cjhdyiznw5w64024513536.png

    cjhdyiznw5w64024513536.png
    ' a2 Y% n  k, ~2 A' ~% I
    图1:PShaRe架构,显示连接光学站点的功率和数据波导。
    0 l6 w' ~, g; ~) U7 R: B7 f( v/ l  K5 K8 o7 w2 j! [
    神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。$ `) ~" D9 b1 u
    0 h! A! |# k# g0 d
    BigBus( [/ e: S. C4 N: \2 P" Z; `
    对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。
    8 E# l: h' g9 ~' |( V1 |" i4 C6 _
    图2说明了BigBus设计:
    : u# T6 v+ ]9 a- W% U' o+ M8 A8 x  ~2 j; v# Q

    hck0tgbp1b364024513636.png

    hck0tgbp1b364024513636.png
    4 \: B3 b) |' C8 Y+ T9 E
    图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。
    7 Q* ^- V( Z1 T0 v0 [! v. ^# Z) X1 d& d8 Y
    BigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合* f' v2 h6 U7 F1 u7 `" H: A$ I
    [/ol]
    4 w. c+ b- A  F这允许在当前条件的响应性和稳定性之间取得平衡。7 f6 B5 H9 I$ b
    " l. z% t9 a4 f  M1 R+ E2 E# s: _* `# m
      D1 K1 C9 U7 A
    多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案
    . E4 u9 A' r" c! J, y/ G5 c  v对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。
    + r2 G' l; v/ _6 M* K( X1 T2 b& ^# T" M7 u
    片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件. Z5 O. D: j" t, y4 E! K3 U
    [/ol]  o, F8 S: y: \
    功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。/ ^. z, H; x' v" @! m  f
    ! [  c. F9 G- m
    GPU设计中的激光调制方案
    6 d- d7 d) p  ?) J% j6 v由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。
    8 t1 u, q3 Z3 v) n
    9 Z; Z( \* q1 V/ W& X图3显示了GPUOpt的整体架构:
      v6 q; d) q7 |( t) i6 M, A* L1 ^! v) y4 M2 g# k- g3 a

    2r1e3lybmxf64024513736.png

    2r1e3lybmxf64024513736.png

    5 i& n) z- e/ y1 m1 u- V图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。
    6 L" I$ O" S3 M9 t! C
      b) o. @9 f7 n8 k8 eGPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:
    # Z* F* _1 z% Z1. SM站点使用基于以下因素的受限预测器(Restr_Pred):
    ; L) p- B/ g' j! b
  • 接收的消息
  • 发送的消息
  • 等待时间: P; @. ]5 U! ?4 n1 N  u
    ) h2 X% u( W: [
    2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):# t9 a- E5 X. i$ A% O
  • 接收的消息
  • 发送的消息
  • 待处理事件9 W  O  r; W7 w/ g* s' Y

    ' c9 H9 {! H" H( j, ]5 ]激光控制器将这些预测结合起来,确定整体功率需求。7 X* [% B8 W: e" ^  r2 T
    + |% S5 j1 g/ N' U* [! `

    0 n9 m0 @$ A0 |5 a' P关键概念和趋势
    & [5 C5 m/ ^4 T2 c  s/ M0 |) b虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:
    8 o6 e  S. p$ x3 p7 ?* n' A8 X
    5 s8 g- \7 Z* K: p( x/ Q6 q1.将时间划分为固定时期进行预测和重新配置
    ; J6 S9 D2 {- B* X, S, n! s. r2. 使用多个输入指标:
    " ~. J# F7 N* `! w5 @
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件
    $ h' O, i  S( l0 A6 W. Q
    3. 将当前指标与历史数据结合$ ]+ _- k2 E6 t
    4. 使用非线性预测函数(如神经网络)捕捉复杂关系
    " [4 q+ W+ {0 z- Z5. 对不同流量类型进行单独预测(如一致性与非一致性)
    ; b: u0 _$ \1 I' t& W6. 分层设计以实现可扩展性( a* A( p5 Q6 C' _2 O' n
    7. 尽可能重用未使用的光功率
    # w- M" l! K$ S, u/ P2 m0 R8. 为特定架构经验性地调整预测参数
    4 R4 m, @% V3 w" t! f. m
    ' A3 T4 D3 b1 {' c- c% Z, o图4说明了有效激光调制可能带来的功率节省:
    " G& T4 K3 z! y" A5 [& h& P) b# @  I8 s( ~+ o1 ?

    opnnfadxepq64024513836.png

    opnnfadxepq64024513836.png
    ; _+ m  U' y' l7 _0 q+ _* k
    图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。6 {, i! F; c+ X/ Z/ B3 }, m, x' }. O

    + o$ {3 f$ g' L( [9 Y4 ~2 B6 L, T. D
    6 Z$ _& n+ @, o6 H' Z; Y% u
    未来方向' Y+ V8 {* D# d
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:
    4 L9 \# r6 O7 T
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化
    3 K+ `# X$ L/ H: a

    - G% C2 {3 s% g, A
    ) W- @7 u( Z# L9 I
    结论
    * l; `6 R6 I+ h$ I% F4 i4 X7 h有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。4 }6 F9 r# O: w- H; }# }
    5 }! e4 I: [1 y

    % a$ x" `$ W+ G  [参考文献
    6 W1 e, T' R9 o0 S5 d$ _5 ]; J[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    ) v/ D. S) q! h0 C" ]0 N3 f# `- z. e& R. \
    - END -
    / D- |$ F9 Y1 h, z. U+ v4 P+ `  ]* U1 }# U5 G; H
    软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    2 j% z0 s+ @, u4 q  |% U点击左下角"阅读原文"马上申请
    : {: V' x3 D( A2 k* U1 g7 z$ \. k1 h* q) j( |3 ^8 c+ U6 v
    欢迎转载5 h5 X( X7 r2 W  s
    $ g) P  [4 C+ n; T# d
    转载请注明出处,请勿修改内容和删除作者信息!
    % M* x) l  f8 d  o5 R) N* y6 m9 @4 R6 {8 \) ?% t7 w# N& F; A0 @
    0 @* p+ C0 Y5 }! u

    ; t  Z3 g5 b% q9 h8 u; Y) H

    pqequtkewc264024513936.gif

    pqequtkewc264024513936.gif

    6 `  h) d5 q" ]" T. K4 x
      J1 @0 ?+ d& I" Z+ L* a2 n# f关注我们
    . O+ r4 o+ H) e5 D4 {0 N5 [( D: \
    % c( c& S3 ~0 d. z: W! z

    f04h1q5oxrw64024514036.png

    f04h1q5oxrw64024514036.png

    0 q2 _& K  C8 O
    : m4 v! A$ W0 P1 a$ o2 ?

    ckxurcq3lg364024514137.png

    ckxurcq3lg364024514137.png

    9 L& p. L6 j1 s
    / F& I, z* ]2 X* _6 a' a

    rq40zwpyofx64024514237.png

    rq40zwpyofx64024514237.png
    6 t) \9 K$ V- f& t5 q
                         
    - O3 o& \* [" Q
    ; D3 ?3 |; F" I; w% D
    % Q) O( {. Z5 P& N
    $ Y4 }3 U* S. ^! V+ ?9 J" B' c5 G
    关于我们:# y& m2 W& l( N8 R7 h8 }/ a
    深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    8 Q2 ]5 r2 Q% p6 k. v+ |: k% ]- x5 K- J) @. E4 L+ f
    http://www.latitudeda.com/
    : ?0 X% _; ?; E9 U( b(点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表