电子产业一站式赋能平台

PCB联盟网

搜索
查看: 152|回复: 0
收起左侧

Hot Chips 2024 | Intel的光计算互连(Optical Compute Interconnect,OCI)

[复制链接]

670

主题

670

帖子

5775

积分

四级会员

Rank: 4

积分
5775
发表于 2024-9-26 08:02:00 | 显示全部楼层 |阅读模式
引言
6 f8 C9 [, v# v% Q在计算和数据通信技术不断发展的今天,对更快、更高效、更高带宽解决方案的需求持续增长。本文旨在帮助读者了解光计算互连(Optical Compute Interconnect,OCI)。OCI是下一代计算架构和数据中心的极具潜力的解决方案。我们将探讨OCI背后的原理、相比传统互连技术的优势,以及该领域的最新发展。- B0 ?" l5 O7 E3 w  U
, b0 G( d* i! a) _0 A8 i
光通信的演进' E9 q$ n$ p, h" I( X

k2bboqyzvep6409029157.png

k2bboqyzvep6409029157.png
5 w$ h# ^8 K8 [0 e
图1:展示了光通信从电信时代到人工智能时代的演进,突出了向更高密度和更低功耗的转变。# z' N7 |! q; D% P6 q# s; I5 h! ?. ^
9 D0 r/ e4 \2 j; f6 L7 Y
光通信技术自诞生以来已经走过了漫长的道路。最初为远距离电信而开发,现在已经进入数据中心,最近更是应用到计算架构中。这种演进可以分为三个不同的时代:
  • 电信时代:特点是长距离通信,跨越数百公里,依赖低损耗光纤和分立光学组件。为了在长距离上保持信号完整性,需要大量的数字信号处理(DSP)。
  • 数据通信时代:随着光技术进入数据中心,焦点转向短距离(小于2公里)的低功耗解决方案。这个时代见证了光电子技术的集成,特别是硅基光电子,以及DSP功能的减少。
  • 人工智能时代:当前时代由机架级距离(小于100米)的高密度、低功耗解决方案需求驱动。具有更大规模的光电子集成和先进的封装技术。
    3 {& _/ s% O1 A- d[/ol]
    + {* h" B7 Z1 F. {% \1 w$ K- I光电共封装和光计算互连
    ! H- }- g4 z5 R* E

    jkvftu1opro6409029257.png

    jkvftu1opro6409029257.png

    ( a5 q9 b' v: F& `* N- D/ B' S. {图2:比较了以太网CPO和光计算互连(OCI)的使用案例,突出了不同的要求和应用。" |: T& y7 t% J% i, v
    4 {. y2 T' U- t0 O* G- `- \3 t
    随着我们朝着更集成的光学解决方案发展,两种主要方法已经出现:
  • CPO:主要用于网络应用,CPO旨在降低功耗和成本,同时保持与现有以太网标准的兼容性。
  • 光计算互连(OCI):为计算架构设计,特别是在人工智能和机器学习应用中,OCI专注于用光学解决方案替代铜互连。提供更高的带宽密度、更长的距离以支持更大的集群,以及更低的功耗。
    / K. J( s* {, i1 c[/ol]) Y/ X, T$ k  m% e$ h; ~) V$ P- }
    CPO和OCI的主要区别在于要求和使用场景。CPO需要保持与现有以太网标准的互操作性,而OCI可以针对特定的计算应用进行优化,可能提供更大的性能优势。
    ! C8 l! R. G8 z. O) Q: p
    " U1 E1 g/ E, V6 i* OOCI:应对现代计算挑战: `7 j& D3 l1 v0 C1 O& N

    yxr4dkszydd6409029357.png

    yxr4dkszydd6409029357.png
    $ P- V! P4 K7 o" R2 M4 b
    图3:概述了OCI的关键性能指标(KPI)和扩展方向,包括功耗、带宽密度和延迟目标。
    6 v% P9 I$ a0 u. u& }! c! d9 h2 f+ j: H
    OCI旨在解决现代计算环境中的几个关键挑战:
  • 功率效率:目标是实现小于3.5 pJ/bit,比当前解决方案降低80%。
  • 延迟:OCI的目标是实现小于10ns的延迟,加上传输时间。
  • 带宽密度:目标是超过1.5 Tbps/mm的封装边缘。
  • 总带宽:OCI的目标是每根光纤2 Tbps。
    6 a# \! }: r! Y0 x[/ol]: K% [" y0 a7 a1 z
    为了实现这些雄心勃勃的目标,OCI利用了几项关键技术和设计原则:
  • 集成光电子技术:更多的光电子功能集成到光电子集成芯片中,主要使用硅基光电子技术。
  • 异构集成:使用先进的封装技术将光电子集成芯片与最优秀的集成线路(IC)结合,创建光学引擎。
  • 紧密集成:光学引擎与主机(XPU或交换机)紧密集成,以实现新的系统和应用。
    % d- x$ O" z! `' |1 E[/ol]
      }( ]' e0 c5 K8 ^3 ^  K' J' g

    9 J+ @4 X' V7 z英特尔的4 Tbps OCI解决方案
    $ h5 }, y  }( d: K2 q" c. ?' }

    yqm1k3srt2y6409029457.png

    yqm1k3srt2y6409029457.png
    ( D* }: W* t% J" c6 q3 ]! z% g
    图4:概述了英特尔的4 Tbps OCI解决方案,展示了光电子集成芯片(PIC)和电子集成线路(EIC)与主机XPU的集成。- H# g6 e% X3 d+ g

    5 a$ B: j0 s+ c0 o  w7 n英特尔开发了4 Tbps OCI解决方案,展示了这项技术的潜力。该解决方案的主要特点包括:
  • 带宽:每个方向2 Tbps(8根光纤 x 8个波长 x 32 Gb/s)
  • 兼容性:设计为与现有计算生态系统兼容,可连接到计算平台上的标准I/O端口
  • 直接驱动:利用来自主机PCIe5(和UPI)SERDES的未重定时直接驱动
  • 面向未来:支持下一代未重定时PCIe6(64 Gb/s PAM4)连接和未来的协同优化并行接口设计$ Y" E+ G7 D' `( [( y! \
    [/ol]7 M& k3 \. s4 ^4 _
    英特尔OCI解决方案的核心是其硅基光电子集成芯片(PIC):
    % @3 Z& v6 f# ?! U% B  x) X

    n1tn5mtdxqv6409029558.png

    n1tn5mtdxqv6409029558.png
    * [% n2 {& o: T( q. k) h8 y' f1 U0 |  G
    图5:显示了英特尔4 Tb/s硅基光电子集成芯片的布局和关键组件,包括激光器、调制器和光电探测器。9 f& z2 [2 _8 @% P8 ]* v) ~

    , o9 ?7 l2 K: |2 ~9 b' }# b/ m这个PIC集成了几项先进特性:
  • 支持并行和串行主机接口
  • 针对功率效率和紧凑尺寸进行优化
  • 高产量硅基光电子平台
  • 8根光纤 x 8个波长 x 64 Gbaud(面向未来的设计)
  • 共享激光器和半导体光放大器(SOA)
  • 高速环形调制器和锗光电探测器(PD)
  • 用于解复用的微环滤波器
  • 偏振分集接收器
  • V形槽无源光纤耦合或可拆卸光纤连接器
    " [# U' B6 P) C6 ^- M[/ol]! L, L$ T; g) i; p$ e% z' I5 M$ p
    英特尔OCI解决方案的一个关键创新是将III-V材料(如InP)与硅基光电子集成:
    % h( q, z  i* x5 c! y9 p

    dw51ibgw1eu6409029658.png

    dw51ibgw1eu6409029658.png

    6 c. F- Q1 f9 i* l/ @" E6 h图6:说明了将III-V材料与硅基光电子集成的价值,展示了混合激光器结构,并强调了在可靠性、性能和成本方面的优势。' U# J8 Y& Y- B" }1 a* \* _1 q

    6 }' i9 c$ b/ c( u, U这种集成提供了几个优势:
  • 提高可靠性:根据现场数据,实现0.1 FIT(单位时间内的故障率)
  • 增强性能:在1400个8波长阵列中,WDM网格的变化小于±15 GHz
  • 成本效益高的生产:实现晶圆级制造,超过1100万个激光器在晶圆上内置和测试% c% O+ U2 D- v, z: J' s! G
    [/ol]0 ^8 D) v$ C, K  R+ K- k
    4 s/ A; a, x& j$ L) Z- q3 O6 z0 ^0 T
    演示和性能
    * t9 J8 O6 q- w/ \) ~1 r英特尔成功使用OCI解决方案实现了CPU到CPU的通信:
    , r2 N+ @7 e2 Z, N: e# t' ]

    v3pj2y2by1h6409029758.png

    v3pj2y2by1h6409029758.png
    7 a) ^0 q0 s& M4 [
    图7:展示了平台间BER(误码率)测试的设置,包括眼图余量测量和传输信号的频谱分析。
    % U- Z" U) s. x% S8 P8 G6 p0 [1 X& S- ?3 x* p
    演示取得了以下结果:
  • 成功实现两个CPU之间32 Gb/s/通道的PRBS31数据传输
  • 均匀的激光器波长间隔和清晰的眼图,表明OCI发射器性能良好
  • 正的眼图余量和约1e-13的BER,证明OCI接收器和整体链路性能良好9 i4 r# r7 t7 a% s2 x
    [/ol]: f+ f) ]3 p3 C. o
    0 p  L0 Q+ V7 t8 O8 {% a, |) p9 }
    未来扩展和发展9 M% Q6 Q6 F; i

    41foo3hky1y6409029858.png

    41foo3hky1y6409029858.png

    ( o0 {. Z  q6 s! d1 J7 w3 V, J图8:展示了OCI和CPO未来带宽扩展的选项,包括增加波长、提高调制率和增加光纤数量。  m  ]& R. ~! \, i, Q, I1 z, q

    " c) o( e5 p4 a$ d: H随着OCI技术的不断发展,正在探索几种未来扩展的途径:
  • 增加波长数量:16波长系统的开发正在进行中
  • 更高的调制率:在计算应用中,从32G转向64G,最终达到128G
  • 增加光纤数量:通过紧凑型连接器设计实现,允许更高的带宽和更高的基数
  • 支持高速以太网CPO:具备224G/通道以太网的高速线性接口能力
    ! \0 |0 W7 h( ?, f[/ol]. z) D  S! U1 A
    结论
    ( F4 R. d5 m+ c' K7 h1 Y/ V光计算互连代表了现代计算环境中高速数据通信的重大进步。通过利用先进的硅基光电子技术和创新的封装技术,OCI在带宽密度、功率效率和延迟方面提供了显著的改进。+ |! ]; d8 _) q  h& p$ N5 f0 e1 N
    0 }' k& e9 p0 X) ~1 y( ]
    英特尔展示的两个CPU之间完全功能的4 Tbps OCI链路,展示了这项技术在革新数据中心和高性能计算架构方面的潜力。随着OCI继续发展和扩展,将在实现下一代人工智能、机器学习和数据密集型应用中发挥关键作用。/ m+ h0 ~+ c* v% v! W( |+ c6 R
    ( y2 M+ T2 J3 y
    参考文献
    ; {1 a$ n+ A; P2 V4 C) s7 l# d3 X[1] S. Fathololoumi, "4 Tb/s Optical Compute Interconnect Chiplet for XPU-to-XPU Connectivity," in 2024 Hot Chips Symposium, Aug. 2024., N& q. w/ [6 d( N& i

    " l: r5 D/ M4 r  F( C7 V( X# z- END -" m% O4 Q3 U/ J* w9 Z* S

    9 S& g: b4 \( [+ _9 ^* Q. R* A软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。! n" m  K  @- P2 I3 Y5 c
    点击左下角"阅读原文"马上申请# U/ W; h1 z6 K2 C/ I/ F

    8 \, S; A% U( t2 Q; V8 P5 T/ }! y( |欢迎转载/ V( }. D5 ~: f/ j

    # e2 ]1 }' c1 x% `- `4 G, U" @转载请注明出处,请勿修改内容和删除作者信息!# j$ d. [2 ~, s/ o1 |- E/ Q1 _
    2 o. s+ D# f9 D5 e! m! m

    1 y& V. z/ g0 h

    + n5 {  K. Y0 X( |

    hqawi4qjos46409029958.gif

    hqawi4qjos46409029958.gif

    ; `9 s) }8 x. C" X
    9 ~1 \' P+ r, F; w+ u, D4 d. E关注我们9 l$ ]$ n( N( i9 D0 F( W" p0 A& k

    - W; P( `. m7 X/ |* u8 P4 ~

    6 e0 x3 k: j" ?: _$ ?! {* s; h1 f

    sn4gyzqrl4h6409030058.png

    sn4gyzqrl4h6409030058.png

    ! s0 E  E5 D) J0 l5 l
    6 `  n, l  \  u( v7 K

    nzqj1tdxbud6409030159.png

    nzqj1tdxbud6409030159.png

    1 b2 i+ g8 ]( M' o; L- F. W% ?

    7 n+ e& L: s; @) ]

    yaqmjpachq26409030259.png

    yaqmjpachq26409030259.png
    9 v  O/ n8 U3 D& q: M' z1 U( [
                         
    . I* J, z6 ^+ r: @1 C4 J, l3 g: d& o: \
    & _( W6 j7 e. E' f
    0 v7 x4 x5 y+ S$ C/ |* h  z: I

    5 M5 B2 u, b9 F' g) k, [2 D9 c) ]  d% N# c; p/ u3 k( D

    1 s; g2 g6 `5 G$ V' y1 B关于我们:
    5 i9 {0 @3 x) Z+ F' J9 J深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    % N3 b6 F3 Q" C! p# u5 D3 k% \7 R/ t8 s8 y
    http://www.latitudeda.com/
    / ~0 x' E4 _; |8 r, o% i(点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表