电子产业一站式赋能平台

PCB联盟网

搜索
查看: 110|回复: 0
收起左侧

理解Compute Express Link(CXL)内存互连技术

[复制链接]

582

主题

582

帖子

4664

积分

四级会员

Rank: 4

积分
4664
发表于 2024-10-31 08:00:00 | 显示全部楼层 |阅读模式
引言/ m3 p$ m1 n# b9 q6 y
在快速发展的计算领域中,高效的内存管理和互连技术对系统性能起着关键作用。计算快速链接(Compute Express Link,CXL)已成为连接内存与各种处理元件以及在数据中心内共享内存资源的主要协议。本文探讨CXL的功能、演变及其对现代计算架构的影响[1]。5 X2 i5 c1 o) q- f
* f$ A  d, n7 _9 g- `) W
什么是CXL?! K. D; g1 T( [7 V* m0 Y7 _
计算快速链接(CXL)是建立在PCI Express(PCIe)基础上的开放行业标准互连技术。它于2019年3月首次提出,此后获得了主要芯片制造商的广泛支持。CXL的主要功能是通过串行通信连接CPU、GPU、FPGA和其他专用加速器,同时允许跨器件池化内存以提高利用率和资源效率。
7 V, ?" K7 X& p' J
5 W' Q$ x2 s7 ~7 ^% T& qCXL由三个子协议组成:
  • CXL.io
  • CXL.cache
  • CXL.memory* f; W5 X$ F& ?9 H) M
    [/ol]8 }& m8 l$ W  I+ J( @; y" j
    其中,CXL.memory因其在数据中心内存扩展和先进AI拓扑中的潜力而引起了最多关注。
    ( L9 X/ r( \$ ?" N3 Y
    ! d, h3 y, u: [6 V' x

    w2p1sg53goz64076743312.png

    w2p1sg53goz64076743312.png
    ( O3 O- d6 Z! S6 j  e
    图1展示了CXL版本3.0和3.1的扩展功能,突出了该协议的演进和能力。
    4 \( U( ]4 ]) F' Y5 @( r/ p5 @/ [* s2 K# J! p, ]5 m0 c9 n
    CXL与其他互连技术的比较1 E7 X9 R5 Q; b  H* {
    虽然CXL经常被与NVIDIA的NVLink(用于连接GPU的高带宽技术)相比较,但它已经沿着不同的路径发展。CXL的主要焦点已从加速器到主机通信转向内存连接。# L9 m6 L' r$ w$ W+ d& u
      f% a0 H6 e. n% I+ q
    Rambus高级产品营销经理Zaman Mollah解释道:"CXL将与其他类似的互连技术共存,有自己的应用和使用场景。CXL可能无法提供GPU中心的AI应用所需的带宽,但在加速器和基于CPU的AI用例中有用处。"
    7 b, Q7 u) F! M3 |
    ! x& M$ s# K/ a6 Y: t  ~- }+ Z9 PCXL的独特优势包括:3 i; J' {$ n, Q0 {6 L5 [3 q
  • 增加容量和带宽的内存扩展
  • 内存重用
  • 智能内存分层应用
  • 可组合的数据中心架构
  • 以可接受的延迟灵活且经济地增加内存容量和带宽6 P, |% V+ \' h" ^
    ) y9 N% E- M0 t7 O! w
    CXL的演变:从1.0到3.18 Q8 R% [0 ~7 @/ q- u$ {
    自诞生以来,CXL经历了几次修订,每个版本都引入了新功能和能力:
    % B5 y! \) I2 H' L8 P
  • CXL 1.0(2019):初始发布
  • CXL 2.0(2020):增强内存池化和共享
  • CXL 3.0(2022):引入fabric能力
  • CXL 3.1(2023):改进fabric管理能力和安全功能
    4 e4 Z) H- ~0 B1 N

    , ]. V% C( S8 X  g6 b  Y6 qCXL 3.1:最新进展
    , ~5 F* o6 B. s" V; ~8 q2023年11月发布的CXL 3.1规范为该协议带来了显著改进。主要增强包括:
    5 `2 @2 f! v8 F! l# l
  • 改进了分解系统的fabric管理能力
  • 优化了资源利用
  • 扩展了内存共享和池化能力
  • 促进了加速器之间的内存共享4 D- C. |, q) S7 v, {

    - ]  [% g9 F4 Z. K! {0 [5 ^
    ; `2 m: g, S5 Q+ t# a

    t4elzqgmvlc64076743412.png

    t4elzqgmvlc64076743412.png

    ( o6 P  m8 |' S3 L+ D图2说明了CXL 3.1中可信安全协议(TSP)如何增强安全性。
    / w. |) S+ F: J. a3 }+ _) G7 i- m4 J% P9 A0 A$ r
    Rambus硅IP产品营销高级总监Lou Ternullo强调了CXL 3.1中的一些新功能:
  • CXL.IO点对点(P2P)
  • 无序I/O(UIO)
  • CXL.mem P2P
  • 可信执行环境(TEE)操作码
  • 跨PCIe传输层的完整性和数据加密(IDE)支持
    ! Y1 \6 h( `# J$ @[/ol]
    * _: u! D7 a. Z+ e: z' G5 N* Y这些功能共同作用,减少延迟,提高安全性,并增强CXL fabric中端点和主机之间的通信。# p# W* v9 D" Y, a0 q
    + r6 G6 D/ i7 S0 u7 k8 N

    ruof03je2pj64076743513.png

    ruof03je2pj64076743513.png
    - ^$ \- p# `# k# P# r5 ]. \9 E# l  U
    图3描述了CXL 3.1中引入的新全局集成内存(GIM)概念。" c1 b* o5 C7 e/ B- J5 e

    2 Z" ^6 C9 }! a6 ~2 e0 EFabric能力和扩展2 u& b/ a. f" O
    CXL 3.1中最显著的改进之一是交换Fabric能力的增强。Ternullo解释道:"现在可以处理基于端口的路由,这允许进行规模扩展部署。交换fabric不受传统树状层次结构的限制。允许主机和器件进行跨域访问,一个器件能够访问多达4,096个主机或其他器件。", ]+ I( A% M% \$ K+ T, b* ]  c9 \& I

    * g$ a: N1 ]& c& N5 V5 d( S这一进步使设计者能够实现具有任意到任意通信的大型系统或拓扑,为数据中心架构创造了新的可能性。$ J2 r  c$ U; \0 T. }9 B  A

    & H% r4 ~+ g7 }7 K! u) {安全性和元数据增强
    - A+ @4 a; t  mCXL 3.1还引入了重要的安全功能,包括:
    " a! v6 l$ k# V" Q
  • 增强保护的可信安全协议
  • 扩展的元数据能力(最多34位)
    : b( _+ o0 M  Y. }9 |+ c

    - j0 ^( f: L2 d9 Z" }: h6 {% p; B这些改进对于通过fabric连接众多虚拟机的规模扩展部署非常重要,允许更好的监控和诊断。
    + m2 f1 }& L0 d3 c, y
    3 ~. p; O2 q8 g3 Z* k* m. Z" M内存池化和扩展
    6 y6 o! q/ L% }0 ]8 k/ T7 }6 y$ I1 MCXL最令人兴奋的应用之一是其促进内存池化和扩展的能力。这一能力解决了数据密集型应用(如AI和机器学习工作负载)对更多内存的日益增长的需求。
    * S" R9 x* v$ e! V: A0 E9 P. R/ X, h* K
    - n  v; @/ Y: ?5 RCadence高级产品营销总监Arif Khan指出,尽管在成本和软件复杂性方面存在一些批评,但实施者对使用CXL构建内存扩展器和池化器件仍有很大兴趣。6 V9 U& w- l+ O7 d" U3 S" ]

    0 d7 M3 |2 y$ _+ q( `6 a

    qf22ywzfth364076743613.png

    qf22ywzfth364076743613.png
    - L6 u- Q( v1 |4 [2 w! i: _* _* U3 S
    图4概述了CXL的使用案例和验证解决方案,展示了该协议的多功能性。
    # i* x2 ^  g6 O6 Y* A( {/ ?  u# k, O0 x1 h. v# R
    内存池化的经济性特别具有吸引力,正如Rambus的Mollah解释的那样:"随着每字节成本降低,内存池化等高级应用将变得更具吸引力,并允许分解的数据中心基础设施,降低总拥有成本(TCO)。"  o2 w3 N6 x* _$ |9 `. l1 z

    ! O3 @" n& t9 X. C2 @8 LCXL在其他技术环境中的地位
    ' x0 e. z7 o+ V4 K0 x* S虽然CXL已经获得了显著的关注,但了解其在其他互连技术中的位置很重要。Synopsys高级技术产品经理Richard Solomon强调,CXL应被视为选择范围的一部分,类似于内存如何有广泛的产品来满足特定需求。7 U: x8 A( v* r# m0 ]4 V

    / J5 H4 B  M) Q9 R8 n8 J- {Siemens Digital Industries Software VIP产品线高级总监Christopher Browy提供了CXL与其他技术比较的见解:"基于PCIe SerDes的CXL具有更低的错误率、更低的延迟和相应的较低带宽。NVLink和UALink使用以太网风格的SerDes,导致高错误率、高延迟和高带宽,因此对于最高性能带宽受限的情况,如GPU到GPU,这些技术具有优势。": }/ k4 \% K3 W  x9 B( ^

    . N+ d6 _% H; S, `% S. r" b: A未来展望) i) z1 I7 B& B5 X
    CXL的未来看起来很有希望,Yole Research预测到2028年市场将达到160亿美元。随着技术的成熟,可以期待看到:
    , B. m/ h& x4 t* g* J% |+ ~6 n
  • 继续用于内存扩展
  • 进一步实现异构计算
  • 增强数据中心分解
  • 最小化服务器过度配置
  • 按需访问内存、存储和加速资源
    : I: g; m9 I; C4 f' r2 E* E
    ' O) }" g& Y1 Z. O
    CXL联盟营销工作组联合主席兼英特尔高级营销经理Anil Godbole强调,CXL正在成为主流:"随着我们推出CXL,每个CPU都将具有CXL功能,因此现在正成为主流。". K  K1 m" y) t1 A8 e$ f) H2 P! N+ C; O

    / p! @' N4 N0 ?0 ], q结论* A5 W, u, `" z1 z* X" K% ]
    CXL迅速发展成为现代计算架构中的重要技术。其高效连接和池化内存资源的能力,加上fabric能力和安全功能的持续改进,使CXL成为未来数据中心和高性能计算设计中的关键参与者。随着技术继续成熟并获得广泛采用,可以期待看到利用CXL独特能力的创新解决方案,以满足数据密集型应用和异构计算环境日益增长的需求。
    . z: ?$ Z& y' L  O8 I9 t$ s4 P+ q4 i
    参考文献4 L! N2 q$ M0 F0 L
    [1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online].+ Q/ V% i7 r! c; ]" R* t+ ?
    END0 N5 f0 L9 a1 P+ o  O

    & E$ ^5 P' T9 b) Y( g* l* g9 m& ^( p) ?: b1 G" H" n( Y
    软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    8 `+ Q+ ^; |5 l, M0 g& J点击左下角"阅读原文"马上申请
    , e+ m7 ^+ V9 g' U! \. C* _( ^
      t" O! h+ d$ ?' h5 [欢迎转载
    8 J" o4 C9 j* o& g9 s, R5 d, m7 O3 W( H( q* f
    转载请注明出处,请勿修改内容和删除作者信息!: V4 A' L( d! a- `+ u

    2 {- E6 Y$ W( z1 t" b* i! t
    # e9 W$ z4 u  m. p8 D$ c/ {

    8 X# q+ L, s5 V% J: r/ ~

    5n2oxhiqkds64076743713.gif

    5n2oxhiqkds64076743713.gif
    + m, R/ u- k, @* D7 z% v; b

    $ p0 z( E* Q5 C6 h6 ~% U7 Q$ H关注我们; y) M+ j6 S  j* B) B) v
    + X6 }. k. |8 @8 d  b: ~5 T- l

    1 K# k# O) s( }5 h* F

    rvd1e5k2qu464076743813.png

    rvd1e5k2qu464076743813.png
    0 U( N( R* X9 Z
    . E( I. E/ @& [2 W1 T3 @+ T" M( c8 n

    yq04wwlhj0e64076743913.png

    yq04wwlhj0e64076743913.png
    9 E5 S3 m$ r  Z# C8 G6 z
    0 }( y* a2 A1 x6 E7 d0 J, `

    svsnew3foyh64076744013.png

    svsnew3foyh64076744013.png

    3 P2 q; R, A# z# T! k
                         
    2 ?. y& y- r9 D' Y5 d" |, R, s" \9 b' k, E" ^& S
    2 @: q6 v8 L% W: [( s0 c

      E/ F. D. d; d, X关于我们:: h9 m5 K; i$ L: ^5 ^9 P1 \
    深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    " j' q8 \! n; W+ S, ]
    6 G. w) L  t- ?2 P+ V! Whttp://www.latitudeda.com/, m( f! c0 h- k* T- o, M
    (点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表