电子产业一站式赋能平台

PCB联盟网

搜索
查看: 195|回复: 0
收起左侧

高效多Chiplets系统互连网络设计

[复制链接]

1069

主题

1069

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11284
发表于 2024-12-30 08:01:00 | 显示全部楼层 |阅读模式
引言
, H7 W/ s! B6 }( k4 C  k随着现代计算系统日益复杂,多chiplet架构已成为构建大规模系统的重要解决方案。通过连接多个较小的chiplet来替代制造单个大型芯片。然而,设计chiplet之间的高效互连网络仍面临挑战,特别是在维持高性能和无死锁路由方面[1]。& E! _, D/ }7 A! H5 {0 }

jrq1kwg1bil64033155429.png

jrq1kwg1bil64033155429.png
2 k; l# a" m* Y2 u) p- X; k2 \. I

8 H4 ^- U( W- S3 u0 ]网络架构与接口设计
. B1 o+ w" K' @( D9 e  q# ^+ L% O在基于chiplet的系统中,基本构建模块通常是每个chiplet内部的二维网格片上网络(NoC)。此架构将节点分为两类:用于外部连接的边缘节点(接口节点)和用于功能模块的内部节点(核心节点),如CPU或AI核心。
1 L: P/ Q- |! P! B/ Q

sstjoepct5m64033155529.png

sstjoepct5m64033155529.png

6 T( X- L3 B5 J! B, N3 k( T1 t图1:chiplet上的网络架构示意图,展示了(a) 6x6二维网格中的36个NoC节点,(b)节点标记方案,以及(c)具有radix-4和radix-10配置的接口分组方法。
( G9 `0 N5 M3 o8 r8 h, h/ s
9 O+ J" o3 M6 M为有效利用chiplet接口,采用接口分组方法,将相邻的边缘节点聚集成抽象接口。这种方法使chiplet的连接基数和带宽分配更加灵活。' W' K1 V: U% ~3 q/ k) T9 b
; d3 o4 `" t$ g: `
高基数互连拓扑7 @+ f4 k+ {2 I2 b
多个chiplet可以通过不同拓扑结构互连形成更大的系统。常见配置包括:
' \/ z6 g8 Y2 M% w

shw1nuhjjfb64033155630.png

shw1nuhjjfb64033155630.png
* s. X! x% v  e
图2:互连拓扑示例,展示了基于相同chiplet基础构建的(a)超立方体和(b)蜻蜓网络配置。
6 S9 \! L) x% c
; \4 E! Y3 I% C$ ^" T超立方体配置:
( c% `% Z+ r  t: P% O1 |8 Q) `每个chiplet沿不同维度与其他chiplet连接
# I2 T4 y4 X% \' e* g* F4 q) {* p, {提供平衡的连通性,直径随节点数呈对数增长
4 h# S6 _' T" X3 W* w" T- r  B4 R支持高效的路由算法) m  L7 b. d8 ]
& E  L& {+ {  C3 U( j- Q0 }

1kr5ojvzsn264033155730.png

1kr5ojvzsn264033155730.png

: f) X( K) ~# R/ m) d7 o% N图3:chiplet互连细节,展示了(a)5D网格的连接和标签排列,以及(b)4D网格中d0-d1平面的连接概览。5 q: \5 w$ D) E( E4 @; ?3 n

) _/ C! @, k- W+ _& A路由方法' p+ d5 c% N; b+ n
路由设计采用负优先路由(MFR)算法确保无死锁运行。这种方法要求数据包在通过正向通道之前必须先通过负向通道,防止循环依赖。' z  u6 \* Z5 R  U: |

hmjbj3scp4564033155830.png

hmjbj3scp4564033155830.png
& l4 K! v( I; D7 j. u; |5 @
图4:路由系统中通道类型(正向、负向和相等)概览,展示了不同路由路径之间的关系。
. |9 k( }% `' \% Z. J+ ~& ^+ s6 X1 f+ O( q: T( U; e9 i
网络交错
& B! ]4 V, `0 \" f为最大化带宽利用率,网络交错技术在抽象接口组内的多个物理接口间分配流量。实现了两种主要方法:
5 b' m# r, v+ @3 `- y0 M

k0rhbll2qfq64033155930.png

k0rhbll2qfq64033155930.png

8 Y' S" g! o0 z( V4 ]. B1 k图5:细粒度和粗粒度交错方法的比较,展示了不同的数据包分配策略。
( G4 r9 N/ O# n$ P* o' q4 |& z+ m0 h9 s* G
1. 性能分析& n' g+ m6 r2 I" a
系统性能在各种流量模式和配置下进行了评估:
8 R! @1 x! ~; K

fce3x2jdcs564033156030.png

fce3x2jdcs564033156030.png

& Z! o2 T  h( C' Y, V图6:不同流量模式下的性能评估结果,展示了延迟与注入率的关系:(a)均匀分布,(b)均匀热点,(c)位互补,(d)位反转,(e)位重排,(f)位转置。' t: U9 r: q7 E+ _6 c, [

1 J# H; w5 T$ S, l

52414c3hmkl64033156130.png

52414c3hmkl64033156130.png
- M$ \5 Y& S9 w/ x
图7:不同系统规模在均匀流量下的平均延迟评估结果,展示了架构的可扩展性。
' ]* |3 R/ U. W7 ^" \+ O; N. {9 w1 P; ~+ W+ A
与传统二维网格系统相比,结果显示显著改进:& y& }* |7 C$ ^
最大注入率提升达2倍; d" [; p6 l& a; V5 L
平均延迟减少高达45%9 e% b; A# G2 f0 l+ G
随着chiplet数量增加,扩展性更好
! `" [% f0 y0 z0 q
# j% U& u! f/ u. ?, C* q
2. 能效分析
) p/ _3 y. p" N1 b% ]6 q% ^

odoitwxxekp64033156230.png

odoitwxxekp64033156230.png
/ M3 ]8 h- L4 B7 K2 e- H4 W
图8:二维网格和超立方体配置在不同规模和NoC大小下的能耗比较。
, Q5 a2 M  n/ X$ @7 {; y) M2 [7 t7 Z+ Y) |4 J
建议的架构显示出显著的节能效果,特别是在大型系统中。对于256-chiplet配置,与传统二维网格设计相比,功耗降低约60%。
6 P: Z3 k9 S6 S" O9 W
" m4 ^7 D1 ^* q* j: S结论
2 `- q" C& c) u' O, m. `所述方法为设计高效chiplet互连网络提供了完整解决方案。通过结合接口分组、自适应路由和网络交错,系统实现了优于传统方法的性能和可扩展性。该架构的灵活性使其能够适应各种系统规模,同时保持高效率和无死锁运行。- N6 B. }  H, `. A, z

" P) e# Z8 ~& n; K: K6 H! K结果表明,这种方法在大规模系统中特别有效,网络直径减小和带宽利用率提高的优势更加明显。该方法为构建具有最佳通信能力的新一代多chiplet系统提供了实用框架。, y: ^' D& b' b3 W

+ h  {' p/ O, E, \$ I参考文献9 v9 ?* q, T8 t  X( L: ?2 p* ~3 a
[1] Y. Feng, D. Xiang, and K. Ma, "A Scalable Methodology for Designing Efficient Interconnection Network of Chiplets," in 2023 IEEE International Symposium on High-Performance Computer Architecture (HPCA), Seoul, Korea, Republic of, 2023, pp. 1059-1071, doi: 10.1109/HPCA56546.2023.10070981.
" h& \3 [: J4 z: ~
& V5 g+ e- n0 w/ i9 D* ?7 \END
8 a8 a, ?4 f1 V; N

$ H1 @2 T+ s9 o, @6 _( v7 f* G+ d; y; t. z8 i
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。$ K8 \3 B- k8 k+ f
点击左下角"阅读原文"马上申请
# b& R1 u# p. }) \+ ^$ L* i0 W% V" q4 e# s
欢迎转载
2 ]5 y, \/ Y+ ~- W: ]* S( ~+ C  O0 t
转载请注明出处,请勿修改内容和删除作者信息!# a& r: v9 J# X  Q

4 C: w" ^) C+ T1 a$ i1 [- x: V, ]" @# A" u
( i2 B, j6 ]  |  V  W

opwvqkiczxu64033156330.gif

opwvqkiczxu64033156330.gif

3 L0 r0 A' n  Q( G
: q# D$ u. z/ M! O7 O9 G; ^关注我们& B! h0 z* j; I2 H. B
2 ^& j5 J- ~1 i) v7 S  l
& b/ i& e/ p- R# m1 ~( i

tpmbw1izfyo64033156430.png

tpmbw1izfyo64033156430.png
1 `& v* i+ m3 _! H

# u3 `1 e9 P; A1 ~- I

fhpmkwmxsih64033156530.png

fhpmkwmxsih64033156530.png
3 N& X8 P; j0 ?$ L, k
1 ?; J: R& r% O; {4 M

jdzsgtgrmgn64033156630.png

jdzsgtgrmgn64033156630.png

  S. l. k0 m' b4 }
                     
0 i; J% m- K3 A- o( ?  t! L; V5 _" h3 c, M

$ q+ D6 R7 I6 S$ J- S- U! l
. ^! Q$ s$ B7 M$ U4 |" Z2 ]关于我们:4 `0 U! h$ E2 \) r: T; ]' z' U
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
6 q; F! ?/ l7 @& I
, ?( h/ @7 t- ~8 yhttp://www.latitudeda.com/. m; K4 f! t  `2 y( o- i) o
(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表