电子产业一站式赋能平台

PCB联盟网

搜索
查看: 94|回复: 0
收起左侧

使用CNSim评估Chiplet网络

[复制链接]

978

主题

978

帖子

9715

积分

高级会员

Rank: 5Rank: 5

积分
9715
发表于 2025-1-10 08:02:00 | 显示全部楼层 |阅读模式
引言
1 H: B) I6 o" n% q7 z; }( Y% y
, e% Q* u$ @3 ?1 d8 t1 qChiplet架构通过在一个封装中集成多个硅芯片,显著提升了计算密度和效率,改变了现代计算系统的设计方式。由于Chiplet网络的异构特性以及片上和片外网络的紧密耦合,评估这类网络存在独特的挑战。本文介绍CNSim(Chiplet Network Simulator),专门设计用于评估大规模Chiplet网络的周期精确、数据包并行仿真器[1]。5 @8 X, g" W* @! T. a0 d' T, {

dsvumwxcgh264052581101.png

dsvumwxcgh264052581101.png

! s( f$ B( Q5 Q' e. n+ z7 F) UCNSim主要特性
9 [# x1 R. q4 {6 ^$ g7 `  _1 ^; F; w" ]5 Q/ C
CNSim具有三个核心功能:* `# V3 p/ z! \4 C
数据包中心架构:与传统的基于周期或离散事件的仿真器不同,CNSim采用新型的数据包中心架构,根据注入时间维护数据包队列。这种方法在保持周期精确性的同时实现了高效仿真。
3 G( z. t! [! ?4 i8 I& {

dq4gcfkpbha64052581201.png

dq4gcfkpbha64052581201.png

5 G+ D5 g  [9 d& ^图1:数据包中心的CNSim架构概览,展示了关键状态值如何存储在数据包而不是网络中。/ g3 R" k$ J2 g; {

+ y3 J3 [5 Z) H5 L7 \$ B8 n并行仿真支持:CNSim实现了基于原子操作的超线程机制,支持高效的数据包并行仿真,保持最小的不一致性。仿真器可以通过工作线程同时处理多个数据包。
5 t' J: Q8 V( _% O. o

wmh51tvtnsv64052581301.png

wmh51tvtnsv64052581301.png

: i0 {$ A3 j. a' Q图2:数据包并行方案,展示了每个工作线程如何从队列中获取数据包进行顺序处理。* S, R3 u" x0 x% a  f3 F

- Z+ z) l4 T( |0 D/ |5 ?, w% F异构路由器和链路建模:CNSim通过可配置的多宽度FIFO和虚拟流水线级,提供了统一的异构路由器和链路建模。3 ?, u( [, z& O# ?" e7 w8 B

t2gff3umcsd64052581401.png

t2gff3umcsd64052581401.png

8 i( f' m5 g5 O( [6 B1 l# w图3:异构路由器和链路的统一建模方法,展示了多宽度FIFO和虚拟流水线级的实现。
/ n1 k, v/ r+ S- N+ b1 ?4 U使用CNSim进行网络评估
6 Q  d6 q6 c0 y" }* [* N" }" u$ J5 n+ ]8 k3 [$ q8 ~
CNSim支持多种网络拓扑,包括2D网格/环形网络、蜻蜓网络和分层拓扑。
; P- s' A7 W5 f2 ~& P

4yf2rnqijqa64052581501.png

4yf2rnqijqa64052581501.png
8 H$ G( P# g* C/ C. W+ S
图4:不同的异构链路Chiplet架构,展示了传统2D网格、基于Chiplet的2D网格拓扑和基于异构链路的2D环形拓扑。
$ Z- G2 W/ Z( N6 U) e2 n; U
+ D* r& l) ]; `1 p
6 G, v2 o1 \; ~# Z; n3 S在流量模式分析方面,CNSim可评估合成流量(均匀随机、位反转、位重排、位转置)、实际工作负载(PARSEC基准测试)以及集体通信(AllReduce模式)。
8 b* q: d, ^5 Y1 m+ A6 ~2 T0 A1 R9 ?7 T0 M& O! ?! u
性能指标包含平均数据包延迟、网络吞吐量、资源利用率和拥塞统计数据。
- i9 I! x+ a/ n! q$ e4 x# P$ [3 C

nlhmulbube064052581601.png

nlhmulbube064052581601.png
/ `' Z( J4 P/ k, Y+ \' H
图5:在均匀流量模式下,不同网络配置的平均延迟与注入率关系的评估结果。8 q+ ^8 O9 a$ h. k4 q/ H
应用实例
; [( J( e  v9 a, y' |7 v) k1 J6 ~" p2 g3 g- O6 ^6 o6 `
案例研究1:异构链路网络
+ e3 y$ v5 T6 b, j" UCNSim支持评估具有不同带宽和延迟的异构链路网络,包括片上链路(1 flit/周期带宽,1周期延迟)、低延迟并行链路(1 flit/周期带宽,2周期延迟)和高带宽串行链路(2 flits/周期带宽,4周期延迟)。3 R; u) Z; N- U# Y$ l

naarxignfxn64052581702.png

naarxignfxn64052581702.png

7 E' a6 H9 R$ _2 c( A9 n& p图6:不同Chiplet网络配置在各种PARSEC工作负载下的性能比较。
' H  F6 K, @9 g( v/ e3 l- N2 X; v$ w! |8 I# H( q4 v4 H
案例研究2:大规模蜻蜓网络- }6 N2 J9 c$ K* @/ O
CNSim可高效仿真从小规模(41组,1,312节点)到大规模(145组,18,560节点)的网络。7 I; a3 h4 J) [9 _) ^

bfx2mic4q3f64052581802.png

bfx2mic4q3f64052581802.png
8 f- s  z. f+ S2 E0 Y0 W$ ~
图7:不同网络规模的全局性能比较,展示了平均延迟与注入率的关系。- Z, q: N) [! u6 d
CNSim使用最佳实践
; A. I3 ?$ \1 {: h
5 v7 N/ C8 `3 P9 m5 d* @配置设置需要定义网络拓扑和规模、配置路由器和链路参数,以及设置流量模式和仿真时长。性能优化方面,应根据网络规模使用适当数量的并行线程,配置数据包发布宽度以平衡速度和精确度,并启用重复路由计算的缓存。结果分析包括收集延迟和吞吐量指标,分析资源利用情况,比较不同配置。0 V6 B% [3 `* K8 [) v
总结
3 {/ j& ?, H* d, ]7 S, V* e$ n# y: ^0 o. ]: ~. O- N
CNSim为评估Chiplet网络提供了周期精确仿真、高效并行执行、异构组件支持和全面的分析能力。8 ]& b& m$ \& D$ d# u. n

jemftxjk1s064052581902.png

jemftxjk1s064052581902.png
! O7 X' o6 c( K9 C, ~
图8:在不同注入率下BookSim和CNSim的内存消耗比较,展示了CNSim的效率。; [: f0 t: E9 t- b$ Q

2 J' t8 i$ O9 @: {  P通过独特的功能和能力,CNSim解决了现代Chiplet网络仿真中的关键挑战,同时保持了高性能和精确性。仿真器的开源特性使研究社区能够在此基础上进行扩展,推动网络创新。4 Q' `& n! c/ k# G. M) ]. M3 O6 r
参考文献. X  o7 x& l; n' ]/ P3 i

, K; H( T7 U2 ~' r[1] Y. Feng, Y. Wei, D. Xiang, and K. Ma, "Evaluating Chiplet-based Large-Scale Interconnection Networks via Cycle-Accurate Packet-Parallel Simulation," in 2024 USENIX Annual Technical Conference (USENIX ATC '24), Santa Clara, CA, USA, July 10-12, 2024, pp. 731-747.1 m7 E' b" M; @; a: c
END
) V! I5 G2 \/ d9 e1 D0 `: L: r! F# v/ k3 q2 D
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
; ?# x$ v4 A& x( S1 ^1 F+ J点击左下角"阅读原文"马上申请6 d+ a! h0 R% G. h2 R0 z' G

  W! @% f6 Q# x! J欢迎转载
  k$ ?7 {: j* d; \$ G3 F! g% S% z3 {2 \
转载请注明出处,请勿修改内容和删除作者信息!
8 S7 f2 A1 x5 }( z" ~8 J' }( Y+ N$ y8 a# w0 K7 x3 Q4 t( Y
: C0 R! i( Q: a# [$ O- s

) N! y( q1 V4 I1 k

2vkk0ys20un64052582002.gif

2vkk0ys20un64052582002.gif

& N; C& Y$ R) I3 _1 `- `% s3 ?: }6 G* S& B8 `- J& |- e' W! W. }7 j
关注我们
* z+ {( ^9 t- @' B: N
; E* S/ w& J; o5 n! C9 `
: Q5 D2 ^; D* J( m" A2 G

dk4m4h1ku5z64052582102.png

dk4m4h1ku5z64052582102.png

! g. j: X) D) g1 A+ b  |0 I( |. b4 i
3 g5 B8 P; ^, k

n0ijmx2jc1r64052582202.png

n0ijmx2jc1r64052582202.png

/ M& ~5 B8 U+ Q2 x  _5 A$ U
  K  c4 f# o6 v' q

lsuipjgxnrz64052582302.png

lsuipjgxnrz64052582302.png
: K' I( l# a% o, Y- _2 |% v% w
                     
0 B6 L) l4 i1 C: H# T% n' B$ O* ]4 o! |0 Z. C7 o
3 q. J5 `; k2 b  X; ~

/ D$ v+ U1 p0 @% h关于我们:* N$ w, P  G* F& B5 ~8 w  V
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
, m# v7 H: }* \  g" G, Q
' z( z2 {' J9 t0 C. thttp://www.latitudeda.com/7 ?9 w! z3 B/ x( C5 B; i9 k9 V
(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表