|
引言% z$ v. s1 e. {7 I) x
随着人工智能和机器学习应用的快速发展,对计算能力的需求不断增加。传统的2D芯片设计方法在满足这些性能需求方面已达到极限。使用2.5D硅中介层和3D封装技术实现较小Chiplet的异构集成,已成为解决这一挑战的有效方法。
; f6 y. |) F2 Q6 [' K
2 t. w" u3 p6 Q2.5D和3D集成在降低成本和提高制造良率方面具有显著优势,但由于紧凑的排列和高计算密度,也加剧了热管理的挑战。随着系统规模的增长和不同设计阶段对精度和速度的要求各不相同,解决这些热建模挑战变得非常重要。
( ~% Y' L( i: S* ^
9 o: _5 G: m( {" o# a$ p! b0 n% Y本文介绍MFIT(多保真度热建模)框架,该框架提供了一系列热模型,可以在整个芯片设计周期中有效平衡精度和速度。我们将探讨MFIT的关键组成部分,以及如何为2.5D和3D基于Chiplet的系统实现高效的设计空间探索和运行时热管理[1]。7 a1 p$ X) r3 o/ U
bhk2s0kkhpq64081031322.png
# a. Z, d. N# J/ M
4 C: {( o" Y {+ b. DMFIT概述
( E' Y6 ?0 y' \3 UMFIT提供了一组多保真度热模型,涵盖了广泛的精度和执行时间权衡:
8 R; \- {+ p: s H' @' p6 k精细FEM(有限元方法)模型抽象FEM模型热RC(电阻-电容)线路模型离散状态空间(DSS)模型
. T2 I$ V0 ^0 R- m4 t( l9 }6 ^; j% _
' z' o3 x6 g8 d8 S! j
qpevg5vst2e64081031422.png
+ B8 C; K0 X4 U2 }0 \ m图1: MFIT中多保真度热模型的概述。该图展示了从精细FEM模型到DSS模型的演进,突出了精度和执行时间之间的权衡。
7 F5 T; R, y! |9 W4 Q" y
4 ]% g3 H ^2 v4 k7 D. D这组模型中的每个模型在设计周期中都有特定的用途:精细FEM模型提供最准确的参考,但过于复杂,无法模拟整个基于Chiplet的系统。捕捉精确的几何形状,作为黄金参考。抽象FEM模型源自精细模型,能够模拟大规模系统,对精度的影响可以忽略不计。用等效材料块替代微观结构。热RC模型将系统进一步抽象为线路表示,允许更快的模拟,适用于设计空间探索。独立于特定几何形状,在连续时间中运行。DSS模型提供最快的执行速度,可实现运行时热管理。针对特定架构进行调整,在离散时间中运行。
: _+ I) G) p+ {! ^[/ol]% u3 u/ U( ~; }# Y( w0 e6 v
以下让我们深入了解每种模型类型。8 X" s9 s8 M: r8 \
. E2 Y" s M/ ^# }, Y0 _精细到抽象FEM建模4 z4 ?* I, x1 P8 u/ o2 H
该过程首先创建封装内特定组件的详细FEM模型,例如中介层内的单个链接和连接Chiplet到中介层的μ-bumps。然而,这种细节水平由于计算复杂性限制了模拟范围。7 y$ \4 S' w! c5 W2 s6 h- ?- K
# |$ M+ p0 M; u
为了实现系统级模拟,MFIT系统地设计抽象模型,用均质块替换详细结构。这些块的材料参数经过精心调整,以匹配原始结构的热行为。6 T; _& U B( z* X7 K" }
! F. H! P4 k5 T: p
mqbl1fsl0wh64081031522.png
* L0 I% W' q. q& T$ e% e
图2: μ-bump层子部分的温度轮廓,比较详细和抽象模型。该图展示了抽象建模如何紧密匹配详细结构的热行为。# A5 \6 n+ S* ^9 d. C
+ Q$ b' c- f6 Z6 e0 a( UMFIT中的关键抽象包括:
0 u* ^ K, N' s% f6 K9 Bμ-bump抽象模型: μ-bumps对热行为至关重要,因为是从Chiplet散热的两条路径之一。MFIT用均质块替换详细的μ-bump和填充材料,经过仔细调整以匹配热特性。链接抽象模型: Chiplet之间的互连链接根据其热影响被建模为抽象块或完全省略。散热器抽象模型: MFIT不模拟复杂的流体动力学,而是使用应用于盖顶的热传递系数(HTC)来表示散热器。
4 h6 \, u( g9 K- P' P( T! B/ N* E# K- B
这些抽象使得FEM模拟能够处理更多Chiplet数量,精度损失可以忽略不计,同时显著减少执行时间。
; C% `3 U% z% c( n! J) D( Y2 R
) p2 {0 z' L. _4 t$ c) C% }$ w4 _热RC模型4 D- m7 n$ b8 H* |, S( {
为了实现快速设计空间探索,MFIT采用了经过FEM参考模型验证的热RC线路模型。构建热RC模型的过程包括:将封装分为水平层创建热节点的3D网络计算每个节点的热传导和热容在封装边界处加入对流热传递5 o& E1 W6 }! i0 p# g9 v
[/ol]
' S, Z+ N' J0 @! O# w% x2 Y由此产生的常微分方程(ODE)系统可以用矩阵形式表示: D, F/ p# C) l* \
, D; z5 M3 O* A5 O6 b# M2 f, L
C × dT/dt = G × T + q
- a4 w, R) U2 j9 n3 G
. c& t2 B- ^2 G; X其中T是温度向量,C是电容矩阵,G是传导矩阵,q是热生成向量。
3 @: b7 x& k8 B3 W1 U- k% Q% ~- x- X! P' J$ B! ]! ?
MFIT采用自适应求解器LSODA来高效求解这个ODE系统,利用矩阵的稀疏性来加速执行时间。
+ @8 }8 \; _: \( _- u( @' c' z! `5 v" m! A
离散状态空间模型+ z" l) ^4 P4 e7 \
为了实现运行时热管理,MFIT通过给定采样周期将热RC模型离散化,得到离散状态空间(DSS)模型。结果模型形式为:! [, e% p* B; }6 u, Y. ?
& U; |8 K3 _, k( jT[k+1] = A × T[k] + B × q[k]
) U! q5 ?* J) Y; M+ g2 O
Y; P h& Q4 Z& c7 X3 q其中A和B分别是状态矩阵和输入矩阵。这种离散时间表示允许极快的执行,适用于实时温度预测和动态热功率管理。
* m; @5 V5 b5 l# }; u) q }! a' i5 ?+ H! u+ [, F
实验结果
2 s; ^+ Q6 l8 E; M# m2 CMFIT在三个2.5D系统(16、36和64个Chiplet)和一个3D系统(16x3个Chiplet)上进行了评估,使用了合成和真实AI/ML应用工作负载。* d2 q5 X( N) k" {* L/ Z
O! z) J8 `: h" U. N+ Z4 G A: I
kob4n0ier2564081031622.png
4 T$ L3 a f$ k% v! g. }) d8 t图3: 提出的热模型和HotSpot对各种Chiplet系统的执行时间。该图展示了MFIT模型相比传统方法实现的显著速度提升。+ O2 Z* R) W$ }- e
* S" B* t2 m6 `( f# W主要发现包括:0 Y4 |7 A( a& x8 c# s
精度: 与FEM模拟相比,热RC和DSS模型的最坏情况平均绝对误差仅为2.5D系统的1.63°C和3D系统的1.30°C。速度: 热RC模型的执行时间从1.8秒到53秒不等,而DSS模型进一步将其减少到39-944毫秒。与需要数小时到数天的FEM模拟相比,这代表了显著的加速。温度违规预测: MFIT模型在预测Chiplet温度超过给定阈值时实现了高精度,大多数工作负载显示超过90%的准确率。
* U: ~7 N T4 u) Z9 ]$ ?* P/ |! ?
8 y# N! Q; h) y2 g, E9 }8 s) o
pglpx02v2aw64081031723.png
' X' Z4 e2 f% j* @图4: 2.5D和3D系统中代表性Chiplet的温度-时间图。这些图表展示了FEM、热RC和DSS模型结果在不同系统配置下的密切一致性。
1 f: a, F9 e U0 O5 M, X. l+ e9 F& |7 t
结论& y1 M( B8 X5 z
MFIT提供了全面的热模型,涵盖了广泛的精度和执行时间权衡,适用于2.5D和3D基于Chiplet系统设计周期的不同阶段。通过提供从系统规范到运行时管理的一致模型,MFIT能够为下一代计算系统实现更高效和热感知的设计。
- d j# V) R2 P! r1 ~$ M
! S8 \9 ]: b" W+ E8 V1 S8 TMFIT的热RC和DSS模型的开源性质鼓励了在这一关键异构集成领域的进一步研究和开发。随着基于Chiplet的系统不断发展,像MFIT这样的框架将在解决性能和集成密度增加带来的热挑战方面发挥关键作用。7 N3 M' e/ t! y3 _5 d
+ U- d" B* ~3 Q2 o
参考文献+ }! d5 X6 A- h, v& m: O" j
[1] L. Pfromm et al., "MFIT : Multi-FIdelity Thermal Modeling for 2.5D and 3D Multi-Chiplet Architectures," arXiv:2410.09188v1 [cs.AR], Oct. 2024.
" s6 Q$ C$ \, z9 w9 d0 REND
0 J5 |% r1 @7 T3 d2 o( J& b3 Y# L% u. ~5 H! n2 M
3 q' x3 w' g, B8 p" x2 T2 C( j软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。& l# k6 J2 w) M( B! v9 ^* x/ P
点击左下角"阅读原文"马上申请& E& T% `$ X3 \3 \6 a5 L* x
/ b) q8 p4 b/ W0 v+ w' {
欢迎转载! r5 M) ?. N) R2 k7 P! M. |, z* k
( h3 n7 I" E- z: m' r9 f9 B转载请注明出处,请勿修改内容和删除作者信息!2 V+ o9 e1 l5 u- v
+ H+ a5 o; y# P, v
8 |1 o. p5 `; z1 j* W/ A: r& {& E& ~4 j( R+ s# y
ohwnfks4kqs64081031823.gif
% _4 y4 ?. p2 Z
) ~" f) p/ X% H; ]* R' Y关注我们
* A1 ?/ }9 M3 U4 f1 x8 A8 C" m5 j1 N( {& }' d3 n% `
+ z1 x. d7 L; O
1inxy2bcemp64081031923.png
- C$ f* R! g/ s* E3 N5 o
| ; J: W( E% g, |! j+ k
rzvg2y30u0064081032023.png
. \5 r( i1 G, A, v5 q
|
" O3 J6 y, Z3 f% s
l3dozhwi3w264081032123.png
( O' I. Q( K, y Y |
( I7 m9 g5 r& l9 f0 l- T4 l3 c4 E. B/ L. D* c# I( [
/ H/ I) e G2 G6 m! K+ P
. @% _5 ~" W- C8 A# f( x关于我们:
9 U5 ?# l( ~1 P9 H& m深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。. h: R$ ^+ V5 m. d+ Z! F
! R( d; V4 E* E. M, Ohttp://www.latitudeda.com/4 j- s1 b* w2 A" d A) W' B
(点击上方名片关注我们,发现更多精彩内容) |
|