|
引言6 C$ C! u& V% a* H9 ]8 v
人工智能和高性能计算的快速发展对半导体芯片间的数据传输提出了更高要求。在当今复杂的计算系统中,芯片间(Die-to-Die, D2D)接口已成为限制系统整体性能的关键瓶颈。本文探讨一种通过创新信号消除技术实现超高数据传输率的突破性芯片间通信方法[1]。
8 r# X! f' N' s+ R
boqhh401thu640164211.png
9 M' i, c, [5 x: ]
0 v3 M0 G& E/ V+ O. |& \* ?1- v; V) O5 x! p! j1 X) O! P( f
芯片间接口的技术挑战6 v4 x* T/ g8 e, ^$ Q. W' i' r
现代计算应用需要芯片间连接具有更高的边缘密度和更低的位错误率(BER)。提高边缘密度的传统方法通常遵循两条路径:增加每根线的数据传输率或减小数据通道间距。然而,这两种方法都面临着显著的技术挑战。. {0 H4 h7 Q- b1 @, |# c3 N
4 x" l5 K% i) c' w使用四电平脉冲幅度调制(PAM-4)来提高数据传输率时,信噪比(SNR)通常会下降,难以实现极低位错误率。同样,同时双向(SBD)信号传输—在同一导线上同时双向传输数据—可以使吞吐量翻倍,但会引入回波和串扰问题,降低信号质量。
( f c0 F1 R' t, C; d: b0 u$ p6 w. E0 c; t0 r
通过移除通道间的接地屏蔽来减小通道间距会带来另一组挑战,因为相邻通道间的串扰增加。虽然传统串扰消除技术可以解决远端串扰(FEXT),但对于同时还受到近端串扰(NEXT)影响的SBD应用来说,这些技术是不够的。3 N: z3 X+ C4 x' o; [% S- P
% _( n; h) _0 d& n2
, v5 `1 W% K" P$ W% k' z1 v2 L革新性信号消除方法
6 P; J, I: h- w5 p, S' c3 `本文介绍的研究提出了一种革新性的64Gb/s/线单端SBD收发器,具有全面的回波、近端串扰(NEXT)和远端串扰(FEXT)消除能力。这种设计使无屏蔽通道能够达到惊人的10.5Tb/s/mm/层的边缘密度,同时在3mm片上通道上保持低于10^-16的位错误率。
: L: d. c3 S4 ?; y" v3 |
vcsd2ynuwl5640164311.png
9 S% c0 @: j- P3 S
图1:源同步双向同时互连。双向解耦、回波和串扰消除的概念。
; o( i. y8 c4 Y/ L. g, l% M3 y
/ Z8 ?% g! w* J1 ?) }8 C5 Q+ b该系统使用源同步SBD互连,通道两侧同时传输数据,产生耦合的双向信号。针对这一挑战的巧妙解决方案是动态电压阈值(D-VTH)电路,该电路根据需要从接收信号中减去的信号来调整切片器阈值电压。
2 \3 L, L2 A/ K8 X% ~# |9 y( ~- A: O. ]& j, }# }, ^$ x
为了理解其工作原理,考虑接收信号(LIn)是右侧出站信号(ROut)、左侧出站信号(LOut)、回波(LEcho)和NEXT(LNEXT)的叠加。D-VTH电路生成阈值(LVTH)作为LOut、LEcho和LNEXT的加权和,然后在采样过程中减去这个阈值以恢复ROut。- ^; V1 I# X4 D, F! ]$ B6 q
% v8 E0 e# j2 P m* ]+ V
这种解耦和消除方法利用了切片器固有的减法特性,无需专用线性减法器。结果是更低的功耗,以及空闲模式下无静态电流—相比以往解决方案的显著改进。
. u8 O; V5 j5 [1 A9 k" o2 }3 S1 b( Q4 X% @; k! r: A
3
) [& m& ^% J3 s, x收发器架构和实现
5 c3 b- W8 o9 b
fxjutx3jr1j640164411.png
$ C: i; u3 g# w; r图2:收发器架构、5位N-over-N DAC电路细节以及展示DAC线性度和眼图性能的仿真结果。+ P2 K+ q) h1 S% G
5 Z. i: e4 F' S9 ^, f1 g; Z
收发器架构由三个主要部分组成:发射器(TX)、动态电压阈值电路(D-VTH)和接收器(RX)。D-VTH包括数字有限冲激响应(FIR)滤波器、多路复用器(MUX)和5位数模转换器(DAC)。
: ^/ C/ y f; ]4 ?$ Q1 E
# ^4 z% E. K6 l; p数字FIR滤波器在三条路径上操作:一条来自本地TX PRBS生成器用于双向解耦和回波消除,另外两条来自相邻干扰源用于NEXT消除。每条路径包含两个抽头,构建高通特性以匹配回波和NEXT特性,足以应对长达4.5mm的通道。& d0 N( s& s2 D1 ?3 X
# Z% N2 b2 k0 g( @# a
设计中的关键创新是DAC中使用的N-over-N结构,该结构以半VDD供电。这包括尺寸相同的低阈值晶体管(MU1)和标准阈值晶体管(MD1),两者都在线性区工作。阈值差异补偿了栅源电压差异,尽管输出电压变化,仍保持匹配的过驱动电压。与传统设计相比,这确保了DAC的优越线性度。( S4 U0 G$ [: N" L
: o* H( v% ^. J" X& D/ l
仿真结果表明,这种方法比增加晶体管上拉尺寸的传统设计实现了至少100%更好的积分非线性(INL)性能。改善的线性度使眼高增加11%,显著提升信号质量。
! B* M2 B8 x7 M7 v" N; x+ G, h/ i9 _6 h( Y( n1 p r/ H0 ~# _
4
4 X! e' H9 k2 p8 t" H/ B+ S' @1 A同步时钟和复位分配- m1 t4 d/ H( R b
tlffjwlt2lr640164511.png
( Z9 n0 j) s1 z1 {1 p
图3:时钟和复位分配架构,时钟幅度、偏斜以及NEXT消除性能的仿真结果
) `. _3 b$ X$ P! M, q" |8 t" x4 a4 `* k' }$ j! _
实现NEXT消除的主要挑战之一是时钟偏斜。在传统系统中,半速率时钟(CK2)和复位信号在收发器间都会出现偏斜,导致分频时钟(如CK4)也产生偏斜。这意味着D-VTH的NEXT消除输出与实际NEXT不对齐。" j! Y4 ]0 a( r
* H, [: _8 K0 r1 R& P) W! l
为解决这个问题,研究人员开发了同步时钟和复位分配系统。关键创新是用电感终止CK2传输线,电感值计算为Z?cot(2πd/λ)/(2πf),其中Z?是传输线特性阻抗,d是传输线长度,λ和f分别是CK2波长和频率。2 l. i9 ~) D* s$ ?
" T7 N$ @8 a9 N- ^- b/ d* q3 H这种电感终止在入射波和反射波之间创建了具有适当幅度和相位关系的驻波。驻波包络随距离变化,遵循2A?cos(2πx/λ),其中x是距离。在测试芯片中,d约为λ/16,最大包络变化限制在8%。
/ N/ \! K; [- s1 ]8 G3 X9 W+ V& {% Z0 x" E
为了保持分频时钟(最高1/32速率)的同步,复位链以延迟控制方式释放复位信号。延迟在每条通道增加2UI(单位间隔),并由不同级D触发器补偿。0 Y( N$ F U' V9 J/ U# z
/ N5 ]4 Z3 P. ^3 M$ S; p8 D6 C: {仿真结果表明,由于入射波和反射波的叠加,驻波分布幅度是传统行波的两倍。驻波分布CK2的眼宽减少仅为0.2ps,比传统方法至少好七倍。
9 ~( ^" K8 G, E, ?* L. F6 l) u0 n$ C* u( y) I/ x% ~* ^% p* ?
52 E. O2 S& K: }# o" x* F$ R( B
片上通道设计和性能
6 z( w y. L# C8 f1 {* A
mnqx2ycrpvk640164611.png
% N: k/ x! F: [4 @3 B" K图4:片上通道结构和模拟频率响应。FIR抽头自适应和使用适应系数的瞬态响应仿真结果。. P9 Y" C+ Q# b$ W
; l0 s; q8 X7 F6 d2 `# V' H片上通道结构由布置在M9层的无屏蔽数据通道组成,通道间距为6.1μm,总长度为3mm。电磁场分析确定了通道频率响应和等效集总模型参数。* M" e3 }9 l/ t* _) x; d8 F" H
# d0 o$ U3 K2 t- l& f
互电容与自电容比(Cm/Cs)为0.28,互感与自感比(Lm/Ls)为0.26。这些值使FEXT在奈奎斯特频率下比插入损耗小24dB。然而,NEXT和回波损耗更为显著,仅比插入损耗分别小7.3dB和8.3dB。2 }0 S" Z( @ W9 g; l
6 q L& g W* z2 y A3 D
使用最小均方(LMS)算法模拟数字FIR滤波器系数的适应过程显示,系数收敛到能有效消除回波和串扰的稳定值。所得眼图显示,尽管通道条件具挑战性,信号恢复效果良好。: O$ L1 [6 W. x) V- d& D
. X; q" ~7 q9 G" E6: W5 h5 U4 k; |. E
测量性能结果7 `5 D, h s+ q) S; c7 H
oggqvu1o3mp640164711.png
7 C" {0 V6 Z2 f
图5:在64Gb/s/线速率下测量的RX内部眼图、浴盆曲线、CIJ减少比例以及模拟功耗分布
. s" r" t" U) u6 I
( o7 i' x5 Q6 v/ s收发器采用28nm CMOS技术制造,包括用于位错误率测量的片上PRBS检查器。在VDD=0.9V(VDDL=0.45V)下64Gb/s/线的测量内部眼图和浴盆曲线证明了消除技术的有效性。* P/ |. L- k! Q/ @: `$ t
3 U; z1 P! q$ x0 Q3 {2 ^1 }
当所有通道通电(引入NEXT),但NEXT消除(NEXTC)和回波消除(EC)禁用时,位错误率超过10^-8。仅启用NEXTC时,眼图开口改善为10^-9 BER时的0.45UI/53mV和10^-12 BER时的0.43UI/50mV。4 p3 ~( s$ f! k
9 c! F* w5 Z6 `+ ^# l9 v5 Z0 Q& m" \
当NEXTC和EC都启用时,眼图开口显著增加约50%,达到10^-9 BER时的0.68UI/80mV和10^-12 BER时的0.64UI/77mV。最令人印象深刻的是,在最佳采样点测得的BER低于10^-16,所有八条通道均计入位错误。8 N, _' p- P% K; b
* E, `- r3 ~1 V- V& C5 c启用EC的串扰引起的抖动(CIJ)测量显示,启用NEXTC后从0.58UI减少到0.06UI—改进89.6%。测量的功率效率为1.21pJ/b,功率分布在各电路部分间均衡分配。3 E( x$ q+ M9 n, v# o7 [0 ]; F* A
$ {& t7 V- H c4 n I3 T4 Y
7
7 Z) z" k, d% S3 `1 l性能比较和芯片实现, B8 E8 ^7 u9 I" u- ^$ o W9 n
与以往工作相比,该收发器实现了最高的每线数据率(64Gb/s)和每层边缘密度(10.5Tb/s/mm)。SBD信号与更密集的无屏蔽通道相结合,通过回波和串扰消除电路实现,在保证极低BER的同时达到了与以往设计相比的最佳性能指标。/ b, H2 y" \' u+ ]' u1 l
0kemoxus1tj640164812.png
1 U7 T9 ]: q4 D7 [- G6 x图6:芯片显微照片和面积概要
8 w- `. e9 n# l+ z# X; O
+ u5 ], R9 F8 F% k V$ L& D7 D; H$ S芯片显微照片展示了主要电路模块的布局,包括FIR和PRBS生成器/检查器、发射器(TX)、接收器(RX)和动态电压阈值(D-VTH)电路。面积分布显示,总电路面积针对所达到的性能进行了良好优化。
2 _1 E. j' [5 R8 Q7 O. T% q2 f7 d. A7 p, i- k5 S* o8 Y
89 D1 W0 l- N* k0 a4 a
结论. K# m/ S: ]/ N- S
这项突破性研究展示了解决高密度芯片间接口关键挑战的强大方法。通过实现具有全面回波和串扰消除的同时双向信号传输,该设计在不牺牲信号完整性的情况下实现了空前的边缘密度。9 d( ~+ l8 T$ u8 s: O1 V* R* O5 s
/ K) n, Y! _. M动态电压阈值技术用于信号解耦和消除,提供了比传统方法更节能的替代方案,而驻波时钟分配系统确保了有效串扰消除所需的精确时序对齐。
& m/ y5 X0 h5 ^# \/ T/ k6 U/ r3 Z9 y0 S k! h: p
凭借64Gb/s/线的数据率和10.5Tb/s/mm/层的极低位错误率下的边缘密度,这款收发器为下一代计算系统中的芯片间通信设定了新标准。随着人工智能和高性能计算继续推动技术发展,这样的创新将在克服当前限制系统性能的互连瓶颈方面发挥关键作用。, Q$ m8 Y( K1 u8 J
$ v1 b5 U1 |2 H/ y3 M
参考文献" F% G6 o. O$ u# v
[1] Z. Wang et al., "A 64Gb/s/wire 10.5Tb/s/mm/layer Single-Ended Simultaneous Bi-Directional Transceiver with Echo and Crosstalk Cancellation for a Die-to-Die Interface in 28nm CMOS," in 2025 IEEE International Solid-State Circuits Conference (ISSCC), Feb. 2025, pp. 588-589.
/ N' K( k& r; m, k. X8 @END
! l4 l3 ^0 x! e0 D) }" d3 @
( m5 F: B$ v# N. i: v; |1 f) ?软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
+ T4 L8 i! A2 \ U7 d点击左下角"阅读原文"马上申请9 E. l4 L: b/ i- a1 k9 C
( C- k8 m: d3 G. [4 _/ c2 T欢迎转载" X4 S' U6 y' u: z& ]) i7 c6 P
; [/ R. \# y8 O. S' d4 _转载请注明出处,请勿修改内容和删除作者信息!- M; ]# u- O: Z1 o; e, ~% o
3 t* G, a8 r! j: n
" p: e# S2 `! f
( I: n' a: D; X
0sghcfmzr5m640164912.gif
% a3 F2 U' n/ B, q; Q# K
1 A4 |* @/ R2 r; H/ P, t6 r3 {
关注我们. f3 m+ V1 K* Q* k
& ~# p5 a- P2 m5 ], s
. i7 q; j) R; d- Y
g2cl4vr5j1w640165012.png
& Q+ s7 L( l# _6 R8 ^. v
| 1 ]; b5 \" X- Z& R
13nejluz2p3640165112.png
$ @ B% l: v; L5 O* O1 c
| 5 v% r" L' y# a
tvnpwciij51640165212.png
1 e9 r) b$ i1 P: y | 9 T1 b& a9 A7 w- P5 M& u
0 i% f, `+ { J6 R; s' H! n2 K, o8 M" k% y6 p5 A7 u* r& c3 ? d
% K+ `% m- d( G, S3 d' S
关于我们:
3 b7 L! h h2 i深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
$ f3 F- R5 y u1 s, _; b/ n) {5 H. @1 @% g* P) Y
http://www.latitudeda.com/6 u4 Z) P. n- ~& h. M- @0 K
(点击上方名片关注我们,发现更多精彩内容) |
|