|

引言) C# n7 v9 ?( x1 i
芯片间数据通信已经成为人工智能硬件发展的关键瓶颈。随着人工智能系统变得更加复杂并分布在多个处理节点上,芯片间数据传输所需的能量和芯片面积已成为进一步扩展的重大障碍。传统的电互连方法在能效和带宽密度方面正达到基本限制。本文将基于Daudlin等人发表在《nature photonics》上的开创性研究,解释三维(3D)光子集成如何为这一挑战提供有效解决方案[1]。
- }8 h: {: P. o2 V3 w- L
rh4ooi3lv1r64015343332.png
1 w" f' H! L9 y4 l
* P0 E/ N' Z! m9 s" b6 S1
% Q: I9 l P/ E% J' b- b带宽瓶颈问题
+ r& O* R8 M3 e. f0 `5 G) D当前计算系统面临一个基本挑战:虽然处理能力持续增长,但芯片间高效移动数据的能力却没有相应提高。在现今系统中,存储在半导体芯片中的数据必须通过厘米长的电线才能到达光发射机(通常以可插拔光收发器形式存在)。这种方法有两个主要缺点:电通道数量有限由于线路长度导致能耗高
7 K, \ y6 u8 D5 d9 p/ }[/ol]9 ^( ^* t0 G" z. C. v
这些因素的组合创建了带宽瓶颈,限制了系统性能,特别是对于需要在分布式计算节点之间进行大量数据移动的人工智能应用。基于光的通信由于能够以最小能量损失传输大量数据,提供了潜在解决方案。然而,在电域和光域之间高效转换仍然充满挑战。
& z7 h$ O2 y! q) ~- w0 U+ a+ E( x0 V' |) S$ S/ P# f* u( l2 N
2, M0 \5 x- R; t2 p
集成光子技术作为解决方案( w6 X5 x& ^( @; J3 x, L# B4 ?
集成光子技术将多个光学组件集成到单个芯片上。硅作为一种特别有吸引力的材料平台脱颖而出,因为它可以利用微电子制造中使用的成熟CMOS(互补金属氧化物半导体)基础设施。硅基光电子平台包括各种器件,如基于微谐振器的调制器、滤波器和锗光电二极管,这些器件可以高效地处理数据传输所需的电-光和光-电转换。6 j9 f9 v& @) N0 s) T0 V* z$ V
/ h# j ?! [ ^* d6 [" d2 d! j
先前的芯片级光收发器方法在效率或规模方面面临局限。早期系统展示了在单个芯片上集成多达64个光子和电子通道,发射器能耗达到约240 fJ每比特。但这些系统有几个缺点:
6 K" y# u( K1 R0 I" e# L1 S接收器能耗超过1,000 fJ每比特由于在二维芯片上的横向排列导致密度有限"冻结"的晶体管技术无法受益于CMOS制造工艺的进步& a. ?% l- I' \- l9 y
# W2 S2 ^4 @% o" X4 `& U三维(3D)集成提供了更好的方法,将更高效的前沿CMOS电子芯片与独立的光子芯片相结合。最近的3D研究展示了低于200 fJ每比特的功耗,但限于八个或更少的通道。6 v8 D( ~; Y6 h* p8 b% G: ~0 Y2 v4 f
/ C" H5 Q" l4 ~4 r6 T6 r6 @% ?1 v3/ V+ E5 h/ P. x/ T6 M( a: n
突破:密集3D集成+ k+ U: N& y b, K2 U4 l6 h
该研究通过光子和电子的密集三维集成提出了变革性方法。该实现实现了:% ^% m/ V& W) b2 b9 v9 |& U$ T; y# M5 H
单个芯片上80个光子通道超低能耗:电光前端仅120 fJ每比特高数据速率:在紧凑区域(0.15 mm2)内实现800 Gb/s空前的带宽密度:5.3 Tb/s/mm22 g/ y$ N; ?7 g, I
; b% i9 `( d' F7 W3 n4 ^) J$ Y2 l8 K# s
gq35i4ycipk64015343433.png
! ^7 |0 Y& w7 Q图1:3D集成光电收发器。a. 电子和光子系统3D集成的示意图,结合电子单元阵列和光子器件阵列。b. 80通道光子器件阵列的显微图像,插图显示两个发射器和两个接收器单元。c. 光子和电子芯片的显微图像。蓝色覆盖显示了四通道发射器和接收器波导路径。d. 键合的电子和光子芯片截面的扫描电子显微图像。e. 键合到印刷电路板并光学耦合到光纤阵列的线连接收发器芯片图像。f. 电子和光子芯片及其相关材料堆叠的横截面图。
/ e7 z6 E7 ?. A* R
$ ~( F" ~2 c `6 Z7 m: V; Q: I这种性能的关键在于使用铜柱凸点的高密度键合工艺。电镀工艺在光子芯片上形成带有铜基座的凸点,并在顶部镀锡,然后在热压力下将这些凸点与镀镍的电子芯片键合。系统使用15 μm间距和10 μm凸点直径(25 μm节距)的2,304个键合点阵列,平衡了过多锡流动可能导致的短路问题和锡不足导致的脆弱连接。
# `, z" i5 Z/ \/ B2 ?+ o3 N4 @6 t4 f0 t" Q9 E/ V: | G
4
* |0 ~9 o/ ?" F& _( P收发器架构0 y4 E2 x1 J, n$ a( P$ s( h
这种3D集成芯片包含80个发射器单元和80个接收器单元,组织成20个波导总线,每个总线有四个波长通道。该系统的运行可以分为两部分理解:
b7 S1 o; e0 e& i* E3 T- n4 Q6 ]% [+ V
1. 发射器操作:每个发射器单元在电子芯片中包含存储伪随机比特序列的本地存储器。当由时钟信号触发时,发射器电路向光子调制器电极发送电压脉冲。这些脉冲使微盘谐振频率蓝移,将其从阻塞状态变为非阻塞状态,从而调制谐振激光线。( x( v, r/ Q. y; H$ _: Q
leau5xulxcz64015343533.png
- W' {2 f2 D- T; e& q2 J/ [* f
图2:发射器特性和性能。a. 发射器实验测试设置示意图,显示单一波长激光通道被发射器调制并在示波器上测量。b. 发射器单元电路原理图。c. 四通道发射器总线的光谱图。d. 代表性微盘的谐振频移作为垂直p-n结应用反向偏置电压的函数。e. 发射信号的ER('1'比特功率除以'0'比特功率)、IL('1'比特功率除以调制器前功率)和归一化OMA(归一化'1'比特功率减去'0'比特功率),1.5V驱动电压。f. 最大OMA下的ER和IL,适用于不同驱动电压范围。g. 测量的发射器阵列能耗,适用于不同驱动电压范围和1/4CV2拟合。h. 不同驱动电压(1、1.25和1.5 V)下调制信号输入商用接收器的BER测量;接收功率是商用接收器的平均信号功率。i. 80个调制器在光子芯片上以10 Gb/s每调制器和1 dBm输入激光功率的眼图。
6 J+ e4 L5 S$ @5 u% T
$ B' G; Z$ f3 Q$ t使用1 V摆幅驱动微盘时,发射器单元仅消耗50 fJ每比特。这种特别低的功耗通过以下方式实现:垂直p-n结微盘,其耗尽区与光学模式之间有高度重叠每伏特应用电压产生75 pm谐振频移的电-光响应电子和光子之间的低电容连接% ]( B3 E- n9 Z! F
[/ol]
. T( E9 P4 S: B垂直p-n结设计特别重要,因为与横向结相比,它能与光学回廊模式更有效地重叠,实现低电压操作。
1 y8 ^+ Z% o) C+ M$ Q: Y; }, P( k) o; M
2. 接收器操作:接收器单元以与发射器互补的方式工作。波长通道在光子芯片上携带信号,微环谐振器选择性地将特定波长耦合到各自的光电二极管上。电子芯片然后放大光电流并将数据写入本地存储器。1 R7 a! }) I6 P$ f
prmwkof2o3s64015343633.png
, D% }, U! f& k* q% \- u. N图3:接收器特性和性能。a. 接收器测试设置示意图,显示由商业发射器调制的激光线被3D集成光电接收器接收。b. 接收器单元电路原理图。c. 光电二极管的响应度(光到电流转换效率)测量。d. 接收器总线的光谱图。e. 使用商业发射器信号的接收器单元BER测试;接收功率是光电二极管处的平均信号功率。/ Y# Q0 R/ p7 F# ^
: |5 |4 d7 J* |* j1 [* B- m接收器单元在-24.85 dBm平均功率、4×10?1?误码率(BER)下接收10 Gb/s信号时消耗70 fJ每比特。这种性能的关键在于:高效光电二极管,响应度为1 A/W低电容(光电二极管为17 fF)精心设计的电子放大器以最小化噪声
& m u. `1 F6 L" [[/ol]
3 M. @8 I4 U4 u/ R9 t+ b该光电二极管是垂直p型硅、i型锗和n型锗二极管,能高效地将光信号转换为电流。最小化噪声对于减少所需激光功率和提高总体能效非常重要。* ~6 v9 F2 ^9 g
# n$ A% O5 h( u0 i1 d3 v* R5; ] y# \" M1 [7 n ?
端到端链路演示/ w5 O& ?2 D3 U/ e
为验证完整系统,研究人员用光纤连接了两个独立的收发器,一个作为发射器,另一个作为接收器。它们之间只放置了一个偏振控制器,两个电子芯片由共享时钟同步。
7 J; P" ~2 `6 V% s6 N1 M5 k: z* B
bwmcuaeirqy64015343733.png
) F5 \0 m+ A# S
图4:发射器到接收器数据通信链路演示。a. 发射器到接收器链路示意图,显示3D集成光电发射器调制四条激光线,以及单独的光电接收器将四个数据通道转换回电域。插图省略了发射器和接收器之间的偏振控制器。b. 链路激光源的光谱图。c. 发射器后四个通道的眼图。图表不包括功率比例尺,因为在示波器前使用了放大器,但未在光学链路中使用。d. 接收器后数据通道的BER。
+ A- B. e+ f, z' g. v5 k1 m5 w' V( [% T. y( o
在这种配置中:9 C% k3 d. J! s
激光二极管阵列提供四个波长通道,每个通道功率为-5 dBm5 T/ d" R- N, P0 ^. H6 ]; ~" n
单个发射器单元以1.5 V驱动调制每个波长,速率为8 Gb/s) l' e+ o- U4 s( P
每个接收器光电二极管的每通道平均功率为-19.5 dBm
$ [6 w. \: M7 n) L片上错误计数器显示最大BER为6×10??,最小为无错误" @) r; E# }9 o" e$ o! \
" E& i# p/ b7 X* g这一演示证明了3D集成中的发射器和接收器可以形成完整的低功耗、高带宽链路,适用于下一代计算系统。: N4 z7 N8 @) \9 I# l' j1 r4 L
. s8 B& B- `( ?( \# V6
3 P, z8 F8 B; |* u! K, x! Q4 g电路实现细节8 W7 u" I1 \5 W- g. q; l4 k% _, F
该系统的出色能效来自于发射器和接收器中的精心电路设计。
' y" ?1 c' m+ R
! ~2 ` ^5 \1 J发射器驱动电路对大多数组件使用1 V电源电压,驱动器本身在1到1.5 V之间运行。级联配置中的高速晶体管防止超过1 V限制时的击穿。宽晶体管减少了调制器电容上的开关延迟,而耦合电容确保高开关速度。
( t6 N2 u, ?" a! m. k6 ?. s& b3 [5 X" e/ l+ X P
接收器电路使用基于反相器的跨阻放大器(TIA)作为初始增益级,随后是均衡器和反相器。放大器输入处的可编程电流DAC消除了光电二极管电流中的直流偏移。TIA具有高反馈电阻(18.6 kΩ)以获得高增益,而均衡器中的主动电感电路消除了频率限制。
3 l; X* ~* f7 [, H4 r7 |- U: i
6 u' J- ~6 \5 {+ K7 \这种电子和光子组件的精心协同设计对于实现系统的卓越性能非常重要。
4 B& U g2 _) j$ r% \+ r M1 i/ X& ]$ `% B# G' M9 a
76 T4 U5 i- ]! X8 q9 K
未来方向和影响, f3 P0 `4 i- n" u9 Z- X$ j
虽然这一演示在能效和带宽密度方面取得了记录性能,但仍有几个改进领域:可开发具有更低电容和更高电光响应的谐振调制器更低电容的光电二极管可以减少接收器功耗和噪声更先进的CMOS工艺节点可以进一步降低电子电路能耗混合键合等更高密度的键合技术可以提高集成密度 n6 C9 t5 M1 P
[/ol]5 P: O( m1 X/ g+ F8 V" W
此外,实际实现需要解决:, x- L( S! I' t5 l. s) g8 B
减少芯片到光纤的光学损耗3 ]7 q+ Q+ L. s7 \. W' c# x: b
更高效的激光集成(使用分布反馈激光器可能低至47 fJ每比特)
) p' J, p$ X- A对温度变化敏感的硅谐振器的热控制
4 e. P5 V4 i3 R- ]" z对偏振敏感的光子电路的偏振管理7 K- \# h2 H4 y1 I3 }; p
; B' W5 C; W$ K7 q: b6 U7 S8 g, B1 X) C这项技术的影响超出了人工智能计算范围。这些低功耗、大规模并行光学链路可以实现普遍的设备连接,通过允许光学链接的分解和可重构计算和存储资源,改变计算方式。这具有在未来十年内革新计算格局的潜力。
9 a- u0 f p# g) J# L6 u+ [8 T0 o2 Y# e! o6 K
8
, H" K4 Y" C7 _) }$ ?9 a5 [结论
1 R2 v9 r! G! d光子和电子的三维集成代表了解决限制分布式计算系统扩展的通信瓶颈的重大突破,特别是对于人工智能应用。通过结合密集3D键合技术、节能光子器件和精心协同设计的电子电路,研究人员展示了一个实现高能效和带宽密度的系统。
0 N. D, z9 x; S# d3 c1 i% m7 c4 v! z4 }/ M/ d) I9 s- h& F$ n
单个芯片上集成80个通道,每比特仅消耗120 fJ,同时提供800 Gb/s总带宽,这种方法表明光互连可以提供下一代人工智能硬件所需的通信能力。随着器件设计、集成密度和系统架构方面的进一步改进,光互连将在计算未来中发挥关键作用。
9 q& j! ]# E0 D7 R# n5 Y t6 E/ m5 z8 C" G: s0 I' l: o
参考文献
! m& z$ E2 h; R/ W% o+ }. ^[1] S. Daudlin et al., "Three-dimensional photonic integration for ultra-low-energy, high-bandwidth interchip data links," Nature Photonics, Mar. 2025, doi: 10.1038/s41566-025-01633-0.% X4 ~6 @* ?- l7 c
END
. O. N' y; ~2 \# J% M1 s" f2 ~6 L9 o" Q
# W' x. T5 G5 y; }# s _" Q8 q软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
- J }) e; t! X* l. k点击左下角"阅读原文"马上申请7 b3 F: D) f& D5 N# U
! B! z$ d5 j8 Q" D. p
欢迎转载7 I6 s2 o9 m2 F! b( K+ X
' h/ V) D7 ~7 _( i- U3 |: E! Q- `# P
转载请注明出处,请勿修改内容和删除作者信息!
5 r4 Q" H( t! k" ^- q
! u5 R& s; n1 Y; `7 S& y* J
! i1 |0 [, n! G; P% f/ A& |+ H
5 Y) `9 _) l& I3 c7 q
xnl1zoddvqp64015343833.gif
4 t: _! q6 G5 Z6 j3 s
4 F2 W- L- d& T, Y4 _. L$ T关注我们) I$ A) u e6 s! J( m( k- B
, Z% D3 a4 }) M
! W; g p; H2 D) O7 h
fu3yidpwije64015343933.png
; t% E) ]2 _/ [ T, F) n ]( z* Y% e+ ? | + e+ u0 H' _6 x' n3 ~. u3 |1 G
jrshaffogut64015344033.png
, r; B4 d( n; G, [1 ?/ U
|
7 X5 `) V$ t; ^; }$ R9 F# R
cenea031ubh64015344133.png
+ T2 n" C; A5 K$ S. @1 w$ R |
& J3 o% C2 H% e5 j
5 z% u/ V. _2 ?+ `# H& j: b* J5 H3 ]# \* R- l$ b
/ U# Y. ~- g% P
关于我们:
$ z0 X$ q( p1 V- ~. f深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。' T# l+ J1 w, j% d6 @; B Q# ]" _
% b) m/ J2 ?/ Mhttp://www.latitudeda.com/
! U' c/ G X9 r+ u2 x, ^, V; B(点击上方名片关注我们,发现更多精彩内容) |
|