|
引言
8 B. O" X, g3 U& O9 Z, w9 M: n; h& @本文探讨AMD即将推出的"Zen 5"核心架构。这一新一代处理器核心在性能和效率方面都有显著提升,对于计算行业的发展具有重要意义。
+ U" m! [ X* K% y. A3 C2 K) B8 R4 J$ @" l
"Zen 5"核心概述8 w5 K9 @' ?3 Q! v
"Zen 5"核心是AMD成功的Zen架构系列中的最新迭代。在继承前代优势的基础上,"Zen 5"旨在提供显著的性能改进,同时保持出色的能效比。- t- N, Z+ t3 ]+ Z, B A5 c! B* \
# F( h/ f" q+ G( b- R9 ^' Q
0x14liirb2v64014029133.png
8 e! d/ _2 O, q! A, Q0 g! p+ a图1:展示了Zen架构的演进,突出显示了Zen 3、Zen 4和Zen 5的关键特性。( M) Q1 i$ [9 I; K' g7 ]8 T
- D( t7 \& g6 M* ^
"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每时钟周期指令数)支持AVX-512变体和FP-5128宽度指令分发和6个ALU(算术逻辑单元)双管线取指/解码采用4nm/3nm制程工艺
7 F: F* l& V. E6 Q[/ol]
! y! o# I8 x, U3 k1 X' D微架构深入分析
1 {3 A8 \4 A& u5 i* P+ r7 H& I"Zen 5"微架构引入了多项增强功能,以提高性能和效率。
" R% H' m' c5 O0 i6 |5 i& w5 Y5 D
wjkplehrz3164014029234.png
; e2 p9 g) b9 S7 [1 j图2:提供了"Zen 5"微架构的详细概览,展示了各个组件及其互连。" C) ~( M1 o& c# t8 d
& C8 w1 b! b- _0 e4 ?3 s. B前端改进:0 ~! F3 A O( g; A [
双指令取指和解码管线8宽度指令分发到整数或浮点单元增强的分支预测,每周期可进行2次预测更大的Op-Cache,可存储6K条指令,每周期2x6宽度取指
5 g5 z' W+ Q5 G
% `5 H% k5 j6 f) |执行单元增强:3 X9 G1 C5 D! J# T& t/ \3 P; C
6个整数ALU和4个AGU(地址生成单元)每周期4个浮点运算,FADD(浮点加法)延迟为2周期完整的512位AVX-512数据通路,提高吞吐量
6 w8 P, i3 S7 }. z$ I$ {5 s. h. Q& T! Z9 ~, n) F5 E3 W
缓存和内存子系统:
% T4 G2 P6 i; v2 \48KB 12路组相联L1数据缓存,每周期可进行4次读取,2次写入操作1MB 16路组相联L2缓存改进的L3缓存延迟8 ~4 k5 J' O! M$ K
! m( d& l" g3 J! r& U2 f. q0 s
"Zen 5"家族和平台支持! j. ^1 u7 S* |0 W" L1 M% U1 x/ X
AMD推出了两种"Zen 5"核心变体,以满足不同市场细分的需求:"Zen 5":优化单线程性能"Zen 5c":注重性能功耗比和性能面积比
! v& @3 c0 n: }0 X; Y$ k[/ol]9 q" v' K, ?5 g* i8 E
6 `0 B z0 w2 n' z5 x7 l
lsonkembxck64014029334.png
/ k. ^) e$ P) y. E2 H/ F- j
图3:展示了"Zen 5"家族成员,显示了"Zen 5"和"Zen 5c"核心之间的差异。
3 T; w4 z6 b( x: L
# E3 \, Q! S: n9 m& x" ]这种方法使AMD能够针对从高性能台式机到节能移动设备的广泛产品范围。
0 u; M9 a& `7 G6 Q5 L$ ^) J2 K L- t( E* l& m; }2 m
新指令集架构(ISA)特性
7 ~5 Y, J* n5 h6 O3 m9 C"Zen 5"核心引入了几项新指令和功能:5 z9 H. ~4 @. _, x; V( E
MOVDIRI/MOVD64B:4、8或64字节的直接存储指令VP2INTERSECT[DQ]:AVX-512向量对交集3VNNI/VEX:带VEX编码的扩展AVX-512指令PREFETCH[I*]:指令线的软件预取增强的安全特性,包括SEV(安全加密虚拟化)改进
# A% v) f! x( c1 W ? J- n( G+ f: }/ ], S2 s" t
性能提升
1 i) Z$ k1 Q' E5 eAMD声称"Zen 5"核心在各种应用和使用场景中都实现了显著的性能提升。
) w$ q/ `2 A: k, T, s+ n* |5 t9 U0 s. i
zvxxsqg3taf64014029434.png
" n8 J: u% ?. p/ O6 m4 T
图4:展示了"Zen 5"相比"Zen 4"的关键进步,突出显示了各个领域的改进。
- U* I: M8 h* X4 \
' H3 L5 G2 ?+ Y, Y* w, U- {4 A M9 mIPC提升4 z4 B ^0 X! S8 d2 ^6 D# [
"Zen 5"核心在一系列应用中展现了令人印象深刻的IPC改进:
6 l3 K: q' W) x0 V- w6 s2 d! L: ?7 z
hnj2wk1sava64014029534.png
7 }" X# y, O$ v; a( @+ P
图5:显示了使用"Zen 5"核心的PC相比前几代产品的IPC提升。
0 p, w- n( V) d( x/ y) |& k& X0 i) z/ H4 W" M9 D
AI和科学计算1 N3 g8 o* G% n( I
"Zen 5"核心在AI和科学计算工作负载方面也表现出显著的性能提升:
+ @7 |2 l& o, ]
# w: }" h( J4 M# Y+ h" O7 L% S
pzv5ibat4ld64014029634.png
3 | w% V* D7 a& [' u" H
图6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"处理器在AI吞吐量性能方面的领先地位。
( @. \2 o- N8 v) x) p$ w2 {3 Z( E: g+ ^5 u" O
在SoC中的实现( S6 x) A4 k5 f+ u2 q
"Zen 5"核心将被实现在各种系统级芯片(SoC)设计中,以满足不同市场细分的需求。
. ?; |4 I+ ?; \( }* E! M"Strix Point" SoC:
; s- i% P' q& O" z/ ~
mbethlwddx564014029734.png
3 U! p. P! w+ f( p* ~图7提供了"Strix Point" SoC的详细框图,展示了"Zen 5"和"Zen 5c"核心的集成。
; q9 x6 H5 o: e a. ]/ M) T% M: m) R9 v/ X6 I
"Strix Point"的主要特性:
2 L" l) ]5 O( P' A/ z8 k. g! F异构架构,包含4个"Zen 5"核心和8个"Zen 5c"核心集成RDNA 3.5图形处理器,最多16个计算单元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5内存PCIe 4.0和USB4连接( X5 {0 k5 O4 v1 L4 E7 D
' G0 o5 j. R8 `6 n) U, E
"Granite Ridge" SoC
* A& ^0 t/ A6 K6 R
iciyktynici64014029835.png
9 a) q' I3 c1 D7 O0 n# c6 z/ p' J, J图8:显示了"Granite Ridge" SoC的框图,该SoC专为高性能台式机应用设计。
+ O9 Y. |7 U7 Y2 w2 E. M0 Q3 [8 [0 M. s7 L ^! z/ a
"Granite Ridge"的主要特性:
- J& M4 P/ A1 W; k, ]0 W+ k- B; [最多16个"Zen 5"核心(2个CCD,每个8核)每个CCD 32MB L3缓存支持DDR5内存PCIe 5.0连接兼容AM5插槽& o4 ^# B4 w4 z
0 v2 W: Q- ]$ }/ _" g' v+ H" A
能效改进$ w. Z. X* E# y) B
"Zen 5"核心在Zen系列的能效优势基础上进行了进一步改进:增强的电源门控技术改进的smt(同步多线程)支持,提高性能功耗比缩短电源状态进入/退出时间优化分支预测,减少无用工作高效的字符串操作和预取器改进
! `1 R" c$ Z+ c9 c& Y4 ^[/ol]
8 s! W# ?. ~6 _. f4 d这些增强功能在保持出色能效的同时,提高了整体系统性能。
; V6 Z P/ } `8 ?% s% D! \( C! h9 L% N1 _
RDNA 3.5图形架构
# T- G, e. u/ i! R对于移动应用,AMD还改进了集成图形架构,推出了RDNA 3.5:# V9 z( H. C( q1 Z
rzwyqc2fvgt64014029935.png
5 X' A+ Q9 k+ B" I图9:概述了为移动应用优化的RDNA 3.5图形架构的改进。
5 y Y$ }7 X, Y# S% S; t, G# p& D# s2 F3 s1 k, L. j+ F
RDNA 3.5的主要改进:
# _1 d w; s5 P+ G3 j1 K' y2倍采样率和点采样加速增强的着色器子系统,插值和比较率提高2倍改进的光栅化子系统,通过子批处理提高效率针对LPDDR5的内存子系统优化和改进的压缩更大的引擎配置,包括8个WGP(工作组处理器)和4个RB+(渲染后端+). E* w+ s" F, y/ R) ~6 Z; G5 |8 {# Y5 m
2 _# m! Q, {- b) o6 d
AMD Ryzen AI与XDNA 2架构( r) l. v+ _9 w% W0 M. L7 I
为了满足个人计算机对AI能力日益增长的需求,AMD引入了XDNA 2架构用于AI加速:: A+ q$ p: ^' y6 v9 Y
xzwccgymld564014030035.png
( f( U& d- O8 ?' P图10:展示了基于XDNA 2架构的AMD Ryzen AI "Strix" NPU(神经处理单元)。# ^( T$ o: h! K0 H9 ?
' W" X m! z, w4 b" D( G" e0 O7 ^XDNA 2的主要特性:
/ Q! C! ?2 t2 y8 D+ z最高50 INT8 TOPS(每秒万亿次运算)和50 Block FP16 TFLOPS8个并发隔离空间流,提高多任务处理能力片上内存容量比上一代增加1.6倍支持块浮点和增强的非线性函数相比上一代产品,性能功耗比提高2倍3 _! w* @/ N4 i
% E3 D9 [6 q/ K% d: d0 c* N: P& g
结论
" r) v# i& f, j' r# y8 C& R( d" KAMD "Zen 5"核心代表了x86处理器设计的飞跃,在各种应用中都提供了显著的性能改进。凭借对AI加速、能效和可扩展性的关注,"Zen 5"核心有能力满足从移动设备到高性能服务器等各种市场细分的现代计算需求。
4 ], V Y$ n0 u: x
& F6 I1 s0 E$ O! V随着AMD不断创新和突破处理器设计的界限,可以期待未来会有更多令人兴奋的发展。"Zen 5"核心及其在各种SoC中的实现,展示了AMD在竞争激烈的处理器市场中提供领先性能和效率的承诺。: O! E) q$ [1 @3 p$ ?
7 L; ~4 L# d1 M: c, F参考文献9 K7 @0 y! I- t! z
[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.
, G" z8 X& F; T9 |, p; {& R
8 }1 b5 h. I! t; V- END -. B3 M ~8 S) c5 b
) [8 l0 [: \% k1 o3 l
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。$ \" P, O: P7 Q) t3 N; L
点击左下角"阅读原文"马上申请! d- S% A% [5 V0 c" f- e
. _- i, P: J' k0 D; O
欢迎转载" m+ U" F2 K' `" t+ R$ f4 f9 D
8 h: A/ A8 w* y
转载请注明出处,请勿修改内容和删除作者信息!
) e8 l' L( g/ q0 d" F6 u, O+ `; ]$ p% h" l
' K/ E( H) }6 l% q1 P6 ?
& U3 G, w5 `7 H1 |
vjhqegeadpe64014030135.gif
9 e) Z* U$ S( W8 N: _' I' O# ?' H2 K' l0 B
关注我们. b; ^( M0 @! y4 j+ O
, ^6 o$ y0 z4 a" \: t% S
R/ I6 J! ^ p. y0 Q
yfjpo4desb064014030235.png
0 S% O/ a* O1 I+ f# e6 \; n. C1 T |
6 K- O( K! m; q4 D5 `; E0 }
diigldkjaki64014030335.png
8 `7 F# F. O4 f0 J' a% z' f
| ; k) P5 w0 O+ m! H# R$ ]- M
5uwjbu0mhxm64014030435.png
; Q0 Z; B" G# ` | 0 m! ^/ w1 [/ G
$ T: g0 _8 W- p4 m5 r7 E; x) d
" h6 Y1 S! \5 x5 y1 v$ |
" \! S4 R5 q! x4 Q关于我们:: f0 C, D0 Q" K( \! H- P, B
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。2 o2 b4 Z( D6 r# k/ K# ?
& C1 ]; S. @! k; Q% [http://www.latitudeda.com/
0 p8 b/ \: S& I$ y0 m" x5 |(点击上方名片关注我们,发现更多精彩内容) |
|