电子产业一站式赋能平台

PCB联盟网

搜索
查看: 99|回复: 0
收起左侧

NVIDIA Blackwell的内存与电源创新技术解析

[复制链接]

1036

主题

1036

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
10657
发表于 前天 08:02 | 显示全部楼层 |阅读模式
GDDR7内存架构, N6 V2 }9 G6 ^% M& y

5 N# d# D5 p& b8 X, }9 x3 VNVIDIA RTX Blackwell架构通过采用GDDR7技术实现了内存技术的重大进步。这一发展是NVIDIA与DRAM行业在架构、线路设计和信号优化方面长期合作的成果[1]。  f  B6 Q. }, U+ t) z% k

q2upkh4omsw64012027341.png

q2upkh4omsw64012027341.png

. \% I* W7 A1 Q" j2 o. v' e

3ugccp43dup64012027441.png

3ugccp43dup64012027441.png

8 h/ C1 P1 A9 A. i( {) D图1:GDDR7与前代GDDR6/6x的对比,展示了通过PAM3信号技术在数据传输率和效率方面的显著提升。
( e1 t7 m; t1 h3 }$ E
0 v# Z. r& p% a3 D, x, nGDDR7内存系统采用PAM3(脉冲幅度调制)信号技术,这是一个相对于之前内存代的重大改变。与GDDR6X的PAM4信号(使用4个级别传输2比特/周期)不同,GDDR7的PAM3方案使用3个级别传输1.5比特/周期。这种改变结合创新的引脚编码方案,大幅提升了信噪比(SNR)性能。
/ z/ j% Z4 H1 C& [8 ~! }
6 u% `2 b& ~0 {/ O对于GeForce RTX 5090,这转化为28 Gbps的GDDR7内存速度,提供1.792 TB/秒的峰值内存带宽。GeForce RTX 5080更进一步推进到30 Gbps GDDR7内存速度,实现960 GB/秒的峰值内存带宽。这些提升在保持更好功耗效率的同时,实现了相对前代的显著性能提升。, W7 y; h+ d$ z
先进电源管理. x$ p1 [8 ^" q- ]1 z, ]  a/ _

* ~, T3 T8 K8 W+ S& D6 i4 tBlackwell架构在Max-Q理念下引入了多项精密的电源管理功能,旨在特定功耗预算内提取最大性能,同时在空闲期间实现快速电源状态转换。- f/ E: L% Y  f- [

sy2b2bjxmmn64012027541.png

sy2b2bjxmmn64012027541.png
  m! I) C, k* e! N- N" Z
图2:新的Max Q电源效率创新,通过多种优化技术提升电池续航时间。
) q! ?( J$ h  s/ ~; C/ K) C- }. B7 M% z) B7 m0 V8 B3 ~
电源管理系统包含先进的电源门控功能,可以快速禁用整个时钟树。这一功能即使在通常被视为"活动"状态的短暂空闲期间也能节省动态功耗。
4 |9 Y/ |8 K# b

mdono0vob5p64012027641.png

mdono0vob5p64012027641.png

5 u+ t( [6 R) l" {. [4 y图3:先进的时钟、电源和轨道门控机制,对GPU各子系统的功耗实现精细控制。
# L6 ?% g& F8 Q& {) f" h电源状态转换
5 P) b7 ~& y( j. b' m' d' T; a7 M( H- s2 |' m
Blackwell的一项重要创新是大幅改进的电源状态转换能力。该架构能够以比前代GPU快1000倍的速度适应动态工作负载,在变化的工作负载条件下实现更高效的电源管理。5 t# F8 u* V5 c

r0hxed0h2cn64012027741.png

r0hxed0h2cn64012027741.png
3 z4 W/ ^/ Z; l' Q3 ?
图4:加速频率切换演示,展示了在不同工作负载下时钟调整的改进响应能力。
$ }% e2 I- f& ]" u" g/ L: }8 r2 q- {, l; A
新的频率切换系统使GPU能够快速响应工作负载变化,根据即时处理需求上下调整时钟速度。这一功能确保在维持功耗效率的同时实现最佳性能,对台式机和笔记本电脑都非常重要。
) A2 i6 ]/ ^9 s低延迟电源状态$ a7 ?4 ~5 ]  v7 O/ X# D( \+ h/ b

( a- r/ a2 a' L0 }

g2m5b3kllrx64012027841.png

g2m5b3kllrx64012027841.png

$ x8 @* v- C/ w) B图5:运行小型语言模型(SLMs)推理时的功耗模式实例,对比Ada和Blackwell架构。' Z) ]% m3 a( X- z; n

: L; y( |( H8 D' _4 g% ~在特定工作负载下,架构通过以下方式实现高达50%的功耗节省:2 L+ `( ^! r* I9 b) U; m
通过性能提升减少活动周期0 R1 d# L* }( Z1 u& L0 Q4 M
通过先进的电源和电压门控降低过渡状态功耗
6 |: `' f+ g7 p. v0 |# X' v相比前代进入深度睡眠状态的速度提高10倍
! A8 k% c/ `( U
实际应用效益7 z8 q& H1 H+ D4 t+ ]$ {

3 u, o" w8 T7 p" c) m  \) b对台式机用户而言,这些改进转化为更好的每瓦性能,GPU在需要时可以发挥最大性能,而在轻负载时保持较低功耗。增强的电源管理功能对高性能游戏场景特别有益,功耗效率直接影响系统温度和风扇噪音水平。
/ Z3 @# |* W3 B3 b( o' c/ t. J! k8 G4 B7 U
笔记本电脑用户从这些创新中获益更多。先进的电源门控和快速状态转换能力有助于延长电池续航时间,同时保持响应性能。快速切换电源状态的能力确保笔记本GPU在需要时能提供最大性能,同时在轻负载时节省电池电量。* V9 P: ^  m  u; k3 |( ?
内存子系统优化
" ~/ e0 ^* t7 t( D) h2 Q8 U+ V. c& m1 N! d+ l- e+ \
RTX 50系列显卡的GDDR7实现包含多项超越原始带宽提升的优化:+ i* n$ w# F7 c$ `$ P
增强的CRC用于RAS(可靠性、可用性、可维护性)! p* h( j  {: l
改进的内存时钟树门控能力
  I/ F6 d' Q" s1 t针对内存子系统优化的电源轨道管理
7 _$ `0 \& X9 D. b* D- \
系统集成考虑4 x9 ]# ]0 C2 m  k- w

; [- f# b* Q, G- W9 N1 U/ q' }对系统搭建者和硬件爱好者来说,Blackwell架构的内存和电源创新需要考虑几个重要方面:* _- o; N/ G7 L. J1 O
电源要求需要考虑功耗的动态特性0 M4 N0 V8 m; K! R& N) z+ y
根据更高效的供电系统优化散热解决方案: V# l- V5 f- U5 b% f" \9 B
通过适当的系统配置最大化内存性能9 l1 c/ f% w) B! U
结语* q  Y: Z2 N; |0 e9 F3 i; a

' @, [' h% S- b) G- y: qBlackwell的内存和电源创新体现了GPU技术的重要进步。GDDR7内存结合PAM3信号技术和精密的电源管理功能,在性能和效率方面都带来了显著提升。这些技术进步为台式机和笔记本用户提供了实际好处,也为系统搭建者创造了构建更高效计算系统的新机会。
7 p# a- a6 S3 h& ~9 L- M2 D2 N7 C! |3 y参考文献
' N( s5 N. g- l8 K' }6 H. G& M; M" i* ~1 G* ]! E' w8 g- _
[1] NVIDIA Corporation, "NVIDIA RTX Blackwell GPU Architecture: Built for Neural Rendering," V1.01, March 2025.8 c; J  I9 C, }% X6 \: O' F, G
END4 L& `% V8 O1 p9 C; S* Y6 w
软件试用申请欢迎光电子芯片研发人员申请试用PIC Studio,其中包含:代码绘版软件PhotoCAD,DRC软件pVerify,片上链路仿真软件pSim,光纤系统仿真软件pSim+等。更多新功能和新软件将于近期发布,敬请期待!
( y% @% M( [8 }! \1 b点击左下角"阅读原文"马上申请6 [# k# L( m9 ~$ e) i7 r+ g
: b3 B" L! j6 J5 U& G$ t
欢迎转载& ~7 m6 t& ]5 N3 d
1 m0 W! K! e% t9 V# ?
转载请注明出处,请勿修改内容和删除作者信息!  s: F1 P; j0 F) w8 }
: ]8 }1 d# h8 z( [

4 C1 s4 O' A% e  |0 w! H' r' o7 p

7 T& T0 }0 X! X2 l( [( c$ D

0ccje0pcdnq64012027941.gif

0ccje0pcdnq64012027941.gif
: P5 }# Y6 Q, c& w6 C# h( s  j

5 X% [+ ]. {5 d- A# O* |关注我们" F  \+ l! h6 E

4 K5 \- u/ S1 M: `. A
: K9 R3 ^( Q, \. k& g1 G& w5 l: b

h25tfuiiss564012028041.png

h25tfuiiss564012028041.png

) n6 a) V' t& u3 U4 J6 M, x! ~  x

; X) ]! z3 K: \

ko1k5thvapk64012028142.png

ko1k5thvapk64012028142.png

% c& j/ l, }- w9 z& [/ f6 ^( Y

: p! B- ^  K0 I; E) S8 o) b5 N

s2g41thtxiv64012028242.png

s2g41thtxiv64012028242.png

- T3 q0 \( s$ B( O/ n( I( k
                      " G# j4 v) f% L
0 f" r& a- X: D7 d2 l0 s
/ h! w! c* R" J0 W. H
6 g7 P# I% @' H3 u; \7 T
关于我们:$ D0 G/ L% l+ G
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
' D- H3 ?$ O$ S7 Q
: q) h" Z& [4 m1 g8 F$ Y' xhttp://www.latitudeda.com/
: i3 Q, s; V) I. {3 @* `* A" N& |(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表