|
引言, J1 z" {' {/ V1 p1 n) o) F
随着人工智能(AI)不断革新我们的生活方方面面,AI处理的方式和地点正在发生显著变化。本文探讨设备端AI的概念、优势、发展历程以及所面临的热设计挑战[1]。* z1 r4 a# q& w( W) I* V" P$ T
: G. [+ o5 _ `! n# Y/ T; H/ S" N
什么是设备端AI?
' ?. V7 d; Q% }* S/ C6 Q设备端AI指的是直接在边缘设备(如智能手机、笔记本电脑和汽车)上执行机器学习算法,而不完全依赖云端处理。这种方法利用片上处理器,如神经网络处理单元(NPU)、中央处理器(CPU)和图形处理器(GPU)在本地执行AI任务。
1 ]: @8 M* R' ]: t+ i
kgsqbkl1e3k640106070653.png
$ M2 v$ d3 n" k" l5 _0 w2 I图1展示了设备端AI的概念,说明了智能如何向边缘设备转移,以及片上AI处理涉及的各种处理器。' L6 |9 }8 l$ `- ?3 H6 B0 o
$ i; g6 I$ g9 t3 y: a5 w
设备端AI的兴起正在改变多个领域,使设备、机器和"物品"变得更加智能和响应迅速。虽然云计算对于大数据汇集和训练AI推理算法仍然必不可少,但设备端处理通过提供即时、本地化的AI功能补充了这些能力。( {9 z6 N/ V7 \
6 ?3 M" M2 Z" H7 ?, v
设备端AI的优势和重要性
; l2 f& }* M) g. I与云端AI处理相比,设备端AI具有几个显著优势:
( a' q4 R/ Z6 T0 P: y$ r( u低延迟:通过本地处理数据,设备端AI大大减少了AI驱动任务所需的时间,这对实时应用很重要。增强隐私:将数据保留在设备上,减少了向外部服务器传输敏感信息的需求,从而提高了数据隐私和安全性。离线功能:设备端AI允许应用程序在没有互联网连接的情况下运行,确保在网络覆盖不佳或无网络覆盖的地区也能保持一致的性能。减轻网络负载:通过本地处理数据,设备端AI有助于减轻网络基础设施的负担,降低带宽需求和相关成本。降低功耗:在许多情况下,设备端处理比持续向云端传输数据消耗更少的电力。5 a4 o5 ?8 T+ N5 n8 P( ?4 G
8 T7 }1 ]% R& b, i5 [+ t
mcyry2klbb1640106070754.png
- @$ m4 H4 R0 R1 J图2展示了设备端推理的优势,突出了低延迟、隐私和可靠性等优点。9 z6 K# `4 u, q% J7 t4 D" W
* L4 K' D0 }" d应用场景的演变
. \/ I6 B4 G/ H; X; l设备端AI的发展迅速且具有变革性。让我们探讨应用场景和硬件如何随时间推移而发展:
, {+ z' U8 L5 t* P/ P
: _5 q+ Q) l* r2 y, PA. 2015年:早期设备端AI应用主要使用简单的卷积神经网络(CNN)进行基本任务。硬件仅限于标量和矢量处理单元。
0 Q7 J. K3 L8 q- _. ?1 y; ?1 j. f) V* h" _0 P0 Y# T3 P/ Y7 f R2 z
B. 2016-2022年:这一时期引入了更复杂的模型,包括Transformer、长短期记忆(LSTM)网络、循环神经网络(RNN)和高级CNN。硬件能力扩展到包括张量处理单元。
! q j: ~! ~1 {& F2 R* Z: C- }% r+ C1 c
C. 2023年:随着具有数十亿参数的大型语言模型(LLM)、大型视觉模型(LVM)和大型多模态模型(LMM)的出现,格局发生了巨大变化。硬件进步通过改进的张量处理和针对Transformer的优化支持这些复杂模型。
% N# _' ^7 n- B1 \$ T9 ` @! I6 z- }, Z
D. 2023年及以后:我们现在看到参数超过100亿的更大模型不断涌现,为复杂的AI助手、Stable Diffusion等图像生成工具和多模态生成式AI模型提供支持。硬件持续发展,引入微瓦片推理和增强对多模态AI任务的支持。 R1 N4 ? P3 e4 H
5ndik4hbfdp640106070854.png
" e2 \* I/ D% P0 P7 A
图3描绘了从2015年到2023年及以后设备端AI应用场景和硬件的演变,展示了模型复杂性和相应硬件进步的发展历程。5 ?* J0 o: u y! i$ q
7 D5 y$ F: {& U' a5 G) x
热设计影响
, g. G. c+ C. d4 X; u" h& f随着设备端AI能力的增长,在移动设备上运行复杂模型所带来的热设计挑战也随之增加。设备端AI的热设计影响受几个因素影响:工作负载依赖性:不同的AI任务会产生不同数量的热量,这取决于任务的复杂性和持续时间。设备散热解决方案:设备冷却系统的效果在管理AI处理产生的热量方面起着关键作用。硬件配置:处理器的特定组合及其功率特性会影响热输出。/ y! v" U' l, S+ B& ?
[/ol]( y3 o4 [* b% [
目前,许多移动设备和笔记本电脑可以在可接受的热限制内运行具有数十亿参数的LLM。然而,随着模型复杂性的持续增长,处理能力、内存和功耗方面的潜在限制可能会导致热设计挑战增加。& S) O* A2 }6 {1 K9 X1 H
wsgs3edjk1j640106070955.png
, @5 G* T/ [: Z. w3 W3 `图4说明了从移动设备到云服务器不同设备类型的模型复杂性和热限制之间的关系。
% ?4 g1 E% H. c7 K2 C- Z1 w4 k. p; j% K# u9 ]5 T* w. R
潜在解决方案
9 Z5 [5 G" f$ M. `7 P0 w& J# ^; n+ v为了应对设备端AI带来的热设计挑战,正在探索几种潜在解决方案:
$ [0 E3 d t+ k9 r1. 提高性能和降低功耗:提高AI处理单元的效率是管理热输出最有效的方法。最近的进展显示了显著的改进,一些处理器在更低的热量下实现了高达5倍的性能提升。
0 T p. I0 A$ `/ _ R
bmqhkkxhv2s640106071055.png
3 e2 i0 f5 e4 S/ [- Q1 J图5显示了Intel Core Ultra 7 155H处理器的性能改进,展示了一小时持续使用期间的NPU性能表现。: w: G! W8 U' B Q
0 H3 G8 g7 K2 F. `3 v) \5 L
2. 热缓解技术:实施类似于CPU使用的热管理策略可以帮助控制热量产生。这可能包括动态频率缩放和工作负载分配。
! w9 l/ n5 D& E( @( u
4 d8 G' N7 f, P! s3. 混合AI:这种方法根据任务复杂性和设备能力在云端和边缘设备之间分配AI工作负载。通过在必要时将复杂任务卸载到云端,混合AI可以帮助管理移动设备上的热输出,同时仍然利用设备端处理对适当任务的优势。
% w2 s# ~; w: P. O' w* H
/ l( c5 P3 ]4 B. A4. 封装创新:芯片封装技术的进步,如2.5D和3D集成技术,可以提高每瓦性能,潜在地减少热输出。
) ?6 c* k7 B' U9 E7 V* m' `. ]0 f* Q) ~' n- U! A
5. 持续AI研究:持续进行的AI架构和算法研究可能会导致更高效的模型,以较低的功耗和热量产生提供高性能。
) z1 G. \- J5 `& u! r; a! P
, K: p( v8 T* _9 Z' B, P; o+ M. G结论
4 v! R7 A0 t2 D, k5 t, e设备端AI代表了将智能功能直接带到边缘设备的重大进步。虽然提供了诸如低延迟、增强隐私和提高可靠性等众多优势,但在移动平台上运行复杂AI模型的热设计影响仍然是持续的挑战。
& n3 o1 l) \$ |1 a1 [% s! ?6 E$ X7 j! G0 Z3 s3 q
随着该领域的不断发展,硬件进步、高效模型设计和创新热管理技术的结合将是实现设备端AI全部潜力的关键。AI处理的未来在于在强大的本地计算和可持续的热管理之间取得平衡,为各个领域日益智能和响应迅速的设备创造条件。
+ [/ j O9 `- o9 @
ntphc3wvfmi640106071155.png
: B h5 z! W' K" B. i
图6总结了设备端AI的要点,包括其优势、当前状态以及克服热设计挑战的未来方向。
: l/ q! z- f% F" M' K9 m( {/ N5 S. m
参考文献
2 ]$ R% K7 d2 a* I6 D9 s% A0 O[1] N. Nikfar, "On-device AI and its thermal implications," in Hot Chips 36 Symposium (HCS), Aug. 2024, pp. 1-25.# _/ h7 p* b! _4 C- g* v9 h
2 J, Q* o( [ L5 v& H! n% X! ~9 JEND
9 y7 d2 f2 v# T& P% z8 L1 l. u* Y) t \. p4 C- O" {% {
9 i# p$ c3 Q4 L软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。* y7 l: I0 p2 W" K" V0 ]' G
点击左下角"阅读原文"马上申请+ g9 T- {* \( D+ s6 b( _
* e4 j8 m8 x3 ^/ ~ h0 n+ P8 {欢迎转载" [- D; O$ q0 e8 t" Z8 S3 \+ S
( E2 Z6 q) W3 g, H7 @, c# Z5 W& C
转载请注明出处,请勿修改内容和删除作者信息!
9 d, j6 B5 Q2 m0 o- A, V4 j
6 f3 F. ? P/ M5 Q3 H8 x* ^* r+ X! X* X
, G ]) L" n, O( B9 O) G2 z
3 {" k: g6 z6 G; O% f
1lqwypxr33g640106071255.gif
! j8 v: F0 ?; ^! ], W
' n* }, a2 g& I1 t
关注我们
$ V E7 t- d1 T/ a' x1 b- h- q d' y9 I; ]: x( H
5 L8 a- K/ w8 T1 d* b
obm3laxvpvr640106071355.png
2 F: q# h$ f. Q; Z: G3 H& P( V) Z1 P | " h2 I1 F/ D) }4 A
dtfpzuzy5jn640106071455.png
" q: v. ~/ Z4 o8 P6 N" {# _
| 5 \9 `' e; n, x
xld0mma5o3b640106071555.png
( u8 |$ @ u4 X& S7 B9 x8 f/ r | ' O0 w1 D9 O* @1 _; P6 u) N
' M' G# u4 z. J% h7 }3 d9 w5 V7 v# Q9 Y
5 m u9 Y" A x. R! l$ }4 z, u
关于我们:) K, Z, C! b- R+ C1 ~% f0 j% B! T
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。; U+ u+ Q8 O! o8 i- u) r8 A; F
( i$ Z- D4 @+ H- c
http://www.latitudeda.com/
7 Y2 n6 Y0 ~" i* C3 Y; o, w7 F(点击上方名片关注我们,发现更多精彩内容) |
|