|
引言9 F/ i/ [ B# z% N6 c: D
大型语言模型(LLM)的出现推动了AI能力的快速发展。然而,这些进步的经济可持续性取决于解决关键的硬件限制。本文基于 Ayar Labs CEO在"The Economics of AI are Failing, But We Can Fix It (With Lasers)"的见解,探讨了AI扩展面临的经济障碍,特别是从以用户为中心向基于代理的工作流转变,以及光学互连在塑造可行未来中的作用[1]。 i5 k7 _( n, a$ V" R% M) q
* C9 k5 E; f, t5 }6 P( I; W- Y
当前AI经济:盈利困境% Z* [ w- Q* i$ u# n& O) e/ l
尽管AI生态系统从芯片制造到软件开发都有大量投资,但许多参与者仍难以实现盈利。这一困境源于当前以计算为中心的硬件设计,难以满足LLM不断增长的需求。这些模型需要庞大的内存容量、强大的计算能力和高内存带宽。结果,公司不得不购买更多硬件,主要是内存控制器,仅仅为了容纳不断扩大的模型规模,从而增加了成本。
! ]3 p) c* \! ` x y
# f5 t) t( p! g" r更复杂的是现有互连技术如以太网和专用Fabric技术(如Infinity Fabric和NVLink)的限制。这些技术虽然提供高带宽,但在距离和可扩展性方面受到限制。这使得高效连接大量芯片变得困难,阻碍了更强大、更高效AI系统的发展。
- s* I& v( |) s3 {" B7 t, U: C e9 @. {
4xgda2wfg5364096564155.png
5 U! g, L4 v% R. ]- y1 m7 y( f/ A+ G
1 b; [4 m' f) }' O
从以用户为中心到基于代理的AI:范式转变$ k) p! i- a8 O' w( _% |6 G r
AI工作负载从用户-模型交互向代理-代理交互的演变对现有硬件基础设施提出了重大挑战。在用户-模型工作流中,用户与单一模型交互。这种工作流在硬件资源分配方面相对简单。然而,代理-代理交互(多个模型相互通信以满足用户请求)引入了新的复杂性。这种基于代理的方法虽然提供了更大的灵活性和潜在的更好结果,但大大增加了对内存、计算资源和互连带宽的需求。" }- K G# Z7 A3 |# A
7 a0 H6 u, v- W' X, ^
随着代理链中模型数量的增加,处理所需的token总数成倍增长,直接影响成本和延迟。此外,链的整体延迟必须保持在用户可接受的限度内,这进一步给系统带来压力。
" _# Z1 q4 E% b3 t9 { \' O8 _7 x; X4 s2 {' d
例如,三个模型的菊花链使所需的token总数增加三倍,导致成本和延迟增加三倍。这凸显了迫切需要能够高效处理日益复杂的基于代理工作流需求的硬件解决方案。
" n2 E6 @$ U( M8 z6 c
fzdzoweajse64096564256.png
# }. |( Y# l) O' o; ?
, o( z8 {0 f3 t$ I/ ?( h光IO:可扩展性和效率的途径9 O9 F0 A7 d6 A `: S& z
目前基于铜的互连的局限性突显了更可扩展、更高效解决方案的需求。光学IO作为一种有希望的替代方案出现,利用光速进行数据传输。这种技术提供了显著优势:更高带宽:光IO超越了当前以太网和Fabric技术的能力。更高密度:这种技术能在给定空间内实现更高的带宽集中度。更低延迟:光IO减少了数据传输相关的时间延迟。5 k; b# ?) c0 n# c8 }
[/ol]5 w: @7 Q6 d0 K9 Z2 |
通过用光互连替代铜链路,可以将AI系统扩展到单个机架之外,以全连接配置连接数百甚至数千个芯片。这实现了更高效的资源利用,促进了更大、更复杂的基于代理AI系统的发展。4 k3 @- w: P5 l. |6 ?' t
y3zongwtuht64096564356.png
# I |, [# c6 M. C- g0 p
0 O+ T/ e) I8 @, \: @3 E4 Y' y' G1 ]
超越计算:平衡硬件设计方法
% L; h' v+ r$ p9 F# I: OAI硬件设计中对计算能力的主要关注需要与更多关注内存带宽和连接性取得平衡。这种观点的转变需要从简单增加内存转向开发优化计算、内存和互连相互作用的架构。% z8 H3 \" n1 s
+ }: q! m- z4 X1 }
一种有希望的方法涉及将光IO直接集成到芯片设计中,创建更紧密耦合和高效的系统。这可以通过光电共封装和硅基光电子等技术实现,允许芯片和内存模块之间进行高带宽通信。! s( c4 `% g9 K& }8 r1 T
! D; b* b/ W% f+ K7 O, c s7 r) \* {
示例说明
! U: X, j, ~0 B, ~ Z! IAyar Labs示例,其中标准ASIC配备8个HBM模块,并增加了10个光IO chiplet。这些chiplet可以连接到1TB内存库,有效扩展了ASIC的内存容量。这种方法为ASIC提供了快速HBM和高带宽光学连接到大量外部内存的访问。- M" p' D5 g$ f
pu4vbnphwen64096564456.png
/ x, l8 G4 Q* l$ R9 U+ X% ~
! s! _" M9 n8 X1 d这种方法解决了目前阻碍AI系统扩展的内存瓶颈,使其能够处理复杂AI工作负载不断增长的需求。: d; X1 Z' H- x, k1 O8 A. s3 z* q
ffluzv0ow3e64096564556.png
$ P4 h9 t# }- O2 @( n5 v
上图展示了传统互连和光学IO在关键性能指标上的比较,光IO在带宽、延迟、密度和可扩展性方面都具有显著优势。
5 l g' _* W/ ^3 [1 O' e3 P3 |8 B, c" a7 `- V, U1 {
塑造可持续AI未来:整体视角8 L# k- k) X8 B5 e$ z3 l2 |
实现AI的变革潜力并确保其经济可行性需要一种涵盖整个AI生态系统的整体方法。这包括硬件设计、软件开发和服务交付。: [ q! O% S# W4 f( _
6 j; W, j; E9 M. {7 b9 O% i' I关注的主要领域:高效和可扩展的硬件架构:从以计算为中心的方法转向平衡设计,集成高带宽连接和充足的内存容量。优化的软件框架:开发能够高效管理多个模型之间通信和数据流的框架,最小化基于代理工作负载中的延迟并最大化吞吐量。灵活和可扩展的云基础设施:实现动态资源分配和重新配置,以适应推理工作负载的波动需求。$ u5 f' c$ p0 E
[/ol]
' W2 u& H* `* g当前AI经济状况既带来挑战也提供机遇。现有硬件基础设施的限制突显了创新和架构范式根本转变的迫切需求。采用光IO等技术并采取更平衡的硬件设计方法可以克服当前阻碍先进AI系统发展的可扩展性和效率障碍。
: t' b/ F3 F% G2 {; ?2 l3 `- i) E4 w
- o( t& x# ] O! I3 g从用户-模型到代理-代理交互的转变虽然要求很高,但展示了AI的未来。复杂和互连系统将为广泛应用提供动力。解决与这一转变相关的经济挑战对于释放AI的全部潜力并培育更可持续和有益的技术环境至为重要。
8 I) U s9 F. ~& A/ g' Q. I% \7 V$ c M) h' k. O" W% J! v
参考文献
- H0 u T$ u$ U! v[1] TechTechPotato, "The Economics of AI are Failing, But We Can Fix It (With Lasers)," YouTube, Sep. 25, 2024. [Online]. Available: https://www.youtube.com/watch?v=gsW4dLYb55c.6 L( k7 E4 |7 {; w
END
. |0 j: c; P/ F
* o7 o* L2 A! W1 y! c; |% |* e
: v5 `& }4 u3 U7 {. A3 x V软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
' |$ |( Y0 ]/ ~. o7 E点击左下角"阅读原文"马上申请3 a# y% p* G4 k! `- {
+ r9 G1 Y" A# h* v/ F( e, `/ b* |" O
欢迎转载. i, w5 ?* j% j+ I' T' D
* h3 N6 T- t# d' r1 B% U; F/ m
转载请注明出处,请勿修改内容和删除作者信息!
. h, p3 I3 r ~# _' M
; l/ j- g8 B4 D g Q6 C8 P& c( b! E0 i2 b0 W; n5 E, E
- w8 W3 z+ Y) o& E. _
lubqb5eolna64096564656.gif
$ G9 Z) \5 @! k1 A/ g
" s; j S7 r G关注我们% ~& s# b5 H) _
5 H* ^ E4 H7 x. y0 ?
; ^0 p, B. ^1 t2 r2 L/ x
usem40bqnxv64096564756.png
" S4 a/ U9 F- q |
^0 K% g$ G9 y- A
gmy3grp3eb364096564856.png
4 i* Y+ Y+ ]3 X( W1 }. n h |
7 ?9 `5 ?1 q a% K5 k" o9 W: P+ N/ F
btweanyrm3q64096564956.png
8 I) z- d9 S" j; w; M
|
. R$ H3 S+ ?/ \# x$ p, R9 E: i4 b3 y. ~" m, m' ^
# }4 C/ O/ C2 W& l
8 [/ @" P7 N& W# \! p8 c关于我们:$ |" \6 a2 R6 Z, J; `9 u
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。- N, z. g+ O1 O
1 @# k& I5 u! p3 r/ W2 a/ ]
http://www.latitudeda.com/
/ ]0 P. A2 ?9 }: K(点击上方名片关注我们,发现更多精彩内容) |
|