|

引言
# p8 Z5 m$ N8 E( O: u; ?近年来,人工智能(AI)已成为我们技术环境中不可或缺的一部分。然而,尽管在AI基础设施上投入巨资,但显著的盈利突破仍然难以实现。本文将探讨AI基础设施当前面临的挑战,介绍光I/O作为解决方案的概念,并讨论其对未来AI盈利能力和性能的潜在影响[1]。3 [7 c% x8 x( X1 f
2 d& P. k7 W( U: N( P& k' B
人工智能基础设施挑战
' o4 Y- S* P% s1 c6 a! h; i, b随着ChatGPT推出接近两年,AI驱动的SaaS公司的淘金热已经遇到了障碍。这一挑战的根源在于芯片级的互连瓶颈,这严重影响了AI堆栈顶层的单位经济效益。+ f- |( @% R5 i8 G
" `. E& `! s+ D. B/ r, N7 X当前的AI模型在规模和复杂性上不断增长,但底层基础设施的能力和经济性未能相应扩展。这种不匹配导致硬件架构的总拥有成本(TCO)高昂且性能有限,这些架构受到电气I/O带来的带宽距离瓶颈的限制。4 d% q u/ p8 F8 e( B( p0 r- y
5emv2tcbgg064077132920.png
; r6 g1 F, l! T5 Y m
图1比较了当今领先的AI扩展解决方案和潜在未来解决方案的吞吐量与盈利能力。* H5 ^0 n! \- ~" M- m
& ^1 ~. b* b. e) D) f! |
当今大规模AI系统的主要瓶颈可归因于两个主要因素:内存带宽:这决定了从内存加载注意力缓存和模型权重到GPU所需的时间。扩展Fabric:这决定了专家/张量并行GPU之间通信激活所需的时间。
4 S" }& D1 t9 D( b[/ol]
r0 K5 F& X3 y/ {/ I传统的铜互连和可插拔光学在当前AI基础设施中未能有效地从封装到集群扩展计算进展。这一限制导致效率低下、功耗增加和成本上升。此外,铜互连将扩展域大小限制在单个机架内,限制了有效内存带宽和容量,最终限制了在这类集群上运行的推理模型的盈利能力和交互性。0 O6 ]( B, R4 n4 r7 J* r! s
6 q6 R0 I8 A. X0 x6 I引入光I/O的盈利之路
& {; }! a' @" D: b& R0 q' F为解决这些挑战并为AI盈利铺路,需要一种新方法:封装内光学I/O。这项创新技术有潜力将下一代GenAI的盈利能力提高20倍,并将交互性提高3-4倍。, v3 ~" S; }4 ?1 ? U
jegausryd1o64077133021.png
, [% v9 d! P3 ]' y图2展示了使用Ayar Labs光I/O解决方案的扩展网络。
/ y; N5 \2 S; C4 m! K! g$ M3 W" B" z: S' g7 J
光I/O通过实现以下优势为带宽距离瓶颈提供了明确解决方案:4 c# _# B) J5 l
提高推理和训练的应用级性能优化TCO指标,包括吞吐量、交互性和盈利能力能够在更大距离内连接更多GPU或加速器在不增加每机架功率的情况下提高集群性能* c0 w8 e# w# D( a# M, g$ z
1 v( F" h/ L% w8 N为更好地理解光学I/O对AI盈利能力的影响,让我们探讨大规模AI的三个关键性能指标:0 ?7 e3 x+ A; C/ e( d j
f0noqmazib464077133121.png
7 W( c+ h3 |4 u* G图3显示了大规模AI的性能指标,包括吞吐量、交互性和盈利能力。$ j. @ J2 m; Z( k& B
吞吐量:定义为用户数量除以每个输出token的时间,这个指标是AI应用盈利能力的关键组成部分。交互性:这表示AI模型在查看不同推理工作负载时的响应能力。定义为每个输出token时间的倒数。盈利能力:这个指标提供了成本结构和应用实现盈利空间能力的洞察。计算方法为吞吐量除以成本和功率。
0 T% s; G' t6 S9 t' r[/ol]5 o' }- M$ u9 E1 h2 y6 r
为准确预测AI推理应用级性能,研究人员开发了一个系统架构模拟器,考虑了各种输入,包括模型规格、技术组件、模型优化、算法细节、网络Fabric和成本。
2 G: i9 W3 T! e1 ]3 P
mvnl0qflxqn64077133221.png
f" l: L1 Y0 C0 [0 t, ], m3 t2 T0 w
图4展示了Ayar Labs用于预测AI推理应用级性能的系统架构模拟器。
( C5 z4 n: g6 x o$ R6 z, S# j+ A$ i0 F9 ?9 j
光I/O对当前和未来AI模型的影响
2 T+ e0 ?9 ~( o' J让我们检视光学I/O如何提高当前和未来AI模型的性能和盈利能力。& d+ @! m" g3 J
& Y& r3 Q% m8 K# Y; C9 x当前GPT-4推理工作负载:1 j/ P( [- i2 |! U) Z3 v
5qxgrwm5gbh64077133321.png
# A0 w' d5 M8 i# o+ R* B8 G
图5演示了光I/O如何显著提高当今GPT-4模型的批处理和人机AI推理工作负载的盈利能力(6倍)和交互性(4倍)。" ^/ R/ f! @% R
+ X- h0 h. `3 D+ l
对于当今约1.8万亿参数的GPT-4模型,光学I/O可以在两个关键领域显著提升性能:批处理:这涉及在大型数据集上运行机器学习模型,以生成批量信息的输出。例如电商网站上的产品评论摘要或基于观看习惯的流媒体电影推荐。人机AI交互:这专注于实时或在线服务,根据需要即时生成预测。例如ChatGPT和各种副驾驶产品。
) T: F) a3 e6 ?0 I[/ol]
$ j4 x0 r% \8 a未来GPT-X模型
- |1 N4 }4 L2 k8 n6 A/ q* L展望未来两到三年,我们可以预期约14万亿参数的GPT-X模型将变得普遍。与当前GPT-4模型相比,这代表模型规模增加了8倍。" G/ }! s: g r% j% {8 R7 Z3 `
wa14oritcu164077133422.png
! W: O# x# ^8 K: B* J- R3 M6 p$ ?, p
图6比较了当今的GPT-4模型与未来GPT-X模型的估计。 i1 R8 X! K( R4 x; W0 {
8 ]8 \+ p7 D7 Z对于这些未来模型,光I/O的优势变得更加显著:
1 l& H% b6 z7 p- b
fcaydgrmtsr64077133522.png
( M. r! [' v: x& G7 E图7说明了光I/O如何有潜力将未来GPT-X模型的盈利能力提高20倍,同时将交互性提高3-4倍。. o, v+ W* Z, R Z
. U/ x! d3 q! k" d3 J1 a2 w- d
根据系统架构模拟器,光学I/O有潜力:
+ f1 J7 K: ?8 M将盈利能力提高20倍将交互性提高3-4倍成为GPT-X未来模型所有用例的唯一可行技术0 O# o2 R; }: c+ B
1 O; b# q% U% {超越人机交互:实现多智能体推理模型$ z! L4 H3 ^; n2 Q) V
光学I/O最令人兴奋的前景之一是其能够实现超越当今人机交互的多智能体推理模型。这项技术使多个AI副驾驶或智能体能够在机器对机器的多智能体交互中相互通信。, Q: Z, X. \. b: u% ^- q5 p
0 J& I+ F+ B" E; _# }: ^9 S5 c
想象这样一个场景,一名工程师正在研发专利,并利用一个co-pilot来利用两个专门智能体的专业知识:专注于工程的智能体专注于法律的智能体- b+ [3 ^& `1 f/ p/ J1 \
[/ol]/ D% h8 m" y+ s0 ~ H" @6 v
这两个智能体将协同工作,提供快速、相关的洞察,显著提高co-pilot对工程师在专利开发中的价值。虽然基于当今的能力这似乎遥不可及,但光I/O使实现更接近。+ g& M0 R6 a- y- Z7 n
/ `) F$ X, }, h5 e* ~
克服数据中心基础设施挑战
8 p& p; ]2 J0 j0 G! o% O传统的电I/O需要将组件紧密堆叠以推动扩展性能,这从数据中心基础设施角度创造了两个显著问题:功率输送:大多数数据中心的设计不支持每机架120 kW的输送,因为典型的CPU机架为20 kW,加速器机架最高为40 kW。功率密度管理:需要冷却解决方案的重大进展来管理机架内的高功率密度。
0 l2 I9 ~& e, Q7 x* V[/ol]9 X- U) v- y6 t
01mk315yssl64077133622.png
* R1 s1 g q" C6 E2 v图8展示了Ayar Labs的光I/O如何非常适合AI扩展Fabric。
+ k' k( T# b! O2 K4 s# R1 h
) ^& x9 G6 ?% ]* ~: U光I/O通过使扩展Fabric能够在更大距离内连接更多GPU或加速器来缓解这些压力。这种集群性能的提高不需要增加每机架的功率。实际上,您可以在每个机架部署16或32个GPU或加速器,并构建更多更好地适应数据中心基础设施的机架,全部通过光学I/O连接。
# h4 {' N" {% K8 s6 E: ^) q) O: R+ M0 v
结论:人工智能基础设施的未来6 s! ~. E! n# B4 V+ D4 h$ v- V$ Y
展望AI基础设施的未来,很明显光学I/O代表着解决阻碍AI盈利能力挑战的转折点。通过打破带宽距离瓶颈并实现更高效的扩展Fabric,光学I/O为AI应用开创了新的可能性,从改进的人机AI交互到革命性的多智能体系统。
+ W" [5 N. R; z
u3tdyo3gu2q64077133723.png
8 I2 H3 c E* R1 T1 |! H! W图9呈现了下一代AI平台的理论路线图。- S$ l. K4 s1 y. a- h) T
7 L- R8 i6 t K' {( P C
对于寻求在"tokenomics"方面取得显著改进并确保当前AI投资带来重大经济产出和盈利的数据中心运营商和AI公司来说,采用光I/O技术将至关重要。随着我们继续推动AI能力的边界,光学I/O将在扩大交互性和连接性的盈利领域、解决功率和热密度问题以及最终释放人工智能全部潜力方面发挥关键作用。3 o: l- `' \+ g6 ^5 d6 l! q& w
6 l$ }7 d% v- Q* z; S- I7 V$ B参考文献
( }& x) n9 ?0 x* X[1] [Ayar Labs]. (2024, September 24). The Future of AI Infrastructure: A Path to Profitability with Optical I/O. Ayar Labs Blog. [Online]. Available: https://ayarlabs.com/blog/the-future-of-ai-infrastructure-a-path-to-profitability-with-optical-i-o/
% k& u6 u6 |8 E; T2 Q4 o
) ]( B4 s0 B+ H9 r( z% B! I" n2 |$ _- END -. m* j6 D( e* G5 t" M/ s
6 S v0 O# K: `+ I, M) \; d5 h4 w
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。3 n! p8 g4 r# { I! Y+ T
点击左下角"阅读原文"马上申请
4 f6 H0 p- f1 g0 _1 ~% Y& t: w/ u1 k8 I/ |' J/ L; e% C6 h: a
欢迎转载+ a+ E2 P8 p, f
! q. I8 _- S! a) m& r# V. w转载请注明出处,请勿修改内容和删除作者信息!
6 e2 B$ P' T5 p0 w5 [/ I# E
1 V3 {1 q- ~6 ~# h( W( u
' t7 V( x3 r# @+ P$ w. d
: ~! J; l& J# }2 F, T
tejhkioo2gd64077133823.gif
& C+ u. M' @/ ~' r
; _/ m, I0 i; F& l. C9 V( A
关注我们
) K0 q; e! W% }' a! ]3 L( X* e! ^ N1 q4 F
5 g7 a/ h2 r/ |( g( A
2ertjb2pwif64077133923.png
, a/ A+ T3 i! o+ Y: }. I
| " }: K% I9 r5 k6 L/ O' ]8 h9 ]" j
wdzz02e4n2b64077134023.png
* g1 K- v R* M+ X: e. t
| ' N. N3 h# k( C* n) a
pqb421kfeqb64077134123.png
, z0 o* V% z; J9 p' L2 e | ( K" [$ f% x# _% B) U( P( L
. i: |+ v, D, d6 \1 M
, Z3 }/ s# z3 V* z
5 g: Z! ~8 o! d( Y w8 z* {关于我们:
- R5 S6 S# I5 ?深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。8 {$ `! v# e! r# z0 i3 A3 ]1 z& x
3 h K2 @. v2 ~) L" Ihttp://www.latitudeda.com/5 A* q$ _; n6 k& n5 l4 Q
(点击上方名片关注我们,发现更多精彩内容) |
|