电子产业一站式赋能平台

PCB联盟网

搜索
查看: 213|回复: 0
收起左侧

Hot Chips 2024 | 大型语言模型和检索增强生成技术介绍

[复制链接]

847

主题

847

帖子

7937

积分

高级会员

Rank: 5Rank: 5

积分
7937
发表于 2024-10-2 08:00:00 | 显示全部楼层 |阅读模式
引言
: w* ~/ |! Z# f/ x- ]5 p3 W本文旨在帮助读者了解大型语言模型(LLMs)和检索增强生成(RAG)技术的基础知识。这些技术正在电子设计自动化(EDA)领域产生重大影响,正在改变芯片设计和验证的方式[1]。
( `, ^4 H9 ^9 s
2 h7 I1 X5 \% B  `4 @什么是大型语言模型?6 m" f" O0 J% H8 H0 R1 e1 T7 B
大型语言模型是设计用于理解和生成类人文本的先进神经网络。这些模型经过海量数据训练,能够执行从简单的文本补全到复杂推理和代码生成等各种语言任务。) y" X! L0 X6 L

xgwwqjp40hv64041748243.png

xgwwqjp40hv64041748243.png

, j5 t* `( b' s) Y2 }9 Y$ Q1 w图1:AI概念层次结构,显示了LLMs在人工智能广泛领域中的位置。
* }, y/ p; O9 C/ j; Z$ G3 s0 ?: C+ ^' |$ c2 e
LLMs建立在复杂的神经网络架构之上,通常包含数十亿个参数。这些参数在训练过程中不断调整,模型需要接触大量文本数据。例如,Meta的Llama 3.1模型在训练过程中处理了超过10万亿个单词,需要约60天的训练时间和20,000多个Nvidia H100 GPU。0 Y; f  g% V. M$ N  f
1 z' n  W3 G& p
这些模型的规模差异很大,从约70亿参数到超过1万亿参数不等。开放和封闭模型的选择取决于架构和权重的公开可用性。通常使用量化技术来压缩权重,在模型大小和准确性之间取得平衡。
  a2 e. e  A% {: Z
3 L' S- r0 v( \7 {) n/ {. [LLM架构和功能
7 F& b1 D  f( R现代LLMs的核心是Transformer架构,由Google DeepMind在2017年的论文"Attention is All You Need"中首次提出。这种架构通过引入自注意力机制彻底改变了该领域,使模型能够同时处理整个文本序列,而不是按顺序处理。
, E! Y+ S; r. Q" k( c+ a1 a6 a- Y' n# v; i6 ^) M

r34a2zpttk464041748344.png

r34a2zpttk464041748344.png

7 [/ R& m  }0 a图2:原始Transformer架构,展示了编码器和解码器组件。
  h, c. l$ h, y' f
! n+ Z# n2 b4 yLLM的关键组件包括:
  • 分词:将输入文本分解成可管理的单元(称为标记)。
  • 嵌入:将标记转换为数值向量表示,捕捉语义含义和单词之间的关系。
  • 注意力机制:从嵌入中计算上下文相关的权重,关注输入的相关部分。
  • Transformer层:通过多层自注意力和前馈神经网络处理嵌入。2 V8 |: w2 L! J/ k3 D1 m& }0 g' l) g
    [/ol]& C9 U# w. C( V' W& i+ n! P% r
    LLM训练和局限性
    3 t' m+ b; z7 [" J训练LLM是复杂且资源密集的过程,通常包括三个阶段:
  • 预训练:模型接触大量文本数据,学习一般语言模式和知识。
  • 微调:预训练模型在特定任务数据上进行进一步训练,以专门化其能力。
  • 人类反馈强化学习(RLHF):可选阶段,根据人类偏好优化模型输出。
    9 r* X6 B' ^( W* Z( ^) h[/ol]' j3 p; z7 |2 A8 @6 z
    尽管LLMs具有令人印象深刻的能力,但也存在几个局限性:
    6 E6 r' \1 L% J& T. |6 b$ O
  • 在复杂的数学和逻辑推理方面存在困难
  • 基于训练数据可能产生有偏见的输出
  • 知识截止于训练时间
  • 可能产生幻觉或自信地陈述错误信息
  • 训练和推理需要高昂的计算和能源成本
  • 关于数据使用和潜在滥用的伦理问题
    7 B# g2 i7 m8 q) {, v
    3 i# m' y1 z5 D) i4 d- C9 t
    检索增强生成(RAG)3 C6 y+ r$ H7 q4 x- E
    为了解决一些限制,特别是知识截止问题,检索增强生成(RAG)技术应运而生。RAG使LLMs能够在生成过程中访问和整合外部信息。" {/ h: U  Z% S

    . P6 P1 s3 m: P1 l. z0 U

    xuq1qy2qrj064041748444.png

    xuq1qy2qrj064041748444.png

    " |  L1 U. R$ l. U0 ?8 a: b9 s图3:RAG架构,显示了从原始数据到LLM响应的流程。1 Y0 q) \( S1 F7 F- j

    $ y1 ]2 P+ `4 q  {- uRAG过程包括:
  • 索引:将原始数据转换为嵌入并存储在向量数据库中。
  • 检索:接收查询时,从向量数据库中检索相关信息。
  • 增强:将检索到的信息与用户的提示结合。
  • 生成:LLM处理增强后的提示以产生响应。
      ?; n' D! Y% y% e5 i[/ol]) f' x9 ^$ j5 q$ s- u
    RAG允许LLMs利用专有信息、最新数据和已知事实,减少产生幻觉的可能性,并扩展模型的有效知识库。# j& b- x# j  v$ Z5 e, [. X

    9 y1 F7 M. r" {) ?, y1 _" _在电子设计自动化(EDA)中的应用
    # V9 H" i* [+ ]- A5 }LLMs和RAG技术在电子设计自动化领域找到了众多应用。关键用例包括:
    " ?1 ?, U5 M; Q0 r( m
  • 架构设计和优化
  • 代码生成和调试
  • IP集成和管理
  • 设计验证和文档编写
  • 入职支持和培训
    8 ~5 T- D( }  Z$ g% L
    9 m, x3 b& R' T& q: F# @
    0 j+ h5 N6 J& n* C/ E2 F( s

    pd5a1epyrls64041748544.png

    pd5a1epyrls64041748544.png
    & _: l& m" y2 e* p4 x8 R  l
    图4:EDA工作流程的演变,显示随着AI技术的进步,人为干预需求的减少。
    " ~0 X. Q4 l+ r( {
    + T: o7 M7 g0 m将LLMs和RAG集成到EDA工作流程中,有望减少许多任务中对人为干预的需求。例如,AI代理现在可以处理复杂的设计任务,如创建具有99%代码覆盖率的UART接收器和测试平台,并自动将文件提交到存储库。
    $ F& U# Q" ^6 i( h) }6 j% O! O# D" F8 @5 F# L' `/ v0 _

    vva5apz0qcq64041748644.png

    vva5apz0qcq64041748644.png
    9 S5 v/ b! g; b3 c. N
    图5:基于LLM的AI代理工作流程,演示如何自动化复杂的EDA任务。
    8 G' Q$ w6 B& c- e% R
    , F4 ?7 F# @  x/ K8 {5 y4 O& g未来方向和挑战8 C, Z  P/ n1 T9 D5 t3 Y
    随着LLMs和RAG技术的不断发展,我们可以期待在其能力和应用方面出现几个进展:
    9 U' A& S6 S: d, z. |/ ^
  • 使用网络信息进行自我事实检查
  • 通过"慢思考"方法提高推理能力
  • 更大的上下文窗口以处理更长的提示
  • 多模态能力,包括语音和图像处理
  • 与外部存储系统集成,增强长期记忆) D% N' M! f0 \) V+ X% n2 o# G
    ; O) d' v# s6 J3 Y* d0 y) p, q% g* c
    然而,仍然存在一些挑战,包括:" Z$ C+ E* G) y
  • 确保在设计过程中合乎伦理地使用AI
  • 管理大规模部署所需的计算资源
  • 解决EDA行业潜在的劳动力变动
  • 处理与训练数据相关的法律和版权问题3 r& _  c* u3 n/ @
    & l, {4 i8 I$ e
    大型语言模型和检索增强生成技术的结合有望彻底改变电子设计自动化领域。通过减少许多任务中对人为干预的需求,这些技术有望加速创新并提高芯片设计和验证过程的效率。随着该领域的不断发展,EDA专业人员必须及时了解这些进展,并调整工作流程以利用AI辅助设计的力量。/ f$ X; d  t+ v6 z( \0 h" R

    # a7 o/ G. A6 U参考文献
    ; H# I# o) Q, d8 F[1] H. Bouwmeester, "HotChips 2024 Tutorial: From LLM+RAG to EDA AI-Agent," PrimisAI, 2024.
    4 b+ o! K1 t/ R; R. R1 z1 m. S  x# h- x- T% R
    - END -
    0 X  k+ _1 _+ w$ s- ^, [
    4 v) K, R0 H( v% [6 N软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    # N% C0 K4 g; |% K点击左下角"阅读原文"马上申请
    $ ?5 {' B! s( J
    1 G' G) C/ q* n# j欢迎转载8 s  Y4 P# H$ g! \; v: _8 i

    9 ?) X( H) C! q1 U! j+ q转载请注明出处,请勿修改内容和删除作者信息!
    $ c% C/ I' Z4 J7 U# O
    ' K# W0 p+ J6 H3 M  @- H/ Y. `/ p  n% V+ q4 D
    ( @* g' n: K- p0 L1 U! j

    dimgwmjgfe264041748744.gif

    dimgwmjgfe264041748744.gif
    0 w- f2 {' q5 ~0 W; Q  d

    # }( v9 T; |$ F# r$ p& h关注我们
    2 Q- g" ]+ k! P. d% ?& t$ I0 w4 c( ~6 x% C
    9 [, ?- Y' X* K, u& g. M5 `0 q

    gxs4ammk2c564041748844.png

    gxs4ammk2c564041748844.png

    , g& ?5 K  U2 q" a/ T. |4 ]

    9 f- F4 C9 g7 F+ N  t" i' u

    0avedeev40g64041748944.png

    0avedeev40g64041748944.png
    2 G! U* D) S: S" R7 k: N

    , c: t* a( M: b0 {; @9 M

    nuvmosao54y64041749044.png

    nuvmosao54y64041749044.png

    5 t& O2 F6 @, e8 q. _* @$ {: o
                          , ~" B" g- r; h6 I. n2 l5 Q4 v
    5 \! I+ g. o* F% X8 Z; m

    4 i% l8 T: D( G1 _
    1 E$ W5 L0 w/ ^% U% }关于我们:
    ( p6 v0 C2 b, B# s2 R深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。0 [/ s3 E; Q! a9 K1 a  J
    ; u' i8 J% T' F- N) e, Z5 g. `2 ]6 w
    http://www.latitudeda.com/
    - l, h/ J, H9 B# v" @(点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表