电子产业一站式赋能平台

PCB联盟网

搜索
查看: 39|回复: 0
收起左侧

独家整理:GPU概念相关的10个常见问题

[复制链接]
匿名  发表于 2024-8-27 08:35:00 |阅读模式
一、GPU典型问题梳理-For新手
随着AI人工智能的火热,GPU卡和GPU服务器市场的需求也持续攀升,服务器相关领域的朋友对GPU相关问题的讨论也越来越多。我整理了常见的10个问题给大家做个专题分享。

如果你对如上问题都很清楚,下文可以不用看了!!
二、CPU和GPU芯片的对比

在计算机系统当中,GPU(图形处理单元)和CPU(中央处理单元)是两个至关重要的概念。它们分别承担着不同的任务,拥有不同的体系结构和设计理念。
  • CPU:中央处理单元,是计算机的大脑,必不可少,所有的工作都需要CPU来指挥或指挥&处理才能完成。
  • GPU:图像处理器,是协助CPU处理特定工作的,也加协处理器或者加速计算单元,在服务器、PC、工作站、游戏主机、手机、平板等往往都需要GPU。
    CPU和GPU在架构组成上的差异:
    两者虽然都是运算的处理器,在架构组成上都包括3个部分:运算单元ALU、控制单元Control和缓存单元Cache。但三者比例却相差很大。
  • 在CPU中缓存单元约占50%,控制单元25%,运算单元25%;
  • 在GPU中缓存单元约占5%,控制单元5%,运算单元90%。
    三、GPU和显卡的区别
    日常的材料和交流中往往大家GPU和显卡画了等号,不能说有错,但严格意义上讲还是有区别的。打个比方, GPU和显卡就像是CPU和主板的关系,GPU是显卡的心脏,CPU是主板的心脏。显卡除了包括GPU,还有一些显存、供电、稳压模块、总线、风扇、外围设备接口等。

    四、GPU和GPGPU的区别
    随着人工智能技术快速发展,除了图形相关算力需求外,对CPU通用计算能力的要求也越来越高。这时,GPGPU应用而生。全称是General Purpose GPU,即通用计算图形处理器。第一个“GP”就是通用的意思,可将GPGPU理解为一个更专的GPU(能力更聚集),主要进行非图形相关程序的运算。

    GPGPU架构设计时,去掉了图形处理的单元,保留了GPU的SIMT架构和通用计算单元。使之更适合高性能并行计算,并能使用更高级别的编程语言,在性能、易用性和通用性上更加强大。目前市场主流的A800、H800、昇腾910B、海光DUC等都属于GPGPU的范畴。
    五、GPU分类:消费卡、专业卡和数据中心卡
    NVIDIA的显卡目前可以按照应用领域大致分为三种类型:
  • GeForce消费卡:面向游戏娱乐领域:如GeForce RTX? 4090、GeForce RTX? 3090等。
  • Quadro专业卡:面向专业设计和虚拟化领域:如NVIDIA RTX? A6000、NVIDIA? T1000等。
  • Tesla数据中心卡:面向深度学习、人工智能和高性能计算领域:如NVIDIA H800\A800 Tensor Core GPU等。
    市场定位不同,服务器大厂是不公开卖消费卡的。
    三个分类在英伟达官网的截图实例如下:

    六、涡轮卡和风扇卡的区别
    做服务器的朋友都知道,目前GPU服务器通常要求显卡是涡轮的,到底和风扇的有啥区别呢?英伟达20系列显卡之前,公版显卡一直是采用涡轮散热器的,不管是AMD还是英伟达,公版显卡全部都是采用涡轮散热器,20系列以后显卡,风扇版显卡开始推广开来。

    1、涡轮版显卡又称涡轮散热器显卡。
    特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
    2、涡轮版显卡又称涡轮散热器显卡。
    特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
    七、显卡的公版和非公版
    公版显卡就是英伟达(NVIDIA)与AMD官方售卖的显卡,非公版就是各大厂品牌商购买GPU芯片后自己组装的显卡,个人消费市场一般比较多的就是非公版显卡。

    公版显卡特点:
    没有花里胡哨的设计,而且公版显卡不是每个芯片都会推出,有些显卡芯片只有公版参数,但没有推出公版显卡。
    非公版显卡特点:
    非公版显卡由其他显卡生产商基于官方芯片生产,比如华硕、七彩虹、微星、影驰等品牌显卡,
    非公版显卡除了外观更为吸引眼球,主要差异还在于频率和一些散热设计。有一些非公版显卡,它们的频率超越了公版标准。这类显卡在同等级别的产品中,用料和设计都更高端,特别是在散热方面,厂商往往下足了功夫,大概分为顶级非公、普通非公、改版非公。
    八、PCIE和SXM接口的卡
    随着NVLink整机的火爆,英伟达的SXM(Scalable eXtensible Module)接口卡也被大家熟知,到底和标准的PCIe 接口卡有何区别,主要在设计理念、应用场景以及性能特点上的总结如下:
    对比项
    SXM卡
    PCIE卡
    接口类型
    SXM是NVIDIA的高端GPU的专用接口。
    计算机系统的通用接口,通用性强,更灵活。
    互联速率
    使用NVLink技术实现GPU之间的高速连接,支持多GPU直接互联,
    受限于PCIe的版本和协议速率,远低于SXM  NVLink的互联速率。
    供电与冷却
    SXM接口支持供电,无需外部电源线,可采用更高效的冷却选项,支持TDP更高
    受限于PCIe槽位供电和服务器主板的供电,TDP要低于SXM卡
    维护性
    英伟达一体化设计,八卡一体,往往故障维护不灵活
    出现问题时,维护门槛低



    九、英伟达HGX和DGX等

    十、 Nvlink 和Nv Switch
    1、Nvlink是一种互联技术,也指通信的链路。
    2、Nv Switch是基于Nvlink技术的芯片或者设备。
    3、在服务器内部NvSwitch就是芯片,跨服务器互联就是搭载芯片的Nv switch设备。



    十一、以A800、H800阉割前后参数对比
    为了合规,A800相对比较厚道,仅限制了GPU之间的互联带宽,从A100的600GB/s降至400GB/s,算力参数无变化。H800则对算力和带宽都进行大幅调整,尤其是HPC领域相关的双精度算力(FP64)几乎归零。

    * 系数矩阵
    ** SXM4 GPUs via HGX A800 server boards, PCIe GPUs via NVLink Bridge for up to 2-GPUs
    ----老张会持续通过公众号分享前沿IT技术,大家多多点赞和关注!
  • 本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有账号?立即注册

    x
    回复

    使用道具

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表