独家整理：GPU概念相关的10个常见问题

阅读模式 · 发表于 2024-8-27 08:35:00

一、GPU典型问题梳理-For新手
随着AI人工智能的火热，GPU卡和GPU服务器市场的需求也持续攀升，服务器相关领域的朋友对GPU相关问题的讨论也越来越多。我整理了常见的10个问题给大家做个专题分享。

如果你对如上问题都很清楚，下文可以不用看了！！
二、CPU和GPU芯片的对比

在计算机系统当中，GPU（图形处理单元）和CPU（中央处理单元）是两个至关重要的概念。它们分别承担着不同的任务，拥有不同的体系结构和设计理念。

CPU：中央处理单元，是计算机的大脑，必不可少，所有的工作都需要CPU来指挥或指挥&处理才能完成。

GPU：图像处理器，是协助CPU处理特定工作的，也加协处理器或者加速计算单元，在服务器、PC、工作站、游戏主机、手机、平板等往往都需要GPU。
CPU和GPU在架构组成上的差异：
两者虽然都是运算的处理器，在架构组成上都包括3个部分：运算单元ALU、控制单元Control和缓存单元Cache。但三者比例却相差很大。

在CPU中缓存单元约占50%，控制单元25%，运算单元25%；

在GPU中缓存单元约占5%，控制单元5%，运算单元90%。
三、GPU和显卡的区别
日常的材料和交流中往往大家GPU和显卡画了等号，不能说有错，但严格意义上讲还是有区别的。打个比方， GPU和显卡就像是CPU和主板的关系，GPU是显卡的心脏，CPU是主板的心脏。显卡除了包括GPU，还有一些显存、供电、稳压模块、总线、风扇、外围设备接口等。

四、GPU和GPGPU的区别
随着人工智能技术快速发展，除了图形相关算力需求外，对CPU通用计算能力的要求也越来越高。这时，GPGPU应用而生。全称是General Purpose GPU，即通用计算图形处理器。第一个“GP”就是通用的意思，可将GPGPU理解为一个更专的GPU（能力更聚集），主要进行非图形相关程序的运算。

GPGPU架构设计时，去掉了图形处理的单元，保留了GPU的SIMT架构和通用计算单元。使之更适合高性能并行计算，并能使用更高级别的编程语言，在性能、易用性和通用性上更加强大。目前市场主流的A800、H800、昇腾910B、海光DUC等都属于GPGPU的范畴。
五、GPU分类：消费卡、专业卡和数据中心卡
NVIDIA的显卡目前可以按照应用领域大致分为三种类型：

GeForce消费卡：面向游戏娱乐领域：如GeForce RTX? 4090、GeForce RTX? 3090等。

Quadro专业卡：面向专业设计和虚拟化领域：如NVIDIA RTX? A6000、NVIDIA? T1000等。

Tesla数据中心卡：面向深度学习、人工智能和高性能计算领域：如NVIDIA H800\A800 Tensor Core GPU等。
市场定位不同，服务器大厂是不公开卖消费卡的。
三个分类在英伟达官网的截图实例如下：

六、涡轮卡和风扇卡的区别
做服务器的朋友都知道，目前GPU服务器通常要求显卡是涡轮的，到底和风扇的有啥区别呢？英伟达20系列显卡之前，公版显卡一直是采用涡轮散热器的，不管是AMD还是英伟达，公版显卡全部都是采用涡轮散热器，20系列以后显卡，风扇版显卡开始推广开来。

1、涡轮版显卡又称涡轮散热器显卡。
特点是：涡轮散热器从涡轮开孔处吸入冷空气，然后将冷空气向四周360度抛散，进而穿过散热鳍片，带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
2、涡轮版显卡又称涡轮散热器显卡。
特点是：涡轮散热器从涡轮开孔处吸入冷空气，然后将冷空气向四周360度抛散，进而穿过散热鳍片，带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。
七、显卡的公版和非公版
公版显卡就是英伟达（NVIDIA）与AMD官方售卖的显卡，非公版就是各大厂品牌商购买GPU芯片后自己组装的显卡，个人消费市场一般比较多的就是非公版显卡。

公版显卡特点：
没有花里胡哨的设计，而且公版显卡不是每个芯片都会推出，有些显卡芯片只有公版参数，但没有推出公版显卡。
非公版显卡特点：
非公版显卡由其他显卡生产商基于官方芯片生产，比如华硕、七彩虹、微星、影驰等品牌显卡，
非公版显卡除了外观更为吸引眼球，主要差异还在于频率和一些散热设计。有一些非公版显卡，它们的频率超越了公版标准。这类显卡在同等级别的产品中，用料和设计都更高端，特别是在散热方面，厂商往往下足了功夫，大概分为顶级非公、普通非公、改版非公。
八、PCIE和SXM接口的卡
随着NVLink整机的火爆，英伟达的SXM（Scalable eXtensible Module）接口卡也被大家熟知，到底和标准的PCIe 接口卡有何区别，主要在设计理念、应用场景以及性能特点上的总结如下：

对比项	SXM卡	PCIE卡
接口类型	SXM是NVIDIA的高端GPU的专用接口。	计算机系统的通用接口，通用性强，更灵活。
互联速率	使用NVLink技术实现GPU之间的高速连接，支持多GPU直接互联，	受限于PCIe的版本和协议速率，远低于SXM NVLink的互联速率。
供电与冷却	SXM接口支持供电，无需外部电源线，可采用更高效的冷却选项，支持TDP更高	受限于PCIe槽位供电和服务器主板的供电，TDP要低于SXM卡
维护性	英伟达一体化设计，八卡一体，往往故障维护不灵活	出现问题时，维护门槛低

九、英伟达HGX和DGX等

十、 Nvlink 和Nv Switch
1、Nvlink是一种互联技术，也指通信的链路。
2、Nv Switch是基于Nvlink技术的芯片或者设备。
3、在服务器内部NvSwitch就是芯片，跨服务器互联就是搭载芯片的Nv switch设备。

十一、以A800、H800阉割前后参数对比
为了合规，A800相对比较厚道，仅限制了GPU之间的互联带宽，从A100的600GB/s降至400GB/s，算力参数无变化。H800则对算力和带宽都进行大幅调整，尤其是HPC领域相关的双精度算力（FP64）几乎归零。

* 系数矩阵
** SXM4 GPUs via HGX A800 server boards, PCIe GPUs via NVLink Bridge for up to 2-GPUs
----老张会持续通过公众号分享前沿IT技术，大家多多点赞和关注！