GPU加速卡对PCB性能的作用是什么？

AI 服务器是专门为运行人工智能算法和处理大规模数据而设计的高性能计算机，它们通常具备高处理能力、大内存和高速存储器、多核心处理器、高速网络接口等特点，能够应对复杂的计算任务和大数据量的处理任务。 AI 服务器中 PCB 价值量的提升主要体现在以下几个模块：GPU 加速卡（OAM），主要由 GPU 芯片、内存芯片、电源模块、散热器等部件组成，通过 PCB 板来连接和传输信号。GPU 加速卡可以分为两种类型：SXM 版本和 PCIE 版本。SXM 版本是指使用 NVIDIA 公司开发的 SXM 接口连接 GPU 芯片和主板的加速卡；PCIE 版本是指使用标准的 PCIE 接口连接 GPU 芯片和主板的加速卡。SXM 版本相比 PCIE 版本具有更高的带宽和更低的延迟，但也需要更高级别的 PCB 板和散热系统。

先进的 GPU 加速卡需要使用 5 阶 20 层或以上的 HDI 板，HDI 板是高密度互连板的简称，它是一种通过激光钻孔或微细加工威廉希尔官方网站，在普通 PCB 板上形成微小的孔径或线宽，从而实现更高层次、更密集的布线和连接的 PCB 板。HDI 板可以提高信号完整性、降低电磁干扰、缩小尺寸和重量、增强可靠性等优点。HDI 板可以分为不同的阶数和层数，阶数表示每个层面上有多少次激光钻孔或微细加工，层数表示有多少个层面叠加在一起。一般来说，阶数越高，层数越多，HDI 板的密度和复杂度就越高。

GPU 芯片和内存芯片都有很多引脚或焊盘，需要通过 HDI 板来实现高效率、低延迟、低功耗、低噪声的信号传输。 GPU 加速卡需要使用高层次、高密度、高可靠性的 HDI 板来连接各个部件，主要有以下几个原因：GPU 芯片和内存芯片都有很多引脚或焊盘，需要通过 HDI 板来实现高效率、低延迟、低功耗、低噪声的信号传输。GPU 加速卡的功耗较高，会产生大量的热量，如果不能及时散发，会影响其稳定性和寿命。

因此，需要使用具有良好导热性能的 HDI 板材料。GPU 加速卡的尺寸较小，需要使用 HDI 板来减少 PCB 板的面积和厚度，提高空间利用率和散热效果。GPU 加速卡的性能较高，需要使用 HDI 板来支持更高的频率和带宽，提高数据传输速度和质量。

5 阶 20 层以上的 HDI 板是目前 PCB 行业中高端且昂贵的产品之一，其制造工艺要求非常高，需要使用先进的设备、材料和工艺。目前，全球能够生产这种 HDI 板的厂商很少，主要集中在日本、韩国、中国台湾等地。 GPU 加速卡对 CCL 的具体要求主要有以下几点：

高频高速性能：由于 AI 服务器需要处理大量的数据和信号，因此 GPU 加速卡需要使用具有高频高速性能的 CCL，即能够在高频率下保持低损耗、低时延、低串扰、低噪声等特性的 CCL。这需要 CCL 具有较低的介电常数（Dk）、介电损耗（Df）、表面粗糙度（Rz）等参数。

导热性能：由于 GPU 加速卡的功耗较高，会产生大量的热量，如果不能及时散发，会影响其稳定性和寿命。因此，GPU 加速卡需要使用具有良好导热性能的 CCL，即能够有效地将热量从芯片传导到散热器或外部环境的 CCL。这需要 CCL 具有较高的导热系数（K）和较低的热膨胀系数（CTE）等参数。

可靠性：由于 GPU 加速卡需要在复杂的环境中长期稳定运行，因此 GPU 加速卡需要使用具有高可靠性的 CCL，即能够抵抗各种应力和环境因素的影响，保持其结构和功能不变的 CCL。这需要 CCL 具有较高的玻璃化转变温度（Tg）、较低的水分吸收率（MOT）、较强的机械强度和耐化学腐蚀性等参数。

GPU 模组板（UBB），即 Unit Baseboard，是一种用于搭载整个 GPU 平台的 PCB 板。GPU 模组板的主要功能是连接多个 GPU 加速卡并与 CPU 主板通信。GPU 加速卡，即 Open Accelerator Module，是一种基于开放标准设计的 GPU 模块，可以插入到 GPU 模组板上。

GPU 之间的高速互联可以通过 NVLink + NVSwitch 实现。NVSwitch 是英伟达推出的一种高性能交换芯片，用于实现多个 GPU 加速卡之间的互联和通信，NVLink 2.0 协议最大能够提供每秒 900GB 的双向带宽。第三代 NVSwitch 有 64 个第四代 NVLink 端口，每个端口可以连接一个 GPU 加速卡或一个 CPU 主板，从而实现多达 64 个 GPU 加速卡的全互联架构。NVSwitch 基于 NVLink 的高级通信能力构建，可为计算密集型工作负载提供更高带宽和更低延迟。

基于第三代 NVSwitch，通过在服务器外部添加第二层 NVSwitch，NVLink 网络可以连接多达 32 个服务器、256 个 GPU，并提供 57.6TB/s 的多对多带宽，实现 GPU 在服务器节点间通信扩展，形成数据中心大小的 GPU。为了实现高速、高效、高可靠的数据传输和图形处理，GPU 模组板需要使用高多层通孔板（THP 板）作为载体。

THP 板是指通过机械钻孔或激光钻孔，在普通 PCB 板上形成大量的通孔，并在通孔内壁镀上一层导电铜箔，从而实现不同层面之间的电气连接。THP 板可以分为不同的层数，层数表示有多少个层面叠加在一起。一般来说，层数越多，THP 板的密度和复杂度就越高。 GPU 模组板需要使用高多层 THP 板来实现高速数据传输和高频信号处理的原因有：GPU 模组板需要处理大量的数据和信号，因此需要使用具有高频高速性能的 THP 板，即能够在高频率下保持低损耗、低时延、低串扰、低噪声等特性的 THP 板。这需要 THP 板具有较低的介电常数（Dk）、介电损耗（Df）、表面粗糙度（Rz）等参数。GPU 模组板需要连接多个 NVLink 芯片和 GPU 加速卡，因此需要使用具有高层次的 THP 板，即能够实现更多的信号通道和更好的电气性能的 THP 板。

这需要 THP 板具有较高的线宽线距、孔径、阻抗控制等参数。GPU 模组板的功耗较高，会产生大量的热量，如果不能及时散发，会影响其稳定性和寿命。因此，GPU 模组板需要使用具有良好导热性能的 THP 板，即能够有效地将热量从芯片传导到散热器或外部环境的 THP 板。这需要 THP 板具有较高的导热系数（K）和较低的热膨胀系数（CTE）等参数。

GPU 模组板对覆铜板有以下具体要求：

层数：由于 GPU 模组板需要连接多个 GPU 加速卡，并且需要实现多层次的电源分配网络（PDN），因此需要使用较高层数的覆铜板。目前，GPU 模组板使用的覆铜板一般在 16 层以上；

电性能：由于 GPU 模组板需要支持高速数据传输和高频信号处理，因此需要使用具有较低介电常数（Dk）和介质损耗因子（Df）的覆铜板，以减少信号的衰减和失真，提高信号的完整性和可靠性，目前 GPU 模组板使用的覆铜板一般采用 PPO 等高性能树脂材料；

热性能：由于 GPU 模组板需要承受较高的功耗和发热量，因此需要使用具有较高热导率和热稳定性的覆铜板，以有效地将热量从元器件传导到散热模组，防止过热造成性能下降或损坏。

目前，GPU 模组板使用的覆铜板一般采用金属基板或者添加导热填料的复合基板；加工性能：由于 GPU 模组板需要实现较多的通孔连接不同层次的电路线路，并且需要实现较大的面积和厚度，因此需要使用具有较好加工性能的覆铜板，以满足 THB 的要求，提高 PCB 的质量和良率。目前，GPU 模组板使用的覆铜板一般采用改性 PPO（MPPO）等可交联的热固性材料，可以提高流动性和加工性。

CPU 主板，是 AI 服务器中连接 CPU、内存、存储等核心部件的部件，它可以实现 CPU 与其他部件之间的高速数据传输，并通过 PCIe 5.0 实现与 GPU 主板的互联。CPU 主板一般采用 ATX 或 EATX 等标准规格，其尺寸为 305mm x 244mm 或 305mm x 330mm，其内部包含一个或多个 CPU 插槽、内存插槽、存储插槽、电源管理芯片等元器件。CPU 主板通过 PCIe 插槽连接到 GPU 主板上，并通过 PCIe 实现高速数据传输。

CPU 主板使用的 PCB 一般为高多层通孔板（Through Hole Board， THB），其特点是具有较多的通孔连接不同层次的电路线路，并且可以实现较大的面积和厚度。THB 可以实现更强的结构支撑和散热能力，并且可以承载更多更复杂的元器件。

CPU 主板对覆铜板有以下具体要求：

介电常数和介质损耗：这两个参数影响信号的传输速度和能量损失，对于高频、高速的 CPU 主板来说，需要选择低介电常数和低介质损耗的 CCL，以保证信号的完整性和质量。

热膨胀系数：这个参数影响 CCL 在温度变化时的尺寸稳定性，对于高温、高功率的 CPU 主板来说，需要选择热膨胀系数与铜箔相近的 CCL，以避免因为热应力导致的层间分离或过孔开裂等缺陷。

热导率：这个参数影响 CCL 在散热方面的性能，对于高温、高功率的 CPU 主板来说，需要选择热导率较高的 CCL，以有效地将热量从 CPU 和其他元件传导到散热器或外部环境。

阻燃等级：这个参数影响 CCL 在遇到火灾时的安全性能，对于所有的电子产品来说，都需要选择阻燃等级较高的 CCL，以防止因为火灾引起的人员伤亡或财产损失。一般来说，阻燃等级应达到 UL94 V-0 或以上。

据产业调研，预估 2024 年 AI 加速卡需求为 400 万颗，加速卡 PCB 用量平均单价 100 美元/ 颗，如果折算成英伟达 DGX A100 服务器对应为 50 万台，对应 UBB 板的 PCB 用量为 1000 美元/台，对应 CPU 主板的 PCB 用量为 200 美元/台，这三部分带来是市场增量合计 10 亿美元。

此外，随着PCIe 标准升级下信息交互速度不断提升，对 PCB 的设计、走线、板材选择等要求提高。

PCIE5.0（第五代 PCI Express 总线标准），是一种用于连接各种外设设备的高速串行接口，于 2019 年 5 月正式发布。PCIE5.0 相比于上一代 PCIE4.0，带宽提升了一倍，能够支持更高性能的 CPU、GPU、存储等设备，满足 AI 服务器等高算力需求。通过改变电气设计改善信号完整性和机械性能，PCIE5.0 新标准减少了延迟，降低了长距离传输的信号衰减。与 PCIE4.0 相比，PCIE5.0 信号速率达到 32GT/s，x16 带宽（双向）提升到了 128GB/s，能够更好地满足吞吐量要求高的高性能设备，如数据中心、边缘计算、机器学习、AI、5G 网络等场景日益增长的需求。除了保证高速传输的能力，PCIE5.0 还进一步加强了信号完整性，不仅适合连接显卡、SSD 等配件，也适用于平台总线的使用。

目前 PCB 主流板材为 8-16 层，对应 PCIe 3.0 一般为 8-12 层，4.0 为 12-16 层，而 5.0 平台则在 16 层以上。从材料的选择上来看， PCIe 升级后服务器对 CCL 的材料要求将达到高频/超低损耗/极低损耗级别。据产业调研，目前支持 PCIe3.0 标准的 Purley 平台 PCB 价值量约 2200- 2400 元，支持 PCIe4.0 的 Whitley 平台 PCB 价值量提升 30%-40%，支持 PCIe5.0 的 Eagle 平台的 PCB 价值量比 Purley 高一倍。根据我们测算，到 2025 年，PCIe 5.0 的升级有望为服务器平台 PCB 带来百亿的价值增量。

编辑：黄飞

阅读全文

pcb(383726) pcb(383726)
gpu(126253) gpu(126253)
服务器(82166) 服务器(82166)
AI(263610) AI(263610)
覆铜板(25987) 覆铜板(25987)

今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200；三星面临罢工存储市场供需引关注

1. 英伟达发布最强 AI 加速卡--Blackwell GB200 ，今年发货 3 月 19 日，英伟达发布最强 AI 加速卡--Blackwell GB200，今年发货。英伟达在今天召开

2024-03-19 11:08:13

778

GPU

的核心处理器。GPU是显卡的“心脏”，也就相当于CPU在电脑中的作用，它决定了该显卡的档次和大部分性能，同时也是2D显示卡和3D显示卡的区别依据。图形处理芯片。GPU能够从硬件上支持T&L

2016-01-16 08:59:11

GPU加速XenApp/Windows 2016/Office/IE性能会提高吗

配置文件来了解3D / GPU / HDX性能。 XenApp服务器运行的是带有4个vCPU和48GB RAM的Windows Server 2016映像。在性能测试期间，我一直在使用GPU

2018-09-12 16:24:19

GPU加速matlab程序

最近遇到了一个加速matlab程序的问题，不知道如何利用GPU，以及使用GPU的先决条件，是不是GPU加速必须要用cuda，最重要的是只用GPUArray和gather函数，加速效果不知道如何，主要是有多个函数调用关系？哪位前辈能指导一下？

2019-03-30 11:21:12

GPU是如何工作的？与CPU、DSP有什么区别？

本帖最后由 24不可说于 2016-8-5 15:15 编辑 GPU是显示卡的“心脏”，也就相当于CPU在电脑中的作用，它决定了该显卡的档次和大部分性能，同时也是2D显示卡和3D显示卡的区别

2016-08-05 13:00:01

PCB开窗的作用是什么为什么要开窗求大神

PCB开窗的作用是什么为什么要开窗求大神！

2016-08-04 11:37:10

PCB开窗的作用是什么为什么要开窗求大神！

PCB开窗的作用是什么为什么要开窗求大神！

2016-08-04 13:36:03

PCB泪滴焊盘的作用

`请问PCB泪滴焊盘的作用是什么？`

2019-12-18 15:29:42

PCB线路板电镀金的目的和作用是什么？

PCB线路板电镀金的目的和作用是什么？

2021-04-21 06:53:12

pcb放置大量接地过孔的作用

`请问pcb放置大量接地过孔的作用是什么？`

2019-12-19 16:40:23

DM368 EVN板SD卡的作用是什么？

您好请问DM368 EVN板SD卡的作用是什么？我把ubl和uboot烧写到nandflash里面，而且我已经Select Switch SW4 for the NAND boot mode

2018-06-21 02:23:22

FPGA加速卡PCB设计考虑

2019-01-04 11:36:15

FPGA为什么快？

不同租户使用的。有的机器上有神经网络加速卡，有的有bing搜索加速卡，有的有网络虚拟加速卡，任务的调度和运维会很麻烦。使用FPGA可以保持数据中心的同构性。通信密集型任务中;FPGA相比GPU、CPU

2018-08-16 09:54:23

Intel QAT加速卡逻辑实例有哪些

Intel QAT加速卡逻辑实例1. QAT相关的名词组织关系在本手册中描述的平台上，处理器可以连接到一个或多个英特尔®通信芯片组8925至8955系列（PCH）设备。从软件角度来看，每个PCH

2021-07-16 08:16:52

MLU220-M.2边缘端智能加速卡支持相关资料介绍

1、MLU220-M.2边缘端智能加速卡简介MLU220-M.2 加速卡采用思元220芯片，芯片基于寒武纪MLUv02架构。加速卡采用标准M.2接口，理论峰值性能为8TOPS，功耗仅为8.25W

2022-08-08 17:37:55

NVIDIA火热招聘GPU高性能计算架构师

GPU架构设计者提供反馈，以改善和推进未来GPU的架构设计基本要求(其一即可)： * 严谨的逻辑思维和分析能力* 有CUDA代码调优经验（或者SIMD等架构的调优经验）* 熟悉矩阵计算的优化和加速* 较强C++编程能力、算法分析和实现* 熟悉计算机体系结构*了解GPU架构与基于GPU的高性能计算

2017-09-01 17:22:28

PCIe加速卡学习资料：基于Kintex Ultrasacle的万兆网络光纤 PCIe加速卡416

基于Kintex Ultrasacle的万兆网络光纤 PCIe加速卡一、产品概述本卡为企业级别板卡，可用于数据中心，安全领域数据采集处理。标准PCI Express全高板，适用于普通服务器

2020-03-25 11:33:15

PCIe加速卡的发展

SSD的性能，特别是延迟的能力。相比PCIe闪存卡的形式，以往外置SSD要经过SAS/SATA，延迟高，在性能上存在差距，因此在需要数据加速的应用场景，如数据库的OLTP应用，PCIe闪存卡就成为了不二

2019-06-24 05:00:55

XCKU115板卡资料：1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡一、概述本板卡系我公司自主研发，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器，主要用于FPGA

2019-10-25 16:00:50

tengine是如何使用arm的GPU进行加速的

【嵌入式AI】多目标分类检测系统实战中，tengine是如何使用arm的GPU进行加速的，这个原理能详细说明一下吗？

2022-09-02 14:18:54

传感器输出的都是电压信号，为什么Ni要有加速卡，应变卡

传感器输出的都是电压信号，为什么Ni要有加速卡，应变卡，全部都去采电压不就行了么，然后再自己换算不就好了？

2014-11-04 17:03:39

光纤加速卡设计方案原理图第410篇-基于XCVU9P+ C6678的40G光纤的加速卡

基于XCVU9P+ C6678的40G光纤的加速卡一、板卡概述二、威廉希尔官方网站指标 •板卡为自定义结构，板卡大小332mmx260mm; •FPGA采用Xilinx Virtex

2022-08-29 15:49:45

基于加速卡的FPGA生态系统布局是怎样的？

FPGA加速卡是如何产生的？主要的FPGA加速卡产品有哪些？基于加速卡的FPGA生态系统布局是怎样的？

2021-06-17 06:07:15

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡解决方案

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡一、概述本板卡系我公司自主研发，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器，主要用于FPGA

2018-07-27 16:49:30

基于Xilinx XCKU115的半高PCIe x8硬件加速卡

基于Xilinx XCKU115的半高PCIe x8 硬件加速卡北京太速科技有限公司一、概述本板卡系我公司自主研发，采用Xilinx公司的XCKU115-3-FLVF1924-E芯片作为主处理器

2018-08-22 17:31:55

如何使用iMX8mmini提高GPU性能？

我正在使用 iMX8mmini 并尝试提高 GPU 性能。使用下面的命令我发现当前 GPU 以 500 MHz 的频率运行。根据数据表或设备树节点，GPU 以 800 MHz 的标称频率运行（最大

2023-04-18 07:17:15

施密特的作用是什么？

施密特的作用是什么？开漏的作用是什么？

2022-01-20 06:18:13

求一种基于Xilinx XCKU115的半高PCIe x8 硬件加速卡

半高PCIe x8硬件加速卡有哪些威廉希尔官方网站指标？半高PCIe x8硬件加速卡的物理特性是什么？半高PCIe x8硬件加速卡的接口测试软件有哪些？

2021-06-25 07:16:05

滤波电路的作用是什么？

什么是最小系统板？什么是开发板？滤波电路的作用是什么？PCB设计注意事项有哪些？

2021-11-03 07:40:56

英特尔QAT加速卡说明（二）精选资料分享

异步模式操作加速卡支持同步和异步操作模式。在同步模式下，API将阻塞，直到加速操作完成后才返回到调用代码。在异步模式下，API将在请求提交到加速器后返回调用代码。当加速器完成操作时，通过调用回调函数

2021-07-23 08:46:52

请问PCB中打Mark点的作用是什么？

老师PCB中如何打Mark点打Mark点的作用是什么Mark点应该放在板的那个位置？？？

2019-09-25 00:33:01

请问ADXL345具备自测功能的主要作用是什么？

请问ADXL345具备自测功能的主要作用是什么？是为了检验加速度传感器本身的性能？进行自测之前是否应将offset X、Y、Z全部清零？

2024-01-02 06:07:05

请问ADXL345自测功能的作用是什么

请问ADXL345具备自测功能的主要作用是什么？是为了检验加速度传感器本身的性能？进行自测之前是否应将offset X、Y、Z全部清零？

2018-11-13 09:47:03

谈GPU的作用、原理及与CPU、DSP的区别

今天，GPU已经不再局限于3D图形处理了，GPU通用计算威廉希尔官方网站发展已经引起业界不少的关注，事实也证明在浮点运算、并行计算等部分计算方面，GPU可以提供数十倍乃至于上百倍于CPU的性能，如此强悍的“新星

2015-11-04 10:04:53