两种GPU之间的延迟对比 AMD RDNA2完胜NVIDIA安培-电子发烧友网

CPU缓存与内存延迟测试，相信大家都有所耳闻，但是GPU同样的测试却几乎没人做过。

ChipsAndCheese就做了一次特别的测试，对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题。

首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼，代表是RX6900XT、RTX3090，前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了InfinityCache无限缓存，提升带宽的同时，延迟也可圈可点，二级缓存命中率上只增加了大约20ns的延迟，明显低于Ampere。

更惊人的是，RDNA2显存延迟和Ampere几乎一模一样，但是别忘了，Ampere只有两个层级的缓存，RDNA2却有四个。

Ampere的缓存架构更加传统，SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟，RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来，GA102核心面积过大，也直接增加了延迟。

这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀，因为二级缓存、三级缓存延迟很低，更适合执行较小的负载。Ampere则相反，高负载下优势明显，比如说4K分辨率。

说完了GPU之间的对比，那么GPU、CPU放在一起怎么样呢？这里以RX6900XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的，所以这里Y轴用了线性数据，可以看到全程大大低于RDNA2，搭配DDR3-1600CL9内存延迟只有63ns，RX6900XT、GDDR6的组合则有226ns，另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIAGPU，包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile。

Maxwell、Pascal其实差不多，前者整体略高一些，可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子，一级缓存延迟低得多，二级差不多，奇怪的是显存延迟在32MB之后偏高，原因未知。

AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970，再加上RX6900XT，很明显在逐代降低，而且是各级缓存都在同时进步。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

amd

amd

+关注

关注
25

文章
5468

浏览量
134144
cpu

cpu

+关注

关注
68

文章
10863

浏览量
211738
数据

数据

+关注

关注
8

文章
7026

浏览量
89020
gpu

gpu

+关注

关注
28

文章
4738

浏览量
128940

《CST Studio Suite 2024 GPU加速计算指南》

的各个方面，包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 -

发表于 12-16 14:25

AMD确认2025年推出RDNA 4显卡,光追与AI性能大幅提升

10月30日，AMD在2024年第三季度财报电话会议上宣布了一个关于GPU的重要信息：其下一代RDNA 4显卡计划于2025年初发布。AMD首席执行官苏姿丰明确表示：“我们计划在202

发表于 10-30 16:50 •630次阅读

AMD与NVIDIA GPU优缺点

在图形处理单元（GPU）市场，AMD和NVIDIA是两大主要的竞争者，它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。一、性能

发表于 10-27 11:15 •689次阅读

噪声传导的两种模式

噪声传导有两种模式，一种为差模传导，一种为共模传导。

发表于 10-15 11:33 •294次阅读

嵌入式MXM模块(NVIDIA安培架构)

电子发烧友网站提供《嵌入式MXM模块(NVIDIA安培架构).pdf》资料免费下载

发表于 10-09 11:09 •0次下载

晶闸管的阻断状态有两种是什么

晶闸管（Thyristor）是一种半导体器件，具有单向导电性，广泛应用于电力电子领域。晶闸管的阻断状态有两种：正向阻断状态和反向阻断状态。以下是对这两种阻断状态的分析。正向阻断状态正向阻断状态

发表于 08-14 16:49 •711次阅读

暴涨预警！NVIDIA GPU供应大跳水

gpu

jf_02331860
发布于 :2024年07月26日 09:41:42

AMD发布ROCm更新，新增RX 8000系列GPU的Navi 44命名

首款Navi 48芯片以Gfx1201之名现身，而Navi 44则以Gfx1200之名亮相。这两款GPU的出现，至少暗示了AMD正在逐步完善RDNA 4

发表于 05-24 16:11 •597次阅读

NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。

发表于 04-26 11:25 •623次阅读

Nvidia与AMD新芯片，突破PCIe瓶颈

AMD 和 Nvidia 的 GPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU 有两个不同的内存域，数据必须通过 PCI

发表于 03-08 14:15 •673次阅读

AMD修复Radeon RX 7900 XTX GPU固件问题，并积极回应TinyBox反馈

据悉，新兴的AI 服务器制造商 TinyBox 在上周公开表示选择非主流CDNA 3.0 架构，转而依赖 AMD RDNA 3.0 GPU 硬件。其创始人兼首席执行官George Hotz较早前分享了照片，展示了其团队正在为客户

发表于 03-07 11:19 •669次阅读

AMD Zen6架构继续飞跃！核显跨越下下代RDNA5

AMD的下一代Zen5 CPU架构还没来，Zen6的消息就已经多次传出，现在又提到了所集成的GPU核显，居然将会搭配同样下下一代的RDNA5。

发表于 02-22 09:53 •863次阅读

AMD将推新GPU，效能媲美英伟达RTX 4080

据悉，AMD正努力研制新品级GPU，性能堪比英伟达的RTX 4080，而售价却只有后者的一半。据多个在线社区反映，AMD即将发布的Radeon RX 8000系列GPU效能与

发表于 01-31 10:00 •2937次阅读

深入解读AMD最新GPU架构

GCN 取代了 Terascale，并强调 GPGPU 和图形应用程序的一致性能。然后，AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路，分别专门用于计算和图形。

发表于 01-08 10:12 •1226次阅读

一次性保险丝与自恢复保险丝这两种之间有什么差别？

一次性保险丝与自恢复保险丝这两种之间有什么差别？一次性保险丝和自恢复保险丝是两种用于电气系统中的保险器件，它们在功能和特性上存在一些差异。本文将对这两种保险丝进行比较，并详细解释它们

发表于 01-04 14:13 •1710次阅读