0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两种GPU之间的延迟对比 AMD RDNA2完胜NVIDIA安培

ss 来源:快科技 作者:快科技 2021-04-21 13:51 次阅读

CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。

ChipsAndCheese就做了一次特别的测试,对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题。

首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼,代表是RX6900XT、RTX3090,前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了InfinityCache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere。

更惊人的是,RDNA2显存延迟和Ampere几乎一模一样,但是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。

Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来,GA102核心面积过大,也直接增加了延迟。

这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere则相反,高负载下优势明显,比如说4K分辨率。

说完了GPU之间的对比,那么GPU、CPU放在一起怎么样呢?这里以RX6900XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的,所以这里Y轴用了线性数据,可以看到全程大大低于RDNA2,搭配DDR3-1600CL9内存延迟只有63ns,RX6900XT、GDDR6的组合则有226ns,另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIAGPU,包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile。

Maxwell、Pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32MB之后偏高,原因未知。

AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970,再加上RX6900XT,很明显在逐代降低,而且是各级缓存都在同时进步。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5468

    浏览量

    134144
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10863

    浏览量

    211738
  • 数据
    +关注

    关注

    8

    文章

    7026

    浏览量

    89020
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4738

    浏览量

    128940
收藏 人收藏

    评论

    相关推荐

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIAAMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 -
    发表于 12-16 14:25

    AMD确认2025年推出RDNA 4显卡,光追与AI性能大幅提升

    10月30日,AMD在2024年第三季度财报电话会议上宣布了一个关于GPU的重要信息:其下一代RDNA 4显卡计划于2025年初发布。AMD首席执行官苏姿丰明确表示:“我们计划在202
    的头像 发表于 10-30 16:50 630次阅读

    AMDNVIDIA GPU优缺点

    在图形处理单元(GPU)市场,AMDNVIDIA大主要的竞争者,它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。 一、性能
    的头像 发表于 10-27 11:15 689次阅读

    噪声传导的两种模式

    噪声传导有两种模式,一为差模传导,一为共模传导。
    的头像 发表于 10-15 11:33 294次阅读
    噪声传导的<b class='flag-5'>两种</b>模式

    嵌入式MXM模块(NVIDIA安培架构)

    电子发烧友网站提供《嵌入式MXM模块(NVIDIA安培架构).pdf》资料免费下载
    发表于 10-09 11:09 0次下载

    晶闸管的阻断状态有两种是什么

    晶闸管(Thyristor)是一半导体器件,具有单向导电性,广泛应用于电力电子领域。晶闸管的阻断状态有两种:正向阻断状态和反向阻断状态。以下是对这两种阻断状态的分析。 正向阻断状态 正向阻断状态
    的头像 发表于 08-14 16:49 711次阅读

    暴涨预警!NVIDIA GPU供应大跳水

    gpu
    jf_02331860
    发布于 :2024年07月26日 09:41:42

    AMD发布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名现身,而Navi 44则以Gfx1200之名亮相。这GPU的出现,至少暗示了AMD正在逐步完善RDNA 4
    的头像 发表于 05-24 16:11 597次阅读

    NVIDIA推出款基于NVIDIA Ampere架构的全新台式机GPU

    NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 623次阅读

    NvidiaAMD新芯片,突破PCIe瓶颈

    AMDNvidiaGPU 都依赖 PCI 总线与 CPU 进行通信。CPU 和 GPU个不同的内存域,数据必须通过 PCI
    的头像 发表于 03-08 14:15 673次阅读
    <b class='flag-5'>Nvidia</b>与<b class='flag-5'>AMD</b>新芯片,突破PCIe瓶颈

    AMD修复Radeon RX 7900 XTX GPU固件问题,并积极回应TinyBox反馈

    据悉,新兴的AI 服务器制造商 TinyBox 在上周公开表示选择非主流CDNA 3.0 架构,转而依赖 AMD RDNA 3.0 GPU 硬件。其创始人兼首席执行官George Hotz较早前分享了照片,展示了其团队正在为客户
    的头像 发表于 03-07 11:19 669次阅读

    AMD Zen6架构继续飞跃!核显跨越下下代RDNA5

    AMD的下一代Zen5 CPU架构还没来,Zen6的消息就已经多次传出,现在又提到了所集成的GPU核显,居然将会搭配同样下下一代的RDNA5。
    的头像 发表于 02-22 09:53 863次阅读
    <b class='flag-5'>AMD</b> Zen6架构继续飞跃!核显跨越下下代<b class='flag-5'>RDNA</b>5

    AMD将推新GPU,效能媲美英伟达RTX 4080

    据悉,AMD正努力研制新品级GPU,性能堪比英伟达的RTX 4080,而售价却只有后者的一半。据多个在线社区反映,AMD即将发布的Radeon RX 8000系列GPU效能与
    的头像 发表于 01-31 10:00 2937次阅读

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 1226次阅读
    深入解读<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b>架构

    一次性保险丝与自恢复保险丝这两种之间有什么差别?

    一次性保险丝与自恢复保险丝这两种之间有什么差别? 一次性保险丝和自恢复保险丝是两种用于电气系统中的保险器件,它们在功能和特性上存在一些差异。本文将对这两种保险丝进行比较,并详细解释它们
    的头像 发表于 01-04 14:13 1710次阅读