0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大家都在争相超过A100,无人对标的Grace Hopper性能几何?

E4Life 来源:电子发烧友网 作者:周凯扬 2023-09-06 01:10 次阅读

电子发烧友网报道(文/周凯扬)作为英伟达CPUGPU威廉希尔官方网站 开发上的集大成之作,Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能,但英伟达还是选择将Grace Hopper(GH200)描述成了世界上最万能的计算平台,这也得益于它同时在AI计算和HPC计算领域展现的可怕性能。

AI计算性能

相信绝大多数人已经从市场疯抢A100、H100的现状,对Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作为一个异构计算平台,在与传统的x86 CPU与H100对比上,也有着不小的性能差距。

首要区别自然就是连接Grace CPU和Hopper GPU的NVLink-C2C,这一高带宽低延迟的互联威廉希尔官方网站 可谓是目前唯一能发挥H100近乎全部实力的方案。支持最高144TB内存的同时,提供900GB/s的带宽。

英伟达官方也对部分AI计算负载进行了测试,在终端应用上对比x86+Hopper与Grace Hopper的一体化方案有何异同。其性能差距可以说是巨大的,就拿最常见的大语言模型推理来说,GH200可以做到x86平台的4.5倍性能表现,而DLRM(深度学习推荐模型)训练与图神经网络(GNN)训练的性能也可以分别达到3.5倍和1.9倍。

其实这里的差异还是体现在互联方案的带宽上,例如x86+Hopper的方案还是在使用PCIe方案,该方案在batch size较小时性能落后还不算明显,一旦到了更大的batch size,PCIe的带宽就成了瓶颈,而不断以高带宽输送数据给H100的NVLink-C2C则可以实现比PCIe高出数倍的性能。

HPC计算性能

Grace Hopper的另一大应用领域自然就是HPC了。HPC主要集中在一些科学、工程的复杂计算上,比如天气预测、生命科学、流体力学等。然而与此同时,不少商业相关的HPC计算也在进一步推动HPC的发展,甚至更早用上最新芯片威廉希尔官方网站 ,比如油藏interwetten与威廉的赔率体系 等。

著名油藏模拟软件ECHELON的开发商Stone Ridge,在最近获得了早期访问权,对英伟达的H100-PCIe、H100-NVL和Grace-Hopper来了场性能测试。早在Volta和Ampere架构时,Stone Ridge就对不同架构的GPU进行了测试,而如今的H100相较这些旧GPU已经在CUDA核心、内存容量和内存带宽上有了数倍的提升。

这些还只是表面上的变化,英伟达还引入了诸多架构改进,提高了ML和HPC应用程序的性能。而Grace Hopper相较传统的x86+GPU方案就更具优势了,首先Grace本身就是一个强大的CPU,每个内核都有四个128位适量单元,超高的内存带宽以及超大的L2+L3缓存。其次,NVLink的存在大大减少了CPU和GPU之间的通信时间。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架构不同版本的英伟达GPU在ECHELON模型上的性能对比 / Stone Ridge


Stone Ridge选择了不同细胞规模的模型,从83000个细胞到670万个细胞,其中Grace Hopper都展现出了不俗的性能,最高可达Volta架构的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架构,所以ECHELON必须重新编译才能在系统上运行,不过对于ECHELON来说,重新编译并不要花太多力气,他们在不修改代码的情况就成功重编译在GH200上正常运行。如果对代码进行进一步优化的话,还有机会获得更高的性能表现。如此高的性能提升,意味着油藏勘探模拟的时间可以被大幅缩短,从而加快油藏评估的速度。

结语

可以说无论是A100还是H100,都只是英伟达在AI与HPC战线扩大战果的第一步棋,明年Q2交付到各大系统中的GH200才是最大的杀手锏,也很可能会成为更抢手的数据中心与超算中心硬件产品。这也恰好证明了英伟达给它的定位,世界上最万能的计算平台。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    本期为大家带来的是100W氮化镓充电器详细介绍拆解。

    本期为大家带来的是100W氮化镓充电器详细介绍拆解。 这款充电器配备折叠插脚以及2C1A接口,两个USB-C口均支持100W PD快充和PPS快充,USB-
    的头像 发表于 11-11 14:59 629次阅读
    本期为<b class='flag-5'>大家</b>带来的是<b class='flag-5'>100</b>W氮化镓充电器详细介绍拆解。

    软银升级人工智能计算平台,安装4000颗英伟达Hopper GPU

    达Ampere GPU。通过新增的4000颗Hopper GPU,该平台的总计算性能已跃升至每秒约4.7百亿亿次。
    的头像 发表于 11-04 16:18 430次阅读

    NVIDIA AI Enterprise荣获金奖

    NVIDIA AI Enterprise、GH200 Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX 2024 获得认可。
    的头像 发表于 05-29 09:27 445次阅读
    NVIDIA AI Enterprise荣获金奖

    亚马逊AWS暂缓订购英伟达Grace Hopper,等待新品Grace Blackwel

    今年 3 月,英伟达宣布了新款人工智能处理器Blackwell,比上一代Hopper提前不到一年面世。CEO黄仁勋表示,新产品在训练大规模语言模型方面的性能将提升一倍。
    的头像 发表于 05-22 12:03 638次阅读

    亚马逊未中断英伟达订单,等待Grace Blackwell更强性能

    英国《金融时报》昨日报道称,亚马逊AWS已暂停订购英伟达最新款“超级芯片”Grace Hopper,等待性能更强的新品Grace Blackwell(GH200)。此举引发市场担忧,认
    的头像 发表于 05-22 11:00 465次阅读

    英伟达静候新品来临,亚马逊暂缓购买Grace Hopper

    今年3月,英伟达发布了全新的Blackwell处理器,距离前任产品Hopper的发布不过短短一年。英伟达首席执行官黄仁勋表示,新款产品在训练大规模语言模型上的效率将提升至原来的两倍。
    的头像 发表于 05-22 09:07 301次阅读

    NVIDIA Grace Hopper点亮AI超级计算新时代

    瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力,以支持突破性研究。
    的头像 发表于 05-15 09:46 363次阅读

    NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速

    德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究。
    的头像 发表于 05-14 09:15 349次阅读

    美国首个Grace Hopper架构超算Venado落地:达10 exaFLOPS

    该超级计算机是由惠普企业集团(Hewlett Packard Enterprise)打造,其运算能力高达 10 exaFLOPS,它是美国第一款采用英伟达Grace Hopper芯片架构的超级计算机系统。
    的头像 发表于 04-18 14:37 408次阅读

    英伟达H200和A100的区别

    英伟达H200和A100两款芯片在性能、架构、内存以及应用场景等多个方面存在显著的区别。
    的头像 发表于 03-07 16:23 3601次阅读

    英伟达H200和A100的差异

    英伟达H200和A100在多个方面存在差异。
    的头像 发表于 03-07 16:18 2538次阅读

    Arm架构与Neoverse威廉希尔官方网站 在基础设施领域的应用与发展

    Arm的Neoverse系列已有稳定的立足点。例如,英伟达的超级芯片Grace-Hopper就是由两片独立的芯片组成,其中 Hopper负责处理所有AI任务,如张量运算,Grace则扮演 CPU角色,利用I/O与内存管理功能与常
    的头像 发表于 02-22 15:36 577次阅读

    NVIDIA特供中国的芯片,AI性能大降10%售价依然高

    目前NVIDIA最昂贵的A100、H100芯片无法对中国市场出售,此前为中国市场定制的A800、H800芯片也被限制对中国出售,可以对中国出售的为定制化的H20等芯片,而这些芯片的性能
    的头像 发表于 01-03 16:07 1330次阅读

    英伟达Grace-Hopper提供一个紧密集成的CPU + GPU解决方案

    英伟达Grace-Hopper提供了一个紧密集成的CPU + GPU解决方案,针对生成式人工智能逐渐成为主导的市场环境。
    的头像 发表于 01-02 15:52 912次阅读

    英伟达和华为/海思主流GPU型号性能参考

    一句话总结,H100 vs. A100:3 倍性能,2 倍价格 值得注意的是,HCCS vs. NVLINK的GPU 间带宽。 对于 8 卡 A800 和 910B 模块而言,
    发表于 12-29 11:43 5992次阅读
    英伟达和华为/海思主流GPU型号<b class='flag-5'>性能</b>参考