英伟达发布超强AI加速卡，性能大幅提升，可支持1.8万亿参数模的训练-电子发烧友网

3月19日消息，NVIDIA宣布成功研发AI加速卡——Blackwell GB200，预计年内开始交付。这是NVIDIA在GTC开发者大会上所公布的最新成果。

GB200创新性的运用了NVIDIA独创的新一代AI图形处理器架构Blackwell。NVIDIA CEO黄仁勋明确指出：“尽管Hopper已然优秀，但我们需要更强的GPU推动发展。”

得益于NVIDIA每两年进行一次GPU架构升级以提高性能的策略，全新的基于Blackwell的加速卡比之前的H100更为强大，尤其适用于AI相关任务。

Blackwell GPU卓越表现使得AI性能达到惊人的20PetaFLOPS。相比之下，基于Hoper架构的H100仅为4PetaFLOPS。NVIDIA强调，这种额外的处理能力将极大地便利人工智能厂商顺利培训复杂且大规模的模型。

Blackwell GPU大大刷新了人们的认知，其庞大身形由台积电4纳米（4NP）工艺制成，包含两个独立制造的裸晶（Die），共有2080亿个晶体管。为了方便捆绑芯片，它采用NVLink 5.0威廉希尔官方网站。两枚Blackwell芯片在同一封装中，相较以往的GPU而言，整体性能显著提升达2.5倍，若处理FP4八精度浮点运算，则性能甚至可飙升至5倍之多。校园秘

关于GB200，NVIDIA宣称，其合成物包括两个B200 Blackwell GPU以及一个基于Arm的Grace CPU。很多人惊讶地发现 NvTech的首批量产计算机将其性能获得了提升超过30倍，同时降低成本和能耗。根据NVIDIA的数据分析，他们现有的硬件只用2000个Blackwell GPU就够再去完成诸如1.8万亿个参数模型这样的运算任务，且只消耗4兆瓦的电力。在参数为1，750亿的GPT-3 LLM基准测试中，Nvidia的GB200的性能甚至超越了H100 7倍。规律纪律意识

对于致力于拥有庞大需求企业的成品服务，NVIDA推出了包含36个CPU及72个Blackwell GPU的NVL72服务器，并附赠一体式水冷散热解决方案，产能可实现高达720 PetaFLOPS的AI训练性能，或者达到惊人的1，440 PetaFlops。另外，还有144个壁搏立帆、576个GPU以及240TB的内存。单据一份官方报道显示，早先以至于要运行一带有1.8万亿个参数模型的堆栈，原先需要8000个 Hopper GPU，外加15兆瓦的电力。

英伟达透露，同类机型已被亚马逊、谷歌、微软和甲骨文计划纳入他们的云服务产品之中，由于对具体采购量的保密，外界暂无确切消息。但据Nvidia表示，已经接到了Amazon AWS对于采用2万片 Blackwell芯片建成的服务器集群的购买计划。通过Node-to-Node NVLink 5.0，每个机架将被18块GB200芯片和9块交换机装满。而不同于此，英伟达的 Skeeter InfiniBand可连接多达144个节点，Quantum-X800 InfiniBand则最高可支持64个节点。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4983

浏览量
103010
gpu

gpu

+关注

关注
28

文章
4733

浏览量
128911
AI

AI

+关注

关注
87

文章
30805

浏览量
268942

大模型向边端侧部署，AI加速卡朝高算力、小体积发展

电子发烧友网报道（文/李弯弯）AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存，旨在加速机器学习、深度学习等算法的计算过程。当前，

发表于 09-17 00:18 •3239次阅读

EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

AI加速卡，通常也被称为AI算力卡，是一种专为加速人工智能（AI）应用和算法而设计的硬件设备。

发表于 09-10 14:56 •0次下载

英伟达Blackwell可支持10万亿参数模型AI训练，实时大语言模型推理

、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。英伟达称，Blackwell拥有6项革命性威廉希尔官方网站，可支持多达10

发表于 09-04 09:10 •2897次阅读

YXC高频差分晶振，频点312.5mhz，高精度.高稳定性，应用于AI加速卡

在一些AI加速卡中，扬兴推荐的YXC差分晶振YSO210PR系列，该系列频率范围为10MHz ~1500MHz，可满足高精度、高稳定度的需求，支持差分信号（LVDS/LVPECL）输出

发表于 08-21 14:03 •331次阅读

YXC高频差分晶振，频点312.5mhz，高精度.高稳定性，应用于<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>

苹果AI模型训练新动向：携手谷歌，未选英伟达

近日，苹果公司发布的最新研究报告揭示了其在人工智能领域的又一重要战略选择——采用谷歌设计的芯片来训练其AI模型，而非行业巨头英伟达的产品。这

发表于 08-01 18:11 •918次阅读

NVIDIA突破美国禁令,将在中东部署其高性能AI/HPC GPU加速卡

Ooredoo达成合作协议，将在中东地区部署其高性能AI/HPC GPU加速卡。这一举动不仅标志着NVIDIA在中东市场的战略布局取得了重大突破，也引发了外界对于如何防止这些先进威廉希尔官方网站流向中国的广泛讨论。

发表于 06-24 14:47 •846次阅读

英伟达总市值破2.5万亿美元

近日，AI领军企业英伟达（NVDA）公布了2025财年第一季度财报，其业绩远超销售和收益预期，继续引领市场风潮。财报发布后，英伟

发表于 05-24 10:00 •518次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

计算工作负载、释放百亿亿次计算能力和万亿参数人工智能模型的全部潜力提供关键基础。 NVLink释放数万亿参数AI模型的

发表于 05-13 17:16

英伟达发布最强AI加速卡Blackwell GB200

英伟达在最近的GTC开发者大会上发布了其最新、最强大的AI加速卡——GB200。这款加速卡采用了

发表于 03-20 11:38 •1124次阅读

英伟达发布性能大幅提升的新款B200 AI GPU

英伟达宣称，B200在性能上比以往最好的GPU快30倍不止。由它构成的服务器集群相比上一代，运算能力飞跃性提升，甚至能使大语言模型的训练速度

发表于 03-20 09:37 •794次阅读

英伟达发布最强AI加速卡GB200，开启新一代AI图形处理时代

英伟达正式发布了其最新、也是迄今为止最强大的AI加速卡——GB200。这一重大发布标志着

发表于 03-19 11:26 •1208次阅读

<b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>发布</b>最强<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>GB200，开启新一代<b class='flag-5'>AI</b>图形处理时代

今日看点丨英伟达发布最强 AI 加速卡--Blackwell GB200；三星面临罢工存储市场供需引关注

1. 英伟达发布最强 AI 加速卡--Blackwell GB200 ，今年发货 3 月 19 日，

发表于 03-19 11:08 •1244次阅读

英伟达发布最强AI加速卡

行业芯事行业资讯

北京中科同志科技股份有限公司
发布于 :2024年03月19日 09:16:43

英伟达市值1.96万亿美元

英伟达市值1.96万亿美元英伟达股价一天之内大涨16%；英伟

发表于 02-24 15:22 •931次阅读

宁畅参与发布AI加速卡液冷设计白皮书

近日，由宁畅参与起草的《基于标准PCIe接口的人工智能加速卡液冷设计》白皮书正式发布。该威廉希尔官方网站白皮书由开放计算标准工作委员会(OCTC)归口，旨在为冷板式人工智能加速卡的设计提供重要指导。

发表于 01-09 11:28 •782次阅读

搜索历史

英伟达发布超强AI加速卡，性能大幅提升，可支持1.8万亿参数模的训练

评论