0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BlueField DPU助力数据中心不断变化的需求

星星科技指导员 来源:NVIDIA 作者:John Kim 2022-04-14 16:17 次阅读

当今的数据中心正在迅速地发展,这就需要一种被称为DPU(数据处理器)的新型处理器。新数据中心的一些应用需要的是一种可卸载、加速和隔离的特定类型DPU架构。8月23日,在Hot Chips 33大会上,NVIDIA芯片架构师Idan Burstein探讨了数据中心不断变化的需求,以及这些需求如何推动NVIDIA BlueField DPU系列产品的架构。

为何需要DPU?

以前的数据中心需在专用服务器集群上独自运行应用,现如今已不同从前。现在,CPU计算、GPU计算和存储等资源已被解聚,可以根据需求将资源组合(分配和组装),还可以根据应用和工作负载的变化对资源进行重新组合或重新分配。

GPU加速的AI正在成为主流,其增强了大量的商业应用,而不仅仅是科学应用。以虚拟化为主的服务器,现在很可能是在裸金属服务器上的容器中运行,尽管这些服务器不再有管理程序或虚拟机,其仍然需要软件定义的基础设施。为支持保证信息安全的零信任方法,防火墙代理和反恶意软件过滤器等网络安全工具必须在每台服务器上运行。这些变化对网络、安全和管理所需的工作方式产生了巨大影响,进而推动了每台服务器对DPU的需求。

DPU任务的最佳定义:卸载、加速和隔离基础设施应用。

卸载:从服务器CPU中接管基础设施任务,这样就可以让尽可能多的CPU计算能力来运行应用。

加速:运用DPU芯片硬件中的加速,以比CPU更快的速度运行基础设施功能。

隔离:将关键的数据面和控制面功能转移到DPU上,这既减轻CPU的工作,同时还可以在CPU或其软件被破坏时保护这些功能。

一个DPU需要具备完成以上三个任务的能力。

poYBAGJX2PWAQ25UAAEqqbk2tEE887.png

图1:数据中心已发展成为软件定义、容器化和可组合的特性。卸载基础设施任务至DPU可提高服务器性能,效率与安全。

仅移动CPU核是不够的

一些DPU厂商所尝试的一种方法是,在DPU上放置大量的CPU核以用于卸载服务器CPU的应用。无论是ArmRISC、X86还是其他类型的CPU核,这种方法都具有根本缺陷,因为服务器的CPU或GPU对于CPU最优或GPU最优的应用已是高效的。虽然DPU上的Arm(或RISC及其他)核确实可能比一般的服务器CPU更节能,但除非Arm核有一个用于该特定应用的加速器,否则不值得为了节能而增加复杂性。

此外,目前市面上已出现基于Arm CPU的服务器,例如基于Amazon EC2 Graviton的实例、Oracle A1 实例,基于Ampere Computing 的Altra CPU,以及Fujitsu的 A64FX CPU的服务器。在Arm上高效运行的应用,均可部署在Arm服务器上。只有在某些功能必须与服务器 CPU 隔离的情况下,例如控制平面或基础设施应用程序的一部分,才需要移动到DPU的Arm核上。

无论从威廉希尔官方网站 角度出发,还是从经济角度出发,将一个标准应用的工作负载从服务器的N个X86核卸载到N个或2N个DPU的Arm 核上都毫无意义。将AI或机器学习应用从服务器GPU卸载到DPU的Arm核上亦是如此。将应用从服务器的CPU和GPU转移到DPU的CPU上,并且不进行任何类型的加速的举动,充其量只是虚晃,最坏的情况还会降低服务器的性能和效率。

pYYBAGJX2P2ABeDNAADjiUBBcBo341.png

图2:将应用从服务器的CPU转移到无加速DPU的CPU核上,除了满足将这些应用与CPU服务器域中隔离的需求外,其他场景都毫无益处。

DPU最适合的加速类型

很明显,一个合适的DPU必须通过硬件加速来增加数据中心的最大效益。它应该加速什么?卸载涉及数据移动和安全性的应用,DPU是最佳选择。 例如,网络与远程直接内存访问 (RDMA) 都最适合卸载到 DPU 芯片,RDMA常用于加速 AI、HPC、大数据和存储应用的服务器之间的数据移动。

对比CPU,如果DPU 具有针对特定任务的加速硬件,卸载和运行效率将会提高很多。 若应用满足于 DPU 的硬件加速能力时,一个设计合理的 DPU 可以执行 30个、100个 甚至 是300 个 CPU 的工作。

DPU 的 CPU 核非常适合运行必须与服务器应用程序,以及操作系统域隔离开的控制平面,或安全应用。 例如,在裸金属服务器中,租户不希望在他们的服务器上运行管理程序,或虚拟机来进行远程管理、遥测或安全,因为这会损害性能,或干扰到应用程序。 然而,云运营商仍然需要能够监控服务器的性能并检测、阻止或隔离入侵该服务器的安全威胁。

DPU 可以独立于应用程序域来运行此软件,提供安全和控制,同时不干扰服务器的性能或操作。

关于作者

John Kim 是 NVIDIA 网络事业部的存储市场总监,致力于帮助客户和供应商从高性能网络连接、智能网卡卸载和远程直接数据存取 (RDMA) 中获益,尤其是在存储、大数据和人工智能领域。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10863

    浏览量

    211758
  • NVIDIA
    +关注

    关注

    14

    文章

    4986

    浏览量

    103050
  • 服务器
    +关注

    关注

    12

    文章

    9160

    浏览量

    85418
收藏 人收藏

    评论

    相关推荐

    如何选择数据中心服务

    在选择数据中心服务时,需要考虑多个关键因素以确保选择的服务能够满足业务需求并确保数据的安全、可靠性和性能。以下是一些关键步骤和考虑因素: 一、明确业务需求 首先,需要明确自己的业务
    的头像 发表于 10-24 16:14 209次阅读

    简述数据中心网络架构的演变

    随着全球对人工智能(AI)的需求不断增长,数据中心作为AI计算的重要基础设施,其网络架构与连接威廉希尔官方网站 的发展变得尤为关键。
    的头像 发表于 10-22 16:23 297次阅读

    怎样保障数据中心不间断电源不断电 提供可靠安全的供配电#数据中心

    数据中心配电系统
    安科瑞王金晶
    发布于 :2024年08月29日 14:51:36

    IaaS+on+DPU(IoD)+下一代高性能算力底座威廉希尔官方网站 白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务器运行效率显著提升,有效降低成本。因此,在新型数据中心建设时,围绕
    发表于 07-24 15:32

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDIA
    的头像 发表于 06-27 17:31 769次阅读

    数据中心液冷需求、威廉希尔官方网站 及实际应用

    夏日炎炎,数据中心制冷威廉希尔官方网站 全新升级,液冷散热,让服务器清凉一夏。本文将带您一起探索数据中心液冷需求、威廉希尔官方网站 及实际应用。 1 数据中心液冷需求
    的头像 发表于 06-19 11:12 1026次阅读
    <b class='flag-5'>数据中心</b>液冷<b class='flag-5'>需求</b>、威廉希尔官方网站
及实际应用

    芯启源DPU赋能绿色数据中心助力实现双碳战略

    近日,深圳市计算机行业协会在南山区前海自贸区的博大数据深圳前海智算中心成功举办了“新质生产力产品与AIPC应用与挑战威廉希尔官方网站 交流会”。芯启源助理副总裁顾宏波受邀分享《DPU赋能绿色数据中心
    的头像 发表于 06-13 09:53 591次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的应用程序和服务。
    的头像 发表于 05-29 09:22 495次阅读

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    #mpo光纤跳线 #数据中心光纤跳线

    光纤数据中心
    jf_51241005
    发布于 :2024年03月22日 10:18:31

    AI数据中心架构升级引发800G光模块需求激增

    计算需求的战略举措。 为什么需要800G光模块? 800G光模块需求的激增与数据中心网络架构的变化密切相关。传统的三层架构(包括接入层、聚合层和核心层)多年来一直是标准。随着AI威廉希尔官方网站 规
    的头像 发表于 03-05 17:32 614次阅读
    AI<b class='flag-5'>数据中心</b>架构升级引发800G光模块<b class='flag-5'>需求</b>激增

    #MPO预端接 #数据中心机房 #机房布线

    数据中心MPO
    jf_51241005
    发布于 :2024年03月01日 11:12:47

    #永久链路 #信道测试 #数据中心

    数据中心
    jf_51241005
    发布于 :2024年02月23日 10:17:58

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    作为专为 NVIDIA® BlueField® 网络平台而设计的数据中心基础设施软件框架,NVIDIA® DOCA™ 使广大开发者能够利用其行业标准 API 在
    的头像 发表于 02-23 10:02 476次阅读

    #光缆水峰 #综合布线光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2024年01月15日 09:43:26