0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU特征结构系列(二)一种DPU参考设计

中科驭数(北京)科技有限公司 2022-05-05 14:23 次阅读

为了满足“数据为中心”的设计理念,本节给出一个通用的DPU参考设计。目前DPU架构的演化比较快,DPU既可以呈现为一个被动设备作为CPU的协处理器,也可以作为一个主动设备,承接Hypervisor的一些功能。尤其是容器威廉希尔官方网站 、虚拟化威廉希尔官方网站 的广泛采用,DPU的角色已经不仅仅是一个协处理器,而是呈现出更多的HOST的特征,比如运行Hypervisor,做跨节点的资源整合,为裸金属和虚拟机提供虚拟网络,数据安全,热迁移等支撑。宏观来看,DPU架构至少可以分为以下几个核心组成部分:

poYBAGJzbASAIgqXAAq6Mgd8PGs685.png

图DPU架构参考设计

一、控制平面

负责管理、配置,通常由通用处理器核来实现。控制平台负责DPU设备运行管理,以及计算任务和计算资源的配置。运行管理通常包含设备的安全管理和实时监控两个主要功能。在安全管理方面支持支持如信任根、安全启动、安全固件升级以及基于身份验证的容器和应用的生命周期管理等。在设备实时监控方面,对DPU各子系统、数据平面中各处理核动态监测,实时观察设备是否可用、设备中流量是否正常,周期性生成报表,记录设备访问日志核配置修改日志。

计算任务和计算资源配置方面,根据计算任务实施配置数据平面中处理单元间的通路,以及各处理单元参数。根据资源利用情况实时进行任务调度以及在计算单元的映射和部署。同时DPU上层同时会支持多个虚拟机,控制平面在任务部署时还要进行虚拟设备的管理,考虑虚拟机间数据和资源隔离,记录运行状态协助虚拟机热迁移。最后,当DPU集成第三方计算平台,如GPUFPGA等,还需要参与部分卸载任务调度。

由于控制平面任务多样,灵活性要求较高,算力要求较低,通常由通用处理器核来实现,比如ARM、MIPS等核心。为便于用户统一管理和配置DPU设备,提供较好的可编程性,通常会运行标准Linux应用程序。并且控制平面与数据平面数据交互驱动程序需要进行深度优化,来提升控制平面与数据平面有效地交互,任务调度效率。

二、IO子系统

主要分为三个大类:

(1)系统IO,负责DPU和其他处理平台(如X86、ARM处理器、GPU、FPGA等)或高速外部设备(如SSD)的集成。系统IO通常传输数据量较大对带宽有着极高的要求,因此多基于PCIe来实现。系统IO接口分为两大类:EP(Endpoint)类和RC(Root Complex)类。

EP类接口负责将DPU作为从设备与X86、ARM等处理平台相连接。为了充分利用DPU上的内部资源,此类接口要支持强大的硬件设备虚拟化功能,比如SR-IOV和VirtIO。并且可以灵活地支持多种类型的设备,如NIC、Storage、Compute设备等。

RC类接口负责将DPU作为主设备与加速平台(如GPU、FPGA)或外设(SSD)相连接。通过此种方式将部分数据处理卸载到第三方加速平台GPU、FPGA中处理,通常数据量较大,需要支持较强的DMA方案。

(2)网络IO,负责DPU与高速网络相连接,主要是以太网或者FC为主。为了能应对急剧增加的网络带宽,DPU中通常辅以专门的网络协议处理核来加速网络包的处理。包括L2/L3/L4层的ARP/IP/TCP/UDP网络协议处理、RDMA、数据包交换协议、基本网络虚拟化协议等,可以实现100G以上的网络包线速处理。

(3)主存IO,负责缓存网络IO和系统IO输入输出数据,以及数据平面中间数据结果。也可作为共享内存,实现不同处理核之间的数据通信。目前主存IO主要包含DDR和HBM接口类型,两类接口,DDR可以提供比较大的存储容量,可以提供512GB以上的存储容量;HBM可以提供比较大的存储带宽,可以提供500GB/s以上的带宽。两种存储接口相结合可以满足不同存储容量和带宽的需求,但是需要精细的数据管理,这块也是DPU设计中比较有挑战的。

三、数据平面

主要负责高速数据通路的功能单元的集成,通常集成多个处理核。数据平面的功能主要分为五类:

1)高速数据包处理,主要对接收到的网络数据包进行如OvS(开放式虚拟交换机)解析、匹配和处理,以及RDMA远程数据传输加速等操作,和之前的网络处理器NP功能类似,但是在性能上有更高的要求,处理带宽线速要达到100G、200G甚至400G。同时,在进行有状态数据处理时也有着更高的要求,如TCP协议,要求硬件记录各连接信息,并能实现多连接间无缝切换。

2)虚拟化协议加速,支持SR-IOV、VirtIO和PV(Para-Virtualization)等虚拟化。支持网络虚拟化VxLAN、Geneve Overlay卸载和VTEP等协议卸载。

3)安全加密,在线IPSec和TLS加密加速,以及多种标准加解密算法和国密算法。并且对于安全算法的处理性能有较高的要求,要达到网络线速,从而不影响其它正在运行的加速操作。

4)流量压缩,对网络数据包,或者要存储的数据,进行实时地数据压缩/解压缩处理,压缩过程中还要完成地址的转换和重映射等操作。或者在线完成数据流变换处理,如面向多媒体流、CDN(内容分发网络)和4K/8K IP视频的“Packet Pacing”流量整形加速等。

5)其他算法加速。除了上述网络、安全协议外还要支持NVMe等存储协议,业务相关的处理卸载也呈增长趋势,如大数据分析SQL加速。

四、DPU设计的关键

数据平面是整个DPU设计的关键,也是DPU设计中最有挑战的模块。主要面临四个挑战:

1)数据中心的工作负载复杂多样,数据平面支持的处理核种类要足够多,不仅包括网络、存储、安全和虚拟化等基础设施服务,另外业务相关的处理也在加速向DPU平台卸载。

2)高并发性数据处理,数据中心承载的业务多且复杂,多虚拟机多种类业务并发要求数据平面集成足够数量的核心,规模要达到几百个核心规模。随着数据中心数据量的不断增加,对处理性能提出越来越多的挑战,DPU数据平面在处理核规模上要具有非常强的可扩展性。

3)复杂的片上互联系统,随着DPU数据平面处理核数量的增加,再加之高并发处理线程运行,同时还要兼顾好数据平面数据处理的灵活,这就要求处理核之间的数据交互既要灵活又要兼顾高带宽。处理核之间的数据互联,以及核间的数据一致性成为另一设计难题。

4)高效简易的编程方式,数据中心业务的复杂多变决定了DPU数据平台可编程性的硬性需求。一方面要兼顾计算效率,必须直观表达出并发处理任务,充分利用计算资源。另一方面要兼顾DPU的易用性,尽量采用高级语言进行编程,易于设计、开发和维护。

总之,DPU数据平面需要一种大规模敏捷异构的计算架构。这一部分的实现也处在“百家争鸣”的阶段,各家的实现方式差别较大,有基于通用处理器核的方式,有基于可编程门阵列FPGA的方式,也有基于异构众核的方式,还有待探索。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    358

    浏览量

    24172
收藏 人收藏

    评论

    相关推荐

    安谋科技发布“玲珑”DPU和新代VPU

    安谋科技(中国)有限公司在自研威廉希尔官方网站 道路上再迈坚实步伐,近日震撼发布首款“玲珑”系列DPU(数据处理单元)及新代VPU(视频处理单元)。此次推出的“玲珑”D8/D6/D2显示处理器,以及“玲珑”V510/V710视频处理器,均源
    的头像 发表于 09-24 14:33 300次阅读

    中科驭数分析DPU在云原生网络与智算网络中的实际应用

    CCF Chip 2024,精彩不能停!7月21日下午,中科驭数在第届中国计算机学会(CCF)芯片大会的“驭数专属时刻”仍在继续,驭数组织承办“DPU威廉希尔官方网站 趋势和应用——DPU在云原生与智算网络中
    的头像 发表于 08-02 11:21 707次阅读

    IaaS+on+DPU(IoD)+下代高性能算力底座威廉希尔官方网站 白皮书

    的威廉希尔官方网站 标准也在不断完善。从此 DPU 不再是行业巨头的“专享”威廉希尔官方网站 ,基础设施与云计算相关产业参与者都在寻求一种简单高效的方法,将 DPU 的优势运用到自身业务系统之中,例如 Red Hat
    发表于 07-24 15:32

    中科驭数发布第三代DPU芯片K2 Pro,较上代能耗降低30%

    电子发烧友网报道(文/李弯弯)近日,中科驭数(北京)科技有限公司(以下简称“中科驭数”)在北京发布了关于DPU(指数据处理器芯片)的套核心威廉希尔官方网站 ,包括国内首颗量产全功能DPU芯片K2Pro,以及
    的头像 发表于 07-01 07:32 3563次阅读

    中科驭数CEO鄢贵海:从计算系统的三个视角重新审视DPU的核心价值

    在信息威廉希尔官方网站 日新月异的浪潮中,DPU正逐渐崭露头角。当前,DPU发展的核心驱动力来自于什么?DPU威廉希尔官方网站 是否已经足够成熟到广泛应用?市场上头部玩家参与到这创新威廉希尔官方网站 的市场角逐之中?在算力时
    的头像 发表于 06-28 14:27 478次阅读
    中科驭数CEO鄢贵海:从计算系统的三个视角重新审视<b class='flag-5'>DPU</b>的核心价值

    芯片软件全上阵 DPU“全家桶”来了!中科驭数成功举办2024产品发布会

    6月19日,中科驭数2024产品发布会在北京中关村展示中心正式举办。聚焦自研DPU核心威廉希尔官方网站 ,中科驭数重磅发布最新DPU芯片K2 Pro、软件开发平台HADOS、以及一系列针对数据中
    的头像 发表于 06-23 11:09 851次阅读
    芯片软件全上阵 <b class='flag-5'>DPU</b>“全家桶”来了!中科驭数成功举办2024产品发布会

    中科驭数发布高性能DPU芯片K2-Pro

    在信息威廉希尔官方网站 领域,每次芯片威廉希尔官方网站 的突破都代表着行业的次飞跃。近日,DPU领域的领军企业中科驭数宣布,成功研发并发布了其第三代DPU芯片——“K2-Pro”。这款芯片的发布,标志着中科驭
    的头像 发表于 06-21 11:41 777次阅读

    基于芯启源NFP3800DPU芯片的深信服安全加速卡XSX40FNN网卡

    近日,国内DPU领域的领军企业芯启源宣布,基于芯启源NFP3800DPU芯片定制的深信服安全加速卡XSX40FNN网卡已成功应用于其防火墙产品,并已批量推向市场。
    的头像 发表于 05-29 14:06 953次阅读
    基于芯启源NFP3800<b class='flag-5'>DPU</b>芯片的深信服安全加速卡XSX40FNN网卡

    NVIDIA DPU编程入门开课仪式在澳门科技大学成功举办

    5 月 24 日,NVIDIA DPU 编程入门开课仪式在澳门科技大学成功举办。作为首个在中国开设 NVIDIA DPU 编程相关课程的高校,来自澳门科技大学不同院系的师生共同见证了本次仪式。
    的头像 发表于 05-28 09:40 396次阅读

    DPU威廉希尔官方网站 赋能下代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络为中心的AI算力底座构建之路》主题演讲,勾勒出在通往AGI之路上,DPU威廉希尔官方网站 赋能下
    的头像 发表于 04-20 11:31 850次阅读

    明天线上见!DPU构建高性能云算力底座——DPU威廉希尔官方网站 开放日最新议程公布!

    威廉希尔官方网站 在不同行业中的应用解决方案有哪些?能带来怎样的业务效果? 3月29日本周五,中科驭数集结产品大咖及解决方案专家团,诚邀您参加以“DPU构建高性能云算力底座”为主题的线上DPU威廉希尔官方网站 开放日! 他们将逐与您分享中科驭数
    的头像 发表于 04-03 18:12 1004次阅读

    中科驭数DPU威廉希尔官方网站 开放日秀“肌肉”:云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

    DPU威廉希尔官方网站 开放日既是对DPU威廉希尔官方网站 应用的典型方案展示,也是DPU威廉希尔官方网站 在重要细分场景走向成熟的标志。
    的头像 发表于 04-01 11:48 788次阅读
    中科驭数<b class='flag-5'>DPU</b>威廉希尔官方网站
开放日秀“肌肉”:云原生网络、RDMA、安全加速、低延时网络等方案组团亮相

    FPGA-Based DPU网卡的发展和应用

    采用单芯片的SoC形态,兼顾性能和功耗。FPGA-Based DPU在硬件设计上的挑战主要来自芯片面积和功耗。
    发表于 02-23 14:40 2072次阅读
    FPGA-Based <b class='flag-5'>DPU</b>网卡的发展和应用

    星云智联首款自研DPU ASIC芯片版流片成功

    近日,星云智联自主研发的DPU芯片M18120回片后,十分钟内成功点亮,十八小时完成通流验证,成功实现了芯片设计目标!这优异的成绩得益于星云智联规范的IPD产品流程、严格的质量控制、高效的项目管理
    的头像 发表于 01-26 14:34 690次阅读

    中科驭数自研第DPU芯片K2获得行业认可

    近日,中科驭数自研第DPU芯片K2在众多云生态创新应用威廉希尔官方网站 产品中脱颖而出,成功入选由中国云产业联盟暨中关村云计算产业联盟发布的“2023年中国云生态创新应用威廉希尔官方网站 产品”。这殊荣既是对中科驭数第
    的头像 发表于 01-18 09:20 1081次阅读