0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器

中科驭数(北京)科技有限公司 2022-04-27 14:41 次阅读

从应用特征来看,可以把应用分为“IO密集型”和“计算密集型”两类,如下图所示。IO密集型应用,通常体现为较高的输入和输出带宽,数据直接来自于IO,数据通常具备流式特征,数据局部性不显著,如果处理性能与带宽匹配,片上缓存的作用就可以弱化。例如处理路由转发、数据加密、压缩等。计算密集型应用,体现为较高的计算密度,通常浮点性能突出,数据来自主存,数据局部性显著,复用性高,主存的大小对于问题求解的性能有直接影响。例如求解线性代数方程组,大规模神经网络训练、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

图不同类型的处理器的特征结构

一个处理器芯片是“IO密集”还是“计算密集”只部分决定了芯片的结构特征,并不能完全定义芯片的主体架构。无论是IO密集,还是计算密集,即可以以通用CPU为核心构造主体计算架构,也可以以专用加速器为核心构造主体计算架构。前者可称之为以控制为中心(control-centric)的模式,后者称之为以数据为中心(data-centric)的模式。控制为中心的核心是实现“通用”,数据为中心的核心是通过定制化实现“高性能”。以应用特征和架构特征这两个维度粗略划分处理器芯片类型分布,如图2-1所示。

通用CPU是偏向于控制为中心结构,理论上看就是要“图灵完备”,要支持完备的指令集,通过编程指令序列来定义计算任务,通过执行指令序列来完成计算任务,因此具备极其灵活的编程支持,可以任意定义计算的逻辑实现“通用”——这也是CPU最大的优势。同时,为了提高编程的开发效率,降低编译器复杂度,缓存管理和细粒度并行度的开发通常都是由硬件来完成。类似的,还有大量的用于各种嵌入式、移动设备的微控制器MCU,并不强调高带宽,也是以控制为中心的结构。NP,DSP也是便向于基于通用处理器来做专用化扩展,但是非常注重高通量的性能属性。例如,NP要支持数Tbps的转发带宽,所以大体可以视为控制为中心、但是IO密集的处理器类型。

GPU是以数据为中心的结构,形式上更倾向于专用加速器。GPU的结构称之为数据并行(data-parallel)结构,优化指令并行度并不是提升性能的重点,通过大规模同构核进行细粒度并行来消化大的数据带宽才是重点。例如,最新的NVIDIA TITAN RTX GPU有4608个CUDA核、576个Tensor核,而且单片GPU通常配置数十GB的超大显存。同时缓存管理多采用软件显示管理,降低硬件复杂度。这类超众核结构是以数据为中心、执行计算密集型任务的代表性架构。

DPU也偏向于数据为中心的结构,形式上集成了更多类别的专用加速器,牺牲一定的指令灵活性以获得更极致的性能。但是与GPU不同,DPU要应对更多的网络IO,既包括外部以太网,也包括内部虚拟IO,所以DPU所面临的数据并行更多可能是数据包并行,而不是图像中的像素、像块级并行。而且DPU也会配置少数通用核(如ARM,MIPS)来处理一定的控制面的任务,运行轻量级操作系统来管理DPU上的众多的异构核资源,所以体现了一定“通用”性,但性能优势主要不源于这些通用核,而是大量专用计算核。早期的一些网络处理器采用过类似Tile64的通用众核结构,以增加核的数量来应对多路处理的数据,实现并发处理,但单路延迟性能通常都比较差。因此,DPU更偏向于以数据为中心,执行IO密集任务。

DPU是软件定义的威廉希尔官方网站 路线下的重要产物。在软件定义网络中,将数据面与控制面分离是最核心的思想。DPU被定义为强化了数据面性能的专用处理器,配合控制面的CPU,可以实现性能与通用性的更佳的平衡。

来源:专用数据处理器(DPU)威廉希尔官方网站 白皮书,中国科学院计算威廉希尔官方网站 研究所,鄢贵海等

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    358

    浏览量

    24171
收藏 人收藏

    评论

    相关推荐

    安谋科技发布“玲珑”DPU和新代VPU

    安谋科技(中国)有限公司在自研威廉希尔官方网站 道路上再迈坚实步伐,近日震撼发布首款“玲珑”系列DPU数据处理单元)及新代VPU(视频处理单元)。此次
    的头像 发表于 09-24 14:33 299次阅读

    OMAP5912应用处理器数据

    电子发烧友网站提供《OMAP5912应用处理器数据表.pdf》资料免费下载
    发表于 08-07 09:16 0次下载
    OMAP5912应<b class='flag-5'>用处理器</b><b class='flag-5'>数据</b>表

    中科驭数分析DPU在云原生网络与智算网络中的实际应用

    的探索与实践”专题论坛,业内DPU专家们将讨论焦点锁定在了DPU在云原生网络与智算网络中的实际应用,深入探讨了如何利用DPU威廉希尔官方网站 解决计算系统级问题,进步推动了
    的头像 发表于 08-02 11:21 706次阅读

    IaaS+on+DPU(IoD)+下代高性能算力底座威廉希尔官方网站 白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务运行效率显著提升,有效降低成本。因此,
    发表于 07-24 15:32

    中科驭数:DPU是构建高效智算中心基础设施的必选项

    先生在《基于DPU的高效智算中心算力底座》主题分享中提出,大模型等智算业务推动算力需求规模快速增长,CPU+GPU+DPU的新型计算节点架构已成为高效智算中心的标准配置,
    的头像 发表于 07-08 10:51 705次阅读

    中科驭数发布第三代DPU芯片K2 Pro,较上代能耗降低30%

    电子发烧友网报道(文/李弯弯)近日,中科驭数(北京)科技有限公司(以下简称“中科驭数”)在北京发布了关于DPU(指数据处理器芯片)的套核心威廉希尔官方网站 ,包括国内首颗量产全功能DPU芯片K2P
    的头像 发表于 07-01 07:32 3557次阅读

    中科驭数CEO鄢贵海:从计算系统的三个视角重新审视DPU的核心价值

    如何找准价值定位?而中科驭数作为国内DPU先行者,又将如何解题,引领DPU行业进入到个全新的高度? 6月19日,在中科驭数2024产品发布会上,中科驭数CEO鄢贵海发表了《重新定义DPU
    的头像 发表于 06-28 14:27 478次阅读
    中科驭数CEO鄢贵海:从计算系统的三个视角重新审视<b class='flag-5'>DPU</b>的核心价值

    芯片软件全上阵 DPU“全家桶”来了!中科驭数成功举办2024产品发布会

    6月19日,中科驭数2024产品发布会在北京中关村展示中心正式举办。聚焦自研DPU核心威廉希尔官方网站 ,中科驭数重磅发布最新DPU芯片K2 Pro、软件开发平台HADOS、以及
    的头像 发表于 06-23 11:09 848次阅读
    芯片软件全上阵 <b class='flag-5'>DPU</b>“全家桶”来了!中科驭数成功举办2024产品发布会

    中科驭数发布高性能DPU芯片K2-Pro

    在信息威廉希尔官方网站 领域,每次芯片威廉希尔官方网站 的突破都代表着行业的次飞跃。近日,DPU领域的领军企业中科驭数宣布,成功研发并发布了其第三代DPU芯片——“K2-Pro”。这款芯片的发布,标志着中科驭
    的头像 发表于 06-21 11:41 774次阅读

    芯启源DPU赋能绿色数据中心,助力实现双碳战略

    近日,深圳市计算机行业协会在南山区前海自贸区的博大数据深圳前海智算中心成功举办了“新质生产力产品与AIPC应用与挑战威廉希尔官方网站 交流会”。芯启源助理副总裁顾宏波受邀分享《DPU赋能绿色数据中心
    的头像 发表于 06-13 09:53 584次阅读

    DPU威廉希尔官方网站 赋能下代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络中心的AI算力底
    的头像 发表于 04-20 11:31 847次阅读

    明天线上见!DPU构建高性能云算力底座——DPU威廉希尔官方网站 开放日最新议程公布!

    算力,是数字经济时代的新质生产力。随着人工智能、智算中心建设等需求不断拓展,DPU在各行各业数据中心的应用逐步深入。异构算力代表DPU在新质生产力建设中,能否给出别开生面的答案,应战算
    的头像 发表于 04-03 18:12 1002次阅读

    芯来科技正式发布首款专用处理器产品线Nuclei Intelligence系列

    本土RISC-V CPU IP领军企业——芯来科技正式发布首款针对人工智能应用的专用处理器产品线Nuclei Intelligence(NI)系列,以及NI系列的第款AI
    的头像 发表于 02-26 10:15 1265次阅读
    芯来科技正式发布首款<b class='flag-5'>专用处理器</b>产品线Nuclei Intelligence<b class='flag-5'>系列</b>

    芯来科技发布AI专用RISC-V处理器内核NI900系列

    在AI威廉希尔官方网站 迅速发展的当下,RISC-V CPU IP领域的领军企业芯来科技,正式发布了针对人工智能应用的专用处理器产品线——Nuclei Intelligence (NI)系列。作为该系列的首款产品,NI900
    的头像 发表于 02-26 09:36 756次阅读

    FPGA-Based DPU网卡的发展和应用

    采用单芯片的SoC形态,兼顾性能和功耗。FPGA-Based DPU在硬件设计上的挑战主要来自芯片面积和功耗。
    发表于 02-23 14:40 2068次阅读
    FPGA-Based <b class='flag-5'>DPU</b>网卡的发展和应用