0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

硬件算力需求飙升,为什么软件生意越来越火?

张慧娟 来源:电子发烧友网 作者:张慧娟 2019-10-14 07:59 次阅读

人工智能进一步推动了对算力的渴求,硬件的世界已经发生了极大的颠覆,不论是数据的处理方式还是计算架构的延伸,除了CPUGPUDSPFPGA等,还涌现出各种各样的AI加速器。除了传统的芯片提供商,算法提供商、设备服务商甚至互联网公司等,也都开始规划自己的芯片战略。另一方面,创新速度也在加剧,甚至远远超出芯片的设计速度。

硬件发展受到了前所未有的挑战。但与此同时,软件的重要性也被提到了前所未有的高度。这背后的逻辑是什么?

三大行业趋势正在驱动变革

第一个趋势是云和端的一体化。以前我们将大的计算量都放在云端,但随之而来产生了带宽传输的问题。当把运算量渐渐移到端侧的时候,又产生了功耗、算力的问题。可能的处理方式是:当数据量较小的时候放在端侧,随着数据量增大再放到云上,这就使得很多场景下很难界定究竟是云上还是端侧,因此需要从云到端统一的解决方案,来适配不同场景下的计算需求。

第二个趋势是AI激增。其前提是数据量的激增,以及数据形态的巨大变化。从传统的文本、图形数据,到现在的视频音频、社交等非结构化数据,未来还有包括联网汽车数据、神经网络数据、基因数据等更多形态的数据。当数据量越来越大之后,如何让数据发挥真正的价值成为重要的关注点。

第三个趋势是异构计算。传统上应对运算性能提升的方式包括单核速度的提升,以及单核变多核。但是当这两种方式仍然无法满足计算需求的时候,CPU+GPU、CPU+FPGA等组合形式的异构计算概念出现了。异构虽然带来了性能上的提升,但是也给软件开发者带来了各种挑战。

软硬件各自为政的时代已过去!

除了上述趋势,软硬件本身的特性也在促使二者关系的转变。硬件按照物理规律在发展,相对于软件,必然存在迭代慢、架构复杂的问题,特别是随着摩尔定律趋缓,硬件架构上的物理增长越来越艰难。相较之下,算法的增长和优化则空间很大,一方面能够提升硬件架构的物理性能;另一方面,通过算法的升级能够带来算力上的跃进。例如苹果、华为、百度、阿里等公司都推出了内置AI算法的芯片,应用场景多以云端为主。

在这些趋势的引领下,软硬件的关系产生了新的变化。软件似乎正变得越来越重要,许多公司甚至选择软件为先,硬件再去跟进。

当所有创新都被按下快进键的过程中,硬件工程师需要工具帮助他们突破固定硬件的开发限制,快速面对市场;软件工程师则需要帮助他们屏蔽硬件复杂性,让他们可以在熟悉的开发环境中提升效率。

二者谁更重要呢?没有软件,芯片无法使用,需要大量的软件开发者去将它表达为用户真正所需;另一方面,软件又需要芯片这个实体去承载,在整个系统中发挥价值。

谁能帮助硬件和软件工程师重新坐下来对话,为他们搭建起沟通的桥梁?

巨头们已经嗅到了这样的趋势。

10月9日,赛灵思宣布推出开放、标准、免费的统一软件平台Vitis。这是赛灵思有史以来首次发布的一款软硬件统一的平台,可以说是赛灵思近年来转型中一个重要的成果,根据官方说明,它可以让包括软件工程师和 AI 科学家在内的广大开发者都能受益于硬件灵活应变的优势。Vitis统一软件平台支持赛灵思异构平台(包括FPGA、SoC和Versal ACAP)上开发嵌入式软件和加速应用,为边缘、云和混合计算应用加速提供统一编程模型。它可以与高层次框架进行集成,通过加速库采用C、C++Python进行开发,也可以使用基于RTL的加速器和低层次运行时API对实现方案进行粒度更为精确的控制。

四层堆栈,打通从硬件到应用的道路!

Vitis 平台构建在基于堆栈的架构之上,该架构可以无缝插入到开源的标准开发系统与构建环境,并且包含一套丰富的标准库。

基础层是 Vitis 目标平台,该平台由电路板和预编程 I/O构成。

第二层称为 Vitis 核心开发套件,覆盖开源赛灵思运行时库,以管理不同域间的数据移动,包括子系统、即将发布的 Versal ACAP内的AI引擎和必要的外部主机。此外,该层也提供编译器、分析器和调试器等核心开发工具,这些工具设计的目的是能与业界标准的构建系统与开发环境无缝集成。

在第三层,8个Vitis 库提供 400 余种优化的开源应用。这8个库分别是:Vitis 基本线性代数子程序(BLAS)库、Vitis 求解器库、Vitis 安全库、Vitis 视觉库、Vitis 数据压缩库、Vitis 计量金融库、Vitis 数据库集和 Vitis AI 库。借助这些库,软件开发者可以使用标准的应用编程接口(API)来实现硬件加速。

Vitis 平台的第四层,也是最具有变革意义的一层是 Vitis AI。它集成了特定领域架构(DSA),提供了针对AI模型的硬件实现,开发者可以使用包括TensorFlow和Caffe等框架进行配置与编程。Vitis AI 提供的工具链能在数分钟内完成优化、量化和编译操作,在赛灵思器件上运行预先训练好的AI模型。此外,它也为从边缘到云端的部署提供了专用 API,实现更好的推断性能与效率。赛灵思很快还将推出另一个 DSA(Vitis Video),支持从 FFmpeg 直接进行编码并提供同样超级简单且功能极强大的端到端视频解决方案。由合作伙伴公司提供的 DSA 包括:与 GATK 集成用于基因分析的Illumina,与ElasticSearch 集成用于大数据分析的BlackLynx,以及当前客户正在使用的专有DSA。

如何打破软硬件壁垒,提升创新效率?

赛灵思软件和人工智能高级经理罗霖,以智慧城市为例说明了如何通过统一软件平台Vitis,来帮助开发人员进行效率提升。

智慧城市一个典型的应用场景就是在道路上实时统计交通流量,包括汽车流量、人流量等,通过大量摄像头实时捕捉,在前端进行特征提取,再传给服务器或云端,进行更高层次的信息提取和分析。

这个典型案例中,摄像头和边缘端服务器端都可以部署赛灵思的器件,硬件开发人员完成IP开发后,再由嵌入式开发人员进行一定程度的修改,基于Shell和Runtime,由应用开发人员使用经过优化的库(包括CNN加速库、数据分析和加速库)完成应用开发。

对于算法开发人员,他们通过TensorFlow等进行模型训练之后,可以得到一个浮点的Model。接下来的开发流程中,他们就可以使用Vitis AI开发工具。基于模型进行第一步优化,第二步完成模型的量化即定点,第三步定点好之后进行编译,生成基于底层DPU的机器代码。最终,在板上进行部署后分析性能,包括运算效率等。如果觉得性能已达到目标,就可以编译成库,应用代码可以直接调用编译好的库,进行网络推断。整个过程中,他们不需要关注底层的RTL、驱动程序或是数据的搬运,所有的工作都是基于模型,由工具去生成在目标硬件上运行的机器代码。

如何快速通过Vitis达到用户所需的目标性能?罗霖表示,第一,软件开发人员可以把算法,包括前后处理都在CPU上完成,这部分不需要底层硬件开发人员的帮助,用Vitis可以达到每秒6帧的性能;第二,把DPU放在Shell里,用算法在其中做加速,性能可以从每秒6帧提升到每秒30帧;第三,为了提升端到端的性能,比如预处理是设计空间的转换或者是视频缩放,这部分可以用Vitis库提供前处理的优化,从30FPS提升到40FPS甚至再提升到80FPS。

整个项目中用到了浏览器、编译器还有分析器,按照时间线来看,内核占用情况、数据从编写到搬运占用时间、中断是否合适……所有这些底层运行的细节,软件工程师一目了然,从而可以判定系统的运行状况,以及瓶颈问题等。而传统上,还需要在工具中专门插入芯片间隙或数据监测器才能够实现。

屏蔽硬件复杂性——当前软件的重要价值

通过开放、通用的软件来屏蔽硬件复杂性,使软件人员在他们熟悉的开发环境中专注于创新,而无需关注底层硬件平台的细节——成为消除当前软硬件壁垒的主要手段。

今年8月,Intel对其即将于年底发布的oneAPI开发者测试版本进行了剧透。OneAPI整合了计算和架构创新,通过高速互连以及新的软件开发模式,希望为开发者简化API。Intel希望将硬件能力抽象出来,把最重要的算法融于oneAPI,使开发者不再需要针对硬件做开发,更容易发挥出硬件的所有潜力。Intel的软件策略似乎更强调围绕架构所进行的扩展,横跨PC、网络和数据中心,目标包括易用性、开放性以及统一的开发体验。

再看英伟达建立在GPU基础上的通用计算开发平台CUDA,由于在性能、成本和开发时间上较传统的CPU解决方案有显著优势,当时一经推出就颇受市场欢迎。近年来,英伟达为了推进GPU的易用性,仍持续从软件层面帮助开发者在更多垂直领域的GPU平台上部署应用程序。

赛灵思大中华区销售副总裁唐晓蕾表示,提供灵活丰富的硬件选择给软件工程师,通过高层的API去调用下层资源,这个理念是一致的,只是不同厂商有不同的实现手段。赛灵思强调软件定义硬件,硬件必须是可适应的、灵活的。

她以自动驾驶多样化的应用场景为例谈到,摄像头、环视、泊车等可能由不同的公司来实现,应用场景包括高速公路、市区、港口、码头等等。如果专门为某一个应用设计一款芯片是不可能的,客户需要的是——灵活的、扩展性较强的平台,可以根据应用和工作负载来优化系统,这是赛灵思推出Vitis的主要原因。此外,推出开放、标准、免费的Vitis,也便于拓展用户群,让更多的软件工程师体验赛灵思的的自适应硬件平台。

未来软硬件的关系走向?

使用标准的环境与API、拥抱开源、软硬件协同作战——是未来软硬件关系的三大方向。

由于开源社区在生态系统和开发者社区创新中越来越重要,巨头们都希望以更积极的态度介入这场大变革之中。

值得一提的是,在开放性方面,赛灵思一个很大的创新还在于:赛灵思完全将集成的开发环境免费提供给用户,让他们将Vitis无缝集成在自己的开发环境中。这与过去用户自己设计开发环境,背后调用赛灵思的编译器和调试工具有很大的不同,更有利于软件开发人员在自适应的开发平台上释放创新力。其开发者网站developer.xilinx.com,将作为连接Vitis开发者社区的空间,由赛灵思、Vitis专家及爱好者共同管理,分享更新、设计技巧等信息。

正如唐晓蕾所说,如果以搭建乐高来比喻未来的系统设计的话,那么硬件更像是一个个的乐高块,软件就像是搭建规则或是创意。乐高块也许会有相同,但不同的搭建方式可以实现创意纷呈,赛灵思希望把乐高块越做越丰富,给工程师更多的选择,帮助他们更容易实现更多的功能创新,灵活应对不断变化的市场需求。



声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47409

    浏览量

    238923
  • 异构计算
    +关注

    关注

    2

    文章

    101

    浏览量

    16315
收藏 人收藏

    评论

    相关推荐

    调度的基础知识

    编者按 “调度”的概念,这几年越来越多的被提及。刚听到这个概念的时候,我脑海里一直拐不过弯。作为底层芯片出身的我,一直认为:
    的头像 发表于 11-27 17:13 212次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>调度的基础知识

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。以下是对企业AI
    的头像 发表于 11-14 09:30 760次阅读

    GPU开发平台是什么

    随着AI威廉希尔官方网站 的广泛应用,需求呈现出爆发式增长。AI租赁作为一种新兴的服务模式,正逐渐成为企业获取
    的头像 发表于 10-31 10:31 200次阅读

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    我们的城市为什么越来越热?

    全球气候在变暖,我们焚烧石油,煤炭等化石燃料,产生了大量二氧化碳等温室气体,导致全球气候变暖,尤其大陆气温升高,城市变得越来越热。图:上海前滩的夜晚,被太阳晒热的建筑热岛效应夏天天太热,在阳光
    的头像 发表于 08-03 08:14 571次阅读
    我们的城市为什么<b class='flag-5'>越来越</b>热?

    摩尔线程张建中:以国产助力数智世界,满足大模型需求

    摩尔线程创始人兼CEO张建中在会上透露,为了满足国内对AI的迫切需求,他们正在积极寻求与国内顶尖科研机构的深度合作,共同推动更大规模的AI智集群项目。
    的头像 发表于 05-10 16:36 977次阅读

    液冷是大模型对需求的必然选择?|英伟达 GTC 2024六大亮点

    的先锋,对液冷散热的三种方式(冷板式、浸没式和喷淋式)做了详细的对比分析、成本测算和市场空间预测。并为您提供一份“实用教程”,指导如何将普通服务器改装为液冷服务器,以应对越来越复杂的计算需求
    的头像 发表于 04-10 12:57 624次阅读
    液冷是大模型对<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>的必然选择?|英伟达 GTC 2024六大亮点

    简史,是一段波澜壮阔的历史

    。依靠大脑所提供的,我们才得以生存。动物也有大脑,也有,但是远远不如人类强劲。在漫长的进化过程中,人类的大脑越来越发达,最终帮助自己
    的头像 发表于 04-04 08:26 678次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>简史,是一段波澜壮阔的历史

    嵌入式会越来越卷吗?

    嵌入式会越来越卷吗? 当谈及嵌入式系统时,我们探究的不仅是一种科技,更是一个日益多元与普及的趋势。嵌入式系统,作为一种融入更大系统中的计算机硬件软件,旨在执行特定功能或任务。但这个看似特定的系统
    发表于 03-18 16:41

    我们该如何应对SOC中越来越庞大和复杂的SDC约束?

    SOC设计变得越来越复杂,成本越来越高,设计和验证也越来越困难。
    的头像 发表于 03-13 14:52 1208次阅读
    我们该如何应对SOC中<b class='flag-5'>越来越</b>庞大和复杂的SDC约束?

    IC datasheet为什么越来越薄了?

    刚毕业的时候IC spec动则三四百页甚至一千页,这种设置和使用方法很详尽,但是这几年IC datasheet为什么越来越薄了,还分成了IC功能介绍、code设置、工厂量产等等规格书,很多东西都藏着掖着,想了解个IC什么东西都要发邮件给供应商,大家有知道这事为什么的吗?
    发表于 03-06 13:55

    Sora爆引全球需求激增?赛思时间同步威廉希尔官方网站 使如虎添翼!

    近日,联想集团杨元庆表示,Sora的推出会加大全球AI需求,会进一步带动AI的普及和平民化应用。从供给侧来看,这一方面会提高对传统性能的要求,另一方面也需要进行新的威廉希尔官方网站 创新。赛思时频创新威廉希尔官方网站 使
    的头像 发表于 03-01 10:36 481次阅读
    Sora爆<b class='flag-5'>火</b>引全球<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>激增?赛思时间同步威廉希尔官方网站
使<b class='flag-5'>算</b><b class='flag-5'>力</b>如虎添翼!

    智能规模超通用,大模型对智能提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   可以分为通用、智能
    的头像 发表于 02-06 00:08 6405次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    深入了解浮点运算—CPU和GPU是如何计算的?

    随着国家大力发展数字经济,的提升和普惠变得越来越重要。在数字化时代,已成为推动科技发展和创新的关键要素。
    的头像 发表于 01-18 18:20 4174次阅读
    深入了解浮点运算—CPU和GPU<b class='flag-5'>算</b><b class='flag-5'>力</b>是如何计算的?