0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

花茶晶晶 来源:电子发烧友 作者:黄晶晶 2024-04-16 09:10 次阅读

电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 威廉希尔官方网站 使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以满足更高性能和更复杂的 AI 工作负载。Ethos-U NPU系列是业界首款 AI 微加速器,英飞凌、恩智浦半导体、奇景光电 (Himax)、Alif Semiconductor 和 Synaptics 等领先企业均已推出搭载 Ethos-U 的量产芯片。最近,Arm发布Arm Ethos-U85 AI加速器,这款加速器在性能、算力、应用场景方面进一步拓展,着眼于未来几年的边缘AI的应用所需。

全新Arm Ethos-U85 AI加速器

与上一代产品相比,Ethos-U85 性能提升四倍,能效提高 20%,它支持MAC 单元从 128 个扩展到 2048 个(在 1GHz 时,算力实现 4 TOPs)。Ethos-U85 提供了相同的一致工具链,实现无缝的开发者体验。全新 Ethos-U85 NPU 支持TensorFlow Lite 和 PyTorch 等 AI 框架。Ethos-U85可满足于智能家居、零售、工业等新兴的边缘 AI 场景对更高性能计算的需求。

wKgZomYclwuAXCUGAAKIwINsqQs457.png
图:Arm Ethos-U85 提供卓越的神经网络加速功能


Ethos-U85支持Transformer 架构和卷积神经网络 (CNN) 以实现 AI 推理。Arm 物联网事业部业务拓展副总裁马健Chloe Ma分析,Ethos-U85 不仅仅提供卷积神经网络 (CNN) 所需的权重矩阵乘的运算,还支持矩阵相乘,这是 Transformer 架构网络的一个基本组成部分。Ethos-U85 增加对Transformer 架构网络的支持,这是优化大模型边缘落地微调时间、提升模型泛化的一个关键特性。

马健表示:“基于 Transformer 的模型具有优异的泛化功能,它将更快地驱动新 AI 应用的发展。Transformer 在视觉和生成式 AI 用例中,比如视频理解、图文结合,图像增强与生成、图像分类和目标检测等方面都极有价值。Transformer 架构网络的注意力机制容易利用并行计算来实现,提高硬件使用效率,使得这些模型能够部署在计算资源有限的边缘设备上。开发者可以通过选用针对 Transformer 架构网络优化的设计,发掘边缘 AI 的新机遇,使这些应用享有更快的推理、更优化的模型性能和可扩展性。”

Ethos-U85 不仅支持低功耗MCU的AI加速。在高性能边缘计算系统中,Ethos-U85与Armv9 Cortex-A CPU相结合,为基于应用处理器智能物联网平台上运行的AI任务实现加速。这将使 Ethos-U85 能够在工业机器视觉、边缘网关、可穿戴设备和消费类机器人等应用中,带来高效能的边缘推理。

全新Arm Corstone-320智能物联网参考设计平台

Corstone-320 包含了 Cortex-M 系列最高性能的嵌入式处理器 Cortex-M85,Ethos-U85 NPU AI 加速器以及Arm Mali-C55 ISP等,以实现为视觉应用优化的低功耗系统。与此前推出的Arm物联网参考设计一致,Corstone-320 不仅仅提供芯片计算子系统 IP 组合,还附带了软件、AI 模型库和开发工具,以实现软件的复用,同时也利用了 Arm 强大的生态系统。它还附带了仿真 Corstone-320 完整系统的 Arm 虚拟硬件,以及单独的 CPU 和 NPU 的固定虚拟平台 (FVP) 模型,以简化开发并加速产品设计,支持软硬件并行协同开发。这种提供边缘 AI 和智能物联网计算子系统全套软硬件和工具链的方法,使得合作伙伴能够在一系列性能点上快速开发,并聚焦于打造差异化价值。

wKgZomYclyuAcbh3AAE7eIyZSLw925.png
图:Arm 助力加速边缘 AI 设备部署进程


马健介绍,全新的参考设计是针对实际工作负载开发的,参考用例包括部署在智能家居中的电池供电摄像系统,以及在工业和零售系统中的低帧率网络摄像头。同时,Corstone-320 参考设计提供了有安全保证的软硬件组合,使得在此参考设计基础上开发的合作伙伴们能够顺利地通过 PSA Certified Level 2 认证,实现对区域和全球安全标准的合规。总之,通过 Corstone-320 预先集成、预先验证的参考设计模版,Arm 能帮助合作伙伴减少边缘智能芯片开发的成本和时间。

基于 Arm 平台的 AI 软件生态系统

“只有 Arm 计算平台才能提供 AI 从云到端、现代敏捷开发和部署流程中所需的特性和功能,实现基于量产验证的一致架构,并采用统一工具链完成AI 转型。”马健说道。实际上,一致性的工具链和平台对于开发者而言非常重要,尤其是面对物联网碎片化,加上AI功能引入的复杂性,如果缺少一个良好的生态、工具支持,将耗费开发者大量的开发时间。

随着边缘 AI 的持续扩展,简单易用才更适于普及推广,因此物联网生态链上下游的芯片与系统供应商、算法软件开发者与集成商们汇聚在Arm计算平台。目前,包括开发者、数据科学家、学术界在内的 AI 研究开发社区,不仅持续受益于 Arm 生态系统与合作伙伴提供的丰富信息与知识,也围绕 Arm 计算平台构建日益增长的软件和工具生态系统,以及开源软件库和 AI 框架,以更简化的开发流程,扩展边缘 AI 的部署。

wKgZomYclzqAGsH9AAFhwlxkXtU102.png
图:基于 Arm 平台的 AI 软件生态系统

马健举例说:“大家熟知的 PyTorch 开源 ML 框架,广泛用于构建和训练神经网络模型,而我们也很高兴看到 PyTorch 基金会投资边缘 AI,发布针对移动和边缘设备推理工具包 ExecuTorch,提供了轻量级运行时 (Runtime) 和算子注册表,覆盖了PyTorch生态系统中的各类模型。此外,由于 Arm 特有的 IP 授权许可模式和开放生态,OEM 和 ODM 可以有多种基于 Arm 架构和计算平台的芯片与模组选择,更灵活地开发适于最终应用的系统方案。”

小结:

随着边缘 AI 的持续发展,Arm 始终处于推动市场和威廉希尔官方网站 进步的核心地位,从 Cortex-M 嵌入式处理器的 Helium 矢量增强指令集,到 Cortex-A 应用处理器的 SVE、SVE2、SME 对矢量和矩阵运算的优化,再到 Ethos-U AI 加速器,Arm 不断丰富产品线并拉高性能。

马健表示,Arm 不会止步于此。随着大模型持续通过量化、剪枝和聚类威廉希尔官方网站 来缩减优化模型,使大模型适于在边缘和超级终端设备部署,Arm认为大小模型云边端结合成为未来 AI 产品的重要发展趋势,也是 AI 应用赋能行业发展的重要方向。而 Arm 已经为此做好准备,来挑战物联网与大模型、多模态 AI 结合的性能与效率极限。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9084

    浏览量

    367390
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268892
  • AI加速器
    +关注

    关注

    1

    文章

    68

    浏览量

    8634
收藏 人收藏

    评论

    相关推荐

    NVIDIA 推出高性价比的生成 AI 超级计算机

    Jetson Orin Nano Super 可将生成 AI 性能提升至1.7
    发表于 12-18 17:01 300次阅读
    NVIDIA 推出高性价比的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 超级计算机

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    线程调度,与Hopper架构的细粒度同步机制,使得异构计算场景下的任务协同更加灵活。在我的分布训练实践中,这些特性显著提升了模型收敛速度。 张量处理的设计是本书点睛之笔。从数学抽象
    发表于 11-24 17:12

    IBM将在云平台部署AMD加速器

    IBM与AMD近期宣布了一项重要合作协议,根据协议,IBM将在其云平台上部署AMD Instinct MI300X加速器。这一举措旨在提升企业客户在生成
    的头像 发表于 11-19 16:24 213次阅读

    NXP推出集成NPU的MCU,支持AI边缘设备!MCU实现AI功能的多种方式

    可扩展的硬件加速器架构,专为AI和ML应用而设计。NPU的引入大幅提升了设备的AI工作负载性能
    的头像 发表于 09-29 01:11 3761次阅读

    芯品# 物联网市场性能最高的 NPU

    提高数据隐私和安全性。 ArmEthos NPU 如何增强边缘和端点的 AI 性能? 多年来,Ar
    的头像 发表于 06-26 17:28 7822次阅读
    芯品# 物联网市场<b class='flag-5'>性能</b>最高的 NPU

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    NVIDIA NVLink,支持 FP4 AI 精度。 GB200 NVL72是一款性能卓越的计算平台,采用更快的第二代Transformer引擎和FP8精度,可将大型语言模型的训练速
    发表于 05-13 17:16

    Arm平台赋能移动端生成AI

    生成人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备。
    的头像 发表于 04-26 11:09 800次阅读

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 745次阅读

    Arm推第三代边缘AI加速器Arm Ethos-U85

    除了Ethos-U85之外,Arm还推出了全新的物联网参考设计平台Corstone-320。该平台将Arm最高性能的Cortex-M
    发表于 04-16 11:09 669次阅读
    <b class='flag-5'>Arm</b>推第三代<b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm发布第三代NPU,适用于工业自动化等场景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神经网络以达 85% 的利用率。其设计适配基于 Arm Cortex-M / A 处理内核的系统,对内存延迟有较强
    的头像 发表于 04-12 16:13 963次阅读

    AMD Versal SoC全新升级边缘AI性能,单芯片方案驱动嵌入系统

    电子发烧友网报道(文/黄晶晶)边缘AI应用需要更多的高性能计算和算力的支持,AMD的Versal和Zynq系列产品一直支持医疗、交通、智能零
    的头像 发表于 04-09 21:32 1067次阅读
    AMD Versal SoC<b class='flag-5'>全新</b>升级<b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>性能</b>,单芯片方案驱动嵌入<b class='flag-5'>式</b>系统

    Arm Ethos-U85:满足物联网面向AI时代的高性能需求

    随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响,其推理任务也逐渐从云端迁移到边缘侧和端侧。
    的头像 发表于 04-09 17:04 1084次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>:满足物联网面向<b class='flag-5'>AI</b>时代的高<b class='flag-5'>性能</b>需求

    Arm推出新一代Ethos-U AI加速器全新物联网参考设计平台

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm Ethos-U85 神经网络处理
    的头像 发表于 04-09 17:02 875次阅读
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos-U</b> <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>及<b class='flag-5'>全新</b>物联网参考设计平台

    Hailo获1.2亿美元新融资,首发AI加速器Hailo-10,助力边缘设备实现生成人工智能

    引入边缘计算领域,为行业发展注入新动力。 边缘人工智能处理的领先芯片制造商Hailo近日宣布C轮融资再获1.2亿美元投资。与此同时,Hailo还推出创新型Hailo-10高性能
    的头像 发表于 04-03 11:57 333次阅读

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器AI Accelerator),是一种专为执行机器学习和深度学习任务而设计的ASIC或定制化处理
    的头像 发表于 02-23 00:18 4582次阅读