Arm与ExecuTorch合作加速端侧生成式AI实现-电子发烧友网

作者：Arm 战略与生态部人工智能和开发者平台与服务高级副总裁 Alex Spinelli

通过 Arm 计算平台与 ExecuTorch 框架的结合，使得更小、更优化的模型能够在边缘侧运行，加速边缘侧生成式 AI 的实现。

新的 Llama 量化模型适用于基于 Arm 平台的端侧和边缘侧 AI 应用，可减少内存占用，提高精度、性能和可移植性。

全球 2,000 万名 Arm 开发者能够更迅速地在数十亿台边缘侧设备上大规模开发和部署更多的智能 AI 应用。

Arm 正在与 Meta 公司的 PyTorch 团队携手合作，共同推进新的 ExecuTorch 测试版 (Beta) 上线，旨在为全球数十亿边缘侧设备和数百万开发者提供人工智能 (AI) 和机器学习 (ML) 功能，进而确保 AI 真正的潜力能被最广泛的设备和开发者所使用。

借助 ExecuTorch 和新的 Llama 量化模型，Arm 计算平台优化生成式 AI 性能

Arm 计算平台无处不在，为全球众多边缘侧设备提供支持，而 ExecuTorch 则是专为移动和边缘侧设备部署 AI 模型而设计的 PyTorch 原生部署框架。两者的紧密合作，使开发者能够赋能更小、更优化的模型，包括新的 Llama 3.2 1B 和 3B 量化模型。这些新模型可以减少内存占用、提高准确性、增强性能和提供可移植性，成为小型设备上的生成式 AI 应用的理想选择，如虚拟聊天机器人、文本摘要和 AI 助手。

开发者无需额外的修改或优化，便可将新的量化模型无缝集成到应用中，从而节省时间和资源。如此一来，他们能够迅速在广泛的 Arm 设备上大规模开发和部署更多的智能 AI 应用。

随着 Llama 3.2 大语言模型 (LLM) 新版本的发布，Arm 正在通过 ExecuTorch 框架优化 AI 性能，使得在 Arm 计算平台边缘设备运行的真实生成式 AI 工作负载能更为快速。在 ExecuTorch 测试版发布的首日起，开发者便能享有这些性能的提升。

集成 KleidiAI，加速端侧生成式 AI 的实现

在移动领域，Arm 与 ExecuTorch 的合作意味着众多生成式 AI 应用，如虚拟聊天机器人、文本生成和摘要、实时语音和虚拟助手等，完全能够在搭载 Arm CPU 的设备上以更高的性能运行。这一成果得益于 KleidiAI，它引入了针对 4 位量化优化的微内核，并通过 XNNPACK 集成到了 ExecuTorch 中，因此，在 Arm 计算平台上运行 4 位量化的 LLM 时，无缝加速 AI 工作负载的执行。例如，通过 KleidiAI 的集成，Llama 3.2 1B 量化模型预填充阶段的执行速度可以提高 20%，使得一些基于 Arm 架构的移动设备上的文本生成速度超过了每秒 400 个词元 (token)。这意味着，终端用户将从他们移动设备上获得更快速、响应更灵敏的 AI 体验。

为物联网的边缘侧 AI 应用加速实时处理能力

在物联网领域，ExecuTorch 将提高边缘侧 AI 应用的实时处理能力，包括智能家电、可穿戴设备以及自动零售系统等。这意味着物联网设备和应用能够以毫秒级的速度响应环境变化，这对保障安全性和功能可用性至关重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上运行，以加速边缘侧 AI 应用的开发和部署。事实上，通过将 ExecuTorch 与 Arm Corstone-320 参考平台（也可作为仿真固定虚拟平台 (FVP) 使用）、Arm Ethos-U85 NPU 驱动程序和编译器支持集成到一个软件包中，开发者可在平台上市前几个月就着手开发边缘侧 AI 应用。

更易获取、更快捷的边缘侧 AI 开发体验

ExecuTorch 有潜力成为全球最受欢迎的高效 AI 和 ML 开发框架之一。通过将应用最广泛的 Arm 计算平台与 ExecuTorch 相结合，Arm 正在通过新的量化模型加速 AI 的普及，让开发者能够更快地在更多设备上部署应用，并将更多生成式 AI 体验引入边缘侧。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ARM

ARM

+关注

关注
134

文章
9097

浏览量
367588
AI

AI

+关注

关注
87

文章
30897

浏览量
269117
人工智能

人工智能

+关注

关注
1791

文章
47279

浏览量
238519

原文标题：ExecuTorch 测试版上线，加速 Arm 平台边缘侧生成式 AI 发展

文章出处：【微信号：Arm社区，微信公众号：Arm社区】欢迎添加关注！文章转载请注明出处。

中信建投建议关注端侧AI模组机会

中信建投近日发布的研报指出，随着OpenAI的ChatGPT功能全面接入苹果设备，包括iPhone、iPad和Mac，端侧AI产业的发展正在加速。这一趋势为

发表于 12-17 14:05 •257次阅读

广和通开启端侧AI新时代

AI发展正酣，随着终端芯片算力越来越高、端侧模型能力越来越强、实时响应及隐私保护的端侧应用需求增加，端

发表于 12-12 10:35 •195次阅读

把握关键节点，美格智能持续推动端侧AI规模化拓展

将成为和系统同样重要的存在，如果说电路是连接身体的“血管”，那么AI就将成为终端的智慧“大脑”。加速演进大模型加速走向端侧从手机移动

发表于 11-26 01:00 •156次阅读

中科创达发开创端侧智能新篇章

生成式AI在创新和应用方面以前所未有的速度向前发展。融合云计算和边缘/端侧计算的混合AI威廉希尔官方网站 ,

发表于 11-17 11:23 •491次阅读

从Apple Intelligence到IoT Intelligence，端侧生成式AI时代加速到来

快速运行以AppleIntelligence为中心的生成式AI功能在手机端侧运行。用库克的话说：“新一代iPhone彻彻底底为AppleIn

发表于 09-11 08:01 •729次阅读

GE医疗与亚马逊云科技达成战略合作，通过生成式AI加速医疗健康领域转型

GE医疗已选择亚马逊云科技作为其战略云服务合作伙伴，致力于推出全新的定制化基础模型，加速创新医疗应用快速开发。 GE医疗将利用亚马逊云科技的机器学习和生成式

发表于 08-29 16:38 •272次阅读

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

简化 AI 创造价值的过程，加速生成式 AI 的发展步伐。 NVIDIA AI Computin

发表于 06-20 17:36 •728次阅读

IBM与SAP深化生成式AI领域合作

近日，IBM与SAP宣布将进一步扩大他们的合作范围，共同在生成式人工智能（AI）领域进行深度探索。此次合作的核心在于，双方将共同为SAP的R

发表于 05-13 09:19 •474次阅读

联发科天玑9300+登场，端侧生成式AI刷新业界最高速

联发科旗舰芯的新一代力作，天玑9300+秉承了天玑系列的突破创新精神，不仅延续了先进的全大核架构和强大的生成式AI能力，更是首次在端侧

发表于 05-08 21:24 •1133次阅读

Arm平台赋能移动端生成式AI

生成式人工智能 (Generative AI) 涵盖了当下广为人知，且备受关注的大语言模型 (LLM)，如今也已落地边缘侧的移动设备。

发表于 04-26 11:09 •803次阅读

Arm推动生成式AI落地边缘！全新Ethos-U85 AI加速器支持Transformer 架构，性能提升四倍

电子发烧友网报道（文/黄晶晶）在嵌入式领域，边缘与端侧AI推理需求不断增长，Arm既有Helium 威廉希尔官方网站使 CPU 能够执行更多计算密集型的

发表于 04-16 09:10 •4618次阅读

NVIDIA生成式AI研究实现在1秒内生成3D形状

NVIDIA 研究人员使 LATTE3D （一款最新文本转 3D 生成式 AI 模型）实现双倍加速。

发表于 03-27 10:28 •498次阅读

SAP与NVIDIA携手加速生成式AI在企业应用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企业客户在 SAP 云解决方案和应用组合中利用数据和生成式 AI 的变革力量。

发表于 03-22 10:02 •607次阅读

生成式AI加速向终端侧演进，NPU、异构计算提供强大算力支持

的400亿美元，增长至2032年的1.3万亿美元，年复合增速达到42%。生成式AI 向终端快速演进当前大部分生成式

发表于 03-16 00:16 •2869次阅读

博世与微软合作开发生成式AI产品

全球知名科技公司博世与微软联合宣布，双方已建立合作关系，共同致力于开发先进的生成式AI产品。这一合作的核心目标在于通过利用

发表于 03-05 11:17 •905次阅读