0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于工业AI的Jetson AGX Xavier模块

星星科技指导员 来源:嵌入式计算设计 作者:Simon Holt 2022-06-08 14:22 次阅读

工业物联网架构师花了数年时间才得出结论,边缘需要数据中心级的性能,以实现高效分析、提高安全性和降低网络成本。在人工智能机器学习领域,传感器设备内部或附近对高端处理能力的需求从一开始就很明显。

考虑到即使是简单的自主机器(我知道这是矛盾的说法)也需要大量的计算能力来运行神经网络来执行障碍物检测、识别和避免等功能。例如,京东和菜鸟等公司生产的自动送货车需要大约每秒 30 兆次运算 (TOPS) 的处理性能,而雅马哈正在开发的自动驾驶检查无人机需要大约 20 兆次运算 (TOPS) 的处理性能。

当然,这对嵌入式和工业工程师提出了一个经典的设计挑战:平衡每瓦性能。性能太低,应用程序失败。功耗太大,自主机器必须连接到持续的电源

随着NVIDIA 的 Jetson AGX Xavier 模块的发布,这种情况正在改变。

服务器级性能,嵌入式功耗

Jetson AGX Xavier 核心的 Xavier SoC 包含大量异构处理性能,适用于人工智能驱动的机器人应用程序,包括:

512 核 Volta GPU,带有 64 个 TensorCore

八核、64 位基于 Arm 的 Carmel CPU

双 NVDLA(NVIDIA 深度学习加速器)引擎

双 7 路 VLIW 视觉加速器引擎

这代表 Jetson AGX 模块的性能高达 32 TOPS,尺寸为 87 mm x 100 mm。如上图所示,该芯片还包括一个 256 位 LPDDR4X 接口,能够以 137 GBps 的速度将数据传输到模块上的 16 GB DRAM,用于与 AI 工作负载相关的频繁读写。

基本上,Jetson AGX Xavier 以嵌入式模块形式提供服务器级性能。然而,同样重要的是,该模块的功耗仅为 10W,或与台式风扇差不多。用户可将操作模式配置为 10W、15W 或 30W,NVIDIA 报告称每瓦性能 (PPW) 的最佳点在 15W 左右。即使在那个水平(大约相当于蓝光播放器的功耗),Jetson AGX Xavier 在推理性能和能源效率方面也大大超过了其前身 Jetson TX2 和 Intel Core i7 + GTX 1070 显卡。

pYYBAGKgQDeAcKYxAADtibAg8G4288.png

Jetson AGX Xavier:引擎盖下

Jetson AGX Xavier 的多项功能可实现这种类型的每瓦性能,从基础芯片架构开始。虽然 SoC 上的每个内核都有自己的内存,但内存是离散 SoC 模块之间的零内存复制。虽然 AGX Xavier 模块确实通过外部 16 GB LPDDR4X DRAM 提供共享内存,但片上数据只是通过管道传递到必要的处理核心。

架构的异构性也提高了效率,因为工作负载可以在最适合任务的架构上执行。这方面的一个例子是片上加速引擎,它可以卸载 Volta GPU,以便它可以专注于更复杂或用户定义的任务。例如,在以 8 位分辨率推断固定功能卷积神经网络 (CNN) 时,NVDLA 引擎可提供高达 5 TOPS 的性能,以 16 位分辨率推断 2.5 TFLOPS 时,功耗在 0.5W 和 1.5W 之间。

poYBAGKgQECARpmYAAFR4BDwBMw371.png

同时,Carmel CPU 内核可以保留用于通用计算任务。

JetPack 简化了深度学习编程的复杂性

Jetson AGX 系列运行 Linux,这在工业嵌入式系统中变得越来越普遍。许多希望利用 Jetson AGX Xavier 性能的工业和嵌入式开发人员可能不太熟悉的是对 GPU 和/或深度学习加速器进行编程。幸运的是,NVIDIA JetPack 4.1.1 软件开发套件 (SDK)在CUDA Toolkit中提供了一揽子 API、嵌入式库以及与常用语言的集成,因此您无需了解如何编程 GPU对 GPU 进行编程。

最新JetPack版本中的一些软件工具包括:

Linux For Tegra R31.0.1 (K4.9)

CUDA 工具包 10.0

cuDNN 7.3

张量RT 5.0 GA

OpenCV 3.3.1

OpenGL 4.6 / GLES 3.2

伏尔甘 1.1

多媒体 API R31.1

阿格斯 0.97 相机 API

TensorRT 5.0 包中提供的 API 也简化了对 DLA 进行编程以执行神经网络工作负载。例如,_setDeviceType() 和 setDefaultDeviceType() 命令可用于在 GPU 或任一 DLA 上执行特定的神经网络层或层,而像 _allowGPUFallback() 这样的命令可让工作负载在 DLA 不支持的情况下恢复到 GPU 。

此外,DeepStream 3.0 SDK 支持 Jetson AGX Xavier,该 SDK 利用 TensorRT、CUDA、多媒体和成像 API 来加速视频分析应用程序的开发。

当然,低级 CUDA 编程是另一种选择。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100742
  • NVIDIA
    +关注

    关注

    14

    文章

    4984

    浏览量

    103015
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4734

    浏览量

    128914
收藏 人收藏

    评论

    相关推荐

    NVIDIA发布小巧高性价比的Jetson Orin Nano Super开发者套件

    NVIDIA近期推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发者套件。这款开发者套件以其小巧的尺寸和高性价比吸引了广泛关注。 Jetson Orin
    的头像 发表于 12-19 11:28 321次阅读

    初创公司借助NVIDIA Metropolis和Jetson提高生产线效率

    初创公司使用 NVIDIA Metropolis 视觉 AIJetson 边缘 AI 平台提高生产线效率。
    的头像 发表于 11-19 14:39 179次阅读

    使用NVIDIA Jetson打造机器人导盲犬

    Selin Alara Ornek 是一名富有远见的高中生。她使用机器学习和 NVIDIA Jetson边缘 AI 和机器人平台,为视障人士打造了机器人导盲犬。
    的头像 发表于 11-09 13:51 246次阅读

    用于工业以太网PHY的AM2x评估模块附加板用户指南

    电子发烧友网站提供《用于工业以太网PHY的AM2x评估模块附加板用户指南.pdf》资料免费下载
    发表于 11-05 09:20 0次下载
    <b class='flag-5'>用于</b><b class='flag-5'>工业</b>以太网PHY的AM2x评估<b class='flag-5'>模块</b>附加板用户指南

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板 视频处理 相机信号

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板 视频处理 相机信号
    的头像 发表于 10-23 10:09 274次阅读
    GPU计算主板学习资料第735篇:基于3U VPX的<b class='flag-5'>AGX</b> <b class='flag-5'>Xavier</b> GPU计算主板 信号计算主板 视频处理 相机信号

    fx3系列的硬件主要由什么组成

    FX3系列是索尼(Sony)推出的一款高性能计算平台,它基于NVIDIA的Jetson AGX Xavier模块,专为需要高性能计算、机器学习、计算机视觉和实时数据处理的嵌入式系统设计
    的头像 发表于 09-18 11:14 464次阅读

    新品发布 | 合众恒跃发布多款无人机智能飞控产品搭载英伟达Jetson模块,赋能低空经济新质生产力

    控产品搭载英伟达Jetson模块系列产品,为低空经济注入新的活力。01HZHY-AI529Compact采用NVIDIA高性能AI处理器,是自主机器和其他嵌入式应用的
    的头像 发表于 07-27 08:46 424次阅读
    新品发布 | 合众恒跃发布多款无人机智能飞控产品搭载英伟达<b class='flag-5'>Jetson</b><b class='flag-5'>模块</b>,赋能低空经济新质生产力

    瑞萨电子推出Reality AI Explorer Tier,用于开发AI与TinyML解决方案

    全球半导体解决方案供应商瑞萨电子(TSE:6723)宣布推出Reality AI Explorer Tier——作为Reality AI Tools软件的免费版本,可用于开发工业、汽车
    的头像 发表于 07-19 10:03 428次阅读

    AC/DC电源模块:应用于工业自动化领域

    BOSHIDA   AC/DC电源模块:应用于工业自动化领域 AC/DC电源模块是一种用来将交流电转换为直流电的电源模块。它在
    的头像 发表于 05-31 13:45 375次阅读
    AC/DC电源<b class='flag-5'>模块</b>:应<b class='flag-5'>用于</b><b class='flag-5'>工业</b>自动化领域

    除英伟达Jetson系列外,AI边缘计算盒子还能搭载哪些算力芯片

    电子发烧友网报道(文/李弯弯)过去几年,随着英伟达推出Jetson系列开始,搭载各种AI算力芯片的边缘设备相继问世。因为外观形似盒子,具备算法推理能力,为区分一般传统工控机,行业多称之为边缘盒子
    的头像 发表于 05-06 09:21 4077次阅读

    研华:AI视觉检测+AMR精准控制,激发智能制造新动力

    研华提供出色的AI+AOI服务,可配合AIR-030 AGX OrinAI系统(用于推理)、AIR-520 4UAI工作站出色运行。
    的头像 发表于 04-18 10:58 621次阅读
    研华:<b class='flag-5'>AI</b>视觉检测+AMR精准控制,激发智能制造新动力

    人形机器人主板:jetson orin nx核心模块与SOM-7583核心模块结合在一块主板上

    ERUN_7583_ORIN_NX嵌入式人工智能计算机底板,专为满足人形机器人的实际需求而设计,他具备jetson orin nx核心模块与SOM-7583核心模块,可以实现核心模块
    的头像 发表于 03-26 11:17 902次阅读
    人形机器人主板:<b class='flag-5'>jetson</b> orin nx核心<b class='flag-5'>模块</b>与SOM-7583核心<b class='flag-5'>模块</b>结合在一块主板上

    AIDI工业AI视觉检测软件介绍

    AIDI是一款基于深度学习的智能工业视觉平台应用于多种工业应用场景,有效解决复杂缺陷的定位识别、分类定级及字符识别等问题,具有强大的兼容性。AIDI 内置多种应用模块,无需编程,帮助用
    发表于 03-25 21:52

    NanoEdge AI的威廉希尔官方网站 原理、应用场景及优势

    硬件设计则是为了确保设备在执行这些任务时能够保持低能耗,从而提高其续航能力。 2、应用场景 NanoEdge AI 可以广泛应用于各种物联网设备和传感器,如智能家居、工业自动化、智能交通、医疗健康
    发表于 03-12 08:09

    NVIDIA Jetson为嵌入式计算领域探索AI可能

    自动化业务流程、通过数据分析获得洞察力、与客户和员工互动……如今 AI 正在大幅提高生产力,推动竞争优势。NVIDIA Jetson 是适用于自主机器和其他嵌入式应用的先进平台,具有出色的 A
    的头像 发表于 01-25 17:03 535次阅读
    NVIDIA <b class='flag-5'>Jetson</b>为嵌入式计算领域探索<b class='flag-5'>AI</b>可能