0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Jetson Nano开发套件具有实时计算机视觉和推理

星星科技指导员 来源:NVIDIA 作者:Dustin Franklin 2022-04-18 15:08 次阅读

GPU 在 2019 年 NVIDIA NVIDIA 威廉希尔官方网站 会议( GTC )上宣布推出了 Jetson Nano 开发者套件 ,这是一款售价 99 美元的计算机,目前可供嵌入式设计师、研究人员和 DIY 制造商使用,在一个紧凑、易于使用的平台上实现了现代人工智能的强大功能,具有完全的软件可编程性。 Jetson Nano 通过一个四核 64 位 ARMCPU 和一个 128 核集成的 NVIDIA GPU ,提供 472 GFLOPS 的计算性能。它还包括 4GB LPDDR4 内存在一个高效的低功耗封装中,具有 5W / 10W 电源模式和 5V 直流输入。

最新发布的 JetPack 4 。 2 SDK 开发包 为基于 Ubuntu 18 。 04 的 Jetson Nano 提供了一个完整的桌面 Linux 环境,支持加速的图形,支持 NVIDIA CUDA toolk10 。 0 ,以及 cuDNN 7 。 3 和 TensorRT 5 等库。 SDK 还包括在本地安装流行的开源机器学习( ML )框架,如 TensorFlow , PyTorch 、 Caffe 、 Keras 和 MXNet ,以及 OpenCV 和 ROS计算机视觉机器人开发框架。

与这些框架和 NVIDIA 领先的人工智能平台完全兼容,使得将基于人工智能的推理工作负载部署到 Jetson 上比以往任何时候都容易。 Jetson Nano 为各种复杂的深层神经网络( DNN )模型带来了实时计算机视觉和推理。这些功能使多传感器自主机器人、具有智能边缘分析的物联网设备和先进的人工智能系统成为可能。甚至传输学习也可以使用 ML 框架在 Jetson Nano 上重新训练网络

Jetson Nano 开发套件的尺寸仅为 80×100 毫米,具有四个高速 USB 3 。 0 端口、 MIPI CSI-2 摄像头接口HDMI 2 。 0 和 DisplayPort 1 。 3 、千兆以太网、 M 。 2 Key-E 模块、 MicroSD 卡插槽和 40 针 GPIO 头。端口和 GPIO 头可以与各种流行的外围设备、传感器和现成的项目一起使用,例如 NVIDIA 在 GitHub 上开源的 3D 可打印深度学习 喷气式飞机。 。

devkit 从一个可移动 MicroSD 卡启动,该卡可以在任何带有 SD 卡适配器的 PC 上格式化和成像。 devkit 可以方便地通过 Micro-USB 端口或 5V 直流桶形插孔适配器供电。摄像头连接器与价格合理的 MIPI CSI 传感器兼容,包括基于 8MP IMX219 的模块,可从 Jetson 生态系统合作伙伴处获得。同时支持的还有 Raspberry Pi 摄像头模块 v2 ,它包括 JetPack 中的驱动程序支持。主要规格见表 1 。

devkit 是围绕一个 260 针 SODIMM 风格的系统 on Module ( SoM )构建的,如图 2 所示。 SoM 包含处理器、内存和电源管理电路。 Jetson 纳米计算模块尺寸为 45x70mm ,将于 2019 年 6 月开始发货,售价 129 美元( 1000 单位体积),供嵌入式设计师集成到生产系统中。生产计算模块将包括 16GB eMMC 板载存储和增强 I / O , PCIe Gen2 x4 / x2 / x1 、 MIPI DSI 、附加 GPIO 和 12 通道 MIPI CSI-2 在 x4 / x2 配置中,最多可连接三个 x4 摄像头或四个摄像头。 Jetson 的统一内存子系统在 CPU 、 GPU 和多媒体引擎之间共享,提供了流线型的零拷贝传感器摄取和高效的处理管道。

深度学习推理基准

Jetson Nano 可以运行多种高级网络,包括流行 ML 框架的完整本机版本,如 TensorFlow 、 PyTorch 、 Caffe / Caffe2 、 Keras 、 MXNet 等。这些网络可用于构建自主机器和复杂的人工智能系统,实现强大的功能,如图像识别、目标检测和定位、姿势估计、语义分割、视频增强和智能分析。

图 3 显示了来自在线可用的流行模型的推理基准测试的结果。有关在您的 Jetson Nano 上运行这些基准测试的说明,请参见 在这里 。该推断使用批次大小 1 和 FP16 精度,使用了 Jetpack4 。 2 中包含的 NVIDIA 的 TensorRT 加速器库。 Jetson Nano 在许多场景下都能达到实时性能,并且能够处理多个高清视频流。

图 3 。使用 Jetson Nano 和 TensorRT ,使用 FP16 精度和批量大小 1 的各种深度学习推理网络的性能

表 2 提供了完整的结果,包括 Raspberry Pi3 、 Intel Neural Compute Stick 2 和 Google Edge TPU Coral Dev Board 等其他平台的性能:

由于内存容量有限、不受支持的网络层或硬件/软件限制,经常出现 DNR (未运行)结果。固定函数神经网络加速器通常支持相对狭窄的用例集,硬件支持专用层操作,网络权重和激活需要适应有限的片上缓存,以避免严重的数据传输损失。它们可以依靠主机 CPU 来运行硬件不支持的层,并且可能依赖于支持框架的简化子集的模型编译器(例如 TFLite )。

Jetson Nano 灵活的软件和完整的框架支持、内存容量和统一的内存子系统,使其能够运行各种不同的网络,达到全高清分辨率,包括同时在多个传感器流上运行可变的批量大小。这些基准测试代表了流行网络的一个样本,但是用户可以在 Jetson Nano 上部署各种模型和定制架构,从而提高性能。而且 Jetson Nano 不仅仅局限于 DNN 推断。它的 CUDA 体系结构可用于计算机视觉和数字信号处理( DSP ),使用包括 FFT 、 BLAS 和 LAPACK 运算在内的算法,以及用户定义的 CUDA 内核。

多流视频分析

Jetson Nano 可实时处理多达 8 个高清全动态视频流,可作为网络视频录像机( NVR )、智能摄像头和物联网网关的低功耗边缘智能视频分析平台进行部署。 NVIDIA 的 DeepStream 软件开发工具包 使用 ZeroCopy 和 TensorRT 优化端到端推断管道,以在边缘和本地服务器上实现最终性能。下面的视频显示 Jetson Nano 在 8 个 1080p30 流上同时执行目标检测,基于 ResNet 的模型以全分辨率运行,吞吐量为每秒 5 亿像素( MP / s )。

基于 ResNet 在 Jetson Nano 上运行的 DeepStream 应用程序

在八个独立的 1080p30 视频流上并发的目标检测器。

图 4 中的框图显示了一个使用 Jetson Nano 的 NVR 架构示例,该架构使用深度学习分析威廉希尔官方网站 ,通过千兆以太网接收和处理多达 8 个数字流。该系统可以解码 500mp / s 的 H 。 264 / H 。 265 视频和 250mp / s 的 H 。 264 / H 。 265 视频。

图 4 。具有 Jetson 纳米和 8x 高清摄像头输入的参考 NVR 系统架构

Jetson Nano 的 DeepStream SDK 支持计划于 2019 年第 2 季度发布。请加入 DeepStream 开发者计划 以接收有关即将发布的通知。

喷气式飞机。

图 5 中所示的 NVIDIA 喷气式飞机。 是一个新的开源自主机器人工具包,它提供了所有的软件和硬件计划,以低于 250 美元的价格构建一个人工智能驱动的深度学习机器人。硬件材料包括 Jetson Nano 、 IMX219 8MP 摄像头、 3D 打印机箱、电池组、电机I2C 电机驱动器和配件。

该项目通过 Jupyter 笔记本为您提供了简单易学的示例,介绍了如何编写 Python 代码来控制电机,如何训练 JetBot 来检测障碍物,如何跟踪人和家庭对象等对象,以及如何训练 JetBot 跟踪地板周围的路径。通过扩展代码和使用 AI 框架,可以为 JetBot 创建新的功能。

还有 ROS 节点 可用于 JetBot ,为那些希望集成基于 ROS 的应用程序和功能(如 SLAM 和高级路径规划)的用户提供 ROS Melodic 支持。包含 JetBot ROS 节点的 GitHub 存储库还包括 Gazebo 3D 机器人interwetten与威廉的赔率体系 器的模型,允许在虚拟环境中开发和测试新的 AI 行为,然后再部署到机器人上。 Gazebo 模拟器生成合成相机数据,并在 Jetson 纳米上运行。

你好,人工智能世界

你好,人工智能世界 为开始使用 TensorRT 和体验人工智能的力量提供了一个很好的方法。只需几个小时,您就可以在带有 JetPack SDK 和 NVIDIA NVIDIA 的 Jetson Nano Developer Kit 上建立并运行一组用于实时图像分类和对象检测的深度学习推理演示。本教程侧重于与计算机视觉相关的网络,并包括实时摄像机的使用。你还可以在 C ++中编写自己易于理解的识别程序。可用的 深度学习 ROS 节点 将这些识别、检测和分段推断功能与 ROS 公司 集成,以集成到先进的机器人系统和平台中。这些实时推断节点可以很容易地放入现有的 ROS 应用程序中。

想要尝试训练自己模型的开发人员可以按照完整的“ 还有两天就要演示了 ”教程进行,该教程涵盖了图像分类、对象检测和语义分割模型的再培训和定制,并使用转移学习。传输学习微调特定数据集的模型权重,避免了从头训练模型。传输学习最有效地在带有 NVIDIA 离散 GPU 的 PC 或云实例上执行,因为培训需要比推断更多的计算资源和时间。

然而,由于 Jetson Nano 可以运行完整的培训框架,如 TensorFlow 、 PyTorch 和 Caffe ,它还可以通过转移学习为那些可能无法访问另一台专用培训机器并愿意等待更长时间等待结果的人进行再培训。表 3 列出了将两天的学习转移到演示教程中的一些初步结果,其中 PyTorch 使用 Jetson Nano 在 20 万张图像上训练 Alexnet 和 ResNet-18 , ImageNet 的 22 。 5GB 子集:

每个历元的时间是完全通过 200K 图像的训练数据集所需的时间。分类网络可能只需要 2-5 个周期就可以得到可用的结果,生产模型应该在离散 GPU 系统上为更多的时代进行训练,直到它们达到最大的精度。然而, Jetson Nano 可以让你在一个低成本的平台上进行深度学习和人工智能的实验,让网络在一夜之间重新训练。并非所有的自定义数据集都可能像这里使用的 22 。 5GB 示例那样大。因此,图像/秒表示 Jetson Nano 的训练性能,每历元时间随数据集大小、训练批大小和网络复杂性而变化。随着训练时间的增加,其他模型也可以在 Jetson Nano 上重新训练。

所有人的 AI

Jetson Nano 的计算性能、紧凑的占地面积和灵活性为开发人员创造以人工智能为动力的设备和嵌入式系统带来了无限的可能性。

关于作者

Dustin Franklin 是 NVIDIA 的 Jetson 团队的开发人员布道者。 Dustin 拥有机器人和嵌入式系统方面的背景,他乐于在社区中提供帮助,并与 Jetson 一起参与项目。你可以在 NVIDIA Developer Forums 或 Github 上找到他。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5085

    文章

    19138

    浏览量

    305716
  • NVIDIA
    +关注

    关注

    14

    文章

    4994

    浏览量

    103162
  • 人工智能
    +关注

    关注

    1791

    文章

    47352

    浏览量

    238769
收藏 人收藏

    评论

    相关推荐

    NVIDIA发布高性价比生成式AI超级计算机

    NVIDIA近日推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发
    的头像 发表于 12-24 10:44 142次阅读

    NVIDIA Jetson Orin Nano开发套件的新功能

    生成式 AI 领域正在迅速发展,每天都有新的大语言模型(LLM)、视觉语言模型(VLM)和视觉语言动作模型(VLA)出现。为了在这一充满变革的时代保持领先,开发者需要一个足够强大的平台将云端的最新模型无缝部署到边缘,从而获得基于
    的头像 发表于 12-23 12:54 184次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Jetson</b> Orin <b class='flag-5'>Nano</b><b class='flag-5'>开发</b>者<b class='flag-5'>套件</b>的新功能

    NVIDIA发布小巧高性价比的Jetson Orin Nano Super开发套件

    NVIDIA近期推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发
    的头像 发表于 12-19 11:28 391次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    计算机具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super
    发表于 12-18 17:01 395次阅读
    <b class='flag-5'>NVIDIA</b> 推出高性价比的生成式 AI 超级<b class='flag-5'>计算机</b>

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 452次阅读

    机器视觉计算机视觉有什么区别

    。机器视觉的研究目标是让机器具有类似人类的视觉能力,能够自动、准确地完成各种视觉任务。 计算机视觉
    的头像 发表于 07-16 10:23 553次阅读

    计算机视觉的工作原理和应用

    计算机视觉(Computer Vision,简称CV)是一门跨学科的研究领域,它利用计算机和数学算法来模拟人类视觉系统对图像和视频进行识别、理解、分析和处理。其核心目标在于使
    的头像 发表于 07-10 18:24 2050次阅读

    计算机视觉与人工智能的关系是什么

    引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如何使计算
    的头像 发表于 07-09 09:25 667次阅读

    计算机视觉和机器视觉区别在哪

    计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。 一、定义 计算机视觉 计算机
    的头像 发表于 07-09 09:22 462次阅读

    计算机视觉属于人工智能吗

    属于,计算机视觉是人工智能领域的一个重要分支。 引言 计算机视觉是一门研究如何使计算机具有视觉
    的头像 发表于 07-09 09:11 1329次阅读

    计算机视觉的主要研究方向

    计算机视觉(Computer Vision, CV)作为人工智能领域的一个重要分支,致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等威廉希尔官方网站 的快速发展,计算机
    的头像 发表于 06-06 17:17 995次阅读

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2无法使用操作系统内置的网络管理器管理Wi-Fi如何解决?

    我们使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,请参阅 Nvidia Jetson
    发表于 05-23 06:47

    【LicheeRV-Nano开发套件试用体验】+智能平板开发

    首先感谢Sipeed矽速科技和电子发烧友给与的这次机会,得以试用LicheeRV-Nano开发套件,并与大家共同分享与学习。 鉴于试用报告格式调整,后面亦按要求展现。 申请理由: 个人多年嵌入式
    发表于 03-06 23:05

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 590次阅读

    计算机视觉的十大算法

    随着科技的不断发展,计算机视觉领域也取得了长足的进步。本文将介绍计算机视觉领域的十大算法,包括它们的基本原理、应用场景和优缺点。这些算法在图像处理、目标检测、人脸识别等领域有着广泛的应
    的头像 发表于 02-19 13:26 1254次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的十大算法