发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

什么是下一代机器人感知处理器？

2365 FPGA 机器人处理器

问答对人有帮助，内容完整，我也想知道答案 0 十年前，微软创始人比尔 · 盖茨在其文章《A Robot in Every Home》里提出他对未来的憧憬：机器人将会像个人电脑一样进入每个家庭，为人类服务。随着人工智能以及智能硬件在过去几年的飞速发展，到了2016年的今天，笔者坚信各项威廉希尔官方网站已臻成熟，智能机器人很快进入商业化时代，盖茨的愿景也极有可能在5到10年内实现。 0
2019-10-17 07:56:49　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × ChristineGu 该类别下有 16 个回答。邀请回答 HengDu 该类别下有 16 个回答。邀请回答 heks 该类别下有 16 个回答。邀请回答 dfasda 该类别下有 15 个回答。邀请回答 nhonglan 该类别下有 15 个回答。邀请回答 yonglanzhang 该类别下有 15 个回答。邀请回答杀狼000 该类别下有 14 个回答。邀请回答 wenminglang 该类别下有 14 个回答。邀请回答 C880U 该类别下有 14 个回答。邀请回答 jhdfvs 该类别下有 14 个回答。邀请回答 chm5 该类别下有 14 个回答。邀请回答 muwersddg 该类别下有 14 个回答。邀请回答 a732538 该类别下有 13 个回答。邀请回答 hrtuoyu 该类别下有 13 个回答。邀请回答 hfgdzc 该类别下有 13 个回答。邀请回答 thyysbk 该类别下有 13 个回答。邀请回答凡人wlj 该类别下有 13 个回答。邀请回答 kszdj113 该类别下有 13 个回答。邀请回答飞雪9366 该类别下有 13 个回答。邀请回答 billbian 该类别下有 13 个回答。邀请回答举报薄坤坤相关推荐 • 什么是下一代机器人感知处理器？ 1886 • 什么是下一代机器人感知处理器？ 2251 • 实现下一代机器人至关重要的关键传感器威廉希尔官方网站介绍 5895 • 现代机器人中有什么传感器？ 2553 • 控制和通信IC对机器人发展起到重要作用 1326 • 机器人系统是什么？ 2783 • ARM处理器的机器人硬件设计方法 2553 • 机器人的定义是什么？工业机器人的应用有哪些？ 4810 • 机器人威廉希尔官方网站大赛鼓励下一代创新者积极学习STEM 2277 • 如何设计智能灭火机器人控制器？ 3477 3个回答

答案对人有帮助，有参考价值 0 要想机器人有智能，必先赋予其感知能力。感知计算，特别是视觉以及深度学习，通常计算量比较大，对性能要求高。但是机器人受电池容量限制，可分配给计算的能源比较低。除此之外，由于感知算法不断发展，我们还需要不断更新机器人的感知处理器。与其它处理器相比，FPGA具有低能耗、高性能以及可编程等特性，十分适合感知计算。本文首先解析FPGA的特性，然后介绍FPGA对感知算法的加速以及节能，最后谈一谈机器人操作系统对FPGA的支持。 FPGA：高性能、低能耗、可编程与其它计算载体如CPU与GPU相比，FPGA具有高性能、低能耗以及可硬件编程的特点。图1介绍了FPGA的硬件架构，每个FPGA主要由三个部分组成：输入输出逻辑，主要用于FPGA与外部其他部件，比如传感器的通信；计算逻辑部件，主要用于建造计算模块；以及可编程连接网络，主要用于连接不同的计算逻辑部件去组成一个计算器。在编程时，我们可以把计算逻辑映射到硬件上，通过调整网络连接把不同的逻辑部件连通在一起去完成一个计算任务。比如要完成一个图像特征提取的任务，我们会连接FPGA的输入逻辑与照相机的输出逻辑，让图片可以进入FPGA。然后，连接FPGA的输入逻辑与多个计算逻辑部件，让这些计算逻辑部件并行提取每个图片区域的特征点。最后，我们可以连接计算逻辑部件与FPGA的输出逻辑，把特征点汇总后输出。由此可见，FPGA通常把算法的数据流以及执行指令写死在硬件逻辑中，从而避免了CPU的Instruction Fetch与Instruction Decode 工作。图1 FPGA硬件架构高性能虽然FPGA的频率一般比CPU低，但是可以用FPGA实现并行度很大的硬件计算器。比如一般CPU每次只能处理4到8个指令，在FPGA上使用数据并行的方法可以每次处理256个或者更多的指令，让FPGA可以处理比CPU多很多的数据量。另外，如上所述，在FPGA中一般不需要Instruction Fetch与Instruction Decode, 减少了这些流水线工序后也节省了不少计算时间。为了让读者对FPGA加速有更好的了解，我们总结了微软研究院2010年对BLAS算法的FPGA加速研究。BLAS是矩阵运算的底层库，被广泛运用到高性能计算、机器学习等领域。在这个研究中，微软的研究人员分析了CPU、GPU以及FPGA对BLAS的加速以及能耗。图2对比了FPGA以及CPU、GPU执行GaxPy算法每次迭代的时间，相对于CPU，GPU与FPGA都达到了60%的加速。图中显示的是小矩阵运算，随着矩阵的增大，GPU与FPGA相对与CPU的加速比会越来越明显。图2 GaxPy 算法性能对比 (单位：微秒) 低能耗 FPGA相对于CPU与GPU有明显的能耗优势，主要有两个原因。首先，在FPGA中没有Instruction Fetch与Instruction Decode，在Intel的CPU里面，由于使用的是CISC架构，仅仅Decoder就占整个芯片能耗的50%；在GPU里面，Fetch与Decode也消耗了10%～20%的能源。其次，FPGA的主频比CPU与GPU低很多，通常CPU与GPU都在1GHz到3GHz之间，而FPGA的主频一般在500MHz以下。如此大的频率差使得FPGA消耗的能源远低于CPU与GPU。图3对比了FPGA以及CPU、GPU执行GaxPy算法每次迭代的能源消耗。可以发现CPU与GPU的能耗是相仿的，而FPGA的能耗只是CPU与GPU的8%左右。由此可见，FPGA计算比CPU快60%，而能耗只是CPU的1/12，有相当大的优势，特别在能源受限的情况下，使用FPGA会使电池寿命延长不少。图3 GaxPy 算法能耗对比(单位：毫焦) 可硬件编程由于FPGA是可硬件编程的，相对于ASIC而言，使用FPGA可以对硬件逻辑进行迭代更新。但是FPGA也会被诟病，因为把算法写到FPGA硬件并不是一个容易的过程，相比在CPU与GPU上编程威廉希尔官方网站门槛高许多，开发周期也会长很多。图4 传统FPGA开发流程与C-to-FPGA开发流程图4显示了传统FPGA开发流程与C-to-FPGA开发流程的对比。在传统的FPGA开发流程中，我们需要把C/C++写成的算法逐行翻译成基于Verilog的硬件语言，然后再编译Verilog，把逻辑写入硬件。随着近几年FPGA威廉希尔官方网站的发展，从C直接编译到FPGA的威廉希尔官方网站已经逐渐成熟，并已在百度广泛被使用。在C-to-FPGA开发流程中，我们可以在CC++的代码中加Pragma, 指出哪个计算Kernel应该被加速，然后C-to-FPGA引擎会自动把代码编译成硬件。在我们的经验中，使用传统开发流程，完成一个项目大约需要半年时间，而使用了C-to-FPGA开发流程后，一个项目大约两周便可完成，效率提升了10倍以上。感知计算在FPGA上的加速接下来主要介绍机器人感知计算在FPGA上的加速，特别是特征提取与位置追踪的计算（可以认为是机器人的眼睛），以及深度学习计算（可以认为是机器人的大脑）。当机器人有了眼睛以及大脑后，就可以在空间中移动并定位自己，在移动过程中识别所见到的物体。

2019-10-18 14:33:16 评论举报贾熹

答案对人有帮助，有参考价值 0 特征提取与位置追踪特征提取与位置追踪的主要算法包括SIFT、SURF和SLAM。SIFT是一种检测局部特征的算法，通过求一幅图中的特征点及其有关规模和方向的描述得到特征并进行图像特征点匹配。SIFT特征匹配算法可以处理两幅图像之间发生平移、旋转、仿射变换情况下的匹配问题，具有很强的匹配能力。SIFT算法有三大工序：1. 提取关键点；2. 对关键点附加详细的信息（局部特征）也就是所谓的描述器；3. 通过两方特征点（附带上特征向量的关键点）的两两比较找出相互匹配的若干对特征点，也就建立了景物间的对应关系。SURF算法是对SIFT算法的一种改进，主要是通过积分图像Haar求导提高SIFT算法的执行效率。SLAM即同时定位与地图重建，目的就是在机器人运动的同时建立途经的地图，并同时敲定机器人在地图中的位置。使用该威廉希尔官方网站后，机器人可以在不借助外部信号（WIFI、Beacon、GPS）的情况下进行定位，在室内定位场景中特别有用。定位的方法主要是利用卡曼滤波器对不同的传感器信息（图片、陀螺仪）进行融合，从而推断机器人当前的位置。为了让读者了解FPGA对特征提取与位置追踪的加速以及节能，下面我们关注加州大学洛杉矶分校的一个关于在FPGA上加速特征提取与SLAM算法的研究。图5展示了FPGA相对CPU在执行SIFT feature-matching、SURF feature-matching以及SLAM算法的加速比。使用FPGA后，SIFT与SURF的feature-matching分别取得了30倍与9倍的加速，而SLAM的算法也取得了15倍的加速比。假设照片以30FPS的速度进入计算器，那么感知与定位的算法需要在33毫秒内完成对一张图片的处理，也就是说在33毫秒内做完一次特征提取与SLAM计算，这对CPU会造成很大的压力。用了FPGA以后，整个处理流程提速了10倍以上，让高帧率的数据处理变得可能。图5 感知算法性能对比 (单位：加速比) 图6展示了FPGA相对CPU在执行SIFT、SURF以及SLAM算法的节能比。使用FPGA后，SIFT与SURF分别取得了1.5倍与1.9倍的节能比，而SLAM的算法取得了14倍的节能比。根据我们的经验，如果机器人将手机电池用于一个多核的Mobile CPU去跑这一套感知算法，电池将会在40分钟左右耗光。但是如果使用FPGA进行计算，手机电池就足以支撑6小时以上，即可以达到10倍左右的总体节能（因为SLAM的计算量比特征提取高很多）。图6 感知算法能耗对比 (单位：节能比) 根据数据总结一下，如果使用FPGA进行视觉感知定位的运算，不仅可以提高感知帧率，让感知更加精准，还可以节能，让计算持续多个小时。当感知算法确定，而且对芯片的需求达到一定的量后，我们还可以把FPGA芯片设计成ASIC，进一步的提高性能以及降低能耗。深度学习深度神经网络是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。在过去几年，卷积深度神经网络（CNN）在计算机视觉领域以及自动语音识别领域取得了很大的进步。在视觉方面，Google、Microsoft与Facebook不断在ImageNet比赛上刷新识别率纪录。在语音识别方面，百度的DeepSpeech 2系统相比之前的系统在词汇识别率上有显著提高，把词汇识别错误率降到了7%左右。为了让读者了解FPGA对深度学习的加速以及节能，我们下面关注北京大学与加州大学的一个关于FPGA加速CNN算法的合作研究。图7展示了FPGA与CPU在执行CNN时的耗时对比。在运行一次迭代时，使用CPU耗时375毫秒，而使用FPGA只耗时21毫秒，取得了18倍左右的加速比。假设如果这个CNN运算是有实时要求，比如需要跟上相机帧率（33毫秒／帧），那么CPU就不可以达到计算要求，但是通过FPGA加速后，CNN计算就可以跟上相机帧率，对每一帧进行分析。图7 CNN性能对比 (单位：毫秒) 图8展示了FPGA与CPU在执行CNN时的耗能对比。在执行一次CNN运算，使用CPU耗能36焦，而使用FPGA只耗能10焦，取得了3.5倍左右的节能比。与SLAM计算相似，通过用FPGA加速与节能，让深度学习实时计算更容易在移动端运行。图8 CNN能耗对比 (单位：焦) FPGA与ROS机器人操作系统的结合上文介绍了FPGA对感知算法的加速以及节能，可以看出FPGA在感知计算上相对CPU与GPU有巨大优势。本节介绍FPGA在当今机器人行业被使用的状况，特别是FPGA在ROS机器人操作系统中被使用的情况。机器人操作系统（ROS），是专为机器人软件开发所设计出来的一套操作系统架构。它提供类似于操作系统的服务，包括硬件抽象描述、底层驱动程序管理、共用功能的执行、程序间消息传递、程序发行包管理，它也提供一些工具和库用于获取、建立、编写和执行多机融合的程序。ROS的首要设计目标是在机器人研发领域提高代码复用率。ROS是一种分布式处理框架（又名Nodes）。这使可执行文件能被单独设计，并且在运行时松散耦合。这些过程可以封装到数据包（Packages）和堆栈（Stacks）中，以便于共享和分发。ROS还支持代码库的联合系统，使得协作亦能被分发。ROS目前被广泛应用到多种机器人中，逐渐变成机器人的标准操作系统。在2015年的DARPA Robotics Challenge比赛中，有过半数的参赛机器人使用了ROS。随着FPGA威廉希尔官方网站的发展，越来越多的机器人使用上了FPGA，在ROS社区中也有越来越多的声音要求ROS兼容FPGA。一个例子是美国Sandia国家实验室的机器人手臂Sandia Hand。如图9所示，Sandia Hand使用FPGA预处理照相机以及机器人手掌返回的信息，然后把预处理的结果传递ROS的其它计算Node。图9 ROS在Sandia Hand中对FPGA的支持为了使ROS与FPGA之间可以连接，Sandia Hand使用了Ro*ridge机制。 Roridge通过JSON API来连接ROS与非ROS的程序。比如一个ROS的程序可以通过JSON API连接一个非ROS的网络前端。在Sandia Hand的设计中，一个ROS Node通过JSON API连接到FPGA计算器，FPGA传递数据以及发起计算指令，然后从FPGA取回计算结果。 Ro**ridge为ROS与FPGA的联通提供了一种沟通机制，但是在这种机制中，ROS Node并不能运行在FPGA上，而且通过JSON API的连接机制也带来了一定的性能损耗。为了让FPGA与ROS更好的耦合，最近日本的研究人员提出了ROS-Compliant FPGA的设计，让ROS Node可以直接运行在FPGA上。如图10所示，在这个设计中，FPGA了实现一个输入的接口，这个接口可以直接订阅ROS的topic，使数据可以无缝连接流入FPGA计算单元中。另外，FPGA上也实现了一个输出接口，让FPGA上的ROS Node可以直接发表数据，让订阅这个topic的其他ROS Node可以直接使用FPGA产出的数据。在这个设计中，开发者只要把自己开发的FPGA计算器插入到ROS-compliant的FPGA框架中，便可以无缝连接其他ROS Node。图10 FPGA成为ROS的一部分最近跟ROS的运营机构Open Source Robotics Foundation沟通中发现，越来越多的机器人开发者使用FPGA作为传感器的计算单元以及控制器，对FPGA融入ROS的需求越来越多。相信ROS很快将会拿出一个与FPGA紧密耦合的解决方案。

2019-10-18 14:33:27 评论举报王峥

答案对人有帮助，有参考价值 0 展望未来 FPGA具有低能耗、高性能以及可编程等特性，十分适合感知计算。特别是在能源受限的情况下，FPGA相对于CPU与GPU有明显的性能与能耗优势。除此之外，由于感知算法不断发展，我们需要不断更新机器人的感知处理器。相比ASIC，FPGA又具有硬件可升级可迭代的优势。由于这些原因，笔者坚信FPGA在机器人时代将会是最重要的芯片之一。由于FPGA的低能耗特性，FPGA很适合用于传感器的数据预处理工作。可以预见，FPGA与传感器的紧密结合将会很快普及。而后随着视觉、语音、深度学习的算法在FPGA上的不断优化，FPGA将逐渐取代GPU与CPU成为机器人上的主要芯片。

2019-10-18 14:33:29 评论举报李椰潭

只有小组成员才能发言，加入小组>>

嵌入式学习小组

8948个成员聚集在这个小组

精选推荐

推荐一个支持js的嵌入式设备开发平台

1033 浏览 0 评论
如何在KEIL中添加NUC972芯片？

1302 浏览 1 评论
如何设计多路数据采集系统中FIFo？

2730 浏览 5 评论
FreeRTOS中如何写硬件中断程序啊？

3021 浏览 9 评论
移植了freeRTOS到STMf103之后显示没有定义的原因？

2922 浏览 6 评论

最新话题

热门话题

keil5中manage run-time environment怎么是灰色，不可以操作吗？

1657浏览 3评论
求助，求推荐性价比较高的单片机

301浏览 2评论
N76E003 GPIO初始化后电平异常怎么解决？

579浏览 2评论
nu_link在keil烧录完程序后复位脚会拉低怎么解决？

491浏览 2评论
M0518 PWM的电压输出只有2V左右，没有3.3V是怎么回事？

556浏览 1评论

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回嵌入式学习小组

回复

关闭

站长推荐 /6

快速回复 返回顶部 返回列表

- 威廉希尔官方网站社区: 张飞电子威廉希尔官方网站社区

KaihongOS威廉希尔官方网站社区

FPGA开发者威廉希尔官方网站社区

RISC-V MCU威廉希尔官方网站社区

HarmonyOS威廉希尔官方网站社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM威廉希尔官方网站论坛

STM32/STM8威廉希尔官方网站论坛

嵌入式威廉希尔官方网站论坛

单片机/MCU论坛

RISC-V威廉希尔官方网站论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源威廉希尔官方网站论坛: 电源威廉希尔官方网站论坛

无线充电威廉希尔官方网站

- 综合威廉希尔官方网站与应用: 机器人论坛

USB论坛

电机控制

模拟威廉希尔官方网站

音视频威廉希尔官方网站

综合威廉希尔官方网站交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI威廉希尔官方网站

蓝牙威廉希尔官方网站

天线|RF射频|微波|雷达威廉希尔官方网站

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS威廉希尔官方网站论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量威廉希尔官方网站

传感威廉希尔官方网站

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航