使用合成数据实现自动驾驶摄像感知系统聚焦远场物体-电子发烧友网

探测远场物体（比如 100 米以外的车辆等）是自动驾驶系统在高速公路上安全运行的基础。

在此类高速环境中，每一秒都至关重要。因此，如果能够将以 70 英里/小时（约 113 公里/小时）速度行驶的自动驾驶车辆的感知范围从 100 米增加到 200 米，那么车辆就会有更多的时间裕量来做出反应。

然而，对于量产乘用车中所部署的摄像感知系统来说，扩大这一范围尤其困难。训练摄像感知系统来探测远场物体需要采集大量摄像数据以及真值（ground truth）标注，比如 3D 边界框和距离等。

▲图1 自动驾驶汽车离其他物体越远，就越难执行准确的摄像感知和真值标注。（图中的汽车未按比例绘制)

对于 200 米以外的物体，要提取这种真值数据就会变得更加困难。物体越远，它在图像中就越小，最终会变得只有几像素那么大。通常情况下，会同时使用像激光雷达这样的传感器，以及聚合和自动标注威廉希尔官方网站来提取 3D 和距离信息，但这类在激光雷达工作范围外的数据会变得稀疏并充满干扰。

▲图2 摄像头数据实例（使用 30 度视场的长焦镜头在高速公路场景中拍摄），放大图显示了只有几个像素的远处汽车图像。

在开发过程中，NVIDIA DRIVE 自动驾驶汽车团队需要解决这一具体挑战。为此，NVIDIA 利用NVIDIA Omniverse Replicator的功能，在NVIDIA DRIVE Sim中生成远场物体的合成真值数据。

NVIDIA DRIVE Sim是依托 Omniverse 构建而成的自动驾驶汽车仿真平台，包含了基于物理学的传感器模型，这些模型已通过全面的高保真传感器仿真验证。

通过 NVIDIA DRIVE Sim 能够查询仿真场景中每个物体的位置（包括在任何摄像头分辨率下，距离车辆 400 米或 500 米的物体）并达到像素级精度。

通过将车辆位置信息与基于物理学的合成摄像头数据相结合，即可生成感知所需的 3D 和距离真值标签。

通过将这些合成真值数据添加到现有的真实数据集中，便能够训练可探测远距离汽车的网络，并将 190 米到 200 米处汽车的 F1 得分提高 33%。

生成远场物体的合成真值数据

为了解决准确标注的远场数据的稀缺问题，NVIDIA 准备生成一个由近 10 万张远距离物体图像组成的合成数据集以增强现有的真实数据集。图 3 展示了在 NVIDIA DRIVE Sim 中使用 Omniverse Replicator 生成这些数据集的过程（从选择 3D 环境，到评估深度神经网络（DNN）性能）。

▲图3 用户可以使用 NVIDIA DRIVE Sim 不断迭代合成数据，以提高深度神经网络（DNN）的准确性。

在选择了针对高速公路用例的 3D 环境之后，NVIDIA 设置了一辆带有所需摄像头传感器的目标车辆（ego vehicle）。

NVIDIA DRIVE Sim 利用建立在 Omniverse Replicator 框架上的域随机化 API，以编程方式改变 3D 资产的外观、位置和运动。通过使用 ASAM OpenDRIVE 地图 API，将车辆和障碍物放置在 100 米至 350 米以上的远场距离上并使之具有情境感知能力。

▲ 可使用 NVIDIA DRIVE Sim 中生成的合成真值数据和 Omniverse Replicator 来训练网络对远场物体的感知。

NVIDIA DRIVE Sim 动作系统能够仿真各种有遮挡物的棘手情况，例如变道或近距离超车抢道等。这为现实世界中难以遇到的场景提供了关键数据。

在数据生成前的最后一步，需使用 Omniverse Replicator 的真值写入器生成必要的标签，包括 3D 边界框、速度、语义标签、物体 ID 等。

利用合成摄像头数据提高摄像头感知性能

这个用例中的真实训练数据集由 100 多万张图像组成，图像中包含高速公路场景中距离超过 200 米的车辆的真值标签。如图 4 左侧所示，这些真实图像中的汽车分布数，在距离数据采集车不到 100 米的地方达到峰值。距离更远的物体的真值标签十分稀疏，不足以提升感知能力。

▲图4 真实世界数据集与 NVIDIA DRIVE Sim 中生成的合成数据相对于本车距离的频率分布比较。目标车辆的前方为 0 度，后方为 180 度。角度为方位角值。

在本案例中，生成了约 9.2 万张合成图像以及约 37.1 万个汽车实例和真值标签，重点是放置在 350 米以内的远距离车辆的分布。合成数据集中的汽车分布更倾向于 150 米以上的远距离。通过向这个真实数据集添加约 9.2 万张合成图像，可将所需的有标签的远场物体引入到训练分布中。

在综合数据集上训练完感知算法后，NVIDIA 对真实数据集进行了测试，该数据集上的汽车分布范围在 200 米以内。根据按距离计算的感知性能改进 KPI，190 米至 200 米之间的汽车的 F1 得分（衡量模型在数据集上的准确性）最多可提高 33%。

▲图5 在使用/未使用 NVIDIA DRIVE Sim 的仿真图像训练 DNN 的情况下，障碍物检测 DNN 的性能提高程度（F1 得分）。

总结

合成数据正在推动自动驾驶车辆开发范式的重大转变，解锁以前无法实现的新用例。通过使用NVIDIA DRIVE Sim和NVIDIA Omniverse Replicator，用户可以设计新传感器的原型、评估新的真值数据类型和自动驾驶车辆感知算法并仿真罕见的负面事件，所有这些都在虚拟的试验场中进行，所耗费的时间和成本远低于现实世界。合成数据集为自动驾驶车辆的感知提供了丰富的可能性并且在不断发展。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

传感器

传感器

+关注

关注
2551

文章
51084

浏览量
753428
激光雷达

激光雷达

+关注

关注
968

文章
3971

浏览量
189903
自动驾驶系统

自动驾驶系统

+关注

关注
0

文章
65

浏览量
6766

原文标题：使用合成数据实现自动驾驶摄像感知系统聚焦远场物体

文章出处：【微信号：Leadtek，微信公众号：丽台科技】欢迎添加关注！文章转载请注明出处。

一文聊聊自动驾驶测试威廉希尔官方网站的挑战与创新

随着自动驾驶威廉希尔官方网站的飞速发展，自动驾驶测试的重要性也日益凸显。自动驾驶测试不仅需要验证车辆的感知、决策、控制模块的独立性能，还需确保系统在复杂

发表于 12-03 15:56 •174次阅读

一文聊聊<b class='flag-5'>自动驾驶</b>测试威廉希尔官方网站
的挑战与创新

标贝科技：自动驾驶中的数据标注类别分享

自动驾驶训练模型的成熟和稳定离不开感知威廉希尔官方网站的成熟和稳定，训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算，L3+级

发表于 11-22 15:07 •891次阅读

标贝科技：<b class='flag-5'>自动驾驶</b>中的<b class='flag-5'>数据</b>标注类别分享

标贝科技：自动驾驶中的数据标注类别分享

发表于 11-22 14:58 •395次阅读

感知融合为自动驾驶与机器视觉解开当前无解场景之困

“多维像素”格式输出，为自动驾驶系统提供目标与环境的多模态精准感知信息：即传感器对目标与环境感知的图像数据（明暗、纹理、颜色等）+雷达

发表于 10-29 14:21 •538次阅读

<b class='flag-5'>感知</b>融合为<b class='flag-5'>自动驾驶</b>与机器视觉解开当前无解场景之困

聊聊自动驾驶离不开的感知硬件

自动驾驶飞速发展，绕不开感知、决策和控制决策的经典框架，而感知作为自动驾驶汽车“感官”的重要组成部分，决定了自动驾驶

发表于 08-23 10:18 •497次阅读

FPGA在自动驾驶领域有哪些优势?

。硬件级安全： 自动驾驶系统对安全性有极高的要求。FPGA的硬件级安全性使其能够在硬件层面实现数据加密、防篡改和防攻击等安全功能，确保自动驾驶

发表于 07-29 17:11

FPGA在自动驾驶领域有哪些应用？

的数据处理和预处理，实现实时计算和反馈。二、数据传输与处理FPGA在自动驾驶中扮演着数据传输和处理的角色。它能够支持多种传感器（如激光雷达

发表于 07-29 17:09

自动驾驶识别威廉希尔官方网站有哪些

自动驾驶的识别威廉希尔官方网站是自动驾驶系统中的重要组成部分，它使车辆能够感知并理解周围环境，从而做出智能决策。自动驾驶识别威廉希尔官方网站主要包括多种传感器及其融

发表于 07-23 16:16 •658次阅读

自动驾驶汽车传感器有哪些

自动驾驶汽车传感器是实现自动驾驶功能的关键组件，它们通过采集和处理车辆周围环境的信息，为自动驾驶系统提供必要的

发表于 07-23 16:00 •2307次阅读

深度学习在自动驾驶中的关键威廉希尔官方网站

随着人工智能威廉希尔官方网站的飞速发展，自动驾驶威廉希尔官方网站作为其中的重要分支，正逐渐走向成熟。在自动驾驶系统中，深度学习威廉希尔官方网站发挥着至关重要的作用。它通过模拟人脑的学习过程，实现对车辆周围环境的

发表于 07-01 11:40 •761次阅读

雷诺集团携手文远知行推出自动驾驶小巴载人服务

雷诺集团近日宣布与自动驾驶领军企业文远知行（WeRide）达成深度合作，计划大规模商业化部署L4级自动驾驶威廉希尔官方网站，并推出自动驾驶小巴载人服务。据悉，雷诺集团是文

发表于 05-16 09:36 •390次阅读

如何提高自动驾驶汽车感知模型的训练效率和GPU利用率

由于采用了多摄像头输入和深度卷积骨干网络，用于训练自动驾驶感知模型的 GPU 内存占用很大。当前减少内存占用的方法往往会导致额外的计算开销或工作负载的失衡。

发表于 04-29 09:12 •896次阅读

未来已来，多传感器融合感知是自动驾驶破局的关键

模态精准感知信息，使自动驾驶系统可以实时精准地感知道路上的各种状况。昱感微融合感知产品方案创新性地将可见光

发表于 04-11 10:26

边缘计算与自动驾驶系统如何结合

当前自动驾驶中，大规模的人工智能算法模型和大规模数据集中化分析均放在云端进行。因为，云端拥有大量的计算资源，可以在极短的时间内完成数据的处理，但是仅依靠云端为自动驾驶汽车提供服务在很多

发表于 03-25 09:26 •554次阅读

自动驾驶感知算法提升处理策略

现代自动驾驶系统的特点是按顺序排列的模块化任务，传统的方法是基于标准的感知-规划-控制这种序列式架构的主流处理方式。即首先将感知信息处理成人类可以理解的语义信息和道路交通信息，然后基于

发表于 12-28 09:56 •1004次阅读

搜索历史

使用合成数据实现自动驾驶摄像感知系统聚焦远场物体

评论

一文聊聊自动驾驶测试威廉希尔官方网站的挑战与创新

标贝科技：自动驾驶中的数据标注类别分享

标贝科技：自动驾驶中的数据标注类别分享

感知融合为自动驾驶与机器视觉解开当前无解场景之困

聊聊自动驾驶离不开的感知硬件

FPGA在自动驾驶领域有哪些优势?

FPGA在自动驾驶领域有哪些应用？

自动驾驶识别威廉希尔官方网站有哪些

自动驾驶汽车传感器有哪些

深度学习在自动驾驶中的关键威廉希尔官方网站

雷诺集团携手文远知行推出自动驾驶小巴载人服务

如何提高自动驾驶汽车感知模型的训练效率和GPU利用率

未来已来，多传感器融合感知是自动驾驶破局的关键

边缘计算与自动驾驶系统如何结合

自动驾驶感知算法提升处理策略