自动驾驶注释数据：如何判断数据集的有效性-电子发烧友网

数据是现代机器学习应用程序中最重要的组成部分，包括自动驾驶汽车的感知系统都是依靠数据进行训练的。目前汽车都配备了许多传感器，这些传感器收集信息并输入到汽车计算机，然后信息必须进行实时处理和注释，以便汽车了解行驶中道路前方的情况。但是，汽车计算机上的算法需要接受有关如何进行分类的训练，所以数据标注的准确性变得很重要。以下是Annotell公司在数据标注上的一些探索。

带注释的数据至关重要，它有两个目的：在汽车上的计算机上训练算法以解释收集的信息，并验证计算机确实已学会正确解释收集的信息。由于注释数据用于这两个关键目的，因此注释的质量至关重要。最终，低质量的注释可能会导致汽车误解道路上正在发生的事情。

注释数据的过程始终包括一些人为的决定，第一个挑战就是让人们同意对记录的数据进行正确的注释，而创建这样的注释准则有时并不像人们想象的那么容易。往往需要有效设计注释准则以提高质量方面具有丰富的经验。第二个挑战是在指南的指导下按比例执行注释。

如何判断数据集的有效性？

量化注释质量的一种方法是注释数据集的精度和召回率。考虑一下标注的类型，其中摄像机图像中的一个对象（如接近的车辆）由一个边界框标注。在对此类数据集的质量进行推理时，有两个重要的问题（i）感兴趣的对象是否已由边界框正确标注，以及（ii）边界框是否实际上包含感兴趣的对象。

上面示意图中出现了错误标注。而在完美注释的数据集中，以上两个错误均不存在。因此，定义质量的一种方法是计算这些错误在带注释的数据集中出现的程度。例如计算

实际表示对象的包围盒的比率。这称为精度。理想情况下，精度为1。用边界框正确注释的对象的比率。这就是所谓的召回。理想情况下，召回率为1。

但是，计算数据集的精度和召回率还需要对整个数据集中的每个帧进行人工批判性检查，这可能与注释过程本身一样昂贵！为了在计算精度和召回率时获得效率，因此Annotell团队依靠统计数据来推断精度和召回率。仅对所有注释的统计选择良好的子集进行人工批判性审查，并使用概率论得出有关整个数据集的结论。

更详细地讲，他们使用贝叶斯方法来计算后验分布，以提高精度并召回整个数据集，这取决于已经进行了严格审查的注释的子样本。它不仅提供了精确度和召回率的估计，而且还量化了这些估计中的不确定性。例如，我们可以计算所谓的95％可信度下限，这意味着可以确定95％的精度或召回率不低于此阈值。

Annotell公司提供了一种具有成本效益的工具，用于根据精度和召回级别以及对级别的确定性来衡量注释的质量。

责任编辑：xj

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据

数据

+关注

关注
8

文章
7006

浏览量
88958
注释

注释

+关注

关注
0

文章
11

浏览量
6527
自动驾驶

自动驾驶

+关注

关注
784

文章
13787

浏览量
166408

一文聊聊自动驾驶测试威廉希尔官方网站的挑战与创新

，包括场景生成的多样性与准确性、多传感器数据融合的精度验证、高效的时间同步机制，以及仿真平台与实际场景的匹配等问题。 自动驾驶测试的必要性与

发表于 12-03 15:56 •160次阅读

一文聊聊<b class='flag-5'>自动驾驶</b>测试威廉希尔官方网站
的挑战与创新

标贝科技：自动驾驶中的数据标注类别分享

自动驾驶训练模型的成熟和稳定离不开感知威廉希尔官方网站的成熟和稳定，训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算，L3+级自动驾驶每辆汽车每天产生的

发表于 11-22 15:07 •880次阅读

标贝科技：<b class='flag-5'>自动驾驶</b>中的<b class='flag-5'>数据</b>标注类别分享

车厂如何安全有效做自动驾驶路测？

自动驾驶威廉希尔官方网站依赖先进的传感器、算法和通信威廉希尔官方网站来实现车辆的自主导航和决策。在这些威廉希尔官方网站中，CANFD和车载以太网是两种关键的通信协议，它们为车辆内部和车辆之间的数据交换提供了高速和可靠的连接。中国

发表于 08-03 08:25 •774次阅读

车厂如何安全<b class='flag-5'>有效</b>做<b class='flag-5'>自动驾驶</b>路测？

FPGA在自动驾驶领域有哪些优势?

。硬件级安全： 自动驾驶系统对安全性有极高的要求。FPGA的硬件级安全性使其能够在硬件层面实现数据加密、防篡改和防攻击等安全功能，确保自动驾驶

发表于 07-29 17:11

FPGA在自动驾驶领域有哪些应用？

FPGA（Field-Programmable Gate Array，现场可编程门阵列）在自动驾驶领域具有广泛的应用，其高性能、可配置性、低功耗和低延迟等特点为自动驾驶的实现提供了强有力的支持。以下

发表于 07-29 17:09

中级自动驾驶架构师应该学习哪些知识

随着自动驾驶威廉希尔官方网站的成熟，对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流；需要协调不同领域的专业知识，确保系统的可靠性、安全

发表于 06-20 21:47 •285次阅读

初级自动驾驶架构师应该学习哪些知识

随着自动驾驶威廉希尔官方网站的成熟，对系统架构师的需求逐渐增加。自动驾驶系统架构师负责设计整个系统的结构、组件、接口和数据流；需要协调不同领域的专业知识，确保系统的可靠性、安全

发表于 06-20 21:45 •298次阅读

标贝数据采集标注在自动驾驶场景中落地应用实例

AI数据服务作为人工智能和机器学习的基础，在自动驾驶领域中有着重要地位。与其他人工智能应用场景相比，自动驾驶的落地场景相对复杂，想要让汽车本身的算法做到处理更多、更复杂的场景，就需要运用大量场景化

发表于 05-28 14:22 •557次阅读

特斯拉拟在华建数据中心，加速自动驾驶发展

据知情人士透露，特斯拉正计划在中国境内建立数据中心，此举是埃隆·马斯克全球自动驾驶战略的重要一环。新数据中心将专门用于训练自动驾驶车辆所需的先进算法，以推动全球

发表于 05-20 10:12 •439次阅读

未来已来，多传感器融合感知是自动驾驶破局的关键

/L4级自动驾驶赛跑的元年。马斯克评论FSD 12.3版本的左转弯操作就像人类司机一样。如果FSD 12.3版本成功，将基本颠覆目前市场上的智能驾驶威廉希尔官方网站路线。基于“数据/算法/算力”的无人驾

发表于 04-11 10:26

自动驾驶数据集的生成模型之WoVoGen框架原理

生成多摄像头的街景视频对于增加自动驾驶数据集至关重要，解决了对广泛而多样的数据的迫切需求。由于多样性的限制和处理光照条件的挑战，传统的基于渲

发表于 01-25 15:26 •575次阅读

自动驾驶领域的数据集汇总

发自动驾驶论文哪少的了数据集，今天笔者将为大家推荐一篇最新的综述，总结了200多个自动驾驶领域的数据集

发表于 01-19 10:48 •997次阅读

万集激光基于车路协同的自动驾驶方案亮相

如何同时兼顾安全与成本？是自动驾驶的一大难题。万集独创基于C-V2X的车路协同自动驾驶解决方案给出了自己的答案。通过将道路的实时交通信息应用进来，可以降低单车智能对于过多传感器的依赖和过多数据

发表于 01-15 11:37 •1041次阅读

语音数据集在自动驾驶中的应用与挑战

随着人工智能威廉希尔官方网站的快速发展，自动驾驶汽车已经成为交通领域的研究热点。语音数据集在自动驾驶中发挥着重要的作用，为驾驶员和乘客提供了更加便捷和安

发表于 12-25 09:48 •556次阅读

搜索历史

自动驾驶注释数据：如何判断数据集的有效性

评论

一文聊聊自动驾驶测试威廉希尔官方网站的挑战与创新

标贝科技：自动驾驶中的数据标注类别分享

标贝科技：自动驾驶中的数据标注类别分享

车厂如何安全有效做自动驾驶路测？

FPGA在自动驾驶领域有哪些优势?

FPGA在自动驾驶领域有哪些应用？

中级自动驾驶架构师应该学习哪些知识

初级自动驾驶架构师应该学习哪些知识

标贝数据采集标注在自动驾驶场景中落地应用实例

特斯拉拟在华建数据中心，加速自动驾驶发展

未来已来，多传感器融合感知是自动驾驶破局的关键

自动驾驶数据集的生成模型之WoVoGen框架原理

自动驾驶领域的数据集汇总

万集激光基于车路协同的自动驾驶方案亮相

语音数据集在自动驾驶中的应用与挑战