端到端驾驶模型的发展历程-电子发烧友网

在搭建无人车时，我和小伙伴们的主要工作是建立一个驾驶模型。所谓的驾驶模型是控制无人车行驶的软件，在功能上类似于一名司机，其输入为车辆状态、周围环境信息，输出为对无人车的控制信号。在所有驾驶模型中，最简单直接的是端到端驾驶模型。端到端驾驶模型直接根据车辆状态和外部环境信息得出车辆的控制信号。从输入端（传感器的原始数据）直接映射到输出端（控制信号），中间不需要任何人工设计的特征。通常，端到端驾驶模型使用一个深度神经网络来完成这种映射，网络的所有参数为联合训练而得。这种方法因它的简洁高效而引人关注。

端到端驾驶模型的发展历程

寻找端到端驾驶模型的最早尝试，至少可以追溯到1989年的ALVINN模型【2】。ALVINN是一个三层的神经网络，它的输入包括前方道路的视频数据、激光测距仪数据，以及一个强度反馈。对视频输入，ALVINN只使用了其蓝色通道，因为在蓝色通道中，路面和非路面的对比最为强烈。对测距仪数据，神经元的激活强度正比于拍摄到的每个点到本车的距离。强度反馈描述的是在前一张图像中，路面和非路面的相对亮度。ALVINN的输出是一个指示前进方向的向量，以及输入到下一时刻的强度反馈。具体的网络结构如图一所示。

图一：ALVINN的网络结构示意图，图片引用于【2】

在训练ALVINN时，其输出的真值被设为一个分布。该分布的中心位置对应于能让车辆行驶到前方7米处的道路中心的那个方向，分布由中心向两边迅速衰减到0。此外，在训练过程中使用了大量合成的道路数据，用于提高ALVINN的泛化能力。该模型成功地以0.5米每秒的速度开过一个400米长的道路。来到1995年，卡内基梅隆大学在ALVINN的基础上通过引入虚拟摄像头的方法，使ALVINN能够检测到道路和路口【3】。另外，纽约大学的Yann LeCun在2006年给出了一个6层卷积神经网络搭建的端到端避障机器人【4】。

近年来，比较有影响力的工作是2016年NVIDIA开发的PilotNet【5】。如图二所示，该模型使用卷积层和全连层从输入图像中抽取特征，并给出方向盘的角度（转弯半径）。相应地，NVIDIA还给出了一套用于实车路测的计算平台NVIDIA PX 2。在NVIDIA的后续工作中，他们还对PilotNet内部学到的特征进行了可视化，发现PilotNet能自发地关注到障碍物、车道线等对驾驶具有重要参考价值的物体【6】。

图二：PilotNet的网络结构示意图，图片引用于【5】

PilotNet之后的模型如雨后春笋般涌现。一个重要的代表是加州大学伯克利分校提出的FCN-LSTM网络【7】。如图三所示，该网络首先通过全卷积网络将图像抽象成一个向量形式的特征，然后通过长短时记忆网络将当前的特征和之前的特征融合到一起，并输出当前的控制信号。值得指出的是，该网络使用了一个图像分割任务来辅助网络的训练，用更多监督信号使网络参数从“无序”变为“有序”，这是一个有趣的尝试。以上这些工作都只关注无人车的“横向控制”，也就是方向盘的转角。罗彻斯特大学提出的Multi-modal multi-task网络【8】在前面工作的基础上，不仅给出方向盘的转角，而且给出了预期速度，也就是包含了“纵向控制”，因此完整地给出了无人车所需的最基本控制信号，其网络结构如图四所示。

图三：FCN-LSTM网络结构示意图，图片引用于【7】

图四：Multi-modal multi-task网络结构示意图，图片引用于【8】

北京大学提出的ST-Conv + ConvLSTM + LSTM网络更加精巧【9】。如图五所示，该网络大致分成两部分，即特征提取子网络和方向角预测子网络。特征提取子网络利用了时空卷积，多尺度残差聚合，卷积长短时记忆网络等搭建技巧或模块。方向角预测子网络主要做时序信息的融合以及循环。该网络的作者还发现，无人车的横向控制和纵向控制具有较强的相关性，因此联合预测两种控制能更有效地帮助网络学习。

图五：ST-Conv+ConvLSTM+LSTM网络结构示意图，图片引用于【9】

端到端驾驶模型的特点

讲到这里，大家也许已经发现，端到端模型得益于深度学习威廉希尔官方网站的快速发展，朝着越来越精巧的方向不断发展。从最初的三层网络，逐步武装上了最新模块和技巧。在这些最新威廉希尔官方网站的加持下，端到端驾驶模型已经基本实现了直道、弯道行驶，速度控制等功能。为了让大家了解目前的端到端模型发展现状，我们从算法层面将这种模型与传统模型做一个简单对比，见下表一：

表一：传统驾驶模型和端到端模型对比

传统的模型一般将驾驶任务分割成多个子模块，例如感知、定位、地图、规划、控制等等。每个子模块完成特定的功能，某个模块的输出作为其它模块的输入，模块间相互连接，形成有向图的结构。这种方法需要人工解耦无人车的驾驶任务，设计各个子模块，而子模块的数量甚至高达上千个，导致这项工作费时费力，维护成本高昂。如此多的子模块又对车载计算平台提出了极高的要求，需要强大的算力保证各个模块能快速响应环境的变化。

此外，传统驾驶模型往往依赖高精地图，导致其数据成本高昂。这类模型通过规则化的逻辑来做无人车的运动规划与控制，又导致其驾驶风格的拟人化程度弱，影响乘坐的舒适性。作为对比，端到端模型以其简单、易用、成本低、拟人化等特点表现出很强的优势。

人们通常认为端到端驾驶模型和模块化的传统模型之间是彼此对立的，有了模块化模型就不需要端到端了。但在无人配送领域，我认为两者应该是互补的。首先，无人配送车“小、轻、慢、物”的特点【10】极大降低了其安全风险。使端到端模型的部署成为可能。然后，端到端模型可以很好地处理常见场景，而且功耗低。模块化的方法能覆盖更多场景，但功耗高。因此，一个很有价值的方向应该是联合部署端到端模型和模块化模型。在常见场景中使用端到端，在复杂场景中，切换到模块化模型。这样，我们可以在保证整体模型性能的同时，尽最大可能降低配送车的功耗。

那么是不是很快就能见到端到端驾驶模型控制的无人配送车了呢？其实，现在端到端驾驶模型还处在研究阶段。我从自己的实际工作经验中总结出以下几个难点：

1、端到端驾驶模型因其近乎黑盒的特点导致调试困难。

由于端到端模型是作为一个整体工作的，因此当该模型在某种情况下失败时，我们几乎无法找到模型中应该为这次失败负责的“子模块”，也就没办法有针对性地调优。当遇到失败例子时，通常的做法只能是添加更多的数据，期待重新训练的模型能够在下一次通过这个例子。

2、端到端驾驶模型很难引入先验知识。

目前的端到端模型更多地是在模仿人类驾驶员动作，但并不了解人类动作背后的规则。想要通过纯粹数据驱动的方式让模型学习诸如交通规则、文明驾驶等规则比较困难，还需要更多的研究。

3、端到端驾驶模型很难恰当地处理长尾场景。

对于常见场景，我们很容易通过数据驱动的方式教会端到端模型正确的处理方法。但真实路况千差万别，我们无法采集到所有场景的数据。对于模型没有见过的场景，模型的性能往往令人担忧。如何提高模型的泛化能力是一个亟待解决的问题。

4、端到端驾驶模型通常通过模仿人类驾驶员的控制行为来学习驾驶威廉希尔官方网站。

但这种方式本质上学到的是驾驶员的“平均控制信号”，而“平均控制信号”甚至可能根本就不是一个“正确”的信号。

例如在一个可以左拐和右拐的丁字路口，其平均控制信号——“直行”——就是一个错误的控制信号。因此，如何学习人类驾驶员的控制策略也有待研究。

在这个问题上，我和小伙伴们一起做了一点微小的工作，在该工作中，我们认定驾驶员在不同状态下的操作满足一个概率分布。我们通过学习这个概率分布的不同矩来估计这个分布。这样一来，驾驶员的控制策略就能很好地通过其概率分布的矩表达出来，避免了简单求“平均控制信号”的缺点。该工作已被 ROBIO 2018 接收。

端到端驾驶模型中常用方法

为了解决上面提到的各种问题，勇敢的科学家们提出了许多方法，其中最值得期待的要数深度学习威廉希尔官方网站【11】和强化学习威廉希尔官方网站【12】了。随着深度学习威廉希尔官方网站的不断发展，相信模型的可解释性、泛化能力会进一步提高。这样以来，我们或许就可以有针对性地调优网络，或者在粗糙的仿真下、在较少数据的情况下，成功地泛化到实车场景、长尾场景。强化学习这项威廉希尔官方网站在近年来取得了令人惊叹的成就。通过让无人车在仿真环境中进行强化学习，也许可以获得比人类驾驶员更优的控制方法也未可知。此外，迁移学习、对抗学习、元学习等威廉希尔官方网站高速发展，或许也会对端到端驾驶模型产生巨大影响。

我对端到端驾驶模型今后的发展充满了期待。“Two roads diverged in a wood, and I took the one less traveled by”【13】。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

传感器

传感器

+关注

关注
2550

文章
51043

浏览量
753112
神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100720
图像分割

图像分割

+关注

关注
4

文章
182

浏览量
17995

原文标题：美团威廉希尔官方网站部解析：无人车端到端驾驶模型概述

文章出处：【微信号：IV_Technology，微信公众号：智车科技】欢迎添加关注！文章转载请注明出处。

端到端自动驾驶威廉希尔官方网站研究与分析

传递和全局优化的优势，成为智能驾驶威廉希尔官方网站发展的重要方向。与传统模块化架构相比，端到端威廉希尔官方网站通过深度神经网络实现从传感器数据输入

发表于 12-19 13:07 •107次阅读

理想汽车智能驾驶团队调整：端到端部门独立

整体负责，并向郎咸朋汇报。经过架构调整后，智能驾驶团队被细分为三个主要部门。夏中谱将专注于“端到端”模型算法的研发与落地工作;贾鹏则转而负责

发表于 12-04 11:11 •506次阅读

爆火的端到端如何加速智驾落地？

编者语：「智驾最前沿」微信公众号后台回复：C-0551，获取本文参考报告：《智能汽车端到端威廉希尔官方网站研究报告》pdf下载方式。 “端到

发表于 11-26 13:17 •241次阅读

爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智驾落地？

连接视觉语言大模型与端到端自动驾驶

端到端自动驾驶在大规模驾驶数据上训练，展现出很强的决策规划能力，但是面对复杂罕见的驾驶场景，依然

发表于 11-07 15:15 •229次阅读

连接视觉语言大<b class='flag-5'>模型</b>与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动<b class='flag-5'>驾驶</b>

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

迈新步，为其机器人出租车业务引入了一种基于谷歌多模态大语言模型（MLLM）“Gemini”的全新训练模型——“端到端多模态自动

发表于 10-31 16:55 •1052次阅读

智己汽车“端到端”智驾方案推出，老司机真的会被取代吗？

随着智能驾驶威廉希尔官方网站的发展，行业已经从早期基于简单规则和模块化逻辑的自动驾驶，逐步迈向依托深度学习的高复杂度智能驾驶解决方案，各车企也紧跟潮流，先后宣布了自己的

发表于 10-30 09:47 •269次阅读

智己汽车“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智驾方案推出，老司机真的会被取代吗？

Mobileye端到端自动驾驶解决方案的深度解析

自动驾驶威廉希尔官方网站正处于快速发展之中，各大科技公司和汽车制造商均在争相布局，试图在这个新兴领域占据一席之地。Mobileye作为全球自动驾驶威廉希尔官方网站的领军企业之一，凭借其独特的端

发表于 10-17 09:35 •351次阅读

Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动<b class='flag-5'>驾驶</b>解决方案的深度解析

智驾进程发力？小鹏、蔚来端到端模型上车

转型的关键时期，而智能驾驶威廉希尔官方网站的发展被视为这场变革的核心动力。作为自动驾驶的支撑威廉希尔官方网站之一，端到端

发表于 09-26 09:19 •269次阅读

智驾进程发力？小鹏、蔚来<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>上车

实现自动驾驶，唯有端到端？

自动驾驶威廉希尔官方网站的迅速发展，越来越多的企业开始探索更加智能、高效的解决方案，随着AI大模型入场，自动驾驶涌现出许多新的威廉希尔官方网站，智驾行业威廉希尔官方网站路径从CNN、RNN、GAN、再到Transform

发表于 08-12 09:14 •721次阅读

实现自动<b class='flag-5'>驾驶</b>，唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>？

周光：不是真“无图”，谈何端到端

端模型的强因果关系，早在今年4月的北京车展，周光就有此言论，并推出不搭载高精度地图和应用端到端模型

发表于 06-03 11:06 •3089次阅读

小鹏汽车发布国内首个量产上车的端到端大模型

小鹏汽车近日宣布，国内首个端到端大模型量产上车，这一革命性的威廉希尔官方网站将大幅提升智能驾驶的能力。据小鹏汽车介绍，这一大

发表于 05-28 11:47 •706次阅读

小鹏汽车发布端到端大模型

小鹏汽车近日宣布，其成功研发并发布了“国内首个量产上车”的端到端大模型，该模型可直接通过传感器输入内容来控制车辆，标志着智能

发表于 05-21 15:09 •678次阅读

理想汽车自动驾驶端到端模型实现

理想汽车在感知、跟踪、预测、决策和规划等方面都进行了模型化，最终实现了端到端的模型。这种模型不仅

发表于 04-12 12:17 •447次阅读

牵手NVIDIA 元戎启行端到端模型将搭载 DRIVE Thor芯片

NVIDIA的DRIVE Thor芯片适配公司的端到端智能驾驶模型。据悉，元戎启行是业内首批能用 DRIVE Thor芯片适配

发表于 03-25 11:49 •333次阅读

端到端模型卷入智驾圈周光：今年上车！

让AI像人类司机一样开车，今年就能做到。 3月17日，在中国电动汽车百人会汽车新质生产力论坛上，元戎启行CEO周光表示，智能驾驶端到端模型

发表于 03-18 11:17 •521次阅读

搜索历史

端到端驾驶模型的发展历程

评论

端到端自动驾驶威廉希尔官方网站研究与分析

理想汽车智能驾驶团队调整：端到端部门独立

爆火的端到端如何加速智驾落地？

连接视觉语言大模型与端到端自动驾驶

Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

智己汽车“端到端”智驾方案推出，老司机真的会被取代吗？

Mobileye端到端自动驾驶解决方案的深度解析

智驾进程发力？小鹏、蔚来端到端模型上车

实现自动驾驶，唯有端到端？

周光：不是真“无图”，谈何端到端

小鹏汽车发布国内首个量产上车的端到端大模型

小鹏汽车发布端到端大模型

理想汽车自动驾驶端到端模型实现

牵手NVIDIA 元戎启行端到端模型将搭载 DRIVE Thor芯片

端到端模型卷入智驾圈周光：今年上车！