0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

港中文等发布MagicDrive:日夜、雨晴、多视角全覆盖,人、物位置随意变更

CVer 来源:新智元 2023-10-20 16:18 次阅读

efaf7ad2-6f13-11ee-939d-92fbcf53809c.gif

【导读】MagicDrive可以细粒度生成高保真、多相机街景,可以随意变换天气、光照条件以及人物位置,海量自动驾驶数据触手可及!

深度学习算法的应用中,高质量的数据是威廉希尔官方网站 创新的关键驱动力,尤其在自动驾驶领域,获取和标注3D感知数据的成本不菲,对于许多研究者和开发者来说都是一个重大挑战。

为此,来自香港中文大学、香港科技大学和华为诺亚方舟实验室的研究人员联合提出了基于 Diffusion的3D自动驾驶数据生成方法MagicDrive。

通过多种3D几何条件的细粒度控制,MagicDrive在生成高保真多相机街景图像的同时,还能够支持多种下游感知任务的训练。

efd1f9ea-6f13-11ee-939d-92fbcf53809c.png

论文地址:https://arxiv.org/abs/2310.02601

项目主页:https://gaoruiyuan.com/magicdrive/

Github: https://github.com/cure-lab/MagicDrive

‍MagicDrive多样化生成数据

MagicDrive是一个突破性的解决方案利用可控生成威廉希尔官方网站 合成自动驾环视相机视图,生成更多样化的自动驾驶数据,为自动驾驶场景仿真提供了新思路。

efe7a682-6f13-11ee-939d-92fbcf53809c.gif

先来看一些MagicDrive的生成效果。

多视角下,前景和背景都能保持一致性:

effec998-6f13-11ee-939d-92fbcf53809c.png

可以一键转雨天:

f00cc6c4-6f13-11ee-939d-92fbcf53809c.png

不止生成车,人、障碍物都能准确控制位置:

f01a1e6e-6f13-11ee-939d-92fbcf53809c.png

还可以一键转夜晚:

f03233fa-6f13-11ee-939d-92fbcf53809c.png

物体位置可以实现细粒度控制:

f03b78f2-6f13-11ee-939d-92fbcf53809c.gif

‍关键问题:多种3D条件的编码与注入

描述自动驾驶场景的条件是多维度的,包括:相机参数、物体框、路面地图以及对场景属性的语言描述(比如天气和时间)。如何将如此复杂的场景信息同时作为条件指导生成,是3D自动驾驶街景数据合成的重点问题。

BEVGen[1]将3D几何信息(路面和物体位置)都投影在BEV空间中,这会丢失全部高度信息,既无法控制物体高度/遮挡,也无法体现路面起伏;BEVControl[2]将3D几何信息分别投影在相机视图中,对于没有高度信息的路面地图而言,投影本身就是一个欠定义的问题,而且这种做法丢失了深度信息,同样无法准确控制遮挡。

f063e59e-6f13-11ee-939d-92fbcf53809c.png

3D几何信息与不同2D投影(相机投影/BEV)控制的比较

MagicDrive在完整考虑这些控制条件的基础上,首次实现3D几何的直接控制。MagicDrive结合Diffusion Model进行条件生成的优势,根据每个控制条件的形式,采用不同的方法对生成进行控制。

f070217e-6f13-11ee-939d-92fbcf53809c.png

MagicDrive的方法框架

具体来说,对于场景级别的信息(语言描述和相机参数)和物体框信息,由于他们具有可变长的性质,MagicDrive先使用不同的编码器讲输入数据编码成嵌入序列,然后使用交叉注意力模块控制图像生成过程;

对于路面地图信息,BEV能够很好地将路面表示成图像的形式,因此,使用类似ControlNet[3]的额外编码器分支,就能够让生成遵循路面地图的条件。

删繁就简:不同视角的一致性生成

多视角一致性是3D场景相机视图生成的另一个重要要求。此前,已经有一些工作探索了室内场景中的多视角一致性约束方法,例如:MVDiffusion[5]和[6],但室内场景通常视角之间重叠较大,因此他们借助了不同的几何先验来限制视角之间的关系。

对于自动驾驶场景,不同相机之间重叠程度是有限的,因此并不需要过强的几何约束。相反,在几何条件足够的情况下(即不同视角已经有独立的几何条件信息),只需要让不同视角的生成过程有信息交互,就能够保证前景和背景的一致生成。

因此MagicDrive提出cross-view attention模块,用于在各个视角的生成过程中与左右相邻视角交换信息,确保了从多个视角看到的前景和背景是一致的,这大大提高了数据的真实性与可靠性。

f085263c-6f13-11ee-939d-92fbcf53809c.png

Corss-view attention 模块控制多视角的一致性

生成效果:在多个下游任务上提升明显

用以真实图像训练的感知模型评价生成模型产生的图片,MagicDrive不仅可以在BEV分割任务上超过baseline,并且能够直接支持3D物体检测任务,体现出优越的生成效果。

MagicDrive生成的图片还可以直接用于数据增强,支持BEV分割和3D物体检测任务,提升BEVFusion[6]和CVT[7]的性能。

除此之外,MagicDrive的多条件控制还可以实现场景、背景和前景的多层次街景图像编辑,用来生成更多的新街景图像。

更多评价结果与讨论请参考原论文。

总结

总的来说,MagicDrive带给我们一个全新的、高效的数据生成途径。不仅成功解决了之街景生成中的3D几何控制问题,而且提供了一种全新的方法,利用细粒度可控生成威廉希尔官方网站 为3D自动驾驶产生训练数据,生成数据的质量和真实性向自动驾驶的感知威廉希尔官方网站 注入了新的活力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2688

    浏览量

    47412
  • 3D
    3D
    +关注

    关注

    9

    文章

    2871

    浏览量

    107442
  • 自动驾驶
    +关注

    关注

    784

    文章

    13760

    浏览量

    166318

原文标题:自动驾驶数据不用愁!港中文等发布MagicDrive:日夜、雨晴、多视角全覆盖,人、物位置随意变更

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【Tisan联网申请】户外集

    申请理由:由于传统的采都是人工的,既费时费力,而且效率不高,基于单片机控制的集器不仅能自动采集雨水,而且还自动换瓶,省时省力。项目描述:由于有多个采样地点,同时控制集板的开合不太容易,基于
    发表于 11-16 11:17

    工厂车间无线WiFi覆盖解决方案

    都是在一个AP覆盖下,手持设备和移动终端随意移动,不会出现跨AP切换断线或延时的问题,真正意义上的零延时零切换。扇区覆盖的缺点:  适合于敞开的车间、仓库、货场,中间不能有横墙或隔断
    发表于 08-11 17:15

    定制段码液晶屏如何确认视角反向?

    的是视角就是有LCD显示屏安装在仪器上的位置来确定的,(如:计算器一般是放在桌子上或握在手上,这种做6:00视角比较好,有些LCD液晶屏是安装在低于
    发表于 07-08 09:13

    G104XVN01.0​友达10.4寸高清视角工业显示屏

    G104XVN01.0​友达10.4寸高清视角工业显示屏一、友达10.4寸液晶屏G104XVN01.0应用详情品牌:友达型号名称:G104XVN01.0屏幕类型:a-Si TFT-LCD , 液晶
    发表于 03-16 10:02

    中文C语言编程玩转联网华为鸿蒙Hi3861开发-基础案例合集

    继《一套支持中文C语言编程的鸿蒙Hi3861智能硬件开发套件》发布后,中文C语言编程玩转联网华为鸿蒙Hi3861开发,多个基础案例视频,包括交通红绿灯、数码管、光电开关、手指侦测心率
    发表于 05-08 23:50

    指示器电路图

    指示器电路图
    发表于 04-13 09:26 796次阅读
    <b class='flag-5'>晴</b><b class='flag-5'>雨</b>指示器电路图

    霓虹灯控制器电路图

    霓虹灯控制器电路图
    发表于 06-16 15:46 974次阅读
    霓虹灯<b class='flag-5'>晴</b><b class='flag-5'>雨</b>控制器电路图

    熵加权视角核K-means算法

    在基于视角加权的视角聚类中,每个视角的权重取值对聚类结果的精度都有着重要的影V向。针对此问题,提出熵加权
    发表于 12-17 09:57 1次下载

    基于视角相容性的视角数据缺失补全

    随着信息威廉希尔官方网站 的快速发展,现实生活中不断涌现出大量的视角数据,由此应运而生的视角学习已成为机器学习领域的研究热点.然而,在数据获取过程中,由于收集的难度、高额成本或设备故障
    发表于 12-18 10:46 1次下载

    基于源数据融合高时空分辨率分类

    高时空分辨率分类与交通、旅游、农业灌溉及人们日常出行都密切相关,然而天有不测风云,东边日头西边。准确的高时空分辨率分类是极具挑战性
    发表于 12-25 11:48 0次下载
    基于<b class='flag-5'>多</b>源数据融合高时空分辨率<b class='flag-5'>晴</b><b class='flag-5'>雨</b>分类

    瓶制作方法

    感觉淘宝卖的瓶不值那个价格,今天上午用白炽灯泡做了一个试试看效果。
    的头像 发表于 09-14 14:08 4457次阅读

    北京联通实现了五个5G覆盖

    今年全国两会,北京联通实现了“五个5G覆盖”,满足 “四个”新媒体需求,即:两会会场区域5G覆盖;大会堂部长通道/媒体展示厅/金色大厅
    发表于 03-19 13:41 1578次阅读

    如何实现大区域联网的低成本覆盖

    低功耗广域网(LPWAN)威廉希尔官方网站 是近年国际上一种革命性的联网接入威廉希尔官方网站 ,具有远距离、低功耗、低运维成本特点,可以真正实现大区域联网低成本覆盖
    的头像 发表于 07-21 10:11 4328次阅读

    行业首款RISC-V联网安全芯片“华芯”正式发布

    近日,由华集团主办的“‘华芯’产品发布会暨合作伙伴战略合作发布会”隆重举行。赛昉科技、微五科技、紫光展锐、海思、移远通信、中移联、中国
    的头像 发表于 12-15 10:04 877次阅读
    行业首款RISC-V<b class='flag-5'>物</b>联网安全芯片“<b class='flag-5'>港</b>华芯”正式<b class='flag-5'>发布</b>

    洪水资源管理远程监控平台

    数据必将耗费大量人力物力。 通过EMCP联网云平台搭建的洪水远程监测预警系统,实现以水库(河道)水雨情信息“全要素、量程、覆盖”自动
    的头像 发表于 11-06 17:17 526次阅读
    <b class='flag-5'>雨</b>洪水资源管理远程监控平台