针对在时变的室外环境中难以视觉定位的问题,博士生颜深创新性地提出一种解决方案 SensLoc。SensLoc 利用移动设备内置的传感器数据,如 GPS、指南针和重力传感器,为视觉定位提供有效的初始位姿和约束条件,从而缩小图像检索和位姿估计的搜索空间。
此外,SensLoc 还设计了一个直接的 2D-3D 匹配网络,以高效地建立查询图像与三维场景之间的对应关系,避免了现有系统中需要多次进行 2D-2D 匹配的低效方案。为了验证 SensLoc 的有效性,论文还构建了一个新的数据集,该数据集包含了多种移动传感器数据和显著的场景外观变化,并开发了一个系统来获取查询图像的真实位姿。大量的实验表明 SensLoc 可以在时变的室外环境中实现准确、鲁棒且高效的视觉定位。
,图像检索任务需要在参考图像集
里找到与查询图有共视关系的图像子集:
,其位置分量来源于 GPS,旋转分量来自于重力计和指南针方向的集成。查询图像只需要在图像子集
中检索共视邻居
表示经纬度的 x-y 坐标,
表示相机的主轴方向。
2 直接的 2D-3D 匹配
给定查询图
和共视邻居
,2D-3D 匹配任务需要建立
像素点与
能观察到的局部点云
之间的 2D-3D 对应关系。
具体而言,首先使用多层级网络提取查询图
和参考图
的粗(用
表示)、细(用
表示)粒度特征,然后将局部点云
投影在参考特征图上并进行插值、平均,得到点云特征。
然后,使用带注意力机制的网络匹配查询图与局部点云的粗粒度特征,确定点云是否为查询图像所见,并初步确定它在图像上的位置。使用注意力机制变换后的粗粒度图像和点云特征分别为
,概率匹配矩阵
表示为
表示为
,通过将点云的细粒度特征
与在
附近裁剪出细粒度窗口特征
进行点乘,得到匹配概率并计算二维位置期望,获取查询图像的亚像素
与局部点云
的精确对应关系。
3 基于重力方向的 PnP RANSAC
给定 2D-3D 的对应关系,之前的工作通常采用 PnP RANSAC 算法求解相机的六自由度位姿。论文在 PnP RANSAC 迭代中插入一个简单有效的验证模块,以保证重力方向的正确性。具体地,对于 RANSAC 迭代生成的位姿假设
,其与传感器位姿
在重力方向
上差值为
预先过滤掉大部分错误位姿,实现更高效、鲁棒的位姿解算。
数据集
论文构建了一个新的数据集,用于验证所提方法的有效性。该数据集包括一个城市公园(约 31,250 平方米),包含植被、河流、建筑和人行道。作为一个公共区域,其不可避免地会经历各种场景的变化,例如不同光照、季节、天气,运动的行人、车辆,甚至新的基础设施建设。数据集的构建流程如下图所示。
。相较于单目相机,全景相机具有更高的采集效率。将 7,958 张全景图像切分并转换为针孔模型后,该数据集包括 47,780 张参考图像。为了确定模型尺度并与地理坐标系保持一致,该研究预先在全景相机上绑定了一个 RTK 记录仪,以记录绝对地理坐标。
2 查询图像采集
在三维参考地图构建完成半年后,该研究在相同地址中行走,并开发了一款安卓应用程序 Acquisition Application(采集 APP),使用华为 P40 pro 和小米 Mix 3 手机拍摄视频以采集查询图像,并通过绑定 RTK 记录仪获取拍摄时的地理位置信息。该采集 APP 能够同时记录手机内置传感器的数据,包括 IMU、重力计、指南针、蓝牙、WiFi 和 GPS。拍摄视频与所有传感器均经过硬件同步和细致校准。由于论文关注于单图的视觉定位,因此视频序列会进行采样以生成不连续的单张图像。
3 三维辅助地图构建与伪位姿真值生成
由于查询图像与三维参考地图之间存在跨时节的变化,因此基于半年前构建的三维参考地图生成查询图像的伪位姿真值较为困难。论文提出在采集查询图像时,同时构建一个三维辅助地图
。三维辅助地图的构建方法与三维参考地图类似,同样使用全景相机和 RTK 记录仪进行采集,并采用 ICP 威廉希尔官方网站
进行对齐。基于三维辅助地图生成查询图像的伪真值等同于基于三维参考地图生成的伪真值。论文设计了一套联合优化方法生成伪真值,优化项包括:1)图像自定位约束;2)序列图像的相对位姿约束;3)IMU 的运动约束;4)其他先验约束,如重力方向和 RTK 位置。




















为互最近邻,
为预设阈值。
最后,对于每一个粗匹配对应的二维像素和三维点云












审核编辑 :李倩
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
传感器
+关注
关注
2550文章
50906浏览量
752719 -
图像检索
+关注
关注
0文章
28浏览量
8036 -
视觉定位
+关注
关注
5文章
50浏览量
12387
原文标题:CVPR 2023 | 六自由度视觉定位
文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
DSP在六自由度电磁跟踪系统中的应用
六自由度电磁跟踪系统根据电磁感应的原理来计算出目标的六个自由度参数,从而唯一确定目标的位置和姿态。怎样由接收到的模拟信号计算得到目标的位置和姿态参数是影响整个系统性能的关键所在。在一些
发表于 01-25 00:11
•1305次阅读

基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计
和增强系统处理图像的实时性,本文提出了一种伊瑟特的六自由度机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特主站上,提高了视觉伺服的实时性.经测试,该平台能够对
发表于 05-29 16:17
基于STM32、以太网、Labview的六自由度Stewart并联运动平台模型
六自由度Stewart并联运动平台模型-X,Y,Z平移、旋转测试六自由度Stewart并联运动平台-Z向旋转正弦波复现六
发表于 04-16 23:25
基于Matlab的开源六自由度协作机器人实验平台
一前言针对机器人相关专业的教学需求,商飞信息科技开发出此开源六自由度协作机器人实验平台。该平台有以下几大特色机器人本体采用自主设计的3Kg负载六自由度协作机器人,机器人每个关节集成电机
发表于 09-07 07:10
基于FPGA的六自由度机器人视觉伺服控制方案设计
机器人视觉系统的硬件选择直接影响图像采集,图像的质量和后期的处理,并影响整个控制系统的实时性,所以应根据要求和这些硬件性能,严格选择硬件。基于伊瑟特的六自由度机器人视觉伺服控制系统
发表于 04-24 10:31
•466次阅读

评论