动态场景下基于注意力机制与几何约束的VSLAM算法

首页    动态场景下基于注意力机制与几何约束的VSLAM算法

         本文针对了传统的SLAM算法在动态场景下易出现动态物体检测不完整以及难以准确判断潜在动态物体的运动状态等问题,提出一种动态场景下基于注意力机制与几何约束的VSLAM算法(VSLAM algorithm based on Attention mechanism and Geometric constraints in Dynamic scenes, AGD-SLAM)。该算法通过设计一种聚合注意力模块,引导模型关注图像中的漏检测区域,同时引入自适应空间特征融合网络ASFF,增强特征提取能力,避免漏检测发生。为减少动态物体对SLAM系统定位精度的干扰,通过基于双重静态点约束的位姿优化估计潜在动态物体运动状态,最终使用全部静态点进行位姿估计和地图构建。在公开TUM数据集进行测试,测试结果表明所提算法的绝对轨迹误差与DynaSLAM相比降低了10.98%,表现出良好的构图能力。

         上图所示为系统整体框架。本文针对传统SLAM 算法易出现动态物体检测不完整以及难以准确判断 潜在动态物体的运动状态等问题,提出一种动态场景 下基于注意力机制与几何约束的VSLAM算法。在潜 在动态物体检测阶段,通过本文所提的AFNET ( Attention mechanism and adaptively spatial feature Fusion target detection NETwork) 目标检测网络对图 像信息中的潜在动态物体进行目标检测,并提取图 像的ORB特征点。在基于双重静态点约束的位姿 优化阶段,通过DBSCAN( Density-Based Spatial Clus tering of Applications with Noise) 密度聚类算法初步 提取潜在动态物体的静态点,生成初步静态点集合, 并使用其进行初步位姿估计,然后使用双重静态点 约束方法,进一步确定物体真实运动状态,并剔除动 态点,再使用全部的静态点集合进行二次位姿优化, 提升系统精度。

         在电脑配置为:Ubuntu18.04版 本Linux 操作系统,Intel( R) Core( TM) i5-11400F@ 2.60 GHz,显卡为 RTX3060,16G 内存上进行实验。实验所用的数据集均来自公开的TUMRGB-D数据集,测试结果表明所提算法的绝对轨迹误差与DynaSLAM相比降低了10.98%,表现出良好的构图能力。