首页 | 本学科首页   官方微博 | 高级检索  
     检索      

可学习深度位置编码引导的车前图像道路可行驶区域检测
引用本文:韩汀,陈思宇,马津,蔡国榕,张吴明,陈一平.可学习深度位置编码引导的车前图像道路可行驶区域检测[J].武汉大学学报(信息科学版),2024(4):582-594.
作者姓名:韩汀  陈思宇  马津  蔡国榕  张吴明  陈一平
作者单位:1. 中山大学测绘科学与技术学院;2. 集美大学计算机工程学院
基金项目:国家自然科学基金(42371343);
摘    要:道路可行驶区域检测是汽车辅助驾驶系统中场景感知的关键基础。基于卷积神经网络的方法因难以获取全局上下文信息而易产生道路空洞和中断等完整性问题,而基于Transformer的方法缺乏局部理解,容易造成边界的错位和越界问题。为了克服上述两类方法的缺陷,提出了一种可学习深度位置编码引导的金字塔Transformer网络架构,融合卷积神经网络与Transformer进行道路可行驶区域检测。该框架建立金字塔Transformer主干网从全局感受野提取道路特征,并结合局部窗口注意力弥补细节损失,以收缩自注意力提升特征计算效率。针对Transformer中传统位置编码忽略像素与实际场景空间关联性的问题,提出用深度图像卷积特征构建可学习位置编码的方法,解决现实关联性脱节引起的注意力偏移和语义不对齐问题。在KITTI道路、Cityscapes与自建厦门市道路数据集上对该方法进行了测试和评估,结果表明,该方法在保证较高效率的同时,具有较高的稳定性和精确性,其最大F值在KITTI和Cityscapes数据集上分别达到97.53%和98.54%,优于目前KITTI道路基准测试的所有方法。此方法可为汽车驾驶辅助系...

关 键 词:Transformer  位置编码  道路感知  可行驶区域检测  自动驾驶
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号