共查询到20条相似文献,搜索用时 187 毫秒
1.
提出了一种从普通单目相机拍摄的两幅图像中自动获取其中物体深度的方法。该方法首先保持相机的参数不变,相机沿光轴方向移动,在物距为u和u+d处各拍摄一张图像,然后采用局部二值拟合能量(local binary fitting energy, LBF)模型的方法分割出图像中的物体,再将物体像的熵的相对变化率和加权Hu氏不变矩结合起来实现图像内物体的自动匹配,最后运用本文推导的公式计算出各个物体深度。实验结果表明了该方法的有效性。 相似文献
2.
3.
在同步定位与地图构建领域,视觉里程计因其传感器成本低廉、定位精度高、蕴含丰富环境信息等优势而得到广泛应用,但环境中的动态物体会显著降低其解算的精度与鲁棒性。针对此问题,提出了一种深度学习辅助的双目视觉里程计,基于几何约束与目标位置约束的方法,能够准确筛选出环境中的动态物体,以提高结果精度,同时能够恢复动态物体的运动轨迹,便于建立语义地图。在KITTI和TUM RGB-D的动态场景数据集上进行测试,得到的结果精度较高。 相似文献
4.
针对DeepLabv3+语义分割网络难以获取极化合成孔径雷达(PolSAR)图像数据分布的问题,该文提出了一种生成对抗网络(GAN)框架下的语义分割方法。其中,GAN的生成器为轻量级复数DeepLabv3+,它能充分提取PolSAR数据的幅度和相位中所蕴含的丰富目标特征,获取精细的语义分割结果;GAN的判别器为实数多分辨卷积神经网络,它和生成器进行对抗学习后,能进一步使得语义分割后的数据分布逼近于真实标签。4个PolSAR数据集的实验结果表明,该文所提方法比DeepLabv3+和轻量级复数DeepLabv3+具有更高的平均交并比、整体精度和平均像素精度。 相似文献
5.
遥感图像语义分割在农业、建筑物监测、城市规划等领域发挥着重要的作用,但传统的提取方法无法满足大规模生产且效率低下。针对该问题本文提出一种基于DeepLabV3+的遥感图像语义分割方法。首先,通过对原始数据变换生成多样化的训练数据集;然后,与FCN、U-Net、PSPNet三种语义分割方法比较。实验结果表明,本文方法在总体精度、准确率、交并比指标都达到最优,可实现遥感图像有效的提取,该研究可为遥感图像自动提取提供一定参考。 相似文献
6.
针对多模态、多尺度的高分辨率遥感影像分割问题,提出了结合空洞卷积的FuseNet变体网络架构对常见的土地覆盖对象类别进行语义分割。首先,采用FuseNet变体网络将数字地表模型(digital surface model,DSM)图像中包含的高程信息与红绿蓝(red green blue,RGB)图像的颜色信息融合;其次,在编码器和解码器中分别使用空洞卷积来增大卷积核感受野;最后,对遥感影像逐像素分类,输出遥感影像语义分割结果。实验结果表明,所提算法在国际摄影测量与遥感学会(International Society for Photogrammetry and Remote Sensing, ISPRS)提供的Potsdam、Vaihingen数据集上的mF1得分分别达到了91.6%和90.4%,优于已有的主流算法。 相似文献
7.
目前,在遥感影像几何条件和辐射质量良好的情况下,通过多视遥感影像的逐像素立体密集匹配对场景进行高程估计的技术相对比较成熟,无论是精度还是效率均达到了较高水平。然而,当具有良好几何条件和辐射质量的多视遥感影像难以获取时,经典摄影测量和计算机视觉的几何处理方法可能会面临较大的挑战。本文对该问题进行了研究,针对大幅遥感图像中各部分高程分布差异大,模型训练难度大的问题,提出了一种基于Swin Transformer和卷积神经网络(convolutional neural network, CNN)的单目遥感影像高程估计方法。一方面Swin Transformer利用滑动窗口和层级设计,兼具了卷积神经网络处理大尺寸图像和提取多尺度特征的能力及Transformer的全局信息交互能力。另一方面针对大幅遥感图像中各部分高程分布差异大带来的训练不稳定问题,本文方法能针对每张输入图像自适应地划分高程值,将高程估计问题转化为分类-回归问题,最终图像各像素点的高程值由划分的高程值及其分布概率得到。试验结果表明:本文所提出的基于Swin Transformer-CNN的遥感影像高程估计方法无论是定性还是定量的... 相似文献
8.
为了提高语义分割数据集的标注效率,研究人员提出了使用点击正负样本区域的交互式语义分割方法。然而,现有交互信息编码方式并未考虑图像上下文结构信息,当用户交互信息(鼠标点击位置)质量较差时,例如位于物体边缘附近时,易出现分割结果错误。针对该问题,本文提出结合超像素分割的交互信息编码方式。在遥感影像及医学影像数据集上的实验表明,结合超像素的交互信息编码方式,可有效提高交互式语义分割的效果,特别是在交互信息质量较差的情况下。 相似文献
9.
视觉同步定位与建图(visual simultaneous localization and mapping,VSLAM)技术是近年来机器人和计算机视觉领域的重点研究方向之一,但当前的主流算法主要面向静态环境,当场景中存在运动的物体时,算法的定位精度和稳定性会受到很大影响。为了解决上述问题,提出了一种惯性测量单元(inertialmeasurementunit,IMU)积分与YOLOv4语义分割结合的VSLAM前端动态特征点剔除算法,通过YOLOv4网络对图像进行语义分割,识别图像中有运动可能的物体;再将IMU积分与语义分割结合,对目标检测框内有运动可能的特征点进行重投影误差的解算,识别并剔除环境中运动的特征点。在TUM Visual-Inertial Dataset上验证该算法,结果表明,在包含运动物体的室内场景下,该算法可以有效剔除环境中的运动物体,显著提升SLAM系统的定位精度和稳定性。 相似文献
10.
《测绘科学技术学报》2018,(5)
提出一种融合单目视觉SLAM与机载GPS信息的无人机视频目标定位方法。首先利用单目视觉SLAM实时估计相机相对位姿,融合机载GPS数据,得到WGS84坐标系下的相机位姿估计;其次利用融合后的相机位姿将已知GPS路标投影到像平面,实现GPS路标与无人机监控视频的叠加显示;最后通过关键帧间的极线搜索匹配确定目标像素点的匹配点,并将其反投影到三维空间得其对应的GPS坐标,实现无人机监控视频中的GPS位置查询。实验验证了该方法的有效性、精确性与实时性。 相似文献
11.
12.
高分辨率遥感影像语义分割的半监督全卷积网络法 总被引:1,自引:0,他引:1
在遥感领域,利用大量的标签影像数据来监督训练全卷积网络,实现影像语义分割的方法会导致标签绘制成本昂贵,而少量标签数据的使用会导致网络性能下降。针对这一问题,本文提出了一种基于半监督全卷积网络的高分辨率遥感影像语义分割方法。通过采用一种集成预测技术,同时优化有标签样本上的标准监督分类损失及无标签数据上的非监督一致性损失,来训练端到端的语义分割网络。为验证方法的有效性,分别使用ISPRS提供的德国Vaihingen地区无人机影像数据集及国产高分一号卫星影像数据进行试验。试验结果表明,与传统方法相比,无标签数据的引入可有效提升语义分割网络的分类精度并可有效降低有标签数据过少对网络学习性能的影响。 相似文献
13.
针对现有极化合成孔径雷达影像语义分割方法存在的缺点,且该方向深度学习研究较少的问题,该文以国产机载全极化MiniSAR系统为依托,首先,对极化合成孔径雷达原理和基于深度学习的极化合成孔径雷达影像语义分割方法进行了分析;其次,使用实验数据对该方法的分割精度进行了验证分析,单类分割最大像素精度达94.61%,全类均交并比达到86.83%,结果证明了该分割方法的可行性和准确性;最后,为进一步提高极化SAR影像语义分割精度,在样本制作、提升效率、矢量化等方面提出了建议。 相似文献
14.
Recently, the focus of semantic segmentation research has shifted to the aggregation of context prior and refined boundary. A typical network adopts context aggregation modules to extract rich semantic features. It also utilizes top-down connection and skips connections for refining boundary details. But it still remains disadvantage, an obvious fact is that the problem of false segmentation occurs as the object has very different textures. The fusion of weak semantic and low-level features leads to context prior degradation. To tackle the issue, we propose a simple yet effective network, which integrates dual context prior and spatial propagation-dubbed DSPNet. It extends two mainstreams of current segmentation researches: (1) Designing a dual context prior module, which pays attention to context prior again with a shortcut connection. (2) The network can inherently learn semantic aware affinity values for each pixel and refine the segmentation. We will present detailed comparisons, which perform on PASCAL VOC 2012 and Cityscapes. The result demonstrates the validation of our approach. 相似文献
15.
针对当前点云语义分割研究对地面站激光点云特征利用不足、正确率较低的问题,该文提出了一种基于多尺度球形邻域特征的深度神经网络算法。该算法基于多尺度球形邻域计算的地面激光点云的粗糙度、高斯曲率,以及全方差、线性度等基于协方差的多种特征,结合XYZ坐标、RGB颜色、激光反射强度组成47维特征向量作为神经网络的输入,经过多组参数组合实验优化神经网络结构,最后通过softmax分类器输出每个点的类别。利用Semantic-3D测试集验证所提的深度神经网络模型,取得了较好的分类精度,总体正确率和平均交并比分别达到了86.6%和55.0%。实验结果表明,所提算法充分利用了地面站激光点云的特征,可有效提升语义分割的正确率。 相似文献
16.
深度卷积神经网络支持下的遥感影像语义分割 总被引:1,自引:0,他引:1
针对高分遥感影像语义分割面临的类别不平衡和上下文信息利用不充分问题,本文提出了一种优化的DeeplabV3+算法。首先通过修改交叉熵损失函数,解决数据不平衡问题;其次使用Vortex Pooling取代ASPP模块提高上下文信息;然后采用多尺度输入充分利用图像的多尺度信息,并用投票策略进行特征融合提高图像分割准确性;最后使用形态学作后处理消除拼接痕迹和噪声。在CCF大赛的数据集上进行训练,并与其他经典语义分割算法进行比较。试验结果表明,该算法充分利用上下文信息,有效减少了错误分类,且使分割边界更精确,尤其对于线状目标的捕捉能力更强;在整幅测试影像上的MIoU可达85.21%,明显优于SegNet、U-Net算法。 相似文献
17.
融合可变形卷积与条件随机场的遥感影像语义分割方法 总被引:1,自引:1,他引:1
当前,深度卷积神经网络在遥感影像语义分割领域取得了长足的发展.标准的卷积神经网络由于卷积核的几何形状是固定的,导致对几何变换的模拟能力受到限制.本文引入一种可变形卷积来增强卷积网络对空间变换的适应能力.由于神经网络架构中使用了池化层操作,这会导致在输出层未能充分地对局部对象进行准确的分割.为了克服这种特性,本文将神经网络输出层的粗糙预测分割结果通过全连接的条件随机场来进行处理,以此来提高对影像细节的分割能力.本文方法易于采用标准的反向传播算法进行端到端的方式训练.ISPRS数据集上的测试试验结果表明本文方法可以有效地克服遥感影像中分割对象的复杂结构对分割结果的影响,并在该数据集上获得了当前最好的语义分割结果. 相似文献
18.
19.
语义分割是智能机器人由感知智能迈向认知智能的重要基础,当前针对点云数据的语义分割方法存在实时性差、精度低等现象。本文系统分析了点云经球面投影所得的距离图像与自然图像的差异,为基于距离图像的实时语义分割网络设计提供了思路。通过分析发现,距离图像具有强空间相关性的特点,将强空间相关性与注意力机制相结合,提出基于空间注意力机制下的LiDAR点云实时语义分割方法SANet。该方法能够高效地聚合空间分布特征与上下文特征,且模型参数量较少,满足实时性的要求。在SemanticKITTI数据集上的试验表明,与其他优秀算法相比,SANet兼顾了实时性与准确性,显著提高了LiDAR点云语义分割的精度,可为自动驾驶及其他机器人应用领域提供辅助支撑。 相似文献
20.
针对高分辨率影像中道路提取效果不佳这一问题,该文提出了一种道路段分割方法。在经典能量函数中引入无符号距离函数表示的形状先验,用以排除非道路干扰物;引入星形形状先验能量项用以解决细小干扰物、道路内部孔洞两个问题,此时可得到一段无干扰物、无孔洞的道路;基于动态外推的思路分割出一条完整的道路段。实验表明该方法可以有效获取影像中不同形态的道路段,同时为影像分割提供有益思路。 相似文献