共查询到20条相似文献,搜索用时 93 毫秒
1.
基于GPGPU的并行影像匹配算法 总被引:7,自引:1,他引:6
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。 相似文献
2.
针对区域范围内多幅待镶嵌影像之间的色彩差异问题,提出一种基于GPU的分块加权Wallis并行匀色算法。首先,根据变异系数对影像自适应分块并利用双线性插值确定每一个像素的变换参数,利用加权Wallis变换消除影像间的色彩差异。然后,为了控制区域整体的匀色质量,利用Voronoi图和Dijkstra算法确定影像间的处理顺序。最后,利用GPU技术进行并行任务设计并从配置划分、存储器访问和指令吞吐量等方面进行优化,提高算法运算效率。实验结果表明,本文方法既能有效地消除影像间色彩差异,又能消除影像间的对比度差异。与CPU串行算法相比,GPU并行算法显著减少了计算时间,加速比最高达到60倍以上。 相似文献
3.
4.
《国土资源遥感》2021,(3)
针对面向汛旱情监测应用中遥感影像处理耗时过长的问题,包括辐射校正、几何纠正、遥感指数计算等过程,对其业务化工作流程进行了分解分析。结合统一计算架构(compute unified device architecture,CUDA)的存储结构和程序设计模型,将数据处理过程划分为数据读取、直方图统计、栅格分割、波段计算、重采样和数据输出等模块,对波段计算及重采样等模块设计了并行处理方案,并通过实验确定了栅格划分的最佳尺度,基于栅格数组图形处理器(graphics processing unit,GPU)映射方法加速了数据传输效率,最终提出了基于CUDA架构CPU-GPU协同的并行处理算法。实验结果表明,辐射校正及遥感指数计算的波段计算模块可节约58.9%的时间;几何纠正效果最为显著,最邻近像元重采样和双线性内插重采样模块的最终加速比分别能够达到9倍和7倍以上。 相似文献
5.
6.
三角网至规则格网的生成在地形内插和遥感影像配准中小面元微分纠正等方面都具有重要应用。其关键在于快速准确地搜索每个格网点所在的三角形,然后根据三角网顶点信息内插每个格网点的信息。针对格网点在三角网中的定位和内插计算量大的问题,本文提出了一种自适应扫描线填充算法以快速准确地搜索定位出每个格网点所在的三角形;针对地形内插或者小面元微分纠正中每个三角形具有相同运算的特点,采用GPU技术实现了TIN格网内插以及小面元微分纠正并行加速。分别采用大范围自动空三获取的三维点进行地形内插以及大尺寸遥感影像进行微分纠正实验,结果表明本文方法可以有效提高效率。 相似文献
7.
8.
利用几何校正法进行不同影像间空间配准 总被引:9,自引:0,他引:9
在影像数据融合、动态变化监测等遥感影像集成分析和应用中,将来自不同传感器、不同时相获取的影像高精度快速配准是其中的关键技术之一。介绍利用几何校正法进行不同影像间空间配准的过程,在不同影像上选取同名点作为控制点,用最近邻、双线性内插或三次卷积内插运算法对分辨率较小的影像进行重采样,完成配准。并采用Landsat TM影像和SPOT pan影像进行实验,结果表明配准精度在1个像素之内,为进一步的遥感影像融合.分类作好数据准备。 相似文献
9.
提出一种对已知相对方位元素的立体影像实施灰度重采样生成核线影像对的方法,对连续像对相对方位元素和独立像对方位元素建立核线影像的理论公式进行了推导,建立了核线影像和原始影像的坐标变换关系;为了提高核线影像建立的效率,在进行核线重采样时,提出分块读写影像的方法。实验表明,建立的核线影像上下视差在亚像素水平,核线影像坐标反算后与原始影像的坐标平均差只有0.000 3个像素,完全可以满足摄影测量立体观测的要求。 相似文献
10.
11.
This research develops a parallel scheme to adopt multiple graphics processing units (GPUs) to accelerate large‐scale polygon rasterization. Three new parallel strategies are proposed. First, a decomposition strategy considering the calculation complexity of polygons and limited GPU memory is developed to achieve balanced workloads among multiple GPUs. Second, a parallel CPU/GPU scheduling strategy is proposed to conceal the data read/write times. The CPU is engaged with data reads/writes while the GPU rasterizes the polygons in parallel. This strategy can save considerable time spent in reading and writing, further improving the parallel efficiency. Third, a strategy for utilizing the GPU's internal memory and cache is proposed to reduce the time required to access the data. The parallel boundary algebra filling (BAF) algorithm is implemented using the programming models of compute unified device architecture (CUDA), message passing interface (MPI), and open multi‐processing (OpenMP). Experimental results confirm that the implemented parallel algorithm delivers apparent acceleration when a massive dataset is addressed (50.32 GB with approximately 1.3 × 108 polygons), reducing conversion time from 25.43 to 0.69 h, and obtaining a speedup ratio of 36.91. The proposed parallel strategies outperform the conventional method and can be effectively extended to a CPU‐based environment. 相似文献
12.
随着图形处理器(GPU)计算功能的日益强大,人们不再满足仅仅用它来做图形处理,而是越来越多地将其应用在通用计算方面。在遥感影像融合的很多算法中,影像数据都可以被并行的处理。本文针对融合处理中的遥感影像数据源为GPU设计了具有数据级并行性的输入流,介绍了利用OpenGL着色语言在GPU中实现融合算法的过程,实验结果表明基于GPU的IHS融合算法的处理速度在数据量较大时较之基于CPU的算法有明显的优势,而且这种优势随图像数据量的增加而越来越明显。 相似文献
13.
Fang Huang Yinjie Chen Li Li Ji Zhou Xicheng Tan 《International Journal of Digital Earth》2019,12(3):328-353
The mean shift image segmentation algorithm is very computation-intensive. To address the need to deal with a large number of remote sensing (RS) image segmentations in real-world applications, this study has investigated the parallelization of the mean shift algorithm on a single graphics processing unit (GPU) and a task-scheduling method with message passing interface (MPI)+OpenCL programming model on a GPU cluster platform. This paper presents the test results of the parallel mean shift image segmentation algorithm on Shelob, a GPU cluster platform at Louisiana State University, with different datasets and parameters. The experimental results show that the proposed parallel algorithm can achieve good speedups with different configurations and RS data and can provide an effective solution for RS image processing on a GPU cluster. 相似文献
14.
15.
缩短GPS接收机冷启动时间一直是GPS领域的热点问题,而决定冷启动时间的关键是捕获速度。针对快速付里叶变换(FFT)捕获算法的并行运算特点和图形处理单元(GPU)适合于进行并行的优势,简单介绍了FFT捕获算法原理和对比了GPU与FPGA的特点,重点设计了各通道和各频点均进行并行计算的FFT捕获算法的GPU实现方案。利用实测的GPS中频数据初步验证了本文捕获方案的正确性和运行时间。试验结果表明:与基于CPU的捕获方案相比,本文的捕获方案对卫星PRN和CA码相位的捕获结果完全正确,而捕获时间大幅度缩短了。 相似文献
16.
CPU/GPU异构混合系统是一种新型高性能计算平台,但现有并行空间插值算法仅依赖CPU或GPU进行加速,迫切需要研究协同并行空间插值算法以充分利用异构计算资源,进一步提升插值效率。以薄板样条函数插值为例,提出一种CPU/GPU协同并行插值算法以加速海量激光雷达(light detector & ranger,LiDAR)点云生成数字高程模型(DEM)。通过插值任务的分解与抽象封装以屏蔽底层硬件执行模式的差异性,同时在多级协同并行框架基础上设计了Greedy-SET动态调度策略,策略顾及底层硬件能力的差异性,以实现异构并行资源的充分利用和良好负载均衡。实验表明,协同并行插值算法在高性能工作站上取得19.6倍的加速比,相比单一CPU或GPU并行算法,其效率提升分别达到54%和44%,实现了高效的协同并行处理。 相似文献
17.
提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在统一计算设备架构(com-pute unified device archetecture,CUDA)上完成影像角点检测的全过程。实验结果表明,基于多GPU的Har-ris角点检测并行算法比CPU上的串行算法可获得最高达60倍的加速比,其执行效率明显提高,对于大规模数据处理呈现出良好的实时处理能力。 相似文献
18.
波形分解是机载激光雷达全波形数据处理的重要基础工作,通过求解波形函数模型的参数,将波形数据利用具体的函数模型拟合出来,实现对全波形及其中各个子波形函数表达。LM(Levenberg-Marquardt)算法及其改进的算法是波形分解中对参数进行拟合求解的常用方法。针对LM算法在参数拟合计算的过程中存在大量迭代和矩阵运算,提出了基于线程块组和线程两级并行粒度的并行计算方案。将串行多次循环迭代求解参数改为单次并行计算取最佳值实现对参数的选择,将矩阵运算进行线程块的协同并行计算,实现了LM算法在通用计算图形处理器上的并行计算。实验证明,在规定阈值条件下,并行LM降低了算法的迭代次数,提高了波形分解LM算法的计算效率,为提高波形分解的处理效率提供了研究思路。 相似文献
19.
根据球面四元三角网(quaternary triangular mesh,QTM)的离散特征及图形处理器(graphics processing unit,GPU)的多线程原理,用距离的计算与比较代替传统的扩张操作,提出了一种基于QTM的球面Voronoi图并行生成算法,并给出了Voronoi边界提取算法。利用C++语言及统一计算设备架构(compute unified device architecture,CUDA)开发了实验系统。实验结果表明,本文算法能够在球面上快速生成点、线、面数据集的Voronoi图,且能够将Voronoi误差控制在两个格网以内。同时,GPU并行计算的使用,提高了算法的效率。 相似文献
20.
分析了利用GPU并行处理技术实现畸变差修正的可能性及任务分配方法,提出了基于GPU的数码影像畸变差修正算法流程,验证了算法的可行性和高效性。 相似文献