首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于GPGPU的并行影像匹配算法   总被引:7,自引:1,他引:6  
肖汉  张祖勋 《测绘学报》2010,39(1):46-51
提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。  相似文献   

2.
李烁  王慧  王利勇  于翔舟  杨乐 《遥感学报》2019,23(4):706-716
针对区域范围内多幅待镶嵌影像之间的色彩差异问题,提出一种基于GPU的分块加权Wallis并行匀色算法。首先,根据变异系数对影像自适应分块并利用双线性插值确定每一个像素的变换参数,利用加权Wallis变换消除影像间的色彩差异。然后,为了控制区域整体的匀色质量,利用Voronoi图和Dijkstra算法确定影像间的处理顺序。最后,利用GPU技术进行并行任务设计并从配置划分、存储器访问和指令吞吐量等方面进行优化,提高算法运算效率。实验结果表明,本文方法既能有效地消除影像间色彩差异,又能消除影像间的对比度差异。与CPU串行算法相比,GPU并行算法显著减少了计算时间,加速比最高达到60倍以上。  相似文献   

3.
在现场直播式地理空间信息服务体系要求的背景下,提出一种快速的核线影像并行生成技术,该技术采用基于CUDA的GPU—CPU协同处理方法,并充分考虑到GPU的并行结构和硬件特点。基于NVIDIA Quadro Fx580显卡对1500像素×2300像素大小的灰度图像进行试验,试验结果表明,相对于串行方法本文方法获得了优于10倍的加速比。  相似文献   

4.
针对面向汛旱情监测应用中遥感影像处理耗时过长的问题,包括辐射校正、几何纠正、遥感指数计算等过程,对其业务化工作流程进行了分解分析。结合统一计算架构(compute unified device architecture,CUDA)的存储结构和程序设计模型,将数据处理过程划分为数据读取、直方图统计、栅格分割、波段计算、重采样和数据输出等模块,对波段计算及重采样等模块设计了并行处理方案,并通过实验确定了栅格划分的最佳尺度,基于栅格数组图形处理器(graphics processing unit,GPU)映射方法加速了数据传输效率,最终提出了基于CUDA架构CPU-GPU协同的并行处理算法。实验结果表明,辐射校正及遥感指数计算的波段计算模块可节约58.9%的时间;几何纠正效果最为显著,最邻近像元重采样和双线性内插重采样模块的最终加速比分别能够达到9倍和7倍以上。  相似文献   

5.
随着图形处理器(GPU)的飞速发展和计算同一设备架构(CUDA)的推出,GPU的并行性和可编程性不断增强,本文提出了一种基于CUDA的Harris算子影像匹配并行处理方法,在GPU中完成对影像的灰度化、Harris角点提取、重采样、灰度相关匹配,并从线程分配、内存使用、共享存储器等方面进行优化。实验结果表明,该方法与CPU串行处理方法相比,其速度得到了明显提升。  相似文献   

6.
三角网至规则格网的生成在地形内插和遥感影像配准中小面元微分纠正等方面都具有重要应用。其关键在于快速准确地搜索每个格网点所在的三角形,然后根据三角网顶点信息内插每个格网点的信息。针对格网点在三角网中的定位和内插计算量大的问题,本文提出了一种自适应扫描线填充算法以快速准确地搜索定位出每个格网点所在的三角形;针对地形内插或者小面元微分纠正中每个三角形具有相同运算的特点,采用GPU技术实现了TIN格网内插以及小面元微分纠正并行加速。分别采用大范围自动空三获取的三维点进行地形内插以及大尺寸遥感影像进行微分纠正实验,结果表明本文方法可以有效提高效率。  相似文献   

7.
在介绍和分析GPU并行编程方法的基础上,给出了在GPU上进行Geo Eye-1影像正射纠正的算法过程。利用NVIDIA Quadro 600显卡对31 985像素×15 251像素的3波段Geo Eye-1影像进行正射纠正,其总体速度比没有加速的算法提升40%以上。试验结果表明,采用GPU并行处理技术可以提升遥感影像处理效率。  相似文献   

8.
利用几何校正法进行不同影像间空间配准   总被引:9,自引:0,他引:9  
孟鲁闽  席晶 《测绘通报》2003,(6):14-15,39
在影像数据融合、动态变化监测等遥感影像集成分析和应用中,将来自不同传感器、不同时相获取的影像高精度快速配准是其中的关键技术之一。介绍利用几何校正法进行不同影像间空间配准的过程,在不同影像上选取同名点作为控制点,用最近邻、双线性内插或三次卷积内插运算法对分辨率较小的影像进行重采样,完成配准。并采用Landsat TM影像和SPOT pan影像进行实验,结果表明配准精度在1个像素之内,为进一步的遥感影像融合.分类作好数据准备。  相似文献   

9.
提出一种对已知相对方位元素的立体影像实施灰度重采样生成核线影像对的方法,对连续像对相对方位元素和独立像对方位元素建立核线影像的理论公式进行了推导,建立了核线影像和原始影像的坐标变换关系;为了提高核线影像建立的效率,在进行核线重采样时,提出分块读写影像的方法。实验表明,建立的核线影像上下视差在亚像素水平,核线影像坐标反算后与原始影像的坐标平均差只有0.000 3个像素,完全可以满足摄影测量立体观测的要求。  相似文献   

10.
为满足应急测绘中大序列航空影像快速正射纠正的要求,提出了一种GPU-CPU协同快速正射纠正方法。实验结果表明,通过对GPU程序进行配置选择优化和存储层次性优化,该方法较传统的基于CPU正射纠正方法,其平均加速比达到52倍。  相似文献   

11.
This research develops a parallel scheme to adopt multiple graphics processing units (GPUs) to accelerate large‐scale polygon rasterization. Three new parallel strategies are proposed. First, a decomposition strategy considering the calculation complexity of polygons and limited GPU memory is developed to achieve balanced workloads among multiple GPUs. Second, a parallel CPU/GPU scheduling strategy is proposed to conceal the data read/write times. The CPU is engaged with data reads/writes while the GPU rasterizes the polygons in parallel. This strategy can save considerable time spent in reading and writing, further improving the parallel efficiency. Third, a strategy for utilizing the GPU's internal memory and cache is proposed to reduce the time required to access the data. The parallel boundary algebra filling (BAF) algorithm is implemented using the programming models of compute unified device architecture (CUDA), message passing interface (MPI), and open multi‐processing (OpenMP). Experimental results confirm that the implemented parallel algorithm delivers apparent acceleration when a massive dataset is addressed (50.32 GB with approximately 1.3 × 108 polygons), reducing conversion time from 25.43 to 0.69 h, and obtaining a speedup ratio of 36.91. The proposed parallel strategies outperform the conventional method and can be effectively extended to a CPU‐based environment.  相似文献   

12.
随着图形处理器(GPU)计算功能的日益强大,人们不再满足仅仅用它来做图形处理,而是越来越多地将其应用在通用计算方面。在遥感影像融合的很多算法中,影像数据都可以被并行的处理。本文针对融合处理中的遥感影像数据源为GPU设计了具有数据级并行性的输入流,介绍了利用OpenGL着色语言在GPU中实现融合算法的过程,实验结果表明基于GPU的IHS融合算法的处理速度在数据量较大时较之基于CPU的算法有明显的优势,而且这种优势随图像数据量的增加而越来越明显。  相似文献   

13.
The mean shift image segmentation algorithm is very computation-intensive. To address the need to deal with a large number of remote sensing (RS) image segmentations in real-world applications, this study has investigated the parallelization of the mean shift algorithm on a single graphics processing unit (GPU) and a task-scheduling method with message passing interface (MPI)+OpenCL programming model on a GPU cluster platform. This paper presents the test results of the parallel mean shift image segmentation algorithm on Shelob, a GPU cluster platform at Louisiana State University, with different datasets and parameters. The experimental results show that the proposed parallel algorithm can achieve good speedups with different configurations and RS data and can provide an effective solution for RS image processing on a GPU cluster.  相似文献   

14.
基于 GPU 的 GNSS 信号跟踪设计与实现   总被引:1,自引:0,他引:1  
软件接收机在数据后处理、算法设计与分析等方面发挥着重要的作用。由于传统的软件接收机均是由CPU 处理器实现,处理效率低下。图像处理单元是高度并行化的处理器,将导航信号处理中并行程度高且对时间要求最为严格的跟踪环节与GPU 的并行处理结构有机结合,能大大提升程序的效率。本文解决了采用GPU实现信号跟踪的关键技术,给出了相关的设计方案,并实现。试验结果表明:采用GPU 实现信号的跟踪,其效率提升了112.5倍。  相似文献   

15.
缩短GPS接收机冷启动时间一直是GPS领域的热点问题,而决定冷启动时间的关键是捕获速度。针对快速付里叶变换(FFT)捕获算法的并行运算特点和图形处理单元(GPU)适合于进行并行的优势,简单介绍了FFT捕获算法原理和对比了GPU与FPGA的特点,重点设计了各通道和各频点均进行并行计算的FFT捕获算法的GPU实现方案。利用实测的GPS中频数据初步验证了本文捕获方案的正确性和运行时间。试验结果表明:与基于CPU的捕获方案相比,本文的捕获方案对卫星PRN和CA码相位的捕获结果完全正确,而捕获时间大幅度缩短了。  相似文献   

16.
CPU/GPU异构混合系统是一种新型高性能计算平台,但现有并行空间插值算法仅依赖CPU或GPU进行加速,迫切需要研究协同并行空间插值算法以充分利用异构计算资源,进一步提升插值效率。以薄板样条函数插值为例,提出一种CPU/GPU协同并行插值算法以加速海量激光雷达(light detector & ranger,LiDAR)点云生成数字高程模型(DEM)。通过插值任务的分解与抽象封装以屏蔽底层硬件执行模式的差异性,同时在多级协同并行框架基础上设计了Greedy-SET动态调度策略,策略顾及底层硬件能力的差异性,以实现异构并行资源的充分利用和良好负载均衡。实验表明,协同并行插值算法在高性能工作站上取得19.6倍的加速比,相比单一CPU或GPU并行算法,其效率提升分别达到54%和44%,实现了高效的协同并行处理。  相似文献   

17.
提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在统一计算设备架构(com-pute unified device archetecture,CUDA)上完成影像角点检测的全过程。实验结果表明,基于多GPU的Har-ris角点检测并行算法比CPU上的串行算法可获得最高达60倍的加速比,其执行效率明显提高,对于大规模数据处理呈现出良好的实时处理能力。  相似文献   

18.
波形分解是机载激光雷达全波形数据处理的重要基础工作,通过求解波形函数模型的参数,将波形数据利用具体的函数模型拟合出来,实现对全波形及其中各个子波形函数表达。LM(Levenberg-Marquardt)算法及其改进的算法是波形分解中对参数进行拟合求解的常用方法。针对LM算法在参数拟合计算的过程中存在大量迭代和矩阵运算,提出了基于线程块组和线程两级并行粒度的并行计算方案。将串行多次循环迭代求解参数改为单次并行计算取最佳值实现对参数的选择,将矩阵运算进行线程块的协同并行计算,实现了LM算法在通用计算图形处理器上的并行计算。实验证明,在规定阈值条件下,并行LM降低了算法的迭代次数,提高了波形分解LM算法的计算效率,为提高波形分解的处理效率提供了研究思路。  相似文献   

19.
根据球面四元三角网(quaternary triangular mesh,QTM)的离散特征及图形处理器(graphics processing unit,GPU)的多线程原理,用距离的计算与比较代替传统的扩张操作,提出了一种基于QTM的球面Voronoi图并行生成算法,并给出了Voronoi边界提取算法。利用C++语言及统一计算设备架构(compute unified device architecture,CUDA)开发了实验系统。实验结果表明,本文算法能够在球面上快速生成点、线、面数据集的Voronoi图,且能够将Voronoi误差控制在两个格网以内。同时,GPU并行计算的使用,提高了算法的效率。  相似文献   

20.
分析了利用GPU并行处理技术实现畸变差修正的可能性及任务分配方法,提出了基于GPU的数码影像畸变差修正算法流程,验证了算法的可行性和高效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号