期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何泓宇张锦明李凤英周雪倩《测绘科学技术学报》2015,(4):427-432

采用Open CL框架下的CPU/GPU平台,借助GPU在并行浮点运算方面的巨大优势,提出了DEM并行插值算法;同时以反距离加权插值算法为例,分析了传统插值算法和并行插值算法之间的优缺点与适应性。最后,通过对比实验对两类算法进行了比较。实验表明,当插值点数较少时,GPU并行插值算法效率低于传统算法;然而,当插值点数很高时,并行插值算法的计算效率较传统插值算法有了显著提高,加速的效果甚至高达137倍。实验证明GPU并行插值算法具有很强的可行性。相似文献

2.

基于PMVS算法的大规模数据细粒度并行优化方法

下载免费PDF全文

刘金硕李扬眉江庄毅邓娟眭海刚 Pan Jeff 《武汉大学学报(信息科学版)》2019,44(4):608-616

三维多视角立体视觉算法（patch-based multi-view stereo，PMVS）以其良好的三维重建效果广泛应用于数字城市等领域，但用于大规模计算时算法的执行效率低下。针对此，提出了一种细粒度并行优化方法，从任务划分和负载均衡、主系统存储和GPU存储、通信开销等3方面加以优化；同时，设计了基于面片的PMVS算法特征提取的GPU和多线程并行改造方法，实现了CPUs_GPUs多粒度协同并行。实验结果表明，基于CPU多线程策略能实现4倍加速比，基于统一计算设备架构（compute unified device architecture，CUDA）并行策略能实现最高34倍加速比，而提出的策略在CUDA并行策略的基础上实现了30%的性能提升，可以用于其他领域大数据处理中快速调度计算资源。相似文献

3.

基于GPU的DEM并行克里格插值算法

赵磊李珂《北京测绘》2018,32(3):294-297

本文借助GPU在并行浮点运算方面的巨大优势,通过对串行克里格插值算法可并行性的分析,基于并行LU分解法、并行邻域搜索方法和直接邻域比较搜索方法,提出了基于GPU的DEM并行克里格插值算法。通过对比实验可知,当插值点数较少时,并行克里格插值算法效率低于串行算法,然而,当插值点数很高时,并行克里格插值算法的效率较串行算法有了显著提高,加速的效果甚至高达102倍。相似文献

4.

基于GPGPU的并行影像匹配算法 总被引：7，自引：1，他引：6

肖汉张祖勋《测绘学报》2010,39(1):46-51

提出一种基于GPGPU的CUDA架构快速影像匹配并行算法,它能够在SIMT模式下完成高性能并行计算。并行算法根据GPU的并行结构和硬件特点,采用执行配置技术、高速存储技术和全局存储技术三种加速技术,优化数据存储结构,提高数据访问效率。实验结果表明,并行算法充分利用GPU的并行处理能力,在处理1280×1024分辨率的8位灰度图像时可达到最高多处理器warp占有率,速度是基于CPU实现的7倍。CUDA在高运算强度数据处理中呈现出的实时处理能力和计算能力,为进一步加速影像匹配性能和GPU通用计算提供了新的方法和思路。相似文献

5.

负载分配的CPU/GPU高分辨率卫星影像调制传递补偿方法

方留杨王密李德仁潘俊《测绘学报》2014,43(6):598-606

本文系统地探讨了使用CPU/GPU协同处理理论对高分辨率卫星影像进行MTF补偿的方法。首先在GPU上对方法进行了基本实现,并通过三种性能优化策略（执行配置优化、存储访问优化和指令优化）进一步提高了方法的执行效率。在Intel Xeon E5650 CPU和NVIDIA Tesla C2050 GPU组成的CPU/GPU系统中对高分一号卫星全色影像进行MTF补偿,加速比达到42.80倍。在此基础上,为充分利用CPU的计算性能,使用CPU/GPU负载分配策略将部分负载分配给CPU进行处理,使用该策略后,方法加速比达到47.82倍,相应的处理时间压缩至1.62s,可满足对高分辨率卫星影像进行近实时MTF补偿的需求。相似文献

6.

利用CUDA的地图代数局部算子优化

张剑波杨文鑫周斯波张帅《测绘科学》2012,37(2):40-43

本文针对地图代数局部算子的传统实现方法应用于海量栅格数据计算时效率低下的问题,从串行算法的并行化映射、计算机图形处理器资源的自适应参数调整等多角度来研究地图代数空间并行算法的实现机制,总结出地图代数局部算子在GPU并行处理架构上的通用求解步骤。实验结果表明,该方法在大数据量处理时较CPU加速效果明显。相似文献

7.

基于OpenCL的泛Kriging算法并行化研究

范光松黄方卜栓栓 JIAN Tao 董蕾《测绘科学》2017,42(5)

针对泛Kriging插值算法在大量数据处理时的高耗时问题,该文从异构平台主机端与OpenCL设备端的交互方式入手,采用OpenCL异构平台开发语言进行泛Kriging算法并行化实现研究,解决了其在进行大数据量处理时数据存储、数据交互、多设备调度等一系列问题。在K20Xm平台上使用不同的数据集和参数对并行泛Kriging算法进行测试,实验结果表明:与Intel Xeon E5-2670CPU平台相比,并行程序插值部分加速比达到40倍以上,整体并行程序加速比达到了18倍。相似文献

8.

对吉林一号光学卫星的应急快速处理方法研究 总被引：1，自引：0，他引：1

《测绘地理信息》2017,(4)

在CPU/GPU协同处理框架下,系统地探讨了光学遥感影像高性能处理方法。首先,实现光学卫星数据处理算法的GPU高效映射,将MTF补偿、传感器校正(包括波段配准和影像拼接)、系统几何校正等算法高效映射至GPU并行执行;在此基础上,为充分利用CPU高频化优势和加速I/O运算,利用Ramdisk技术在内存盘处理程序数据与结果输出,利用Intel C++Compiler编译优化框架。在GeForce GT 755M(GPU)、Mobile Quad Core Intel Core i7-4700MQ(CPU)的Windows系统环境下,对吉林一号卫星全色影像和多光谱影像原始数据进行0~2级产品的光学遥感影像预处理。实验结果表明,与传统预处理算法相比,此高性能算法的处理时间缩短到了40s以下,最高加速比达到11.216,可满足对海量光学卫星遥感影像数据的应急快速处理需求。相似文献

9.

CUDA环境下地形因子的并行计算

陈亮赵磊李珂《北京测绘》2017,(4):9-12

为了满足栅格数据空间分析的高性能计算需求,本文以坡度计算为例,提出在CUDA环境下将串行地形因子算法进行并行优化的方法:根据地形因子计算过程中无数据相关性,适合进行数据并行计算的特点,将CPU上可以并行执行的计算任务通过CUDA并行处理机制映射到GPU线程块上,从而提高计算效率。试验测试了不同栅格规模下串行算法和并行算法的执行时间差异,测试结果表明,并行地形因子算法的性能明显优于串行算法,在网格规模为12800×11200时,获得最高串-并加速比24.39。相似文献

10.

基于 GPU 的 GNSS 信号跟踪设计与实现 总被引：1，自引：0，他引：1

张尧唐小妹陈华明孙广富《全球定位系统》2014,(5):59-63

软件接收机在数据后处理、算法设计与分析等方面发挥着重要的作用。由于传统的软件接收机均是由CPU 处理器实现,处理效率低下。图像处理单元是高度并行化的处理器,将导航信号处理中并行程度高且对时间要求最为严格的跟踪环节与GPU 的并行处理结构有机结合,能大大提升程序的效率。本文解决了采用GPU实现信号跟踪的关键技术,给出了相关的设计方案,并实现。试验结果表明：采用GPU 实现信号的跟踪,其效率提升了112.5倍。相似文献

11.

A Parallel Scheme for Large‐scale Polygon Rasterization on CUDA‐enabled GPUs

下载免费PDF全文

Chen Zhou Zhenjie Chen Yuzhe Pian Ningchuan Xiao Manchun Li 《Transactions in GIS》2017,21(3):608-631

This research develops a parallel scheme to adopt multiple graphics processing units (GPUs) to accelerate large‐scale polygon rasterization. Three new parallel strategies are proposed. First, a decomposition strategy considering the calculation complexity of polygons and limited GPU memory is developed to achieve balanced workloads among multiple GPUs. Second, a parallel CPU/GPU scheduling strategy is proposed to conceal the data read/write times. The CPU is engaged with data reads/writes while the GPU rasterizes the polygons in parallel. This strategy can save considerable time spent in reading and writing, further improving the parallel efficiency. Third, a strategy for utilizing the GPU's internal memory and cache is proposed to reduce the time required to access the data. The parallel boundary algebra filling (BAF) algorithm is implemented using the programming models of compute unified device architecture (CUDA), message passing interface (MPI), and open multi‐processing (OpenMP). Experimental results confirm that the implemented parallel algorithm delivers apparent acceleration when a massive dataset is addressed (50.32 GB with approximately 1.3 × 10⁸ polygons), reducing conversion time from 25.43 to 0.69 h, and obtaining a speedup ratio of 36.91. The proposed parallel strategies outperform the conventional method and can be effectively extended to a CPU‐based environment. 相似文献

12.

天宫一号高光谱数据辐射校正的CUDA并行优化

赵海娜吴远峰张兵《遥感学报》2014,18(Z1):49-55

高光谱图像经过辐射校正后,消除了探测元的响应差异,能更好地满足专题信息提取的数据要求.利用探测元的列均值、列标准差等统计信息对天宫一号高光谱短波红外数据进行辐射校正检验,并基于GPU CUDA计算模型对均值归一化、矩匹配、相邻列均衡等3种相对辐射校正算法进行了并行计算优化.通过辐射校正计算流程拆分,CPU控制流程逻辑,GPU执行数据级并行计算,并建立CUDA的计算单元与数据单元的映射关系,获得5—7倍的计算加速比,这些辐射校正算法依据图像自身统计信息,且易于进行并行计算优化,满足实时校正的处理时效要求,为未来高光谱数据在轨实时辐射校正提供了新思路. 相似文献

13.

基于多GPU的Harris角点检测并行算法

肖汉周清雷张祖勋《武汉大学学报(信息科学版)》2012,37(7):876-881

提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在统一计算设备架构(com-pute unified device archetecture,CUDA)上完成影像角点检测的全过程。实验结果表明,基于多GPU的Har-ris角点检测并行算法比CPU上的串行算法可获得最高达60倍的加速比,其执行效率明显提高,对于大规模数据处理呈现出良好的实时处理能力。相似文献

14.

遥感影像CVA变化检测的CUDA并行算法设计 总被引：1，自引：1，他引：0

常方正赵银娣刘善磊《遥感学报》2016,20(1):114-128

随着遥感影像数据量以及复杂程度的日益增加,遥感图像的快速处理成为实际应用过程中亟需解决的问题。为了实现遥感影像的实时变化检测,针对基于变化矢量分析CVA的变化检测算法,设计了一种基于统一计算设备构架CUDA的并行处理模型。首先利用地理空间数据提取库GDAL实现大数据量遥感影像的分块读取、操作和保存;其次将基于变化矢量分析的变化检测过程分为变化强度检测、映射表构建和变化方向检测,并借助CUDA C将变化矢量分析算法的3个步骤嵌入到CPU和GPU组成的异构平台上进行实验;最后利用该模型对不同数据量的遥感影像进行CVA变化检测并作对比分析。实验结果表明:与CPU串行相比,基于GPU/CUDA的遥感影像CVA的变化检测速度提高了10倍左右;在一定程度上,达到了实时变化检测的效果。相似文献

15.

CPU和GPU协同的多光谱影像快速波段配准方法

下载免费PDF全文

方留杨王密潘俊《武汉大学学报(信息科学版)》2018,43(7):1000-1007

随着遥感影像数据量的飞速增长,传统的串行波段配准方法已无法满足大数据多光谱影像的实时配准需求。针对该问题,提出了一种CPU和GPU协同的多光谱影像快速波段配准方法。首先进行计算量和并行度分析,将同名点匹配和微分纠正映射至GPU执行,仿射变换系数拟合仍驻留在CPU执行。其次通过核函数任务映射和基本设置,使算法步骤在GPU上可执行,并设计了3种性能优化方法(访存优化、指令优化、传输计算堆叠),进一步提高了波段配准的执行效率。在NVIDIA Tesla M2050 GPU和Intel Xeon E5650 CPU组成的实验平台上,对遥感26号卫星多光谱影像的实验表明,使用该方法加速后的波段配准执行时间仅为3.25 s,与传统串行方法相比,加速比达到了32.32倍,可以满足大数据多光谱影像的近实时配准需求。相似文献

16.

异构环境下的快速质量引导相位解缠算法

钟何平张森田振唐劲松《武汉大学学报(信息科学版)》2015,40(6):756-760

提出了一种异构环境下的快速质量引导相位解缠算法。将干涉相位图进行分块,载入图形处理器(GPU)中共享存储器,实现干涉相位质量图的高密度并行计算。然后将质量图下载到主机内存,通过CPU进行量化质量引导,求解最终的解缠相位。该算法充分利用了GPU和CPU的计算特点实现快速质量引导相位求解。最后通过对InSAR和InSAS干涉相位图的解缠试验验证了所提算法的高效性。相似文献

17.

多视密集匹配并行传播GPU-PatchMatch算法

邓非颜青松肖腾《测绘学报》2020,49(2):181-190

针对多视密集匹配的效率较低的问题,提出了GPU-PatchMatch多视密集匹配算法。该算法使用GPU提高PatchMatch的计算效率;同时充分利用稀疏场景信息,对深度信息进行规则初始化;为提高传播效率,使用了金字塔红黑板并行传播深度信息。最后在DTU、Strecha和Vaihigen数据集上进行了试验,并与常用的多视密集匹配算法进行对比。试验结果表明,本文算法在重建效率上有较大提高,与CPU算法(PMVS、MVE、OpenMVS)相比有7倍以上提升,与GPU算法相比也有2.5倍以上提升,表明本文算法的有效性。相似文献