首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 687 毫秒
1.
大范围动态水面场景的实时三维仿真是虚拟海洋环境以及三维游戏中研究的难点和热点。由于水的动态性以及各种复杂的光照等效果,传统基于CPU的模拟很难达到实时交互的能力。近年来图形处理器(GPU)性能得到大幅度提高,尤其引人注意的是出现可编程特性,这使得人们可以充分利用GPU上提供的运算器来设计算法完成一定的任务。基于此,针对目前实时水波模拟的瓶颈及提倡的"解放CPU"(Offload CPU)的思想,本文对水波模拟的模型进行了研究,提出了一种基于GPU的水波模拟方法,充分利用GPU的并行运算及浮点运算能力.加快水面模拟的速度。文章给出了一定网格大小下,数量不同的点波源模拟水面的效果,并给出了单纯利用CPU和基于GPU两种方法的对比情况。  相似文献   

2.
纳维-斯托克斯方程是描述流体运动的基础物理模型。首先简要介绍了在计算机上实现该模型的数值解算方法。在流体运动的计算机视觉仿真中,密度渲染才是最终结果,因此,又阐述了流体的密度场与速度场的关系,并且给出了流体仿真的基本流程。由于可编程图形处理器(GPU)具有并行性和速度快等特点,流体模拟的解算和渲染在图形处理器上运行更加高效,但是利用GPU编程实现流体仿真必须要实现3个核心转换,最后以支持3维纹理的Direct3D10为例,给出了利用GPU实现流体运动仿真两个简单实例。  相似文献   

3.
纳维-斯托克斯方程是描述流体运动的基础物理模型.首先简要介绍了在计算机上实现该模型的数值解算方法.在流体运动的计算机视觉仿真中,密度渲染才是最终结果,因此,又阐述了流体的密度场与速度场的关系,并且给出了流体仿真的基本流程.由于可编程图形处理器(GPU)具有并行性和速度快等特点,流体模拟的解算和渲染在图形处理器上运行更加高效,但是利用GPU编程实现流体仿真必须要实现3个核心转换,最后以支持3维纹理的Direct3D10为例,给出了利用GPU实现流体运动仿真两个简单实例.  相似文献   

4.
基于GPU的大规模爆炸效果模拟   总被引:3,自引:0,他引:3  
提出一种基于图形处理单元(GPU)的方法来模拟深空探测器撞击天体产生的大规模爆炸效果.利用基于GPU的多粒子系统方法模拟爆炸产生的3种喷射物,基于欧拉网格与漩涡粒子相结合的方法及GPU的通用计算能力解算流体动力学方程模拟了浓烟的翻腾与扩散.实验结果表明,用该方法能够产生具有较高逼真度的大规模爆炸效果.  相似文献   

5.
高胜  曾琪明  焦健  梁存任  童庆禧 《测绘科学》2015,40(1):85-88,67
作为InSAR处理中的重要操作,干涉图滤波是比较耗时的步骤之一。针对广泛应用的Goldstein滤波算法,文章设计了一种基于GPU的滤波加速方法,定量评价了滤波效果,并探讨了基于GPU加速的滤波时间与数据大小和滤波窗口大小的关系,讨论了当前GPU的核心设计在并行计算中的缺点。在取得与CPU处理结果相同精度的前提下,此方法获得大约22倍的加速比。  相似文献   

6.
对基于DEM数据的SPH水体流动模拟技术进行研究。对整个模拟流程进行重点介绍,并根据DEM数据的特点,对SPH的边界条件处理方法进行修改。最后借助Open GL的显示能力,在2种不同类型的地形上对水体流动进行实时计算和模拟。实验表明,对边界条件处理方法的修改是合理的,基于DEM数据的SPH水体流动模拟结果令人满意。  相似文献   

7.
基于元胞自动机(CA)的局部并行计算特性和统一计算设备架构(CUDA)并行计算架构,提出了GPU-CA的溃坝洪水演进计算模型,重点探讨了溃坝洪水演进元胞自动机模型、GPU模型映射、计算优化、CPU/GPU协同的溃坝洪水演进模拟与分析等关键问题,研发了原型系统,并选择了案例进行初步试验。试验结果表明,在保证溃坝洪水演进模拟结果有效性的情况下,与基于CPU-CA串行计算模式相比,基于GPU-CA的溃坝洪水演进模型计算可提高计算效率,加速比随着元胞格网分辨率的提升而增加,当元胞格网的大小为10m时,模型计算效率的加速比可以达到15.9倍,可支持实时溃坝洪水演进模拟分析与风险评估。  相似文献   

8.
构建了多视匹配过程的总计算量模型,根据模拟参数赋值结果,分析得到了其中的密集计算任务,探讨了其GPU并行加速的必要性;针对单立体影像匹配技术细粒度GPU并行计算方案的不足,研究并设计了一种多视匹配密集计算任务的GPU粗粒度并行计算方案;利用专业级的GPU并行计算平台,对GPU粗粒度并行计算方案进行了实验验证,结果表明,该方案对于多视匹配过程中密集计算任务的并行加速效果十分显著。  相似文献   

9.
随着航空航天遥感技术的不断发展,以遥感影像为代表的栅格数据分辨率越来越高,遥感影像处理呈现出数据量大、复杂度高的特点。近年来,通用GPU的运算性能不断提高为加速密集运算提供了新的途径,目前,采用GPU并行技术进行遥感影像处理成为新的研究热点。本文提出了基于GPU并行计算的巨幅遥感影像坐标转换方法,实践证明,相比于传统的转换方法基于GPU的算法有较为明显的提速。  相似文献   

10.
遥感影像正射纠正的GPU-CPU协同处理研究   总被引:1,自引:0,他引:1  
提出了一种基于CUDA的遥感影像正射纠正GPU-CPU协同处理方法,以实现重采样操作的GPU细粒度并行化。根据GPU的并行结构和硬件特点,采用执行配置优化技术提高warp占有率,利用共享存储器优化减少对效率低下的全局存储器中坐标变换系数的重复访问,通过纹理存储器代替全局存储器优化对原始影像数据的访问。实验结果表明,并行算法能够充分发挥GPU的并行处理能力,利用GeForce 9500 GT显卡,对大小为6 000像素×6 000像素的全色影像进行多项式纠正对比实验,最邻近灰度内插重采样和双线性灰度内插重采样的最终加速比分别能够达到8倍和10倍以上。  相似文献   

11.
This research develops a parallel scheme to adopt multiple graphics processing units (GPUs) to accelerate large‐scale polygon rasterization. Three new parallel strategies are proposed. First, a decomposition strategy considering the calculation complexity of polygons and limited GPU memory is developed to achieve balanced workloads among multiple GPUs. Second, a parallel CPU/GPU scheduling strategy is proposed to conceal the data read/write times. The CPU is engaged with data reads/writes while the GPU rasterizes the polygons in parallel. This strategy can save considerable time spent in reading and writing, further improving the parallel efficiency. Third, a strategy for utilizing the GPU's internal memory and cache is proposed to reduce the time required to access the data. The parallel boundary algebra filling (BAF) algorithm is implemented using the programming models of compute unified device architecture (CUDA), message passing interface (MPI), and open multi‐processing (OpenMP). Experimental results confirm that the implemented parallel algorithm delivers apparent acceleration when a massive dataset is addressed (50.32 GB with approximately 1.3 × 108 polygons), reducing conversion time from 25.43 to 0.69 h, and obtaining a speedup ratio of 36.91. The proposed parallel strategies outperform the conventional method and can be effectively extended to a CPU‐based environment.  相似文献   

12.
辐射度模型是虚拟植物冠层内光分布模拟的主要算法之一,针对其形状因子计算量大,辐射能量计算效率低等问题,提出了一种辐射度计算加速方法。以虚拟枇杷冠层内光分布模拟为例,利用均匀体素剖分场景包围盒及三维体素遍历方法进行光源与树模型之间的遮挡判断,同时结合CUDA技术使辐射度算法的形状因子求解并行化。采用归约求和算法和共享内存实现植物模型接受辐射总能量的快速求解。该方法较CPU串行方法有150多倍的加速比。将太阳直射光合有效辐射(photosynthetically active radiation,PAR)分布模拟结果与光线跟踪模型、传统辐射度模型模拟结果进行对比,天空散射PAR分布模拟结果与龟型算法、传统辐射度模拟对比。计算所得PAR值接近,变化趋势一致,表明该方法有较好的精度保证。  相似文献   

13.
智能化无人矿山对作业现场环境的可视化要求较高,现有的可视化方法仍存在诸多问题:数据采集方式单一,存在监控盲区;数据传输线缆布设困难且易被损坏,传输延时较高;表现形式不够全面立体,并且不能用于VR/AR、SLAM、机器人定位避障等应用场景。为了满足智能矿山建设的可视化需求,本文结合当前传感技术、矿用机器人以及5G技术的发展,探讨了从数据采集、服务器部署到接收显示的详细步骤。针对全景及深度影像这类新型三维数据,提出一种基于GPU和UNITY的嵌入式视频实时传输方法,包括实时编码、异步传输、轻量级的嵌入式流媒体系统、利用UNITY实时处理以及元数据的同步传输。借助UNITY平台,将三维可视化任务从CPU转移至GPU,仿真实验表明,最高渲染帧率为60 fps时,GPU占用率在35%以下。最后,以全景和深度传感器为例进行了测试,对数据编码、位移贴图、纹理纠正进行有效性验证,并从延迟、帧率、CPU占用率3个方面评估性能。结果表明,所提关键技术均可有效提高运行效率、减少资源占用,相比FFplay延时更低。全景影像的可视化代替了视角固定的传统监控,深度数据为智能矿山巡检机器人定位及避障提供实时数据源,传输方法整体向下兼容。不仅解决传统方法视角单一、布线困难的问题,而且考虑到了智能矿山建设过程中的新需求。  相似文献   

14.
Pen‐and‐ink style geomorphological illustrations render landscape elements critical to the understanding of surface processes within a viewshed and, at their highest levels of execution, represent works of art, being both practical and beautiful. The execution of a pen‐and‐ink composition, however, requires inordinate amounts of time and skill. This article will introduce an algorithm for rendering creases – linework representing visually significant morphological features – at animation speeds, made possible with recent advances in graphics processing unit (GPU) architectures and rendering APIs. Beginning with a preprocessed high‐resolution drainage network model, creases are rendered from selected stream segments if their weighted criteria (slope, flow accumulation, and surface illumination), attenuated by perspective distance from the viewpoint, exceed a threshold. The algorithm thus provides a methodology for crease representation at continuous levels of detail down to the highest resolution of the preprocessed drainage model over a range of surface orientation and illumination conditions. The article also presents an implementation of the crease algorithm with frame rates exceeding those necessary to support animation, supporting the proposition that parallel processing techniques exposed through modern GPU programming environments provide cartographers with a new and inexpensive toolkit for constructing alternative and attractive real‐time animated landscape visualizations for spatial analysis.  相似文献   

15.
A high accuracy surface modeling method (HASM) has been developed to provide a solution to many surface modeling problems such as DEM construction, surface estimation and spatial prediction. Although HASM is able to model surfaces with a higher accuracy, its low computing speed limits its popularity in constructing large scale surfaces. Hence, the research described in this article aims to improve the computing efficiency of HASM with a graphic processor unit (GPU) accelerated multi‐grid method (HASM‐GMG). HASM‐GMG was tested with two types of surfaces: a Gauss synthetic surface and a real‐world example. Results indicate that HASM‐GMG can gain significant speedups compared with CPU‐based HASM without acceleration on GPU. Moreover, both the accuracy and speed of HASM‐GMG are superior to the classical interpolation methods including Kriging, Spline and IDW.  相似文献   

16.
为了进一步解决大数据量带来的平差效率低下的问题,引入GPU并行计算技术,同时使用预条件共轭梯度法以及不精确牛顿解法求解区域网平差过程中的法方程,构建了适用于GPU并行计算的全新的区域网平差技术流程。本文方法避免了存储法方程系数矩阵,而是在需要的时候实时的计算该矩阵,使得本文算法相较于传统的算法所需的计算机内存空间大幅减少(仅需要存储平差原始数据即可),平差计算速度明显提升,同时计算精度与传统方法相当。初步试验证明,本文的方法在普通电脑上仅需要约1.5min即可完成对4500张影像、近900万像点数据的平差计算,且计算精度达到子像素级。  相似文献   

17.
随着遥感影像数据量的飞速增长,传统的串行波段配准方法已无法满足大数据多光谱影像的实时配准需求。针对该问题,提出了一种CPU和GPU协同的多光谱影像快速波段配准方法。首先进行计算量和并行度分析,将同名点匹配和微分纠正映射至GPU执行,仿射变换系数拟合仍驻留在CPU执行。其次通过核函数任务映射和基本设置,使算法步骤在GPU上可执行,并设计了3种性能优化方法(访存优化、指令优化、传输计算堆叠),进一步提高了波段配准的执行效率。在NVIDIA Tesla M2050 GPU和Intel Xeon E5650 CPU组成的实验平台上,对遥感26号卫星多光谱影像的实验表明,使用该方法加速后的波段配准执行时间仅为3.25 s,与传统串行方法相比,加速比达到了32.32倍,可以满足大数据多光谱影像的近实时配准需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号