共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
条件模拟是一种计算非常耗时的高精度三维插值算法。针对串行条件模拟算法计算时间过长的问题,提出基于GPU的并行条件模拟算法,并进行储量估算。对条件模拟算法进行并行分析,利用GPU的高度并行性,构建CUDA通用计算开发环境,实现串行条件模拟算法到并行条件模拟算法的转换,使条件模拟算法的时间复杂度从O(n)降至O(logn)。并对西藏甲玛铜矿进行了储量估算。实验结果表明,在安装普通NVIDIA显卡的计算机以及估算精度不下降的情况下,GPU并行条件模拟的计算效率比CPU串行条件模拟的计算效率提高了60倍以上。 相似文献
3.
4.
5.
6.
由于岩土工程地质条件的复杂性及其规模的不断增大,对大规模数值计算速度的要求越来越高。显卡核心单元(GPU)由于其硬件构造特殊,有着并行计算上的独特优势、高速浮点运算性能和超高的内存带宽,可以很好地解决大规模的科学计算速度问题。文中介绍了GPU与CPU的硬件构架差异,总结了多核CPU、工作站等方式发展的局限性及GPU在并行运算方面的优势,详细阐述了GPU各类计算模式的发展特点及其成果,展示了其在坝区渗透特性中随机微分方程加速求解过程中的优越性,探讨了采用GPU进行大规模岩土工程数值计算的应用前景。 相似文献
7.
8.
《物探化探计算技术》2017,(5)
三维地震波动方程有限差分数值模拟,受到计算量大且内存消耗大地制约而计算效率较低,严重影响其发展和应用。目前,一种全新的异构众核协处理器,为三维并行计算提供了一条解决计算效率和数据存储问题的重要途径。基于三维有限差分计算的特点,介绍了面向MIC(Many Integrated Core)平台的三维瑞雷波有限差分并行算法移植和性能优化,采用ofload模式将计算核函数加载到MIC上,在MIC协处理上使用openMP多线程并行方式,并通过循环合并、nocopy数据传输、SIMD向量化和CPU+MIC协同计算方式进行优化。通过模型计算可知:三维数值计算程序在MIC上具有近线性加速比,MIC+CPU协同并行计算的性能可以达到纯CPU节点的4.5倍,大大提高了计算效率。通过对模拟结果与解析解的比较,以及对频散曲线特征的分析,验证了数值模拟的正确性。 相似文献
9.
针对三维直流电法正演模拟中大型稀疏线性方程组求解,在GPU(Graphic Process Unit)集群上实现了并行预处理共轭梯度(conjugate gradient,CG)算法。矩阵预处理使用可并行的对称逐次超松弛近似逆预处理(symmetric successive over relaxation approximate inverse preconditioner,SSORAI),与传统的对称逐次超松弛预处理(symmetric successive over relaxation preconditioner,SSOR)相比,避免了串行的三角矩阵回代求解过程,增加了并行性。在GPU集群通信上,使用支持跨节点GPU-GPU直接通信的MVAPICH2,省去了GPU间通信时GPU到CPU的数据中转过程。为了提高数据局部性和重复性,使用RCM算法(reverse Cuthill-Mckee algorithm)对预处理后的线性方程组进行带宽缩减,并利用GPU的计算通信重叠,极大地缩减了计算时间。实验结果表明,这里提出的方法在GPU集群上有很好的可扩展性。同时,程序基于CUDA FORTRAN语言实现,可以容易地与现有FORTRAN程序相结合,提高程序的性能。 相似文献
10.
完全3维弹性波数值模拟计算时间长,并且占用庞大的计算资源,这不利于在计算机配置不高的情况下进行科学研究,而二维弹性波数值模拟又达不到三维模拟的精度;同时,当模型、波场空间分布比较复杂时,传统的3维波动方程拟谱法模拟结果比较差.因此,在较高数值精度的一阶应力-速度弹性波动方程的基础上,采用傅氏变换仅计算y方向的偏导数,利用有限差分方法计算x、z方向和时间的偏导数,即利用2.5维数值模拟方法,实现在二维介质中计算三维弹性波场.最后通过数值模拟实现了在各向异性介质中多波波场的数值模拟,验证了2.5维方法是一种高精度、高效率、且能适应复杂模型的正演模拟方法,通过波场分析进一步认识了波在各向异性介质中的传播规律. 相似文献
11.
分布式水文模型对流域水文过程的应用深度及广度不断加深,常与数值天气及气候预报相结合,面临巨大的计算量。近年来GPU技术的进步使普通电脑能够实现高效而又廉价的并行计算。提出了资料插值、单元产流以及单元汇流采用GPU并行计算,马斯京根法河道汇流采用一种非并行的递归方法。基于笔记本电脑和NVIDIA GPU/CUDA结合C#语言,由分布式新安江模型在沂河流域的模拟应用表明,降水量空间插值及新安江产流的并行执行效率为普通CPU上C#的8~9倍。使用直接递归法实现马斯京根汇流演算比以往采用汇流次序表的执行效率提升0.5~0.9倍。 相似文献
12.
《物探与化探》2016,(1)
相比于VTI介质q P波数值模拟方法,考虑倾角因素的TTI介质q P波数值模拟方法能够更加准确地描述各向异性介质中波场的传播特征。常规的声学近似方法往往会造成TTI介质中倾角急剧变化的区域出现数值不稳定,笔者首先引入一个各向异性控制参数,推导了稳定形式的TTI介质二阶q P波方程,保证q P波场的稳定传播;其次,通过引入波场的伪速度分量,推导了其等价的一阶应力—速度形式及相应的PML边界条件,并应用优化的旋转交错网格有限差分(RSGFD)方法实现了精确的数值模拟。数值结果表明:TTI介质一阶q P波方程能够稳定、有效地模拟q P波的运动学特征,利用优化的RSGFD方法可以得到精确的合成地震记录,同时可以相对地提高计算效率。 相似文献
13.
基于纵波、横波解耦的弹性波高阶有限差分方程和PML吸收边界条件,实现了RVSP观测统中弹性波数值模拟。采用完全弹性波波动方程进行数值模拟,可以得到纵波和横波的混合波场,且波场丰富,符合实际地震波的传播规律。该正演模拟方法纵波、横波自然解耦,产生全波场、纯纵波和纯横波模拟记录。通过对层状介质模型、凹陷模型,以及实际复杂介质模型的RVSP弹性波进行数值模拟,得到各模型不同分量下全波、纯纵波和纯横波的波场,并对弹性波传播特征进行了分析,为下一步的RVSP地震资料处理和解释工作奠定了理论基础。 相似文献
14.
15.
基于CUDA的地震相干体并行算法 总被引:1,自引:0,他引:1
相干体技术在地震勘探资料解释方面得到了广泛的应用,由于相干体技术处理的对象是三维地震数据体,所以算法运算时间较长。为了缩短解释周期,本文充分发挥GPU并行计算优势,对C3相干体算法进行并行化分析。从硬盘读取数据到GPU上计算相干值并写入硬盘的整个过程进行分析,剔除了冗余数据的读取,完成了C3相干体算法的并行化设计与实现。最后分别对串行算法与并行算法进行性能测试,结果表明本文设计的并行算法在保证精度的前提下达到了16倍左右的加速比,对加快地震资料解释具有重要意义。 相似文献
16.
基于一阶速度-应力波动方程,采用高阶交错网格有限差分数值模拟方法,对弹性及黏弹性TTI介质进行正演数值模拟。模拟时采用完全匹配层吸收边界条件(PML)消除边界反射。同时设计了层状介质模型、断层模型,通过模型的正演计算,得到了不同时刻的地震波波场快照及合成地震记录,分析其波场运动学及动力学特征。模拟结果表明,交错网格有限差分法可以很好地完成对复杂介质的波场模拟,具有较高的精度和可靠性。 相似文献
17.
基于BISQ模型的各向同性孔隙介质弹性波三维交错网格高阶有限差分数值模拟 总被引:1,自引:1,他引:1
从BISQ模型弹性波的本构方程和运动方程出发,推导出了基于BISQ模型的各向同性孔隙介质弹性波三维高阶交错网格有限差分算法,进行了数值模拟,在低频下能看到明显的快纵波、快横波和微弱慢纵波,在高频情况下可以看到明显的快纵波、快横波、慢纵波和慢横波。在三维情况下对比了xoz、xoy、yoz平面内的波场切片,并对平行xoz平面,不同y值处的波场切片进行了对比,结果证明三维数值模拟可以从不同角度更好地反映波场的传播特性。 相似文献
18.
19.
为了进一步提高叠前时间体偏移的计算效率,实现了在GPU\CPU协同并行计算模式下Kirchhoff叠前时间体偏移技术,并进行优化。经在Nvida Tesla C1060GPU上的测试表明,GPU(Graphic Processing Unit)的处理速度是CPU(单核)的四十倍左右。同时表明,CUDA(Cornpute Unified Device Architectarc)编程为CPU向GPU的转化提供了一个较为方便的语言环境。 相似文献