首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 437 毫秒
1.
岩土工程百万以上自由度有限元并行计算   总被引:3,自引:0,他引:3  
张友良  冯夏庭 《岩土力学》2007,28(4):684-688
讨论了大规模有限元并行计算需要解决的并行策略、大量数据的分布存储、方程组迭代求解和程序实现等问题。采用区域分解的“分而治之”的并行策略实现有限元并行。结合区域分解并行策略,将每个子区域的数据信息存储在相应的各个计算机上,实现存储局部化,大大减少并行计算中的通讯量,同时可以实现大规模计算。采用Schur补和共轭梯度法来实现方程组的并行求解,解决岩土有限元病态方程组的求解。采用面向对象的编程技术开发了并行有限元程序。对两个大规模算例进行了并行计算,得到了较好的结果。  相似文献   

2.
陈曦  刘建坤  李旭  田亚护  王英男 《岩土力学》2013,34(Z2):272-277
岩土工程建设的发展极大地促进了三维数值模拟的应用。大规模三维有限元计算需要求解一系列大型线性方程组,这些线性方程组的求解直接影响着整个有限元计算的效率。复杂岩土工程问题通常涉及多相和多体耦合相互作用,各相之间或不同固体材料之间性质差别显著,可能导致Krylov子空间迭代法收敛缓慢,甚至求解失败。为了提高Krylov子空间迭代法的求解效率和可靠性,提出一种新的高效预处理技术,通过算例验证了所提出的分区块迭代预处理方法的有效性。  相似文献   

3.
付晓东  盛谦  张勇慧 《岩土力学》2014,35(8):2401-2407
非连续变形分析(DDA)方法严格满足平衡要求和能量守恒,具有完全的运动学及数值可靠性,但对大规模岩土工程问题的数值模拟耗时太长,尤其是线性方程组求解,并行计算可以很好地解决该问题。首先基于DDA方法的基本理论,阐述了适用于DDA方法中的基于块的行压缩法和基于“试验-误差”迭代格式的非零位置记录;其次,引入块雅可比迭代法并行求解DDA方法的线性方程组,并改进了相应的非零存储方法;最后,基于OpenMP实现了DDA线性方程组求解并行计算,并将其应用于地下洞室群的破坏过程分析,以加速比为并行效率的指标评价,结果表明,该并行计算策略可以极大提高DDA的计算效率,而且适合各种规模的问题。  相似文献   

4.
基于粗细网格的有限元并行分析方法   总被引:2,自引:0,他引:2  
付朝江  张武 《岩土力学》2006,27(5):807-810
并行计算己成为求解大规模岩土工程问题的一种强大趋势。探讨了粗细网格与预处理共轭梯度法结合的并行有限元算法。从多重网格刚度矩阵推得有效的预处理子。该算法在工作站机群上实现。用地基处理时土体强夯的数值模拟分析进行了数值测试,对其并行性能进行了详细分析。计算结果表明:该算法具有良好的并行加速比和效率,是一种有效的并行算法。  相似文献   

5.
付晓东  盛谦  张勇慧  冷先伦 《岩土力学》2016,37(4):1171-1178
非连续变形分析(DDA)方法对大规模工程问题的数值模拟耗时太长,其中线性方程组求解耗时可占总计算时间的70%以上,因此,高效的线性方程组解法是重要研究课题。首先,阐述了适用于DDA方法的基于块的行压缩法和基于试验-误差迭代格式的非0位置记录;然后,针对DDA的子矩阵技术,将块雅可比迭代法 (BJ)、预处理的块共轭梯度法 (PCG,包括Jacobi-PCG、SSOR-PCG) 引入DDA方法,重点研究了线性方程组求解过程中的关键运算;最后,通过两个洞室开挖算例,分析了各线性方程组求解算法在DDA中的计算效率。研究表明:与迭代法相比,直解法无法满足大规模工程计算需要;BJ迭代法与块超松弛迭代法(BSOR)的效率差别不大,但明显不如PCG迭代法。因此,建议采用PCG迭代法求解DDA线性方程组,特别是SSOR-PCG值得推广;如果开展并行计算研究,Jacobi-PCG是较好的选择,当刚度矩阵惯性优势明显时,BJ迭代法同样有效。  相似文献   

6.
张友良  谭飞  张礼仁  施明明 《岩土力学》2016,37(11):3309-3316
讨论了亿万单元有限元模型的可扩展并行计算方法。从软件和硬件两个方面提出了前处理、并行计算方法、程序算法、后处理实现等核心问题的解决方案。采用网格加密方法生成一亿单元的有限元模型,利用对偶原始有限元撕裂内联法(FETI-DP)求解系统方程。基于图论理论建立了子区域间的通讯拓扑关系,实现了子区域间点对点通讯,避免速度慢、通信量大的全局通讯。在自主开发程序基础上,增加相应模块,采用面向对象编程技术和MPI消息传递库开发程序。对一个一亿多单元的工程实例运用5 000核并行计算,得到了超线性加速比。计算结果在专用图形工作站上进行后处理,显示和交互操作速度良好。研究在两方面实现了突破:一是将模型规模提高到了一亿多单元;二是同时调用了5 000个计算核来并行运算,并得到了很高效率。高分辨率有限元并行模拟研究成果可为岩土工程中结构特别复杂、计算区域特别大、地质情况复杂等模拟提供很好的技术方法和实现手段。  相似文献   

7.
随着地球物理设备和探测技术的不断发展,快速处理大规模地球物理数据的需求也随之增长。为了解决三维重力数据密度反演的耗时问题,提出一种并行的预处理共轭梯度算法来提高计算效率。本文分别采用两种不同的预处理算子通过组合模型数据反演进行测试比较,并利用迭代残差和计算用时共同评价其加速效果。结果表明:对称逐次超松弛预处理方法比对角预处理方法反演计算速度快,密度结果更贴近实际模型;与传统串行的共轭梯度算法相比,本文并行预处理快速算法可以获得近19倍的加速比。将该算法应用于美国Vinton盐丘的实测重力数据中,反演结果能够很好地圈定出岩体的位置,验证了本文并行预处理共轭梯度法在三维重力数据快速反演中的高效性和可行性。  相似文献   

8.
针对三维直流电法正演模拟中大型稀疏线性方程组求解,在GPU(Graphic Process Unit)集群上实现了并行预处理共轭梯度(conjugate gradient,CG)算法。矩阵预处理使用可并行的对称逐次超松弛近似逆预处理(symmetric successive over relaxation approximate inverse preconditioner,SSORAI),与传统的对称逐次超松弛预处理(symmetric successive over relaxation preconditioner,SSOR)相比,避免了串行的三角矩阵回代求解过程,增加了并行性。在GPU集群通信上,使用支持跨节点GPU-GPU直接通信的MVAPICH2,省去了GPU间通信时GPU到CPU的数据中转过程。为了提高数据局部性和重复性,使用RCM算法(reverse Cuthill-Mckee algorithm)对预处理后的线性方程组进行带宽缩减,并利用GPU的计算通信重叠,极大地缩减了计算时间。实验结果表明,这里提出的方法在GPU集群上有很好的可扩展性。同时,程序基于CUDA FORTRAN语言实现,可以容易地与现有FORTRAN程序相结合,提高程序的性能。  相似文献   

9.
刘明贵  刘绍波  张国华 《岩土力学》2010,31(9):3019-3024
由于岩土工程地质条件的复杂性及其规模的不断增大,对大规模数值计算速度的要求越来越高。显卡核心单元(GPU)由于其硬件构造特殊,有着并行计算上的独特优势、高速浮点运算性能和超高的内存带宽,可以很好地解决大规模的科学计算速度问题。文中介绍了GPU与CPU的硬件构架差异,总结了多核CPU、工作站等方式发展的局限性及GPU在并行运算方面的优势,详细阐述了GPU各类计算模式的发展特点及其成果,展示了其在坝区渗透特性中随机微分方程加速求解过程中的优越性,探讨了采用GPU进行大规模岩土工程数值计算的应用前景。  相似文献   

10.
大型洞室群软岩置换方案优化的并行实现   总被引:1,自引:1,他引:0  
并行计算己成为求解大规模岩土工程问题的一种强大趋势 。 以水布娅大型洞室群软岩置换方案优化为例 , 探讨了方案优化中的并行计算问题,分析了并行计算中的编程模式 、 任务划分 、负载平衡和编程方法等问题,在 W id n o w s 环境下的 PC 机群上成功实现了软岩置换方案优化的并行计算,并获得了近乎线性的加速比 , 从而大大提高了方案优化的计算速度和效率 , 为岩土工程计算并行化思路提供了重要参考 。  相似文献   

11.
位移反分析的粒子群优化-高斯过程协同优化方法   总被引:2,自引:0,他引:2  
针对采用随机全局优化技术进行岩土工程位移反分析存在数值计算量大、效率低的问题,将粒子群优化算法与高斯过程机器学习技术相结合,提出了位移反分析的粒子群优化-高斯过程协同优化方法。该方法利用全局寻优性能优异的粒子群优化算法进行寻优的基础上,采用高斯过程机器学习模型不断地总结历史经验,预测包含全局最优解的最有前景区域,通过提高粒子群搜索效率并降低适应度评价次数,进而有效地降低位移反分析过程中的数值计算工作量。多种测试函数的数学验证和工程算例的研究结果表明该方法是可行的,与传统方法相比较,可显著地降低位移反分析的计算耗时。  相似文献   

12.
We present a high-order method for miscible displacement simulation in porous media. The method is based on discontinuous Galerkin discretization with weighted average stabilization technique and flux reconstruction post processing. The mathematical model is decoupled and solved sequentially. We apply domain decomposition and algebraic multigrid preconditioner for the linear system resulting from the high-order discretization. The accuracy and robustness of the method are demonstrated in the convergence study with analytical solutions and heterogeneous porous media, respectively. We also investigate the effect of grid orientation and anisotropic permeability using high-order discontinuous Galerkin method in contrast with cell-centered finite volume method. The study of the parallel implementation shows the scalability and efficiency of the method on parallel architecture. We also verify the simulation result on highly heterogeneous permeability field from the SPE10 model.  相似文献   

13.
Large‐scale engineering computing using the discontinuous deformation analysis (DDA) method is time‐consuming, which hinders the application of the DDA method. The simulation result of a typical numerical example indicates that the linear equation solver is a key factor that affects the efficiency of the DDA method. In this paper, highly efficient algorithms for solving linear equations are investigated, and two modifications of the DDA programme are presented. The first modification is a linear equation solver with high efficiency. The block Jacobi (BJ) iterative method and the block conjugate gradient with Jacobi pre‐processing (Jacobi‐PCG) iterative method are introduced, and the key operations are detailed, including the matrix‐vector product and the diagonal matrix inversion. Another modification consists of a parallel linear equation solver, which is separately constructed based on the multi‐thread and CPU‐GPU heterogeneous platforms with OpenMP and CUDA, respectively. The simulation results from several numerical examples using the modified DDA programme demonstrate that the Jacobi‐PCG is a better iterative method for large‐scale engineering computing and that adoptive parallel strategies can greatly enhance computational efficiency. Copyright © 2015 John Wiley & Sons, Ltd.  相似文献   

14.
基于MPI的快速富里叶变换并行算法   总被引:1,自引:1,他引:0  
随着并行计算技术的快速发展 ,数据处理、信息处理等应用领域处理问题规模的日益增大 ,对并行计算的需求也越来越迫切。这里给出一种基于可移植消息传递界面 (MPI)标准的一维快速富里叶变换并行算法 ,可应用于分布式存储并行计算机系统  相似文献   

15.
As far as the bifurcated tunnel of underground engineering is concerned, it is usually used in the water conveyance system. Due to the complexity of underground rock masses and concrete lining, researches on mechanical characteristic and stability of the bifurcation tunnel have attracted more and more attention in the geotechnical field. In order to understand bifurcated tunnel in detail, three-dimensional (3D) numerical method is applied to solve the above key subjects by simulating a practical project. Furthermore, sub-model technology is applied to analyze the intersection position, corresponding deformation and stress results in the practical condition. Meanwhile, 3D excavation and support calculation under four conditions have been simulated based on 3D self-compiled code and Ansys software. In addition, the paper plays emphasis on the stress, displacement analysis considering different stress releasing ratio instead of rheological analysis, and the results corresponding with the fact indicate the feasibility of 3D elasto–visco–plastic code.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号