首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 906 毫秒
1.
并行效率的初步研究   总被引:1,自引:1,他引:1       下载免费PDF全文
用有限区域中尺度差分网格模式,采用分区域并行计算方法,在TRANSPUTER并行计算机上研究大规模并行计算中计算问题复杂度与并行计算效率的关系。结果表明,采用适当的并行计算法,增加处理机个数和计算问题的复杂度可使并行加速比增大;并行效率则随着处理机个数的增加而降低,随着计算问题复杂度的增加而提高;大规模并行计算能明显地提高计算速度,很适合于解决大量计算的问题,在数值预报方面具有广阔的发展前景。  相似文献   

2.
中尺度数值模式在IBMP690上的并行测试   总被引:1,自引:0,他引:1  
2005年初,安徽省气象局在IBMP690上分别实现了MM5、WRF、GRAPES中尺度数值预报模式的并行计算,并分别对他们的加速比和并行效率做了测试。结果表明:当分别采用8、16、24个处理机时,三种模式均可在1个h内完成36~72 h的预报,并行效率约为65%,即能够满足业务需要,又较充分利用了计算机系统资源;当增加处理机数时,GRAPES的计算时间缩短最显著,平均并行效率也最高。  相似文献   

3.
广州区域数值预报模式并行化计算   总被引:6,自引:0,他引:6       下载免费PDF全文
采用消息传递方式 (MPI) 对最近发展的广州区域数值预报模式进行了并行化计算研究。根据模式的结构和计算过程特点, 模式适合采用水平分区方案进行并行计算处理。在曙光3000并行计算机上分别采用一维和二维分区并行方案实现了模式的并行化计算, 并对模式的并行效率、并行加速比和并行通讯时间百分比等做了测试。对测试结果的分析表明:采用8个CPU时, 两种方案都能在1 h内完成72 h的预报, 一维分区方案的并行效率则保持在90 %左右, 可以满足业务运行需要。当模式使用8个以上CPU时, 通讯时间迅速增加并超过了计算时间的50%, 模式并行效率明显下降。CPU相同时, 模式一维分区并行方案比二维分区并行方案并行效率高且实现起来简单。  相似文献   

4.
高分辨率数值预报模式并行计算方法研究   总被引:1,自引:0,他引:1  
根据计算机软硬件条件引进开发数值模式在PVM环境下的并行版本,于1996年6月开始模式并行计算业务实验。结果表明:在数值预报中采用并行计算技术后,其CPU加速比达到3.21,并行效率达80%,模式并行计算版本运行基本稳定,计算结果与串行计算结果基本一致。  相似文献   

5.
浅水波模式半拉格朗日方法的并行研究   总被引:1,自引:0,他引:1       下载免费PDF全文
该文研究的问题是分布式并行计算机消息传递方式下半拉格朗日并行算法, 重点研究二维浅水波并行模式中有关子区域过渡带(HALO)的问题和有关求解赫姆霍兹方程的并行算法。进行了一系列的对比试验, 研究在不同分辨率下模式的并行效率的问题。结果表明:采用分区域并行计算的方法, 可得到较好的并行效率。模式中使用半拉格朗日方法处理平流项是有利的, 在分辨率高时, 可有效地提高计算速度。  相似文献   

6.
为验证高性能AREM模式(H-AREM)的并行性能,本文利用相同分辨率的AREM3.4P和H-AREM并行模式,比较了不同并行方法的影响;利用不同分辨率的H-AREM模式比较了不同剖分策略的影响。结果表明,基于并行框架的并行方法和二维剖分策略有利于并行性能的提升,HAREM在加速比和可扩展性方面都要优于原并行模式,特别是分辨率8 km的H-AREM模式能够扩展到8099核,在不显著增加计算时间的前提下具有更好的预报效果。  相似文献   

7.
亥姆霍兹方程是非静力平衡大气模式动力内核的主要计算瓶颈之一,其离散矩阵性态差,采用常见预条件Krylov迭代往往收敛很慢。随着全球非静力平衡大气模式时空分辨率的不断提高,亥姆霍兹方程求解面临求解精度和计算时间的双重困难。在高分辨率情况下,迭代计算步数和计算量剧增,而且很多传统的预条件迭代求解方法不收敛,迫切需要研究收敛性和并行可扩展性兼备的预条件迭代方法。为此,在安腾机群上建立了基于并行可扩展科学计算工具集(PETSc)的GRAPES全球非静力平衡模式亥姆霍兹问题并行解法器对比研究平台,结合高性能预条件库(hypre),完成了对GRAPES在用解法器、代数多重网格、并行不完全LU分解(EUCLID)及加性Schwarz区域分解等一系列克雷洛夫预条件迭代的分析对比。结果显示PETSc结合高性能预条件库的并行方案是解决GRAPES模式三维亥姆霍兹方程高效并行计算的一个有效途径,其中以代数多重网格预条件迭代的性能最突出;并行加速比分析显示,代数多重网格预条件迭代的并行可扩展性明显优于GRAPES现有解法器,更适用于更高精度和较大规模并行计算。  相似文献   

8.
高性能并行计算,一直是气候系统模式研究中的重要科学前沿。然而,随着计算机技术的发展,计算机体系结构越来越复杂,以及气候系统模式本身的复杂性使得开发高性能气候系统模式成为一个难题。采用了一种全新的并行程序设计方法:基于针对气象科学中的计算特点发展出的领域编程框架J-Earth,构建了高性能并行大气环流模式H-GAMIL。在对原模式GAMIL分析和解构以后,结合J-Earth的特点,采用面相对象的编程方式,对H-GAMIL进行重构。重构后的H-GAMIL具有现代软件标准化模块化的特点,并具有自动二维剖分、MPI(Message Passing Interface)和Open MP(Open Multi-Processing)混合并行实现、并行输出等新功能。解决了原模式一维剖分受到处理器限制,串行IO等问题。在此基础上,本文对H-GAMIL进行了并行效率测试,结果显示,模式水平分辨率为1°(纬度)×1°(经度)时,可使用上千处理器核,并行效率达40%以上且负载平衡达70%。测试结果表明了H-GAMIL具有较好的并行效率和可扩展性;同时对H-GAMIL模拟性能进行对比分析,其结果表明H-GAMIL保持了原模式的守恒性,并且具有与原模式相当的模拟性能,能够满足气候研究的计算需求,达到实用程度。  相似文献   

9.
一种适用于有限差分模式的负载平衡区域分解方法   总被引:6,自引:1,他引:6  
金之雁  王鼎兴 《气象学报》2002,60(2):188-193
分布式内存并行处理在数值天气预报等超大规模科学计算中已经得到了广泛的应用。中尺度模式由于分辨率高 ,计算量大 ,需使用更多的处理机进行并行运算。另一方面 ,由于复杂的物理过程的采用 ,增加了不同天气的计算量的不平衡。但是 ,目前所广泛使用的并行处理方法在处理机数量较多时不能很好地均衡计算负载 ,引起并行计算效率的降低。本文提出了一种新的非规则区域分解负载分配方法。并与已有的负载分配方法进行了分析试验对比 ,该方法能更有效地平衡负载 ,取得更好的加速效果  相似文献   

10.
该文分析了WRF模式模拟时提高分辨率对计算能力的需求是量级式增长;介绍了集群的基本原理和组成部件;并从实例出发,介绍了用微机多核CPU组建单机集群方案和WRF模式的并行编译方式。分析了地市级气象台站建立区域中尺度数值预报系统应考虑的几个因素。用6种区域方案进行了并行试验,试验相关数据表明:WRF模式在多核CPU构建的Linux单机集群中并行效率高,运算的CPU越多速度越快。用多核CPU单机集群并行方式运转WRF模式具有成本低、简单稳定、运算速度快的特点。  相似文献   

11.
利用WRF模式,研究了模式水平和垂直网格分辨率对台风“天鸽”(2017)模拟的影响。结果表明:水平分辨率的改变会对台风路径造成一定的影响,这种影响与改变水平分辨率以后所引起的台风强度和结构的变化有关。使用更高的水平分辨率时模拟的台风强度往往更强。此外,改变垂直分辨率对台风的路径模拟也有一定的影响。采用双曲正切的垂直分层方法,提高垂直层数,模式大气的垂直分辨率都有增加,但是在低层和高层垂直分辨率的增加更大。低层和高层垂直分辨率增加,模拟的台风强度增强。模式的水平分辨率和垂直分辨率之间匹配才能比较好地模拟台风,双向嵌套模式在提高嵌套层数的同时也要增加模式的垂直分辨率。台风强度和结构变化密切相关,台风强度增强的重要原因是台风云墙随着分辨率的增加更加陡峭,垂直风速随着水平分辨率的提高逐渐增强。   相似文献   

12.
利用2015~2017年淮河流域汛期ECMWF(空间分辨率0.125~ox0.125~o)、JMA(空间分辨率0.5~ox0.5~o)、WRF(空间分辨率0.1~ox0.1~o)6h、12h、24h时间分辨率的降水预报产品计算淮河流域面雨量预报,对比评估各预报时效的绝对误差、相对误差、晴雨正确率及各量级面雨量预报的TS评分。结论如下:(1)0~72h预报时效,EC的绝对误差最小、WRF居中,JMA最大。(2)三个模式的晴雨正确率随着时效的增加缓慢下降,但都维持较高水平。(3)EC和JMA的面雨量预报存在系统性高估。(4)WRF在对短历时强降水的预报性能优于其他两个模式。(5)各模式的面雨量预报性能存在日变化,且随着降水强度的增大,日变化特征更加显著,对午后到傍晚的暴雨预报准确率明显低于其他时间段。  相似文献   

13.
基于MPI技术的AREM模式并行开发及试验   总被引:1,自引:0,他引:1  
应用消息传递接口函数库(MPI)并行程序设计技术开发了中尺度暴雨数值预报模式AREM(Advanced Regional Eta-coordinate Model)的并行版本,并在3种计算机系统平台下进行了加速比测试,结果显示出较高的并行效率和较好的可扩展性。建立并行版本后,模式高分辨率版本能够满足时效性要求。通过采用并行模式的高低分辨率版本对一个暴雨个例进行模拟表明,高分辨并行版本的模拟结果与观测更为接近,并具有较好的预报时效性。  相似文献   

14.
随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为主流架构。为适应这种既有分布式又有共享内存的硬件体系架构,使用MPI与OpenMP混合编程模型,可以实现节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式,MPI用于节点间通信,OpenMP用于节点内并行计算。该文采用MPI与OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行MPI与OpenMP混合并行方案设计和优化。试验结果表明:MPI与OpenMP混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI与OpenMP混合并行方案比单一MPI方案效果好,但在线程数量大于4时,并行效果显著下降。  相似文献   

15.
植被覆盖度对兰州地区气象场影响的模拟研究   总被引:5,自引:0,他引:5  
何建军  余晔  陈晋北  刘娜  赵素平 《高原气象》2012,31(6):1611-1621
利用WRF(Weather Research and Forecasting)模式耦合Noah陆面过程模式,模拟了兰州地区冬季气象场,并用观测资料对模拟结果进行了检验。利用2006年中分辨率成像分光辐射计(MODIS)植被归一化指数(NDVI)计算得到的植被覆盖度替换模式默认的植被覆盖度,研究了植被覆盖度对WRF模式模拟结果的影响。结果表明,新的植被覆盖度数据使研究区域的地表反照率减小,发射率增加,感热通量白天增加、夜间减小;还明显地改进了WRF模式对近地面温度和风速的模拟;植被覆盖度对地表蒸发有很大影响,冬季干旱半干旱地区的植被基本处于休眠状态,地表蒸发以直接蒸发为主,使用新的植被覆盖度数据后,模拟区域的植被覆盖度增加,地表蒸发减小,近地面水汽含量减少,WRF模式模拟的边界层高度增大。  相似文献   

16.
雷达组网拼图算法是强对流天气短时临近预报系统(Severe Weather Automatic Nowcasting,SWAN)的重要基础方法之一。提高拼图算法的效率,不仅可以提升现有SWAN临近算法序列的时效性,也能更好地应用高分辨率雷达数据,具有重要的实际意义。采用中央处理器(central processing unit,CPU)和图形处理器(graphics processing unit,GPU)混合架构设计并行雷达拼图算法,其中CPU负责雷达数据的解析和调度GPU并行模块,GPU负责大规模数据的并行计算。通过分析计算统一设备架构(compute unified device architecture,CUDA)算法的并行开销和拼图算法的特点,提出并实现了GPU内存管理优化和数据交换流程优化方案,提高了组网拼图算法的效率。对比试验结果表明,基于CUDA的GPU并行拼图算法和SWAN中30线程并行的CPU算法相比,在全国1 km和500 m分辨率的拼图任务上,加速比分别达到3.52和6.82。综上,基于CUDA的并行拼图算法不仅可以提高SWAN短时临近算法序列的时效性,也为更高分辨率雷达资料的拼图提供了技术支持。  相似文献   

17.
WRF模式不同分辨率模拟分析   总被引:1,自引:1,他引:0  
利用WRF中尺度模式对内蒙古地区2011年降水天气过程进行模拟分析,主要研究模式不同水平分辨率对温度和降水的影响。结果表明:水平分辨率为27km时,模式可以较好的模拟我区的降水落区和强度;不同分辨率下模拟单站降水结果存在差异,分辨率提高,模式空报率下降,但是漏报率却明显增加,TS评分降低;分辨率提高与温度预报准确率无明显的正相关,模式前12h预报准确率明显高于后12h,模式分辨率提高对后12h温度预报准确率结果有明显改善。  相似文献   

18.
介绍了集群的基本原理和组成部件,并从实例出发,总结了组建一个4台微机简易集群的流程和操作技巧;将WRF模式在集群环境中进行了并行试验,试验相关数据表明:WRF模式在普通微机构建的Linux集群(PC-Cluster)并行效率较高。用微机集群并行方式运转WRF模式具有成本低、简单易行、运算效率高的特点。  相似文献   

19.
开展气象数值模式在神威·太湖之光系统的移植与优化,对研究模式与新型计算架构的适应性有重要意义。该文以BCCAGCM模式为研究对象,将其移植到神威·太湖之光全国产异构众核计算系统,进行性能分析,对模式动力框架和物理过程计算结构进行调整,将计算核心段采用OpenACC技术进行众核加速优化,大量代码进行算法重构。结果表明:各核心段计算效率基本达到未优化的3倍左右,最高可达14倍左右,将各核心段集成,形成异构众核集成版本,可正确、稳定运行,计算误差合理。在不同并行规模,采用从核对模式整体计算进行加速效果比较稳定,基本保持在1.9倍,26000核并行规模动力试验并行效率约70%,其他试验约为57%。  相似文献   

20.
介绍了集群的基本原理和组成部件,并从实例出发,总结了组建一个4台微机简易集群的流程和操作技巧;将WRF模式在集群环境中进行了并行试验,试验相关数据表明:WRF模式在普通微机构建的Linux集群(PC-Cluster)并行效率较高。用微机集群并行方式运转WRF模式具有成本低、简单易行、运算效率高的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号