共查询到16条相似文献,搜索用时 609 毫秒
1.
2.
基于处理器制造工艺的提升接近极限,传统的单纯靠提高主频来提升性能已不适合时代需求,促使处理器从单核向多核转化。经过近年发展,多核处理器在当前成为主流配置,而气象程序大部分还是串行的,极大地浪费了处理器的计算资源。MPI和OpenMP作为两种主要的并行环境,具有各自的优势。MPI适用于分布式内存计算机,但是需要对程序进行的修改较多,难度大。OpenMP使用共享内存方式,对程序修改较少。相对来说,OpenMP更适合于多核处理器的并行计算。通过对CALMET进行OpenMP并行化加快CALMET运行速度的尝试,介绍了对串行程序进行OpenMP并行化的一般方法。主要步骤包括:对串行程序进行性能分析,找出计算时间最长的程序段进行并行改写;对循环进行OpenMP并行化,修改中间变量为单个线程私有;编译运行并行程序,进行性能比较;比较并行与串行的运行输出结果是否一致。 相似文献
3.
采用消息传递方式 (MPI) 对最近发展的广州区域数值预报模式进行了并行化计算研究。根据模式的结构和计算过程特点, 模式适合采用水平分区方案进行并行计算处理。在曙光3000并行计算机上分别采用一维和二维分区并行方案实现了模式的并行化计算, 并对模式的并行效率、并行加速比和并行通讯时间百分比等做了测试。对测试结果的分析表明:采用8个CPU时, 两种方案都能在1 h内完成72 h的预报, 一维分区方案的并行效率则保持在90 %左右, 可以满足业务运行需要。当模式使用8个以上CPU时, 通讯时间迅速增加并超过了计算时间的50%, 模式并行效率明显下降。CPU相同时, 模式一维分区并行方案比二维分区并行方案并行效率高且实现起来简单。 相似文献
4.
在引进欧洲中期天气预报中心 (ECMWF) 的全球谱模式的基础上,通过对原模式的分析改造,首次以分布与共享相结合的方式在国家气象中心IBM/SP高性能计算机上实现了全球谱模式的高效运行。采用调整向量长度、优化程序设计、完善消息传递机制和实现MPI与OpenMP的混合并行编程等方法,减少模式的通信量、计算量和内存的使用量,提高了计算效率。实现了在T213L31分辨率条件下,10天预报可以在3 h之内完成,达到业务对时限的要求。建立了与T213L31全球谱模式相配套的最优插值(OI)并行处理分析系统,解决了由于观测站点在全球不均匀分布所带来的计算负载不均衡问题。在此基础上,实现了T213L31全球资料同化与预报系统并建立了相应的自动作业监控系统。 相似文献
5.
6.
从理论上讲 ,在多节点多处理器并行计算机系统上用MPI/OpenMP进行混合并行编程 ,即在节点间用MPI通信 ,而节点内用OpenMP ,应该取得比用纯MPI并行化的应用程序更好的并行性能。目前 ,各国的应用程序开发者和气象工作者们都在致力于这方面的研究。可以说 ,这种方法的可行性是不容置疑的 ,它应当是今后并行编程框架设计的共同趋势。本文介绍了在IBMSP并行计算机上优化和并行化高分辨率有限区同化预报系统(HLFAS)中模式所采用的这种混合编程方法和技术。1 HLAFS系统高分辨率有限区同化预报系统包括资料分… 相似文献
7.
8.
高性能并行计算,一直是气候系统模式研究中的重要科学前沿。然而,随着计算机技术的发展,计算机体系结构越来越复杂,以及气候系统模式本身的复杂性使得开发高性能气候系统模式成为一个难题。采用了一种全新的并行程序设计方法:基于针对气象科学中的计算特点发展出的领域编程框架J-Earth,构建了高性能并行大气环流模式H-GAMIL。在对原模式GAMIL分析和解构以后,结合J-Earth的特点,采用面相对象的编程方式,对H-GAMIL进行重构。重构后的H-GAMIL具有现代软件标准化模块化的特点,并具有自动二维剖分、MPI(Message Passing Interface)和Open MP(Open Multi-Processing)混合并行实现、并行输出等新功能。解决了原模式一维剖分受到处理器限制,串行IO等问题。在此基础上,本文对H-GAMIL进行了并行效率测试,结果显示,模式水平分辨率为1°(纬度)×1°(经度)时,可使用上千处理器核,并行效率达40%以上且负载平衡达70%。测试结果表明了H-GAMIL具有较好的并行效率和可扩展性;同时对H-GAMIL模拟性能进行对比分析,其结果表明H-GAMIL保持了原模式的守恒性,并且具有与原模式相当的模拟性能,能够满足气候研究的计算需求,达到实用程度。 相似文献
9.
基于MPI技术的AREM模式并行开发及试验 总被引:1,自引:0,他引:1
应用消息传递接口函数库(MPI)并行程序设计技术开发了中尺度暴雨数值预报模式AREM(Advanced Regional Eta-coordinate Model)的并行版本,并在3种计算机系统平台下进行了加速比测试,结果显示出较高的并行效率和较好的可扩展性。建立并行版本后,模式高分辨率版本能够满足时效性要求。通过采用并行模式的高低分辨率版本对一个暴雨个例进行模拟表明,高分辨并行版本的模拟结果与观测更为接近,并具有较好的预报时效性。 相似文献
10.
11.
随着通用图形处理器 (GPGPU) 计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有重要影响。该文依托NVIDIA公司计算统一设备架构 (CUDA) 技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,在保持系统结果一致的前提下,对比单颗高端CPU,Tesla C1060 GPGPU具有11倍的加速效果,明显提升了GRAPES全球模式的执行速度和预报时效。研究表明:使用通用图形处理器技术提升数值预报模式的执行速度非常有潜力。 相似文献
12.
开展气象数值模式在神威·太湖之光系统的移植与优化,对研究模式与新型计算架构的适应性有重要意义。该文以BCCAGCM模式为研究对象,将其移植到神威·太湖之光全国产异构众核计算系统,进行性能分析,对模式动力框架和物理过程计算结构进行调整,将计算核心段采用OpenACC技术进行众核加速优化,大量代码进行算法重构。结果表明:各核心段计算效率基本达到未优化的3倍左右,最高可达14倍左右,将各核心段集成,形成异构众核集成版本,可正确、稳定运行,计算误差合理。在不同并行规模,采用从核对模式整体计算进行加速效果比较稳定,基本保持在1.9倍,26000核并行规模动力试验并行效率约70%,其他试验约为57%。 相似文献
13.
大气环流数值模式的一种并行化方案 总被引:1,自引:2,他引:1
从一般计算机并行计算理论出发,结合大气科学模式的特点,总结出一套对数值模式适用的并行化编程方案,而且提出了并行计算过程中应该注意的一些问题.利用文中提到的方案,可以帮助刚开始接触并行计算的模式编程人员快速完成串行数值模式的并行编程.最后,以一个串行的大气环流模式SAMIL并行化编程作为实例,对其并行计算过程和并行计算效率进行了描述和分析. 相似文献
14.
15.
通过武汉区域气象中心数值预报MAPS(Mesoscale Analysis and Process System)模式并行化移植的实例,介绍了如何使用共享内存,消息传递的并行方式进行数值预报模式并行化工作,对不同条件下并行MAPS模式的并行效率进行了比较。结果表明,对数值预报MAPS模式完成程序优化和共享内存方式以及消息传递方式的并行化等工作后,MAPS模式运算时间大为缩短,满足预报业务时效的要求。 相似文献
16.
一个有限差分大气环流模式的并行效率 总被引:2,自引:0,他引:2
适合于大规模并行处理机(MPP)的中国科学院大气物理研究所新一代九层大气环流模式(IAP 9L AGCM)被发展成功。本文描述了并行模式的设计原则,给出了该模式的并行版本在我国几种主要的并行机上的并行执行效率数据。采用消息传递方式(MPI)的区域分解方法用于实现程序的并行,结果表明,对于该模式,只有一维区域分解方法才能取得较好的并行可扩展性,即随着处理器的增加而能得到相应较好的并行加速比和并行效率。 相似文献