首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
BCC_AGCM大气环流模式异构众核加速技术   总被引:1,自引:0,他引:1  
肖洒  魏敏 《气象科技》2018,46(2):245-249
针对未来高性能计算在CPU混合架构上的发展趋势,本文对大气环流模式BCC_AGCM中的部分核心段在混合架构的神威·太湖之光高性能计算机系统上进行众核加速分析与优化。文中以核心段quad为例,通过对代码内容结构重写和使用OpenACC语言对程序进行运行指示的方式,将该核心段成功移植加速并通过了结果正确性验证。结果表明,使用OpenACC语言能够以对源代码的较小改动来获得一定的加速比,在异构环境中源代码优化加速提升的效果取决于程序结构、循环并行颗粒度以及地址连续性。  相似文献   

2.
肖洒  魏敏  邓帅  徐达  张晨琛 《气象》2019,45(7):1001-1008
为使数值模式适应异构架构在高性能计算领域的快速发展趋势,本文基于OpenACC语言,对气候模式BCC_AGCM3.0中动力框架三段程序段进行GPU加速优化试验。通过异步执行设置、循环内移、数据管理及向量参数化配置等方式,对模式中计算密集部分程序段进行GPU加速并行化,并进行了优化运行效率对比及正确性验证。试验结果表明,BCC_AGCM3.0模式中三段程序段GPU加速后效率提升均在3倍以上,BCC_AGCM气候模式全球涡度均方根相对误差控制在一定范围之内。加速方法及策略对于数值天气气候模式在异构环境下的移植与优化具有一定参考价值。  相似文献   

3.
在大规模集群高性能计算机系统上进行WRF模式并行计算测试,研究WRF模式不同水平分辨率和垂直分辨率与并行计算时间、并行加速比和并行效率的关系。测试结果表明,随着并行计算使用计算核心个数的增加,并行计算时间减少,并行加速比增大,并行效率则降低;在使用计算核心个数相同的情况下,随着水平分辨率的提高,WRF模式并行计算时间增加,并行加速比增大,并行效率也提高。  相似文献   

4.
广州区域数值预报模式并行化计算   总被引:6,自引:0,他引:6       下载免费PDF全文
采用消息传递方式 (MPI) 对最近发展的广州区域数值预报模式进行了并行化计算研究。根据模式的结构和计算过程特点, 模式适合采用水平分区方案进行并行计算处理。在曙光3000并行计算机上分别采用一维和二维分区并行方案实现了模式的并行化计算, 并对模式的并行效率、并行加速比和并行通讯时间百分比等做了测试。对测试结果的分析表明:采用8个CPU时, 两种方案都能在1 h内完成72 h的预报, 一维分区方案的并行效率则保持在90 %左右, 可以满足业务运行需要。当模式使用8个以上CPU时, 通讯时间迅速增加并超过了计算时间的50%, 模式并行效率明显下降。CPU相同时, 模式一维分区并行方案比二维分区并行方案并行效率高且实现起来简单。  相似文献   

5.
BCC_CSM气候系统模式移植优化及其气候模拟验证   总被引:1,自引:0,他引:1  
为了提高BCC_CSM气候系统模式运行效率,保障业务科研工作的顺利开展,进行BCC_CSM气候系统模式在IBM高性能计算系统的移植工作;通过性能优化使BCC_CSM模式运行效率显著提高,通过气候要素形势场分布和相对误差量化指标对BCC_CSM气候系统模式模拟性能进行验证。结果表明:移植优化后,BCC_CSM气候系统模式计算效率提高为原来的1.4倍;基于CMIP5 piControl试验,完成531-540年10 a的气候模拟,年平均地表气温形势场分布合理,相对误差小于0.5%,BCC_CSM气候系统模式计算和模拟性能均能满足应用需求。  相似文献   

6.
任意正交曲线坐标系下的海洋模式动力框架的发展与评估   总被引:1,自引:1,他引:0  
本文发展了一个可以适用于任意水平正交曲线坐标系的海洋模式动力框架,并将其应用于中国科学院大气物理研究所大气科学和地球流体力学数值模拟国家重点实验室发展的气候系统海洋模式LICOM2.0(LASG/IAP Climate system Ocean Model,version2.0)。在经纬网格坐标系下,新的动力框架与LICOM2.0原有的动力框架模拟结果完全一致。基于新的动力框架,海洋模式可采用能够准确描述北冰洋地形的三极网格,克服了LICOM2.0经纬网格版本必须将北极点处理为孤岛的缺陷,从而显著改进了模式对于北冰洋环流和北大西洋经圈翻转流函数(AMOC)的模拟能力。此外,引进三极网格还可以避免模式网格距随纬度增加而急剧减小带来的计算不稳定,在LICOM2.0的三极网格版本中,模式不需要采用任何空间滤波方案仍然能够保证计算的稳定性,从而与LICOM2.0的经纬网格版本相比,极大地提高了模式的并行效率,这一点在当水平分辨率提高到0.1度时表现得尤为明显,海洋模式的并行加速比可以从经纬网格版本的5.8左右提高到三极网格版本的15.0左右。  相似文献   

7.
中尺度数值模式在IBMP690上的并行测试   总被引:1,自引:0,他引:1  
2005年初,安徽省气象局在IBMP690上分别实现了MM5、WRF、GRAPES中尺度数值预报模式的并行计算,并分别对他们的加速比和并行效率做了测试。结果表明:当分别采用8、16、24个处理机时,三种模式均可在1个h内完成36~72 h的预报,并行效率约为65%,即能够满足业务需要,又较充分利用了计算机系统资源;当增加处理机数时,GRAPES的计算时间缩短最显著,平均并行效率也最高。  相似文献   

8.
GRAPES全球切线性和伴随模式的调优   总被引:5,自引:2,他引:3       下载免费PDF全文
伴随技术是四维变分同化(4DVar)系统中计算代价函数梯度的最佳办法,切线性和伴随模式的效果和效率直接影响着4DVar系统的发展。基于GRAPES(Global and Regional Assimilation PrEdiction System)全球切线性和伴随模式1.0版本,利用GRAPES全球模式2.0版本在并行框架和性能等方面的改善,重新优化和设计了GRAPES全球切线性伴随模式2.0版本,提高了GRAPES全球切线性和伴随模式的效果和效率,优化了切线性模式程序结构,使其计算时间最优可控制在非线性模式的1.2倍以内;采用在切线性模式中保存基态的方法,重构了伴随模式的程序结构,使其计算时间最优控制在非线性模式的1.5倍以内;在GRAPES全球切线性物理过程的设计中,将线性物理过程的轨迹基态计算和切线性扰动计算解耦,提高了GRAPES全球切线性和伴随模式的计算效果和效率。  相似文献   

9.
高分辨率数值预报模式并行计算方法研究   总被引:1,自引:0,他引:1  
根据计算机软硬件条件引进开发数值模式在PVM环境下的并行版本,于1996年6月开始模式并行计算业务实验。结果表明:在数值预报中采用并行计算技术后,其CPU加速比达到3.21,并行效率达80%,模式并行计算版本运行基本稳定,计算结果与串行计算结果基本一致。  相似文献   

10.
赵春燕  王彬  孙婧  常飚  胡江凯  周斌 《气象科技》2021,49(4):535-541
随着气象数值模式的发展完善,已广泛应用于国家级和区域中心,研发力量地理上分散。支撑数值模式运行的高性能计算机系统呈现出异构众核的发展趋势,模式研发的学科交叉衍生性越发明显,分布式模式研发的高效协同共享成为一个亟待解决的问题。本文基于Git建立了一个代码管理协作共享平台METCODE,实现了气象数值模式的代码版本管理、集成协作共享与过程管理,方便地支持分布式团队的合作研发。平台已在气象数值模式的研发中成功应用,应用效益良好。  相似文献   

11.
从串行程序分析、并行方案选择到具体算法实现, 依次介绍了基于神威机的集合数值天气预报系统中“客观分析子系统”的并行化过程, 并给出了并行化后的性能评测。  相似文献   

12.
湖南省气象局依托国家超级计算长沙中心,建立了我省第一个远程高性能计算终端用户.针对远程环境的搭建,首先分析了湖南省气象局在高性能计算方面的需求,然后从省级气象部门业务计算需求出发,重点阐述了以高性能计算机集群"天河一号"为计算资源的远程计算环境的系统架构以及主要技术路线与方法.考虑到远程高性能强大的计算能力和省级气象部门作业提交的复杂需求,又进一步设计了湖南省远程高性能任务调度的系统流程以及保障远程计算环境高速稳定的多层面方案.最后也给出了高分辨率中小尺度WRF模式在该环境下运行的实际情况,计算速度改善非常明显.  相似文献   

13.
随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为主流架构。为适应这种既有分布式又有共享内存的硬件体系架构,使用MPI与OpenMP混合编程模型,可以实现节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式,MPI用于节点间通信,OpenMP用于节点内并行计算。该文采用MPI与OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行MPI与OpenMP混合并行方案设计和优化。试验结果表明:MPI与OpenMP混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI与OpenMP混合并行方案比单一MPI方案效果好,但在线程数量大于4时,并行效果显著下降。  相似文献   

14.
随着通用图形处理器 (GPGPU) 计算技术的快速发展,通过大规模增加处理系统的并发度来提升性能成为计算机高性能计算的最新趋势。目前,通用图形处理器已经被应用到科学计算的诸多领域。长波辐射作为GRAPES模式中极为重要的物理过程,其巨大的计算量对整个GRAPES模式的运行效率有重要影响。该文依托NVIDIA公司计算统一设备架构 (CUDA) 技术平台,以GRAPES全球模式中长波辐射传输方案为例,对其进行了大规模并发设计和优化,在保持系统结果一致的前提下,对比单颗高端CPU,Tesla C1060 GPGPU具有11倍的加速效果,明显提升了GRAPES全球模式的执行速度和预报时效。研究表明:使用通用图形处理器技术提升数值预报模式的执行速度非常有潜力。  相似文献   

15.
全国综合气象信息共享平台架构设计技术特征   总被引:5,自引:2,他引:3       下载免费PDF全文
全国综合气象信息共享平台(CIMISS)是依托天气雷达数据共享平台工程项目建成的国省统一数据环境,实现各类气象数据的规范管理,直接支撑气象业务应用。该文介绍了CIMISS架构设计及核心内容,结合业务应用效果的实例分析,阐述架构设计如何有效提升数据和应用的集约高效。借鉴企业架构(EA)方法,建立了业务架构、数据架构、应用架构、技术架构和标准规范体系。采用一系列架构优化设计,包括实现元数据统一管理同步、数据质量控制、统一业务监控、异构数据库统一数据服务、优化信息流程、分层设计和集群技术应用等,满足CIMISS标准性、扩展性、稳定性等需求,获得良好的全流程数据服务时效,核心资料接收入库总耗时均小于3 min,数据访问效率较国家级气象资料存储检索系统提升2~5倍。继承现有CIMISS架构设计成果,正在设计中的气象大数据平台整体技术架构将向云平台、分布式存储等新技术升级。  相似文献   

16.
网格计算及其在气象中的应用   总被引:2,自引:0,他引:2  
杨学胜  张卫民  陈德辉 《气象》2005,31(2):79-82
网格是近年来最新发展起来的一种计算技术。通过使用一组开放标准与协议,各机构能够通过互联网或内部网访问数据、存储介质和其它异构计算资源,最终将分布在不同地理位置上的网络、数据、计算资源、存储、应用等在内的资源整合成为一个无缝的计算环境。气象以其高计算量、高吞吐量和密集型服务在美国、欧洲、日本等网格应用计划中占有重要的地位。如ECMWF的EcAccess,美国超级计算应用中心的MEAD等。这些计划的实施将有效地聚合分布在不同地理位置上的高性能计算资源与人力资源,实现计算资源和气象数据的共享,为数值预报乃至地球系统模拟提供一个远程的协同攻关环境。  相似文献   

17.
虽然云计算的应用越来越广泛,但也具有不能支持高移动性、不支持地理位置信息及高时延等亟待解决的问题.为此,雾计算已经出现,并将云计算扩展到网络的边缘,以减少延迟和网络拥塞.首先介绍了雾计算的概念、特点和结构,然后讨论了具有代表性的应用场景以及雾计算的安全问题.另外,还对雾计算相似的原位计算和连续计算进行了介绍.最后,给出了云计算与雾计算的区别与联系,并分析了雾计算未来的发展方向.雾计算扩大了以云计算为特征的网络计算范式,将网络计算从网络的中心扩展到网络的边缘,从而可以更加广泛地运用于更多的应用形态和服务类型.  相似文献   

18.
遥感大数据分布式技术研究与实现   总被引:2,自引:2,他引:0       下载免费PDF全文
面向卫星遥感海量数据,针对其数据量的急速增长,对数据分析、价值挖掘提出了全新的挑战,引入驱动大数据应用的分布式模式,建立了适应卫星遥感大数据的网格模型,打破了数据的时空割裂和限制,数据可以作为整体进行存储、计算和应用,模型设计的网格、时间片、物理层的基本结构,可以保证未来云计算的实施。该文提出了基于希尔伯特曲线的网格散列算法,以此建立的分布式系统具有优异的并行读写性能和良好的负载均衡能力;遥感大数据分布式系统,实现了数据的高速分布式并行读写,支持数据的精确时空匹配和动态获取,整个系统的扩展能力可以达到线性增长,系统基于通用软硬件平台实施,实现卫星遥感大数据灵活、按需和简便的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号