首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
超级计算机上矩阵乘的并行计算与实现   总被引:3,自引:0,他引:3       下载免费PDF全文
数值预报系统中经常要用到矩阵乘运算。在分布式超级计算机 (如IBM-SP) 上, 矩阵乘的并行计算需要较多的数据移动, 有效的数据传输对矩阵乘的实现至关重要。该文讨论了两种矩阵乘的并行算法, 一种是基于矩阵的列-行划分方式, 一种是基于矩阵的网格划分方式。在IBM-SP计算机上的实验结果表明, 网格划分的矩阵乘并行算法通讯开销更小, 并行效率更高, 其并行加速比较列-行并行算法改善约10 %。  相似文献   

2.
并行技术在神威集合数值天气预报系统中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
张眙 《应用气象学报》2002,13(2):232-238
文章讨论了基于神威巨型机的并行化集合数值天气预报系统中实现的各种并行算法, 性能分析结果表明并行方案最大限度的利用了神威机的处理器资源, 设计的并行算法效率较高, 满足了实时业务运行的时效要求。  相似文献   

3.
浅水波模式半拉格朗日方法的并行研究   总被引:1,自引:0,他引:1       下载免费PDF全文
该文研究的问题是分布式并行计算机消息传递方式下半拉格朗日并行算法, 重点研究二维浅水波并行模式中有关子区域过渡带(HALO)的问题和有关求解赫姆霍兹方程的并行算法。进行了一系列的对比试验, 研究在不同分辨率下模式的并行效率的问题。结果表明:采用分区域并行计算的方法, 可得到较好的并行效率。模式中使用半拉格朗日方法处理平流项是有利的, 在分辨率高时, 可有效地提高计算速度。  相似文献   

4.
本文是把传统的大气、海洋问题中常用的串行迭代法——Liebmann方法(点迭代)和局地格林函数迭代法(局地点迭代),从算法上变成适合于IBM—4381(P03)双CPU并行执行的并行算法,求解Poisson方程零边界值问题。实例计算试验表明:上述两种方法的并行算法的效率是同一计算问题的串行算法的1.8倍和1.9倍;若把区域扩大,局地格林函数并行迭代效率可达2.8倍,大大超过IBM公司所称P03型机是P01型机的1.7倍的效率;本文还指出IBM-4381(P03)型计算机的两个CPU在执行并行运算时,可以共享数据组。  相似文献   

5.
通过对地面自动气象站观测数据入库的工作流程分析,结果表明多线程处理性能比单线程高3.85倍,业务应用证明了该并行方案稳定可靠,为气象资料处理并行化规划和提高处理性能提供参考。  相似文献   

6.
雷达组网拼图算法是强对流天气短时临近预报系统(Severe Weather Automatic Nowcasting,SWAN)的重要基础方法之一。提高拼图算法的效率,不仅可以提升现有SWAN临近算法序列的时效性,也能更好地应用高分辨率雷达数据,具有重要的实际意义。采用中央处理器(central processing unit,CPU)和图形处理器(graphics processing unit,GPU)混合架构设计并行雷达拼图算法,其中CPU负责雷达数据的解析和调度GPU并行模块,GPU负责大规模数据的并行计算。通过分析计算统一设备架构(compute unified device architecture,CUDA)算法的并行开销和拼图算法的特点,提出并实现了GPU内存管理优化和数据交换流程优化方案,提高了组网拼图算法的效率。对比试验结果表明,基于CUDA的GPU并行拼图算法和SWAN中30线程并行的CPU算法相比,在全国1 km和500 m分辨率的拼图任务上,加速比分别达到3.52和6.82。综上,基于CUDA的并行拼图算法不仅可以提高SWAN短时临近算法序列的时效性,也为更高分辨率雷达资料的拼图提供了技术支持。  相似文献   

7.
基于处理器制造工艺的提升接近极限,传统的单纯靠提高主频来提升性能已不适合时代需求,促使处理器从单核向多核转化。经过近年发展,多核处理器在当前成为主流配置,而气象程序大部分还是串行的,极大地浪费了处理器的计算资源。MPI和OpenMP作为两种主要的并行环境,具有各自的优势。MPI适用于分布式内存计算机,但是需要对程序进行的修改较多,难度大。OpenMP使用共享内存方式,对程序修改较少。相对来说,OpenMP更适合于多核处理器的并行计算。通过对CALMET进行OpenMP并行化加快CALMET运行速度的尝试,介绍了对串行程序进行OpenMP并行化的一般方法。主要步骤包括:对串行程序进行性能分析,找出计算时间最长的程序段进行并行改写;对循环进行OpenMP并行化,修改中间变量为单个线程私有;编译运行并行程序,进行性能比较;比较并行与串行的运行输出结果是否一致。  相似文献   

8.
遥感大数据分布式技术研究与实现   总被引:2,自引:2,他引:0       下载免费PDF全文
面向卫星遥感海量数据,针对其数据量的急速增长,对数据分析、价值挖掘提出了全新的挑战,引入驱动大数据应用的分布式模式,建立了适应卫星遥感大数据的网格模型,打破了数据的时空割裂和限制,数据可以作为整体进行存储、计算和应用,模型设计的网格、时间片、物理层的基本结构,可以保证未来云计算的实施。该文提出了基于希尔伯特曲线的网格散列算法,以此建立的分布式系统具有优异的并行读写性能和良好的负载均衡能力;遥感大数据分布式系统,实现了数据的高速分布式并行读写,支持数据的精确时空匹配和动态获取,整个系统的扩展能力可以达到线性增长,系统基于通用软硬件平台实施,实现卫星遥感大数据灵活、按需和简便的应用。  相似文献   

9.
从串行程序分析、并行方案选择到具体算法实现, 依次介绍了基于神威机的集合数值天气预报系统中“客观分析子系统”的并行化过程, 并给出了并行化后的性能评测。  相似文献   

10.
HPF是在FORTRAN90的基础上,拥有数组分配、新数据并行的特点,以及支持并行体系结构有效使用的内部和库函数,它提供一个全局名字空间和单线程控制,用户可以用分布(Distribution)和对准(Alignment)说明定义所希望的数据布局,用显式的并行结构表达并行机制。HPF由于其强大的计算功能和拥有数组分配、新数据并行的特点,在发展高分辨率中尺度数值预报模式和其它气象实时业务中发挥重要作用。  相似文献   

11.
一个有限差分大气环流模式的并行效率   总被引:2,自引:0,他引:2  
适合于大规模并行处理机(MPP)的中国科学院大气物理研究所新一代九层大气环流模式(IAP 9L AGCM)被发展成功。本文描述了并行模式的设计原则,给出了该模式的并行版本在我国几种主要的并行机上的并行执行效率数据。采用消息传递方式(MPI)的区域分解方法用于实现程序的并行,结果表明,对于该模式,只有一维区域分解方法才能取得较好的并行可扩展性,即随着处理器的增加而能得到相应较好的并行加速比和并行效率。  相似文献   

12.
A new version of the Institute of Atmospheric Physics (IAP) 9-Layer (9L) atmospheric general circulation model (AGCM) suitable for Massively Parallel Processor (MPP) has been developed. This paper presents the principles of the parallel code design and examines its performance on a variety of state-of-the-art parallel computers in China. Domain decomposition strategy is used to achieve parallelism that is implemented by Message Passing Interface (MPI). Only the one dimensional domain decomposition algorithm is shown to scale favorably as the number of processors is increased. This work is partly supported by the National Natural Science Foundation of China (Grant Nos. 49775268 and 49823002), the China National Key Development Planning Project for Basic Research (Grant No. G1998040905) and the CAS Key Innovation Direction Project (Grant No. KZCX2208).  相似文献   

13.
并行效率的初步研究   总被引:1,自引:1,他引:1       下载免费PDF全文
用有限区域中尺度差分网格模式,采用分区域并行计算方法,在TRANSPUTER并行计算机上研究大规模并行计算中计算问题复杂度与并行计算效率的关系。结果表明,采用适当的并行计算法,增加处理机个数和计算问题的复杂度可使并行加速比增大;并行效率则随着处理机个数的增加而降低,随着计算问题复杂度的增加而提高;大规模并行计算能明显地提高计算速度,很适合于解决大量计算的问题,在数值预报方面具有广阔的发展前景。  相似文献   

14.
本文介绍数值天气预报(NWP)问题,用IBM4381—P03型计算机的两个CPU,实现气象物理模型x-y方向“分解-联合”的自稳定差分格式的并行计算的初步情况:(1)4381-3型的CPU可按通常理解的分开任务方式实现并行计算;(2)MVS大型操作系统控制VS FORTRAN库中的MTF(Multitasking Facility)实行分开任务-并行处理-等待同步,从而实现NWP模型的并行运算,这在我国气象问题计算中还是第一次,今后卫星数据处理的新方案可用4381-3双CPU并行处理,老方案也可逐步变成并行计算;(3)并行加速达到1.3—1.5,尚未达到IBM公司的1.8加速水平,还有潜力可挖。  相似文献   

15.
Summary With the increasingly widespread adoption of massively parallel processing (MPP) computers for applications in computational fluid dynamics it becomes appropriate to reconsider the geometrical configuration of the computational grid that best suits the problem. In the case of global numerical weather prediction we have recently advocated a conformal spherical-cubic geometry. Among its merits, this grid lends itself naturally to simple domain-decomposition and obviates the need for polar filtering.Here we extend the same principles, but with an emphasis on the problem of regional forecasting. In this case we observe that it is possible to cover the global domain with a conformal grid geometry based on the mapping to the sphere of a back-to-back pair of octagonal regions. In the most symmetrical case, each octagon maps to a hemisphere. By compounding this mapping with a nonhomogeneous conformal mapping of the sphere to itself, one can also arrange to have quasi-uniform enhanced resolution of the resulting grid inside any chosen circle on the sphere, at the expense of relatively coarse resolution degrading gradually with distance outside the circle of interest.With appropriate grid dimensions, the new conformal octagon decomposes naturally into several identical square subdomains for efficient distribution over the nodes of an MPP computer.With 11 Figures  相似文献   

16.
GRAPES全球格点模式的并行计算负载平衡策略   总被引:1,自引:0,他引:1  
随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一.目前高性能计算机计算能力已达到每秒千万亿次浮点计算.系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统的设计也提出了挑战.数值天气预报软件系统要充分利用高性能计算机提供的计算资源,必须依靠并行计算方法,这包括适合计算问题的可扩展并行算法的设计、合适的数据分配方案以及良好的任务负载平衡方案.作为中国新一代数值天气预报格点模式,GRAPES(Global and Regional Assimilation and PrEdiction System)设计的最终目标是一个科研/业务通用,区域/全球通用模式.作为一个格点模式,GRAPES的并行计算具有与欧洲中期数值顶报研究中心谱模式并行计算不同的特点,GRAPES的并行计算采用了经典的水平网格数据划分.但对于全球的GRAPES模式,由于采用拉格朗日差分方案,模式极地及附近区域格点与格点之间距离的减小.使得模式并行计算在采用简单的经纬网格划分方式实现时,必须考虑极地区域并行计算跨越多个处理器时导致的频繁通讯解决途径.本研究提出了利用消息传递组通讯实现全球格点模式并行计算的一种方法,其核心思想是将极点附近一定区域内的处理器按纬向划归不同的处理器组.文中还给出了该实现方法的任务分配算法,提出了改进的任务分配负载平衡方案.在中国气象局高性能计算机IBM-cluster1600上的测试表明,算法具有较好的可扩展性,其负载平衡方案改善了计算的绝对墙钟时间,使并行计算效率提高10%以上.模式的准业务运行结果表明计算墙钟时间基本可以满足数值预报业务的实时性要求.  相似文献   

17.
定位精度是评价雷电定位网络的重要指标之一,定位算法直接影响雷电探测结果的精度。雷电监测系统探测数据误差不可避免,传统定位算法不具备抗误差干扰能力,迭代计算易发散,定位结果精度不高。为了满足实际应用需求,提出一种新的雷电定位算法DG-LLA(DBSCAN and grid-search lighting location algorithm),在定位计算中引入DBSCAN(density-based spatial clustering of applications with noise)方法与网格搜索方法。通过仿真与国家雷电监测网实际定位结果对比分析定位算法性能。结果表明:到达时间差(time difference of arrival,TDOA)法和Taylor级数展开法定位误差较大,仿真区域的均方根误差分别为982 m和668 m;定位中引入DBSCAN方法后,均方根误差明显减小为406 m,引入DBSCAN方法和网格搜索方法后,均方根误差减小为349 m;在相同回击数据条件下,算法DG-LLA与国家雷电监测网相比定位数量更多,回击数据的利用率从43.4%提升到51.5%,新增定位结果周围雷达回波特征较强,定位精度更高。  相似文献   

18.
赵春燕  王彬  孙婧  肖华东 《气象科技》2022,50(2):194-201
气象数据是现代天气预报和气候预测业务的重要基础支撑,种类众多格式复杂,针对气象数据应用研究中缺乏便捷通用的格式转换处理工具的问题,设计开发了一种通用气象数据格式转换工具,采用Python开发算法工厂并调用第三方气象数据处理库集成实现气象数据的解读分析和格式转换,支持多种主要气象数据的处理,面向应用场景,提供命令行和可视化应用终端。该工具已在北京高性能计算机应用中心网站发布,并在数值预报模式中试支撑环境中部署应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号