共查询到16条相似文献,搜索用时 140 毫秒
1.
数值预报产品数据与日俱增,采用传统的关系型数据库对其进行存储和管理存在效率低和存储能力不足的问题。另外,基于文件的存储方式在数据存储处理、数据读取和算法计算等方面存在性能瓶颈。针对这一问题,基于Hadoop技术体系设计了分布式的数据存储模型,实现了数值预报产品数据的分布式存储和处理,开发了数值预报产品数据接入处理模块;并实现了基于Rest Web Service的获取数值预报产品要素场数据访问接口、时间序列数据访问接口、数据下载接口等业务应用接口。多业务用户的实际业务测试表明, 该平台在诸如数值预报产品气象数据处理和业务应用方面较传统技术架构具有一定优势。 相似文献
2.
3.
4.
云计算技术使用分布式的计算技术实现了并行计算的计算能力和计算效率,解决了单机服务器计算能力低的问题。基于长序列历史资料所计算得出的气候标准值对于气象领域实时业务、准实时业务及科学研究中均具有重要的意义。由于长序列历史资料数据量大、运算逻辑较复杂,在传统单节点计算平台上进行整编计算耗时非常长。该文基于Hadoop分布式计算框架搭建了集群模式的云计算平台,以长序列历史资料作为源数据,基于MapReduce计算模型实现了部分整编算法,提高计算时效。同时,由于数据源本身具有文件个数多、单个文件小等特点,对数据源存储形式及数据文件大小进行改造,分别利用SequenceFile方式及文本文件合并方式对同一种场景进行计算时效对比测试,分别测试了10个文件合并、100个文件合并两种情况,使时效性得到了更大程度的提升。 相似文献
5.
气象资料是一种宝贵和重要的信息资源,内蒙古气象信息化资料工作从上个世纪70年代末开始,全区为此项工作投入大量的人力、财力和物力。经过几十年的努力才逐步形成现在规模较大的气象数据信息源。目前,我区的主要数据集有地面气象资料模式数据集(A0、A1文件数据集)、地面气象资料标准 相似文献
6.
为满足气象实时资料传输中大量气象数据小文件的高时效传输需求,对其中的数据传输服务进行优化,提出一种基于实时网络状况的自适应数据传输优化方法。该方法采用优化网络传输协议并使用文件压缩技术,通过获取网络传输线路上的实时参数,实时调整压缩参数和网络传输参数以优化传输性能。在自适应压缩时,通过试验分析和归纳,确立了气象数据小文件标准为文件小于50 KB;根据网络实时状况,设计了基于实时网络状况自适应调整压缩等级的算法。在自适应传输参数调优中,研究了TCP缓冲区大小和TCP并发连接数在GridFTP协议中的重要性,针对实时网络状况,分别设计了自适应调整TCP缓冲区大小和TCP并发连接数的算法,算法提升传输性能65%。对以上提出各自适应参数调整算法进行试验验证表明,融合压缩和网络传输的自适应调优方法能显著提升气象小数据文件的传输性能近500倍。 相似文献
7.
在Hadoop分布式计算和存储架构下,自定义ETL数据清洗规则将海量自动站小时单站文件按所属年和站号合并为大文件流转存储至HDFS中,并运用SparkSQL并行计算框架进行统计处理生成常用气象要素日统计值。结果表明,数据处理和获取时效较关系型数据库方式有显著提升。采用SparkSQL并行计算框架对多气象要素多站点和长时间序列进行数据统计处理查询均能达到秒级别响应,并随着统计站点数的不断增加和时间跨度的延长其优势更为明显,能更高效地支撑此类气象数据服务,为海量气象数据处理从关系型数据库到大数据分布式架构的转换处理提供了新思路。 相似文献
8.
9.
10.
针对气象数据种类多、信息量大、精度高等特点,传统的关系型数据库系统在存储处理、数据读取等方面存在负载饱和、读写性能不理想等问题,利用云数据存储技术,结合气象数据特征,设计了基于云数据存储平台的气象数据存储和处理方法。通过分析气象数据的结构化、半/非结构化特征,采用云关系型数据库存储结构气象数据;采用NoSQL对象库存储半/非结构化气象数据;在数据的存储过程中,应用了气象数据分块压缩技术,进行气象数据存储和传输。结果表明,所讨论的方法具有很好的存储传输效率,能够满足大规模气象数据在业务应用中对存储查询和处理速度的要求。 相似文献
11.
气象数据的传输时效保障已成为探测和信息部门的重要工作之一,快速统计各类数据到报率和及时率成为一项迫切需求.基于MapReduce编程模型设计了各类数据到报率和及时率的算法,在Hadoop平台上利用该算法实现了各类数据的逐日到报率和及时率的统计,选择文本方式和Sequence File方式作为MapReduce计算模型的输入数据源进行对比试验.试验结果表明,Sequence File作为数据源能更好地提升MapReduce并行运算的性能. 相似文献
12.
13.
14.
为深入了解地面基础气象资料中存在的问题,进一步提高资料质量,综合利用国家级和省级气象资料部门存储的1951—2009年2474个国家级地面气象站观测的气温、气压、水汽压、相对湿度、风向、风速、降水量7种要素信息化基础数据,检测并分析了数据中存在的问题。结果显示:国家级和省级气象部门存储的资料中均存在大量与实际观测数据不符的信息化问题,包括资料的替代问题、要素数据类似缺测问题以及数据录入错误等;还存在国家级和省级气象部门保存的基准基本站资料不一致现象,包括资料序列长短不同、对外服务时提供自动还是人工观测数据不一致、更正不同步造成的数据不同等。该文针对上述资料问题给出了详细的检测方法及检测结果。为了确保数据的正确性,有必要在此次数据质量检测经验的基础上,对所有历史月报数据文件中的所有要素观测值进行彻底检测与更正。 相似文献
15.
以高频海量气象格点数据为研究对象,针对传统实时处理系统数据处理效率不高的问题,设计并实现了高频精细化气象格点数据实时处理系统的总体架构和业务流程,在分析海量高频次气象格点数据特点的基础上,设计和实现了符合气象业务需求的分布式存储模型;利用多通道动态感知技术实现了动态多通道的文件处理和文件到达的快速感知触发;利用实时数据快速处理技术实现基于精准位置寻址的快速数据块定位算法,进而实现数据块的精准定位;利用数据按需实时截取技术实现了在空间范围内按需进行裁剪的截取算法,进而实现数据按需抽取;实际业务应用表明,系统有效地提升了半结构气象数值预报产品数据的实时处理效率。 相似文献
16.
典型气象年生成方法及原始气象数据质量分析 总被引:4,自引:0,他引:4
准确分析建筑热环境性能及其能耗需要代表当地平均气候状况的逐时典型气象年数据。根据我国现有的4次定时气象数据,选取建筑气候标准(GB50178-93)的7个气候区的代表城市,运用美国Sandia典型气象年方法,产生了代表城市的建筑能耗模拟分析用标准气象年数据。着重论述了针对原始气象数据的缺测情况,在生成典型气象年时的数据处理过程和质量控制原则,为建立和完善我国建筑节能用标准气象数据库提供了前期的理论分析基础。 相似文献