首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Shark/Spark的分布式空间数据分析框架
引用本文:温馨,罗侃,陈荣国.基于Shark/Spark的分布式空间数据分析框架[J].地球信息科学,2015(4):401-407.
作者姓名:温馨  罗侃  陈荣国
作者单位:中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室;中国科学院大学
基金项目:国家高技术发展研究计划“863”项目(2013AA12A204、2013AA122302)
摘    要:随着空间数据的与日俱增,传统依托于单节点的空间数据管理方法,已难以满足海量数据高并发的需求。云计算的兴起带来机遇与挑战,分布式技术与数据库技术的优势互补,为云计算下高效的数据管理提供了可能。本文提出一种在分布式计算引擎(Shark/Spark)中集合之关键技术(包括空间数据映射、空间数据加载、数据备份及空间查询等),将空间数据库对空间数据的高效存储、索引及查询优势与分布式计算引擎对复杂计算的优势相结合,实现一种基于Shark/Spark的分布式空间数据分析框架。在具体实现中,通过空间自定义函数和空间函数下推2种方式实现空间查询,结果表明,影响返回结果数据量的空间查询更适合下推给空间数据库完成,而不影响返回结果数据量的空间查询,利用分布式计算引擎直接运算更有优势。同时,通过与现有的一种分布式GIS方案(Arc GIS on Hadoop)对比发现,空间数据库的空间索引可有效提高查询效率,空间数据管理也更加独立。

关 键 词:Shark  Spark  Hadoop  空间数据库  空间查询
本文献已被 CNKI 等数据库收录!
点击此处可从《地球信息科学》浏览原始摘要信息
点击此处可从《地球信息科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号