首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
空间关联规则挖掘研究进展   总被引:7,自引:0,他引:7  
随着空间数据获取技术的进步, 空间数据量日益增大, 已超出人们的分析能力。传统的空 间数据分析方法只能进行简单的数据分析, 无法满足人们获取知识的需要。空间关联规则是空间 数据挖掘一个基本的任务, 是从具有海量、多维、多尺度、不确定性边界等特性的空间数据中进行 知识发现的重要方法。本文从基本概念、分类、挖掘过程、挖掘方法、目前研究成果等方面对其进 行综述, 重点阐述了空间关联规则挖掘效率的改进策略、基于不确定空间信息的挖掘方法、挖掘 过程及结果的可视化、弱空间关联规则的挖掘方法等。通过对现有空间关联规则研究成果和存在 问题的深入剖析, 指出了其未来主要的发展方向。  相似文献   

2.
空间数据挖掘技术研究进展   总被引:22,自引:0,他引:22  
空间数据具有海量、非线性、多尺度、高维和模糊性等复杂性特点,空间数据挖掘技术是对空间数据中非显性的知识、空间关系等模式的自动提取。该文从空间数据挖掘的知识类型、方法、体系结构、过程以及与GIS系统集成等方面对其进行综述。重点阐述空间特征及区分规则、空间分类及聚类规则、空间分布及关联规则、空间序列及演化规则等知识类型以及统计分析、机器学习、探索性数据分析、可视化分析等数据挖掘方法。通过对空间数据挖掘理论、应用和系统实现等方面研究方向、存在问题的分析,指出集数据库、知识库、专家系统、决策支持系统、可视化工具、网络等技术于一体的空间数据挖掘系统是其主要发展方向。  相似文献   

3.
关联规则挖掘是社会安全事件分析的重要方法之一,用于发现事件属性项及事件间的潜在关联。该文分析了社会安全事件的时空特性,利用时空关联规则挖掘方法分析事件属性项间的时空关联。为解决现有时空关联规则挖掘方法需要事先指定挖掘时间区间的问题,提出一种非指定时间约束的时空关联规则挖掘方法,根据事件时间属性值和时间划分粒度为事件空间和专题属性项增加时间标识,用时间标识代替时间属性值,得到全时间域内带有时间指向性的关联规则挖掘结果。以全球恐怖主义事件数据库为数据源,对该方法进行验证,结果表明其具有一定的可靠性与实用性,能够为社会安全事件的分析与预测、快速响应与防范提供决策依据。  相似文献   

4.
叙述了面向“数字城市”多源数据的空间数据立方体空间度量的基本定义;描述了空间度量的聚集概念,并结合具体的图例阐述了点状、线状、面状空间度量的聚集过程;解释了空间数据立方体维上钻、维下翻、维层次上钻、维层次下翻的空间度量聚集操作基本原理。  相似文献   

5.
多维空间分析的关键技术--空间数据立方体   总被引:9,自引:3,他引:6  
介绍空间数据立方体在“数字城市”建设中的作用以及国内外研究现状;讨论非空间维、空间维、数字度量、空间度量的基本概念和结构,给出空间数据立方体的完整描述。空间数据立方体的分析操作主要由概括分析、局部分析、全局分析和旋转分析组成,介绍这些分析操作的功能和结构;结合具体实例数据介绍多维缓冲区空间分析。  相似文献   

6.
基于Shannon信息熵原理的GIS数据信息量表达属于语言学信息体系中的语法层次,描述了空间目标分布结构上的不确定性特征。该文将该信息量测度方法应用于空间数据的尺度变换中,考察尺度变换中空间数据语法结构在统计意义上的变化特点,进而通过信息熵的变化发掘尺度变化中空间数据信息量的变化规律。基于空间目标群的Voronoi图剖分建立信息熵度量,以空间尺度变换中的移位、合并两种典型操作为案例,研究了面状目标群尺度变换中信息量衰减的初步规律,并尝试将其结论用于地图综合方法质量评价。  相似文献   

7.
空间索引技术可提供高效的空间数据组织与管理方式,以支撑海量空间数据的挖掘与分析。针对当前空间索引存在的知识体系不明晰、选择难等问题,该文通过文献调查法和CiteSpace工具,依据空间划分及映射方法将空间索引划分为基于树结构、格网、空间填充曲线和地址编码的空间索引四大类,并综述其原理、空间结构、适用范围及在GIS领域的应用,最后对空间索引在数据组织、高效计算、可视化、可靠性等方面的研究进行展望。结论如下:基于树结构的空间索引最具普适性且可以处理多维度及多层次的数据,查询性能依赖于树结构的平衡性及数据的分布;基于格网的空间索引可以均匀划分空间以便于高效范围查询,却不适用于非结构化或动态数据集;基于空间填充曲线的空间索引可以在实现维度压缩的同时保持局部邻近性,但插入或删除数据可能导致整个曲线的重构难以频繁更新;基于地址编码的空间索引将语义地址信息转化为编码信息,便于高效检索,然而语义地址匹配仍存在较大误差和不确定性。研究结果可为空间数据组织和结构设计提供参考。  相似文献   

8.
基于空间数据挖掘技术的森林防火智能决策支持系统研究   总被引:3,自引:0,他引:3  
从智能空间决策支持系统的功能需求出发,分析了森林防火是复杂的空间决策问题,它具有动态性、分布性、数据量大、数据性质复杂等特点,决策者面对突如其来的灾害及海量的、复杂的、易变的和分布的数据和信息,很难做出及时、科学和准确的决策。因此,建立集成空间信息分析处理的、具有知识发现能力的智能决策支持系统是十分必要的。而空间在线分析处理(Spatial OLAP)和空间在线分析挖掘(Spatial OLAM,Spatial OLAPmining)是集成空间数据处理的OLAP和OLAM,能够在空间数据仓库上发现隐含的知识和规则,并在不同的维、度上进行查询和分析。从系统需求分析、功能设计、系统实现和系统运行实例方面,论述融合了GIS、空间OLAP和空间OLAM技术的空间智能决策支持系统的设计思想和关键技术的实现。提出基于空间OLAP和OLAM知识发现机制,建立一种集成GIS、空间数据仓库、空间OLAP/OLAM和决策支持系统的新型决策分析工具。  相似文献   

9.
基于空间语义学基础理论,将传统的地理信息服务技术与新兴的语义服务技术相结合,建立地理信息语义服务框架及知识标注方法体系,并应用于地理空间信息服务处理中,提供智能化、自动化的地理信息服务发现、组合与触发策略;设计基于文本挖掘算法的半自动知识标注引擎,提高服务处理自动化程度,实现包含丰富语义信息的地理空间语义服务的发布;建立基于规则和推理引擎的地理信息服务匹配与发现机制,提高服务发现效率;建立地理信息服务语义标注与服务匹配评价方法,采用基于空间关联规则的标注正确性评估策略,验证知识标注价值。  相似文献   

10.
地理空间数据本质特征语义相关度计算模型   总被引:1,自引:1,他引:0  
关联数据是跨网域整合多源异构地理空间数据的有效方式,语义丰富的关联是准确、快速发现目标数据的关键。根据地理空间数据在空间、时间、内容上的语义关系,提出地理空间数据本质特征语义相关度计算模型。通过构建本质特征的关联指标体系,分层次逐级计算地理空间数据的语义相关度。与传统的语义相关度计算方式不同,以地理元数据为语料库,充分考虑地理空间数据的特点及空间、时间、内容在检索中不同的重要程度,分别采用几何运算、数值运算、词语语义相似度计算和类别层次相关度计算的方式,构建地理空间数据的语义相关度计算模型。该模型具有构建简单、适用于多源异构数据、充分结合了数学运算和专家经验知识等特点。实验表明:模型能够有效地计算地理空间数据本质特征的语义相关度,并具备一定的扩展性。  相似文献   

11.
空间关联规则是空间数据挖掘的重要内容,其结果表明了各种空间对象之间的关联关系.本研究以福州地区作为试验区,以DEM、坡度、坡向等地形特征以及2009年福州地区土地利用现状作为基础数据,利用Apriori算法从中提取出地形特征与土地利用现状之间的关联关系,讨论并分析两者之间关联规则的提取结果及空间关联规则提取方法的优缺点;研究结果表明了2009年福州地区的土地利用现状分布,即林地多,耕地、住宅用地等偏少的情况,林地分布在各种地形上且与坡向之间无强关联性;而且对于不同的最小置信度和支持度,该算法所提取的结果有所不同,如何提高算法效率、合理的设置最小置信度和支持度以及提取结果的评价与解释等将是今后进一步研究的重点.  相似文献   

12.
空间关联规则是空间数据挖掘的重要内容,其结果表明了各种空间对象之间的关联关系.本研究以福州地区作为试验区,以DEM、坡度、坡向等地形特征以及2009年福州地区土地利用现状作为基础数据,利用Apriori算法从中提取出地形特征与土地利用现状之间的关联关系,讨论并分析两者之间关联规则的提取结果及空间关联规则提取方法的优缺点...  相似文献   

13.
The reality of uncertain data cannot be ignored. Anytime that spatial data are used to assist planning, decision making, or policy generation, it is likely that error or uncertainty in the data will propagate through processing protocols and analytic techniques, potentially leading to biased or incorrect decision making. The ability to directly account for uncertainty in spatial analysis efforts is critically important. This article focuses on addressing data uncertainty in one of the most important and widely used exploratory spatial data analysis (ESDA) techniques—choropleth mapping—and proposes an alternative map classification method for uncertain spatial data. The classification approach maximizes within-class homogeneity under data uncertainty while explicitly integrating spatial characteristics to reduce visual map complexity and to facilitate pattern perception. The method is demonstrated by mapping the 2009 to 2013 American Community Survey estimates of median household income in Salt Lake County, Utah, at the census tract level.  相似文献   

14.
地形特征与山地气候变化空间关联规则数据挖掘研究   总被引:2,自引:0,他引:2  
以四川省的地形、气候为研究对象,针对山地地形特征与气候变化研究中,传统的统计分析、非线性拟合等方法缺乏分析处理海量数据和提取隐含信息能力的问题,提出将关联规则数据挖掘与栅格图像处理、地形分析相结合的研究方法。该方法利用栅格图像处理和地形分析技术,对地形和气候栅格图像进行坐标转换、裁剪、分类、因子提取、离散化等预处理,再用Apriori算法对提取的地形特征因子和气候因子进行分析,得到反映两者之间相关性的强关联规则。通过对60余万组数据的分析,得到22条满足最小支持度和置信度的关联规则,并由此综合分析得到6条复合关联规则。实验证明,这些反映地形特征与气候变化幅度之间关联性的关联规则可信度较高。  相似文献   

15.
Spatial association rule mining (SARM) is an important data mining task for understanding implicit and sophisticated interactions in spatial data. The usefulness of SARM results, represented as sets of rules, depends on their reliability: the abundance of rules, control over the risk of spurious rules, and accuracy of rule interestingness measure (RIM) values. This study presents crisp-fuzzy SARM, a novel SARM method that can enhance the reliability of resultant rules. The method firstly prunes dubious rules using statistically sound tests and crisp supports for the patterns involved, and then evaluates RIMs of accepted rules using fuzzy supports. For the RIM evaluation stage, the study also proposes a Gaussian-curve-based fuzzy data discretization model for SARM with improved design for spatial semantics. The proposed techniques were evaluated by both synthetic and real-world data. The synthetic data was generated with predesigned rules and RIM values, thus the reliability of SARM results could be confidently and quantitatively evaluated. The proposed techniques showed high efficacy in enhancing the reliability of SARM results in all three aspects. The abundance of resultant rules was improved by 50% or more compared with using conventional fuzzy SARM. Minimal risk of spurious rules was guaranteed by statistically sound tests. The probability that the entire result contained any spurious rules was below 1%. The RIM values also avoided large positive errors committed by crisp SARM, which typically exceeded 50% for representative RIMs. The real-world case study on New York City points of interest reconfirms the improved reliability of crisp-fuzzy SARM results, and demonstrates that such improvement is critical for practical spatial data analytics and decision support.  相似文献   

16.
基于大数据的城市服务业空间关联分析   总被引:7,自引:5,他引:2  
廖伟华  聂鑫 《地理科学》2017,37(9):1310-1317
信息技术与电商平台的发展,产生了各种各样的大数据。在城市服务业中,商家在电商平台上注册自己带有坐标的信息,构成了空间服务业的空间大数据源。首先建立限定距离阈值的空间关联规则数据模型,介绍该模型产生频繁项集和关联规则的方法与步骤。最后利用Python爬取糯米网南宁站的商家信息,用Apriori算法做出了10~1 000 m 6种距离阈值的空间关联规则和服务业空间频繁项集。  相似文献   

17.
基于数据挖掘的地图质量集对分析模型   总被引:1,自引:0,他引:1  
汪明武  金菊良  李丽 《地理科学》2008,28(5):688-692
应用模糊联系度的概念,以探讨对差异度系数进行数据挖掘的改进集对分析方法,实现对不确定性数据信息的数据挖掘和深入分析,提高评价结果的准确性和可靠性。结合实例验证构建模型的正确性和有效性,并与模糊数学方法及专家评价方法的结果进行对比分析,结果表明应用基于数据挖掘的集对分析方法评价地图质量是有效可行的,且操作过程简单。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号