首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 62 毫秒
1.
空间关联规则挖掘研究进展   总被引:7,自引:0,他引:7  
随着空间数据获取技术的进步, 空间数据量日益增大, 已超出人们的分析能力。传统的空 间数据分析方法只能进行简单的数据分析, 无法满足人们获取知识的需要。空间关联规则是空间 数据挖掘一个基本的任务, 是从具有海量、多维、多尺度、不确定性边界等特性的空间数据中进行 知识发现的重要方法。本文从基本概念、分类、挖掘过程、挖掘方法、目前研究成果等方面对其进 行综述, 重点阐述了空间关联规则挖掘效率的改进策略、基于不确定空间信息的挖掘方法、挖掘 过程及结果的可视化、弱空间关联规则的挖掘方法等。通过对现有空间关联规则研究成果和存在 问题的深入剖析, 指出了其未来主要的发展方向。  相似文献   

2.
北极海冰的大量融化,加速了北极航道开发和利用,对北极水域船舶事故风险管理提出了更高的要求。本文以2008—2017年的北极水域船舶事故数据为样本,运用数据挖掘技术和方法,对北极水域船舶事故进行了时空特征分析,并对船舶属性与事故属性之间的潜在映射关系进行了关联规则挖掘。结果表明:北极水域事故数逐年呈上升的趋势,事故主要发生在巴伦支海东部的俄罗斯摩尔曼斯克港口水域和挪威北部水域;北极水域严重事故受船舶总吨、船旗国、船舶类型、事故类型、事故水域等变量的影响,船舶尺度较大的船舶更容易造成严重事故;北极水域俄罗斯籍渔船的严重事故,很多是由机损事故引发的,但很少造成环境污染。研究结论可辅助海事管理部门和航运企业开展北极水域船舶事故预防和风险管理工作。  相似文献   

3.
地形特征与山地气候变化空间关联规则数据挖掘研究   总被引:2,自引:0,他引:2  
以四川省的地形、气候为研究对象,针对山地地形特征与气候变化研究中,传统的统计分析、非线性拟合等方法缺乏分析处理海量数据和提取隐含信息能力的问题,提出将关联规则数据挖掘与栅格图像处理、地形分析相结合的研究方法。该方法利用栅格图像处理和地形分析技术,对地形和气候栅格图像进行坐标转换、裁剪、分类、因子提取、离散化等预处理,再用Apriori算法对提取的地形特征因子和气候因子进行分析,得到反映两者之间相关性的强关联规则。通过对60余万组数据的分析,得到22条满足最小支持度和置信度的关联规则,并由此综合分析得到6条复合关联规则。实验证明,这些反映地形特征与气候变化幅度之间关联性的关联规则可信度较高。  相似文献   

4.
随着用户对基于位置服务隐私安全的日益关注,位置隐私保护成为当前研究的热点,但传统方法只针对单次或空时临近的多次匿名查询进行隐私保护,并未考虑基于大空时尺度范围匿名集分析的推理攻击.该文研究了针对空时K-匿名数据的关联规则挖掘算法,并利用南京市2 612辆出租车在2007年7月15日的GPS轨迹数据进行模拟实验.实验结果表明,基于空时K-匿名数据的关联规则可对用户的敏感空时区域隐私进行推理攻击,从而产生更具威胁性的隐私暴露风险.该研究成果对于优化空时K-匿名方法、实现位置隐私的增强性保护具有实践价值,对于丰富隐私保护数据挖掘领域的研究具有一定的理论参考价值.  相似文献   

5.
空间关联规则是空间数据挖掘的重要内容,其结果表明了各种空间对象之间的关联关系.本研究以福州地区作为试验区,以DEM、坡度、坡向等地形特征以及2009年福州地区土地利用现状作为基础数据,利用Apriori算法从中提取出地形特征与土地利用现状之间的关联关系,讨论并分析两者之间关联规则的提取结果及空间关联规则提取方法的优缺点...  相似文献   

6.
空间关联规则是空间数据挖掘的重要内容,其结果表明了各种空间对象之间的关联关系.本研究以福州地区作为试验区,以DEM、坡度、坡向等地形特征以及2009年福州地区土地利用现状作为基础数据,利用Apriori算法从中提取出地形特征与土地利用现状之间的关联关系,讨论并分析两者之间关联规则的提取结果及空间关联规则提取方法的优缺点;研究结果表明了2009年福州地区的土地利用现状分布,即林地多,耕地、住宅用地等偏少的情况,林地分布在各种地形上且与坡向之间无强关联性;而且对于不同的最小置信度和支持度,该算法所提取的结果有所不同,如何提高算法效率、合理的设置最小置信度和支持度以及提取结果的评价与解释等将是今后进一步研究的重点.  相似文献   

7.
在基于Apriori算法的单维布尔关联规则基础上,以姜寨遗址主要遗迹的属性数据为研究对象,利用该算法对姜寨一期文化遗迹的属性数据进行了关联挖掘分析。首先进行房屋遗迹属性的关联挖掘,然后进行土坑葬等的属性数据挖掘,找到了聚落遗址属性数据之间隐含的关系,为聚落考古遗址的资料分析提供了一种新技术。  相似文献   

8.
遥感数据的模糊不确定性及其处理方法探讨   总被引:11,自引:0,他引:11  
通过对遥感数据生成机理的分析,得出遥感数据存在不确定性,并进一步论证了不确定性中含有模糊不确定性,这样对遥感数据的不确定性处理更加全面和合理,从而达到提高遥感数据的精度和消除遥感数据不确定性的目的。综合国内外对遥感数据模糊不确定性的处理研究,探讨了几种处理方法,发现还没有一种方法能圆满解决遥感数据的模糊不确定性。  相似文献   

9.
廖伟华  聂鑫 《热带地理》2018,38(6):751-758
同位模式表示不同类型的实体在空间邻域内共同频繁出现的规律,是城市实体空间关联的主要表达形式,但不能挖掘出指定实体的空间关联,需要寻找新的计算方法。在城市计算的视角下,通过引入粗糙集研究城市空间关联问题发现:1)该方法能把复杂的地理空间关联问题转换成信息决策问题,在信息决策表中计算城市实体之间的空间关联等拓扑关系,计算过程和结果可以挖掘城市行业之间的空间集聚和关联问题。2)通过属性约简得到属性核可以把高维空间数据降维,找到影响空间关联的重要因子。3)该方法拓宽了城市计算的理论方法体系和粗糙集方法的行业应用。最后,通过Python爬取南宁市城市服务业数据,进行方法的验证,计算结果与成熟的Apriori算法结果,以及南宁市服务业空间关联实际情况基本一致,证明了粗糙空间关联方法的可行性和正确性。  相似文献   

10.
降雨信息空间插值的不确定性分析   总被引:48,自引:2,他引:48  
文章以潮白河流域为样区,根据58个雨量站1990年的降雨观测数据,采用反距离权重法、克立格法、样条函数法、趋势面法等插值方法,分析了站点数量变化、时间尺度变化、栅格像元的尺度变化、插值方法的差异对降雨数据空间插值结果的影响,剖析降雨插值中的不确定性。结果表明:(1)插值站点数量越大,区域降雨插值的不确定性越小;(2)像元尺度在50m~1000m间变化对降雨插值的不确定性只有微弱的影响;(3)对应于时间尺度由年到月到日的变化,降雨插值的不确定性随时间尺度的减小而显著增大;(4)不同插值方法影响到降雨空间插值的不确定性水平。为了减少降雨信息空间插值的不确定性,根本途径是要引入第三方相关变量,并将其整合到现有的插值算法中。高相关性变量的选取及其与插值模型的整合方式将成为降雨插值研究的主导方向。  相似文献   

11.
基于空间数据挖掘的含义,分析空间数据挖掘的特点、主要方法分类和面临的主要问题;结合空间数据的特点,提出一种空间数据挖掘体系结构,并分析空间数据挖掘的基本过程,阐述了当前空间数据挖掘面临的主要问题并展望其发展趋势。  相似文献   

12.
基于大数据的城市服务业空间关联分析   总被引:7,自引:5,他引:2  
廖伟华  聂鑫 《地理科学》2017,37(9):1310-1317
信息技术与电商平台的发展,产生了各种各样的大数据。在城市服务业中,商家在电商平台上注册自己带有坐标的信息,构成了空间服务业的空间大数据源。首先建立限定距离阈值的空间关联规则数据模型,介绍该模型产生频繁项集和关联规则的方法与步骤。最后利用Python爬取糯米网南宁站的商家信息,用Apriori算法做出了10~1 000 m 6种距离阈值的空间关联规则和服务业空间频繁项集。  相似文献   

13.
The aim of mining spatial co-location patterns is to find the corresponding subsets of spatial features that have strong spatial correlation in the real world. This is an important technology for the extraction and comprehension of implicit knowledge in large spatial databases. However, existing methods of co-location mining consider events as taking place in a homogeneous and isotropic context in Euclidean space, whereas the physical movement in an urban space is usually constrained by a road network. Furthermore, previous works do not take the ‘distance decay effect’ of spatial interactions into account, which may reduce the effectiveness of the result. Here we propose an improved spatial co-location pattern mining method, including the network-constrained neighborhood and addition of a distance-decay function, to find the spatial dependence between network phenomena (e.g. urban facilities). The underlying idea is to utilize a model function in the interest measure calculation to weight the contribution of a co-location to the overall interest measure instance inversely proportional to the separation distance. Our approach was evaluated through extensive experiments using facility points-of-interest data sets. The results show that the network-constrained approach is a more effective method than the traditional one in network-structured space. The proposed approach can also be applied to other human activities (e.g. traffic accidents) constrained by a street network.  相似文献   

14.
Spatial association rule mining (SARM) is an important data mining task for understanding implicit and sophisticated interactions in spatial data. The usefulness of SARM results, represented as sets of rules, depends on their reliability: the abundance of rules, control over the risk of spurious rules, and accuracy of rule interestingness measure (RIM) values. This study presents crisp-fuzzy SARM, a novel SARM method that can enhance the reliability of resultant rules. The method firstly prunes dubious rules using statistically sound tests and crisp supports for the patterns involved, and then evaluates RIMs of accepted rules using fuzzy supports. For the RIM evaluation stage, the study also proposes a Gaussian-curve-based fuzzy data discretization model for SARM with improved design for spatial semantics. The proposed techniques were evaluated by both synthetic and real-world data. The synthetic data was generated with predesigned rules and RIM values, thus the reliability of SARM results could be confidently and quantitatively evaluated. The proposed techniques showed high efficacy in enhancing the reliability of SARM results in all three aspects. The abundance of resultant rules was improved by 50% or more compared with using conventional fuzzy SARM. Minimal risk of spurious rules was guaranteed by statistically sound tests. The probability that the entire result contained any spurious rules was below 1%. The RIM values also avoided large positive errors committed by crisp SARM, which typically exceeded 50% for representative RIMs. The real-world case study on New York City points of interest reconfirms the improved reliability of crisp-fuzzy SARM results, and demonstrates that such improvement is critical for practical spatial data analytics and decision support.  相似文献   

15.
GIS不确定性框架体系与数据不确定性研究方法   总被引:1,自引:0,他引:1  
该文分析了GIS数据不确定性研究现状,总结了GIS中数据不确定性的研究问题,提出GIS中数据不确定的框架体系,并结合非线性复杂科学的研究方法,对GIS数据不确定性的研究方法进行了分析、归纳和阐述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号