首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
针对现有的地理流双变量异常聚类方法忽视了时间维度的问题,提出面向地理流的双变量时空扫描统计方法。先构建面向地理流的多尺度时空扫描窗口;通过伯努利模型下的扫描统计量检测窗口中是否存在异常流簇,采用蒙特卡洛模拟方法检验扫描统计量的统计显著性;筛选一系列时空分布无重叠的异常流簇。应用该方法识别厦门市网约车流和巡游车流的时空异常流簇,以发现两类出租车竞争模式的时空格局。结果表明:巡游车流占优簇常发生在凌晨,分布在娱乐、餐饮、住宿等场所;网约车流占优簇常发生在上午或傍晚,分布在办公地点与居住地之间。该方法挖掘的结果能够发现异常流簇准确的时空分布特征,可为城市交通规划提供支持。  相似文献   

2.
针对传统聚类算法在处理时空位置数据挖掘时面临的多维聚类问题,提出了动态加权聚类模型。该模型叠加利用经典k-均值和基于密度的DBSCAN聚类算法,通过计算最大轮廓系数确定合适的簇数目,按照划分初始簇类、识别和剔除噪声点、修正聚类簇中心点位置坐标3个步骤实现对大体量多维时空位置数据的聚类分析,提出了动态权重系数计算公式,优化了基于密度的DBSCAN聚类算法中相似度函数,并在Python3.7环境下以网络签到数据集实例仿真验算了该模型算法。实验结果表明,相较单一的传统聚类算法,该模型能综合利用多维非位置属性对时空位置数据点聚类,更合理界定聚类簇的归属数据点,对提升时空位置数据集聚类簇中数据点的聚类效果明显。  相似文献   

3.
时空聚类分析是对时空大数据进行利用的一种有效手段,目前传统聚类算法存在着大规模分布数据难以处理,海量数据处理时间较长,确定参数困难,聚类质量较差等缺陷。因此,提出一种分布式增量聚类流程DICP,利用广域网分布增量聚类方法,避免大量数据的传输拷贝,有效提升聚类运算效率。对于DICP流程中的时空数据聚类算法本身,研究了一种大数据环境下的IMSTDCA时空数据聚类算法,借助密度聚类的思想,通过时空数据的聚集趋势预分析、时空数据聚类算法,以及时空数据聚类结果评价3个步骤完成聚类分析,实现时空大数据的快速高效信息挖掘。  相似文献   

4.
李欣 《测绘通报》2017,(7):61-65
时空聚类分析是对时空大数据进行利用的一种有效手段。本文提出了一种分布式增量大数据聚类分析方法,利用分布增量机制不但可以减少重复计算和迁移拷贝次数,而且可以持续对聚类结果进行修正,能够在保持聚类准确性的条件下提升整体运算效率。而聚类算法本身通过数据聚集趋势预分析、聚类算法和结果评价3个步骤,构建了一体化时空邻域,在时间和空间维度保证了聚类结果的准确性。经过试验证明该方法可以实现时空大数据的快速高效信息挖掘。  相似文献   

5.
针对传统上单独采用K-means或DBSCAN等方法对共享单车位置数据聚类时造成的聚类结果与真实的聚类结构不符的问题,本文提出了一种基于共享单车时空大数据的细粒度聚类方法(FGCM)。该方法通过DBSCAN进行初始聚类,并在此基础上采用GMM-EM算法进行细部聚类,以提取细粒度层级的热点区域。试验表明,该方法可根据密度阈值排除噪声和离群值,无需指定细部聚类簇数,簇的形状和大小比较灵活。在对共享单车大数据位置特征进行聚类时,与传统的单独采用K-means或DBSCAN的方法相比,FGCM具备更高的精细程度,能够充分展现共享单车的实际聚集特征,可用于规划共享单车电子围栏等设施,在不降低通勤效率的基础上规范共享单车的停放问题。  相似文献   

6.
从空间数据场的角度出发,提出了一种基于场论的层次空间聚类算法(简称HSCBFT)。该算法是通过模拟空间实体间的凝聚力来描述空间实体间的相互作用,进而采取层次凝聚的策略进行聚类。通过实验分析可以发现,层次空间聚类算法具有如下优势:①空间聚类簇中各空间实体很好地满足了空间邻近且专题属性相似的要求;②能发现任意形状的空间簇,且具有良好的抗噪性;③输入参数较少。  相似文献   

7.
针对当前在精细识别道路拥堵时空范围方面研究的不足,提出一种利用GPS轨迹的二次聚类方法,通过快速识别大批量在时间、空间上差异较小且速度相近的轨迹段,反映出道路交通状态及时空变化趋势,并根据速度阈值确定拥堵状态及精细时空范围。首先将轨迹按采样间隔划分成若干条子轨迹,针对子轨迹段提出相似队列的概念,并设计了基于密度的空间聚类的相似队列提取方法,通过初次聚类合并相似子轨迹段,再利用改进的欧氏空间相似度度量函数计算相似队列间的时空距离,最后以相似队列为基本单元,基于模糊C均值聚类的方法进行二次聚类,根据聚类的结果进行交通流状态的识别和划分。以广州市主干路真实出租车GPS轨迹数据为例,对该方法进行验证。实验结果表明,该二次聚类方法能够较为精细地反映城市道路的拥堵时空范围,便于管理者精准疏散城市道路拥堵,相比直接聚类方法可以有效提升大批量轨迹数据的计算效率。  相似文献   

8.
对战场文本数据的深入挖掘,可以高质量和高效率地发现时空主题结构,从而有效揭示战场事件发展的时空规律。针对现有的主题发现方法无法有效适用于具有多维异构关系的时空主题发现,提出了一种融合多维关系联合聚类的时空主题发现方法,首先构建以地理环境实体、地理位置与事件主题为节点的主题关系网络;然后以张量模型的Tucker分解建立主题关系的完全表达式作为主题分类的目标函数;最后运用块值矩阵分解方法进行联合聚类计算,获取主题分类结果和内聚结构。实验结果表明,该方法能够有效发现具有时空语义关系特征的主题结构,较好地体现出地理环境要素与时空主题之间的关联性,以及时空主题在地理位置与事件主题标签上的内聚性,反映出主题的演化过程。  相似文献   

9.
CLIQUE是一种重要的数据挖掘算法,广泛应用于大型数据库中的高维数据聚类。分析了CLIQUE算法的主要思想以及聚类算法在地震目录分析中的研究现状,提出了利用CLIQUE算法对全球地震目录进行聚类处理的流程。根据时空数据的多维特征,首先划分子空间计算密集单元,再将其连接聚簇并投影至各个维度进行可视分析。以近40 a(1977-2016年)的全球地震目录为数据源进行CLIQUE聚类实验,结果表明CLIQUE能有效发现地震现象在不同维度下呈现的聚集模式,且相对于其他聚类算法具有较高的效率。本文方法具有一定的可靠性与实用性,能够为地震事件的评估和防范提供决策依据。  相似文献   

10.
传统扫描统计方法在进行时空异常聚类模式挖掘时,受扫描窗口形状的限制,不能准确地获取聚类区域形状。提出一种改进的不规则形状时空异常聚类模式挖掘方法stAntScan。新方法基于26方位时空邻近单元格构建时空邻接矩阵,再对蚁群最优化扫描统计方法进行改进,使其能适应三维大数据量的时空区域扫描。模拟数据和真实微博签到数据的实验证明,stAntScan能有效地识别时空范围内的不规则形状异常聚类,并且准确性较经典的SaTScan方法高。  相似文献   

11.
同时顾及空间邻近与专题属性相似的空间层次聚类是挖掘空间分布模式的一种有效手段。空间层次聚类方法虽然可以获得多层次的聚集结构,但聚类结果显著性的统计判别依然是一个尚未解决的难题。为此,本文提出了一种空间层次聚类结果显著性的统计判别方法,用于确定空间层次聚类的停止准则,减少聚类过程对参数设置的依赖。通过试验分析与比较发现,该方法能够有效判别空间层次聚类结果的显著性和确定层次聚类合并过程的停止条件,同时具有很好的抗噪性,避免随机结构的干扰。  相似文献   

12.
The discovery of spatio-temporal clusters in complex spatio-temporal data-sets has been a challenging issue in the domain of spatio-temporal data mining and knowledge discovery. In this paper, a novel spatio-temporal clustering method based on spatio-temporal shared nearest neighbors (STSNN) is proposed to detect spatio-temporal clusters of different sizes, shapes, and densities in spatio-temporal databases with a large amount of noise. The concepts of windowed distance and shared nearest neighbor are utilized to define a novel spatio-temporal density for a spatio-temporal entity with definite mathematical meanings. Then, the density-based clustering strategy is employed to uncover spatio-temporal clusters. The spatio-temporal clustering algorithm developed in this paper is easily implemented and less sensitive to density variation among spatio-temporal entities. Experiments are undertaken on several simulated data-sets to demonstrate the effectiveness and advantage of the STSNN algorithm. Also, the real-world applications on two seismic databases show that the STSNN algorithm has the ability to uncover foreshocks and aftershocks effectively.  相似文献   

13.
针对Delaunay三角网空间聚类存在的不足,提出一种顾及属性空间分布不均的空间聚类方法。首先将Delaunay三角网空间位置聚类作为约束条件,采用广度优先搜索方法,以局部参数"属性变化率"作为阈值识别非空间属性相似簇的聚类过程。以城市商业中心为例,验证了该方法能够更客观地识别非空间属性相似的簇,且自适应属性阈值可以满足不同聚类需求,为城市商业中心等空间实体的提取提供了一种有效方法。  相似文献   

14.
Traditional dual clustering algorithms cannot adaptively perform clustering well without sufficient prior knowledge of the dataset. This article aims at accommodating both spatial and non‐spatial attributes in detecting clusters without the need to set parameters by default or prior knowledge. A novel adaptive dual clustering algorithm (ADC+) is proposed to obtain satisfactory clustering results considering the spatial proximity and attribute similarity with the presence of noise and barriers. In this algorithm, Delaunay triangulation is utilized to adaptively obtain spatial proximity and spatial homogenous patterns based on particle swarm optimization (PSO). Then, a hierarchical clustering method is employed to obtain clusters with similar attributes. The hierarchical clustering method adopts a discriminating coefficient to adaptively control the depth of the hierarchical architecture. The clustering results are further refined using an optimization approach. The advantages and practicability of the ADC+ algorithm are illustrated by experiments on both simulated datasets and real‐world applications. It is found that the proposed ADC+ algorithm can adaptively and accurately detect clusters with arbitrary shapes, similar attributes and densities under the consideration of barriers.  相似文献   

15.
李光强  邓敏  张维玲  陈翼 《遥感学报》2010,14(3):475-486
首先发展了基于事件影响域的时空事务表构建策略,提出了基于事件影响域的时空关联规则挖掘方法,给出了相应的挖掘算法(简称ECSTAR算法)。通过一个实际算例验证了所提方法的可行性和有效性。  相似文献   

16.
王海起  朱锦  王劲峰 《东北测绘》2014,(2):18-21,24
空间聚类不仅应考虑GIS对象属性特征的相似性,还应考虑对象的空间邻近性。不同属性、位置特征在聚类中起到的作用不同。采用信息熵方法计算空间距离中各属性距离、位置距离的权重,权值大小用于度量相应特征在fuzzy c-means隶属度计算时的作用大小,并引入相似性指标,当两个聚类之间的相似度高于某个合并阈值时,则对应的一对聚类进行合并,从而克服需预先设置聚类类数的问题。通过应用实例的聚类有效性分析,与普通空间距离相比,基于空间加权距离的FCM算法具有稳定性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号