首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 150 毫秒
1.
针对传统聚类算法在处理时空位置数据挖掘时面临的多维聚类问题,提出了动态加权聚类模型。该模型叠加利用经典k-均值和基于密度的DBSCAN聚类算法,通过计算最大轮廓系数确定合适的簇数目,按照划分初始簇类、识别和剔除噪声点、修正聚类簇中心点位置坐标3个步骤实现对大体量多维时空位置数据的聚类分析,提出了动态权重系数计算公式,优化了基于密度的DBSCAN聚类算法中相似度函数,并在Python3.7环境下以网络签到数据集实例仿真验算了该模型算法。实验结果表明,相较单一的传统聚类算法,该模型能综合利用多维非位置属性对时空位置数据点聚类,更合理界定聚类簇的归属数据点,对提升时空位置数据集聚类簇中数据点的聚类效果明显。  相似文献   

2.
时空聚类分析是对时空大数据进行利用的一种有效手段,目前传统聚类算法存在着大规模分布数据难以处理,海量数据处理时间较长,确定参数困难,聚类质量较差等缺陷。因此,提出一种分布式增量聚类流程DICP,利用广域网分布增量聚类方法,避免大量数据的传输拷贝,有效提升聚类运算效率。对于DICP流程中的时空数据聚类算法本身,研究了一种大数据环境下的IMSTDCA时空数据聚类算法,借助密度聚类的思想,通过时空数据的聚集趋势预分析、时空数据聚类算法,以及时空数据聚类结果评价3个步骤完成聚类分析,实现时空大数据的快速高效信息挖掘。  相似文献   

3.
李欣 《测绘通报》2017,(7):61-65
时空聚类分析是对时空大数据进行利用的一种有效手段。本文提出了一种分布式增量大数据聚类分析方法,利用分布增量机制不但可以减少重复计算和迁移拷贝次数,而且可以持续对聚类结果进行修正,能够在保持聚类准确性的条件下提升整体运算效率。而聚类算法本身通过数据聚集趋势预分析、聚类算法和结果评价3个步骤,构建了一体化时空邻域,在时间和空间维度保证了聚类结果的准确性。经过试验证明该方法可以实现时空大数据的快速高效信息挖掘。  相似文献   

4.
CLIQUE是一种重要的数据挖掘算法,广泛应用于大型数据库中的高维数据聚类。分析了CLIQUE算法的主要思想以及聚类算法在地震目录分析中的研究现状,提出了利用CLIQUE算法对全球地震目录进行聚类处理的流程。根据时空数据的多维特征,首先划分子空间计算密集单元,再将其连接聚簇并投影至各个维度进行可视分析。以近40 a(1977-2016年)的全球地震目录为数据源进行CLIQUE聚类实验,结果表明CLIQUE能有效发现地震现象在不同维度下呈现的聚集模式,且相对于其他聚类算法具有较高的效率。本文方法具有一定的可靠性与实用性,能够为地震事件的评估和防范提供决策依据。  相似文献   

5.
刘杰  张戬 《现代测绘》2017,(3):31-34
随着数据的采集、存储、计算等能力不断提升,在数据挖掘领域,基于大数据的时空信息数据的分析和处理正是当前研究的热门问题。步入"互联网+"时代后,从巨大体量的时空大数据中挖掘出潜藏的有价值的信息具有重大意义。加之时空数据处理更为复杂,日趋繁重的时空数据处理任务急需寻找有效时空数据挖掘方法。据此,从数据挖掘中的时空数据挖掘模式的分析和展示角度出发,探讨时空数据挖掘的几种模式,包括时空频繁模式、时空关联模式、时空共现模式、时空分类、时空聚类、时空异常模式检测等,分析这些时空数据挖掘模式目前发展状况,对存在的问题及可能的解决办法进行探讨。  相似文献   

6.
针对当前在精细识别道路拥堵时空范围方面研究的不足,提出一种利用GPS轨迹的二次聚类方法,通过快速识别大批量在时间、空间上差异较小且速度相近的轨迹段,反映出道路交通状态及时空变化趋势,并根据速度阈值确定拥堵状态及精细时空范围。首先将轨迹按采样间隔划分成若干条子轨迹,针对子轨迹段提出相似队列的概念,并设计了基于密度的空间聚类的相似队列提取方法,通过初次聚类合并相似子轨迹段,再利用改进的欧氏空间相似度度量函数计算相似队列间的时空距离,最后以相似队列为基本单元,基于模糊C均值聚类的方法进行二次聚类,根据聚类的结果进行交通流状态的识别和划分。以广州市主干路真实出租车GPS轨迹数据为例,对该方法进行验证。实验结果表明,该二次聚类方法能够较为精细地反映城市道路的拥堵时空范围,便于管理者精准疏散城市道路拥堵,相比直接聚类方法可以有效提升大批量轨迹数据的计算效率。  相似文献   

7.
随着世界海洋经济的快速增长和各国海洋贸易的持续发展,船舶AIS系统被世界各国广泛采用,由此产生海量的船舶轨迹数据。如何对这些多维、动态的数据进行挖掘和利用,成为当前时空数据挖掘领域的研究热点之一。文中在经典DBSCAN空间聚类算法的基础上,对船舶轨迹数据进行清洗、压缩等预处理,并将其划分为特征点相连的子轨迹段,然后引入时间距离度量方法,实现对船舶轨迹的时空聚类。最后基于东海某海域(113°45′37″E~130°23′43″E,17°47′29″N~38°52′59″N)近一个月的船舶轨迹数据进行实验,结果表明相比经典DBSCAN算法,文中算法能够在兼顾时间信息的基础上,对船舶轨迹数据进行有效的时空聚类,为后续研究预测船舶的行为模式奠定基础。  相似文献   

8.
如何选取有效的聚类算法或者扩展算法让GML数据发挥更大的作用是数据挖掘的一项重要任务。分析GML成功应用于各领域带来的一系列问题,提出研究GML数据挖掘的意义,通过研究经典的聚类算法,从算法的效率、可伸缩性、对噪声的敏感性和复杂度等多个方面对聚类算法的性能进行比较,这对GML聚类挖掘算法的设计具有积极意义。  相似文献   

9.
针对传统上单独采用K-means或DBSCAN等方法对共享单车位置数据聚类时造成的聚类结果与真实的聚类结构不符的问题,本文提出了一种基于共享单车时空大数据的细粒度聚类方法(FGCM)。该方法通过DBSCAN进行初始聚类,并在此基础上采用GMM-EM算法进行细部聚类,以提取细粒度层级的热点区域。试验表明,该方法可根据密度阈值排除噪声和离群值,无需指定细部聚类簇数,簇的形状和大小比较灵活。在对共享单车大数据位置特征进行聚类时,与传统的单独采用K-means或DBSCAN的方法相比,FGCM具备更高的精细程度,能够充分展现共享单车的实际聚集特征,可用于规划共享单车电子围栏等设施,在不降低通勤效率的基础上规范共享单车的停放问题。  相似文献   

10.
传统扫描统计方法在进行时空异常聚类模式挖掘时,受扫描窗口形状的限制,不能准确地获取聚类区域形状。提出一种改进的不规则形状时空异常聚类模式挖掘方法stAntScan。新方法基于26方位时空邻近单元格构建时空邻接矩阵,再对蚁群最优化扫描统计方法进行改进,使其能适应三维大数据量的时空区域扫描。模拟数据和真实微博签到数据的实验证明,stAntScan能有效地识别时空范围内的不规则形状异常聚类,并且准确性较经典的SaTScan方法高。  相似文献   

11.
The discovery of spatio-temporal clusters in complex spatio-temporal data-sets has been a challenging issue in the domain of spatio-temporal data mining and knowledge discovery. In this paper, a novel spatio-temporal clustering method based on spatio-temporal shared nearest neighbors (STSNN) is proposed to detect spatio-temporal clusters of different sizes, shapes, and densities in spatio-temporal databases with a large amount of noise. The concepts of windowed distance and shared nearest neighbor are utilized to define a novel spatio-temporal density for a spatio-temporal entity with definite mathematical meanings. Then, the density-based clustering strategy is employed to uncover spatio-temporal clusters. The spatio-temporal clustering algorithm developed in this paper is easily implemented and less sensitive to density variation among spatio-temporal entities. Experiments are undertaken on several simulated data-sets to demonstrate the effectiveness and advantage of the STSNN algorithm. Also, the real-world applications on two seismic databases show that the STSNN algorithm has the ability to uncover foreshocks and aftershocks effectively.  相似文献   

12.
刘萌  邬群勇  邱端昇  孙梅  张强 《测绘学报》2017,46(4):516-525
位置签到数据蕴含了城市居民活动变化。由于客户端位置候选问题,不同的签到行为以同一候选位置签到时会产生位置重复现象。针对现有密度聚类方法在签到数据聚类上存在的问题,以快速搜索和查找密度峰值聚类算法(CFSFDP)为基础,提出了签到位置数据的密度峰值快速搜索与聚类方法。首先,引入位置重复频率来表达签到位置重复,然后,对原始签到位置数据点统计位置重复频率并重新设计数据结构,以新的空间点要素为研究对象寻找密度峰值点;最后,构建了峰值点密度簇聚类算法,在点要素集聚类过程中考虑密度连通性来保证峰值密度簇的连续与完整。试验表明,所提出的聚类方法有效避免了重复度较高的离群位置对象选为峰值并聚类的情况,并具有良好的空间适应性。所提取的密度峰值点不仅可以用来表示热区的中心,还能够反映热区的集中趋势,进而可以帮助探索热区的动态变化情况。  相似文献   

13.
传统面向文本数据的事件检测方法在处理以微博为代表的社交媒体数据时面临着效率和准确性的挑战。同时,社交媒体数据中富含的位置信息常常不能被有效地识别和利用,这无疑会影响到事件检测的效果。本文基于对已有研究的总结归纳,定义了一类面向微博签到数据的时空热点事件,并提出了一种新的微博时空热点事件检测方法对其进行识别。通过两组实际数据的实验,证明该方法能够有效地从海量的微博数据中挖掘出具有时空特征的热点事件。  相似文献   

14.
在大数据时代来临的背景下,传统数据处理和分析方法已无法满足时空大数据高效存取、实时处理、分析挖掘等需求。本文结合智慧广东时空信息云平台的项目建设案例,探讨了面向大数据的时空信息云平台的建设目标、总体架构、关键技术、应用情况等内容,为解决海量时空大数据处理与分析性能问题,推动地理信息服务高质量发展做了积极探索。  相似文献   

15.
针对现有出租车轨迹数据挖掘中时间序列邻近度量方法存在的问题,提出一种基于DBSCAN算法和改进的DTW距离的时间序列聚类算法提取具有相似性出行特征的时空模式,进而研究城市人群出行行为的时空差异。以南京市为例,结合电子地图对出行模式的空间分布特征进行分析,证明了本文所提出的方法的有效性。实验结果表明:在空间分布上,工作日出租车出行模式按照平均出行频次由高到低排序,从城市中心向四周扩散,呈中心环状分布,出行模式区域界限较为明显,同类出行模式分布区域对应相似的功能。提出了一种基于DBSCAN算法和改进的DTW距离的时间序列聚类算法提取具有相似性出行特征的时空模式,有效地分析城市人群出行行为的时空差异。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号