首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
目前,文本挖掘的研究已经成为热点领域,并在人们的日常生活和决策分析过程中起到了越来越重要的作用。本文总结了文本挖掘的概念和基本特征,并在此基础上重点研究了基于文档集的文本挖掘模型。结合现有的一些知识表达概念和挖掘算法,设计出一种新的文本挖掘模型。通过实例验证表明,该模型在查准率和查全率方面都优于一般的文本挖掘模型,对于提高挖掘效率具有十分重要的意义。  相似文献   

2.
随着GML规范的不断完善及广泛应用,大量的不同时期的GML空间数据开始累积。如何从GML时空数据(库)中提取知识,已成为当前空间数据挖掘亟待解决的热点问题。针对半结构化GML时空数据的特点,采用时空数据挖掘的理论与方法,探讨数种GML时空序列模式相似性度量挖掘算法。  相似文献   

3.
知识服务是GIS的重要应用方向,海量文本数据中蕴含的丰富隐式地理信息的分析与挖掘成为热点研究问题。在自然资源管理领域,一定时空范围内的自然资源分布相对独立和分散,文本中的丰富语义信息零散、庞杂且高度非结构化,缺少有效的组织表达、关联整合与综合应用方案。本文面向自然资源管理领域的文本数据和自然资源实体,提出了语义驱动的地理实体表达框架,通过语义描述、空间位置、属性特征和时间演化四元组来组织表达文本内蕴的地理实体多域信息,并从概念、空间、属性和时间4个维度定义并表示实体间的多类语义关系;继而按照地理实体信息抽取、信息存储和语义关联构建等步骤,给出了多维度地理实体关联网络的构建方法,并设计了基于关联网络的知识问答服务算法;最后,以建设用地审批为例,利用审批过程电子文本数据,完成建设用地信息的实体化表达、建设用地实体关联网络的构建及知识问答服务的实现。试验与分析结果表明,本文的理论与方法能有效促进自然资源管理领域文本中地理信息的有机整合、充分关联与科学管理,为提升自然资源领域信息的应用与社会化服务水平提供切实可行的途径。  相似文献   

4.
随着个性化地图服务的深入研究,如何获取更加实时可靠的用户个性化信息和需求,成为当前研究的难点。本文从人们最重要的交流工具——文本数据出发,在当前文本挖掘技术的支持下,提出了一种能够识别挖掘用户所言,分析提取用户所需,并最终实现地图可视化的个性化地图服务模型。通过实例验证,该模型能够有效地提取地图知识和用户信息,为个性化地图服务的发展提供技术和数据支撑。  相似文献   

5.
基于分类规则挖掘的遥感影像分类研究   总被引:6,自引:0,他引:6  
分析了目前遥感影像的统计分类、神经网络分类及基于符号知识的逻辑推理分类方法的优缺点.以GIS为平台,构建了多源空间数据库,将数据挖掘的思想和方法引入遥感影像分类中,提出了面向分类规则挖掘的遥感影像分类框架.针对遥感光谱数据及其他空间数据的特点,定义了连续属性样本分类概念和分割点评价指标,提出了一种新的连续属性样本分类规则挖掘算法.选择一个试验区,采用该算法分别对遥感光谱数据、遥感光谱和DEM数据相结合的数据进行分类规则挖掘、遥感影像分类和分类精度比较.结果表明:(1)该算法具有较高的分类精度;(2)加入DEM等与分类相关的其他空间数据可以提高遥感影像的分类精度.通过挖掘分类规则进行遥感影像分类,扩展了基于知识的逻辑推理分类方法中知识获取渠道,提高了分类规则获取的智能化程度.新的连续属性样本分类规则挖掘算法,扩展了归纳学习算法对连续属性样本分类的适应性.  相似文献   

6.
基于Rough集的居民地属性知识约简与结构化选取   总被引:1,自引:0,他引:1  
基于Rough集理论提出了居民地属性知识约简及其结构化选取的方法。该方法充分利用Rough集理论具有较强知识挖掘能力的特点,定量分析居民地选取中条件属性的重要性,简化属性知识,并以此为基础计算每个居民地的重要性,实现居民地的结构化选取。实例证明,该方法能够从数据库中挖掘出相关知识,具有较强的自适应能力。  相似文献   

7.
对社交媒体所包含文本数据的深入挖掘,有利于有效地进行后续的时空分析。提出了一种新的基于共词网络的社交媒体数据主题挖掘方法,依据词频-逆文档频率分析,自动筛选出与主题相关的关键词汇,基于微博间是否包含相同的关键词汇,提出构建以微博为节点的共词网络,并结合Louvain社区探测算法进行文本主题挖掘。所提出的方法是一种无监督方法,且具有不需要指定聚类数目的优点。实验表明,该方法在主题挖掘表现上,准确率和召回率均优于常用的文档主题生成模型。以收集的2012年北京暴雨期间包含关键词的微博为例,利用提出的方法对微博数据集进行挖掘和时空分析,结果表明所提方法在实际应用中的有效性。  相似文献   

8.
提出了带确定性决策项的关联规则挖掘算法。理论和实验分析表明,该算法与传统的关联规则挖掘算法相比,具有高效率。在实际中应用该挖掘算法,可以得到有意义的知识模式,为生化企业优化生产环境提供理论基础。  相似文献   

9.
研究了一种基于主题特征的地理大数据挖掘及推荐技术,通过建立空间数据与非空间数据的语义关联、聚类分析等手段,将非空间数据进行空间化,实现同步挖掘。通过对数据单元中含有的主题类别信息的判断,将满足用户需求的地理大数据挖掘结果推荐给用户。该技术可以从大量具有较低密度值的非结构化数据中提取信息和发现知识,且推荐的准确度和效率较高。  相似文献   

10.
赵婷  华一新  李响  李翔  杨飞 《测绘工程》2016,25(6):28-32
地理标签数据是指蕴含在网页、照片、微博等信息媒介中的地理空间信息,其表现形式通常是经纬度坐标。通过分析地理标签数据的研究现状,对地理标签数据进行分类,并归纳地理标签数据具有属性数据非结构化、海量信息分布不均、强调位置相对关系等特点。针对其中一个特点,通过对K-means算法进行改进,结合计算机图形学相关知识,利用热力图表达地理标签数据的分布特征。最后,通过与ArcGIS核密度图、散点图进行比较,得出该热力图算法具有表达效果明显、用户体验好等优点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号