共查询到17条相似文献,搜索用时 62 毫秒
1.
地理命名实体分类体系的设计与应用分析 总被引:2,自引:0,他引:2
自然语言是一种重要的空间数据来源,从自然语言中获取地理空间信息是地理信息科学的重要研究议题。完善的地理命名实体分类体系,有助于实现自然语言中地理空间信息的解析、存贮、组织、管理、分析及共享应用。现有的基础地理要素分类体系、地名分类体系和组织机构分类体系,分别侧重于不同的应用领域,只能表达自然语言中的部分地理命名实体,没有考虑时空关联特性。本文在参照大量相关标准的基础上,根据大量自然语言文本的标注结果,以地理命名实体所指代的空间位置、地理特征和属性作为分类标准,采用主分表和复分表相结合的方式,设计了地理命名实体分类体系(简称GNEC)。采用定量和定性相结合的方法,分析了GNEC与GB/T18521-2001,GB/T13923-2006,CHG IS的地名分类体系、ADL的FTT词表之间的兼容性,并以中文文本的地理命名实体解析和地图服务为例,验证了GNEC的应用性能。多样性是自然语言中地理实体描述的重要特征,而分类体系主要实现地理命名实体的概念化操作。因此,在GNEC基础上构建本体,将成为解决这一问题的有效途径。 相似文献
2.
自然资源可持续利用、国土空间优化和治理能力现代化需要全要素、多尺度和长时间序列自然资源调查监测数据,关键是构建较为完善的自然资源要素综合观测网络,形成全方位、高精度、高时间分辨率、高空间分辨率的数据获取能力。本文在自然资源调查监测需求分析的基础上,结合当前空天地网感知能力和技术水平,构建自然资源调查监测协同化数据获取技术框架,提出空天地网多维度数据协同获取技术方法,梳理需要突破的关键技术,旨在为自然资源调查监测体系和协同式数据获取能力建设提供依据。 相似文献
3.
4.
地理要素变化发现是地理信息数据库动态更新的重要组成部分。互联网在信息传播中扮演着越来越重要的角色,网页文本中蕴含着一些现势性很强的地理要素信息,可作为地理要素变化发现的数据源。本文结合网络爬虫和朴素贝叶斯分类模型,提出并实现了一种面向网页文本的地理要素变化发现方法。首先,本文在收集分析地理要素变化新闻锚文本的基础上,构建了网络地理要素变化新闻关键词库,并基于关键词库设计了适于地理要素变化发现的网络爬虫,实现了候选网页文本的主动获取;接着为了提取地理要素变化新闻,本文训练构造了适于地理要素变化发现的朴素贝叶斯分类器,对候选网页文本进行筛选。最后通过实验对比了本文方法与现有方法在准确性和全面性上的表现。 相似文献
5.
矢量和栅格是GIS应用中两种基本的地学数据格式。与矢量数据相比,栅格数据利于空间建模和空间分析,且是空间尺度分析应用中常用的数据格式。一般来讲,较大尺度的矢量数据,涉及到保密性和知识产权的问题,若将这类矢量数据栅格化后,所得栅格数据由于其空间坐标精度相对降低而更易于实现数据共享。随着地学信息收集技术的不断发展,栅格数据正逐渐成为地学应用主要的数据格式。然而,传统的栅格化是一个伴随有属性信息损失的过程,主要原因在于一个栅格单元区域内存在混合类型。针对现阶段栅格化过程中的这个问题,本文以2005年全国1:25万土地覆被矢量数据为例,提出了一种在ArcGIS软件环境下,依据在一个单元格网中,一种土地覆被类型表达为一个GRID图层的原则,结合POLYGRID命令及其{LOOKUP_TABLE} INFO文件进行土地覆被矢量数据无属性信息损失栅格化的方法。该方法可为相关研究人员在今后处理和分析地理空间数据的工作提供新的思路,以及为空间尺度的应用研究提供有价值的参考。 相似文献
6.
7.
命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:(1)与无词汇增强功能模型... 相似文献
8.
房地产估价的常用方法是将估价对象与邻近估价时点和邻域空间的类似房地产进行比较,从而估算其客观合理的价格,这需要用到大量的可比房产价格数据。GIS主题爬虫的应用可以有效解决目前房产估价所面临的数据缺乏、效率低下等问题。该文综合运用主题爬虫、网页解析技术、数据库技术、Web技术和GIS技术进行房产数据的提取、存储、空间分析,并利用所提取的实时房产交易案例进行房产价格估算;设计并实现了一个具备房产地理位置查询、房屋基本属性查询、房屋价格估算、房产批量评估等功能的房产信息实时更新与处理系统。最后对该系统做了前端、后台及数据库的优化,在某公司的估价业务工作中得到了实际应用,并取得了良好的用户体验效果。 相似文献
9.
孔云峰 《地球信息科学学报》2022,24(9):1730-1741
区划问题是将特定地理区域划分为若干空间连续的分区,满足分区内差异最小和分区间差异最大这一基本原则,广泛应用于地理、环境、生态、经济、农业、城市等领域。1960s以来,学者尝试建立各种区划问题数学模型,设计了一系列的求解算法,代表性的算法主要有:AZP、ARISEL、SKATER和REDCAP。本文提出了一个基于迭代局部搜索(ILS)的区划问题算法,进一步提升算法性能。该算法主要机制包括:邻域单元移动搜索改进分区质量;参照中心单元快速计算分区方差,提升算法速度;使用扰动机制跳出当前解局部最优状态;更新分区中心点提升分区方案目标值;使用群搜索探索更大的解空间;以及算法各步骤中通过分区空间连续判断和破碎修复保持分区空间连续。55个基准案例测试表明:ILS算法求解质量优于ARISEL和SKATER算法。一个多指标气候分区实验也表明:ILS算法求解质量优于SKATER、REDCAP和ARISEL算法。 相似文献
10.
11.
传统标绘系统都是单用户工作模式,不能满足现代社会中群体用户在分布式环境下协同标绘的要求。本文将网格技术引入分布式实时协同标绘研究中,设计了基于网格的分布式实时协同标绘系统的框架,介绍了其系统框架,以及协同管理、协同消息、网格调度器等技术。将网格和GIS技术的结合,实现了分布式实时协同符号标绘系统原型,满足群体用户的地理信息共同协调与合作标绘的要求。实验表明,以网格技术构建分布式实时协同绘系统,能实现广域网下的快速协同,使其响应速度快,稳定性好。 相似文献
12.
地质大调查工作不仅涉及全国基础地质、地质矿产、地质灾害、地质环境等多专业、多比例尺等多种工作手段,还涉及中央、地方、社会等不同资金来源的项目。由于地质工作部署在地质工作中的先行性地位,做好部署方案编制对整个地质工作的开展具有重要作用。全国地质调查协同部署平台建设是为了统筹多种资金来源的地质调查工作,进一步优化地质调查工作部署方案编制,实现工作程度数据、部署专题数据等多源数据的一体化耦合显示、综合分析、部署方案编制等功能。全国地质调查协同部署平台的建立,提供了中央地方共享工作程度数据和地质调查工作部署需求对接的一个重要渠道,以信息化的手段促进了中央地方部署方案"协同"编制。 相似文献
13.
14.
15.
综合减灾中,协同研判是一种十分有效的灾情汇聚分析手段。现有灾情协同研判系统存在灾情研判水平层次低、研判活动缺乏系统化管理、数据同步共享方式造成网络传输压力大等问题。数据集中的复制式模型是一种高效的协同系统模型,有效提高系统可靠性和降低网络传输量并兼顾空间数据一致性和数据存储效率。本文详细介绍了灾情研判技术流程和关键技术,充分利用复制式模型特点设计并实现了一个基于复制式模型的灾情协同研判系统。实验表明,该系统稳定可靠,能有效满足分布式、异步或同步灾情协同研判的要求。 相似文献
16.
利用基于信息流的风险评估模型和方法针对信息系统安全风险进行风险量化和估计,采用多级模糊综合评判的方法,设计并实现了基于信息流的风险评估系统。实验表明,所设计的风险评估系统能用于各种信息系统的安全性评估,为组织实现自己的安全策略提供参考。 相似文献
17.
利用基于信息流的风险评估模型和方法针对信息系统安全风险进行风险量化和估计,采用多级模糊综合评判的方法,设计并实现了基于信息流的风险评估系统。实验表明,所设计的风险评估系统能用于各种信息系统的安全性评估,为组织实现自己的安全策略提供参考。 相似文献