首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 46 毫秒
1.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

2.
地理知识库是地理实体及其相互间关系的集合,对于智能搜索、问答、推荐等知识服务有重要的支撑作用.然而,已有的地理知识库由于来源、形式、构建者等的不同,在实体地名、空间位置、类别等方面存在"同义异形"和"同形异义"的语义异构现象,影响了地理知识库间的知识融合与共享.语义对齐是解决语义异构的一种有效方法,其中实体类别对齐是语...  相似文献   

3.
网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本蕴含的地理实体关系分布稀疏,基于频率的方法难以直接应用于地理实体关系的关键词提取。为解决该问题,本文基于公开访问的网络资源,提出一种语境增强的关键词提取方法。首先,基于在线百科和开放的同义词词典,通过语境合并和语义融合创建增强的语境,以降低语境中词语的稀疏性。接着,Domain Frequency和Entropy频率统计方法从增强语境中自动构建一个大规模语料。然后,基于该语料选择词法特征并统计其权值,用于扩大语境中词语间的差异。最后,使用选择的词法特征度量增强语境中词语的重要性,将权值最大的词语作为描述地理实体关系的关键词,并基于大规模真实网络文本开展实验。实验结果表明:对于地理实体关系的关键词识别,本文方法的平均精度为85.5%,比Domain Frequency和Entropy方法分别提高41%和36%;对于新增关键词识别,本文方法的精度达到60.3%。语境增强的关键词提取方法能有效地处理地理实体关系分布的稀疏性,可服务于网络文本蕴含地理实体关系的抽取。  相似文献   

4.
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持.植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节.针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建.针对现有Word2vec、ELMo和BERT等语...  相似文献   

5.
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。  相似文献   

6.
知识图谱广泛应用于人工智能领域,基于此融合多源地理空间数据并表示地理事物的语义和时空信息,实现“数据—知识”的转换成为人们关注的热点。但现有通用知识图谱的空间知识覆盖度低且存在错误,同时基于维基百科构建的地理知识图谱存在空间关系、中文属性和坐标信息等属性缺失问题。因此本文以地理空间数据和百度百科数据的特征分析为基础,提出了以地理空间数据提取地理实体为主,百度百科补充属性信息为辅的知识图谱构建方式。① 基于GeoSparql设计模式层的地理实体、要素、几何形状和空间关系的逻辑关系;② 通过地理实体提取、实体链接和属性信息填充,在数据层实现空间知识融合;③ 结合关系型数据库和图数据库,设计空间知识存储方式;④ 在实体和关系2个方面定量分析知识图谱的构建规模。结果表明,本文构建的知识图谱中地理实体覆盖度和链接百科成功率相对较高,扩充了地理实体的概念描述信息,并将地理坐标的覆盖率提高到100%,对地理数据到地理知识的拓展具有重要意义。  相似文献   

7.
一、前言 目前,空间数据库质量的检查主要建立在人类专家对相关标准规范知识、地理知识、测绘知识理解的基础上,从中抽查部份样本数据,借助GIS软件进行查看、分析,对相关地理要素表达的台理性、准确性进行评估,获得对该样本数据库质量等级的评价.由于专家对相关标准规范和相关知识理解的不一致性、样本数据的不完整性、检查评价标准的不统一,往往不同的专家会有不同的评价结果.  相似文献   

8.
微地图是一种面向大众的新型地图,是传统地图在自媒体时代下的发展和补充。针对微地图数据来源广泛,质量参差不齐的问题,本文提出了一种基于空间相似性的微地图道路网质量评价方法。首先,将上下文信息与形状、方向、距离、拓扑关系以及一维线特征5个空间特性结合,计算微地图数据与参考数据的空间相似性;然后,对样本数据组合,并利用熵值法计算客观权重,取平均值作为各评价指标的权重系数;最后,采用可拓云评价法完成对微地图数据定量计算与定性分析结合的综合评价。本文使用9组不同质量的微地图道路网数据进行实验,结果表明,本文方法符合微地图精度低、内容少的特点,质量评价结果与实际更为符合。相较于模糊综合评价法,本文将精度低,但内容与参考数据一致的微地图数据评价等级提升为优;相较于现有的线要素空间相似性评价法,本文将精度低,但根据用户需求制图,且有重要地标参与计算的微地图数据评价等级提升为良。本文方法对微地图数据有较强的适用性,为微地图道路网质量评价提供了可行方法。  相似文献   

9.
提出一种基于微分形态学断面的机载LiDAR点云数据滤波新方法。该方法由点云数据构建规则格网,去除粗差点;对构建的每一个格网进行多尺度分解,获取初始地面点及地物点;分别利用曲面逼近及微分形态学断面构建DTM(digital terrain model),通过阈值函数判别二者之间的残差,确定最终地面点。使用国际摄影测量与遥感学会提供的测试数据进行实验,并与8种经典滤波算法比较分析,表明该方法能够有效去除地物点和保留地面点,并降低总误差。  相似文献   

10.
互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。  相似文献   

11.
面向遥感大数据的地学知识图谱构想   总被引:1,自引:0,他引:1  
由于地球表面的时空异质性与复杂性,传统从遥感影像具有的信息特征出发,构建智能解译算法解决遥感地学认知的思路在应对面向全球的海量遥感大数据分析时,其精度和地学实用性已触及瓶颈.为此,本文从地学知识为核心的角度出发,结合当前知识图谱理论的发展,提出一种新的面向遥感大数据分析的地学思维构想——地学知识图谱.本构想将地学知识的...  相似文献   

12.
建筑物是城市环境中的主要地物类型,从高分影像等数据中自动提取建筑物对于提升土地利用变化检测、城市规划与土地执法等业务的质量与效率具有重要意义。本文针对现有建筑物提取方法存在的边界提取不精确的问题以及采用手工特征表达图像信息的局限性,融合LiDAR数据与高分影像两种数据源的特征信息,提出一种基于SegNet语义模型的建筑物提取新方法。首先,对LiDAR数据预处理得到数字表面模型(DSM)、数字地形模型(DTM)、归一化数字表面模型(nDSM),利用高分影像NDVI值去除nDSM中部分树木点,得到结果影像nDSM_en;其次,分别获取LiDAR数据回波强度、表面曲率以及高分影像NDVI值 3个特征构建特征图像训练SegNet语义模型,利用训练得到的模型完成建筑物初始提取;最后,采用阈值法分割nDSM_en得到影像对象,利用影像对象约束建筑物初始提取结果,完成建筑物精提取。在以ISPRS 官方提供的标准数据集(数据采集的地理区域为德国Vaihingen,采集时间2008年7—8月)为样本的实验中,本文方法在像素层次的平均查全率、平均查准率和提取质量分别为96.4%、94.8%和91.7%;针对面积大于50 m 2的建筑物对象,上述3个指标均为100%。实验结果表明:本文提出与实现的建筑物提取方法更好地利用了反映建筑物与非建筑物本质差异的特征信息,有效地实现了2种数据源的相对优势互补,提高了建筑物的检测与提取精度。  相似文献   

13.
文本蕴含大量地理位置描述信息,有效融合地理关联信息以实现文本的精细定位是地理信息服务的难点。本文提出一种融合土地利用/覆被信息的描述地理位置的细粒度定位方法:在文本描述地理关联信息(地理位置实体、土地利用/覆被实体与空间关系)抽取、土地利用/覆被精细分类与地理位置粗粒度匹配定位的基础上,使用自然语言空间关系近似转换模型,确定地理位置的细粒度定位范围;基于土地利用/覆被实体及其周边精细分类信息,在该范围内检索匹配,确定地理位置的细粒度定位坐标。本文以野生亚洲象活动/肇事监测文本为例开展实验,并用匹配率与位置精度评价定位质量,结果表明:本文方法显著提升了地理位置的细粒度定位质量,实验精确匹配率(81.51%)、位置误差距离的均值(65.97 m)及其≤50 m的比例(70.50%)均优于国内主流在线地理编码与地名检索服务结合空间关系或其单独使用结果。该方法有助于完善地理位置定位方法体系、提升地理信息空间化质量,并可服务于野生动物活动/肇事监测预警等精细定位任务。  相似文献   

14.
城市空间扩展是衡量城市化进程的重要指标。本文以闽南金三角地区的福建省漳州市主城区作为研究区,选取2000、2006和2013年的Landsat遥感影像,利用IBI建筑指数分别提取了3个年份的建筑用地信息,然后对其变化进行GIS分析。结果表明,13 a间漳州市主城区面积净增13.69 km2,净增面积为2000年的66.9%。主城区主要沿交通主干道往西北方向呈带状和面状扩展。缓冲区分析表明,道路对主城区扩展起到很大的引导和促进作用。综合社会经济数据可知,主城区的城市扩展历程与第二产业的发展密切相关,属工业导向型的城市扩展模式。另外,城市人口的增加也起到了一定的促进作用,不同区位人口增长速率的差异,对城市扩展的方向也产生了一定的引导作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号