首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。  相似文献   

2.
解析文学作品中的空间信息并进行空间可视化分析,为文学研究提供了一个新的视角,对于理解文学作品具有重要的参考价值。本文尝试利用2类方法解析古诗词文本空间信息,即“基于古今地名关系的明确定位法”和“方位推测定位、近似替代定位、时空推测定位等近似地名定位方法”;设计了能表达古诗词作者、诗词文本、诗词地名和相关地理空间信息的数据库,以唐李白诗词为例,收集诗词967首,对其中563首的创作地、所描述的地名或景观进行了空间定位,初步建成了诗词地理数据库。在GIS中,对于李白诗词创作的地点、诗词中描述的地名及作者联想到的地名等位置信息进行地理制图,并归纳分析其空间分布特征,能清晰展现李白的创作空间和诗词文本表征的空间分布格局。研究表明:应用GIS技术对文学作品进行空间分析是可行的,从地理空间视角研究古诗词等文学作品具有重要价值。  相似文献   

3.
地理学是一门研究各种地理要素的时空分布、演化过程,以及相互作用机制的综合性学科。随着现实世界从二元空间向三元世界的演进,对地理信息内涵的理解、表达和挖掘亟待进一步加深与扩展。现有以“位置+几何+属性”的地理信息表达模式难以支撑各种地理要素及其规律的表达。本文从地理学视角出发,立足三元世界理念,梳理了信息要素及其转变成地理信息的过程,形成了以时间、地点、人物、事物、事件、现象和场景“七要素”的信息表达体系,并从地理语义、空间位置、几何形态、属性特性、要素关系、演化过程、作用机制7个地理维度上对其进行解读。实现了地理学视角下对地理信息内涵的全方位分类和描述,为面向地理学综合集成研究的地理信息多维描述与计算分析提供理论支撑。  相似文献   

4.
日常生活中人们使用定性的自然语言描述地理实体,如何将定性描述的地理实体转换为定量的图形符号是空间认知、地图表达等领域面临的挑战。本文提出一种基于自然语言形态描述的地理实体表达方法,通过对自然语言中地理实体的语义信息进行分析,对自然语言描述的地理实体的形状、大小、分布状况等空间形态信息以地图形式进行近似表达。本文首先阐述了自然语言形态描述的定义与内涵,结合地图符号相关理论,研究了形态描述驱动的地理实体模拟表达策略,并对不同语义模糊度的地理实体图形表达进行了分析和实例设计,最后提出了一种计算空间实体相似性的方法对表达效果进行评估。结果表明,基于本文方法的地理实体模拟表达与手绘图中地理实体的平均相似度达到89.5%,与导览图的地理实体平均相似度达到86.86%,能够实现较好的表达效果,具有一定的科学性和可行性,为自然语言到地图语言的转换研究奠定了基础。  相似文献   

5.
网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本蕴含的地理实体关系分布稀疏,基于频率的方法难以直接应用于地理实体关系的关键词提取。为解决该问题,本文基于公开访问的网络资源,提出一种语境增强的关键词提取方法。首先,基于在线百科和开放的同义词词典,通过语境合并和语义融合创建增强的语境,以降低语境中词语的稀疏性。接着,Domain Frequency和Entropy频率统计方法从增强语境中自动构建一个大规模语料。然后,基于该语料选择词法特征并统计其权值,用于扩大语境中词语间的差异。最后,使用选择的词法特征度量增强语境中词语的重要性,将权值最大的词语作为描述地理实体关系的关键词,并基于大规模真实网络文本开展实验。实验结果表明:对于地理实体关系的关键词识别,本文方法的平均精度为85.5%,比Domain Frequency和Entropy方法分别提高41%和36%;对于新增关键词识别,本文方法的精度达到60.3%。语境增强的关键词提取方法能有效地处理地理实体关系分布的稀疏性,可服务于网络文本蕴含地理实体关系的抽取。  相似文献   

6.
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用“本体知识”、“事实知识”和“同义词知识”构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的“Stanford OpenIE”工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。  相似文献   

7.
随着遥感数据网、传感网、物联网和人工智能的发展,逐渐形成空天地海立体化、集成化和一体化的地理空间传感网。地理空间传感网感知资源呈现出多源、异构和分散的特征,面向多层次用户个性化、即时化和智能化应用需求,存在异构资源共享管理、多协议实时接入、时空无缝感知、自动化感知和精准预测等技术挑战。静态地理信息服务由于无法提供鲜活的地理信息,难以满足地理事件的综合监测、决策预警和聚焦应用需求,急需发展地理空间传感网融合服务技术和实时动态地理信息服务平台。本文围绕信息物理网环境下空天地海观测平台的观测高效共享和融合服务问题,提出了传感网观测共享信息模型和点面观测协同无缝重建模型,突破了观测在线接入、集成管理、星地融合、时空预测和聚焦服务等地理空间传感网融合服务关键技术,研制了包含“感—联—知—控”等功能的传感网时空信息网络感知服务系统GeoSensor,介绍了GeoSensor在流域、海洋和城市等典型应用。未来将进一步发展“人—水—城”智能感知认知理论,突破“空天地海人”群智感知、空间智能和认知服务技术,开展长江经济带应用。  相似文献   

8.
脆弱水印可以实现对数据内容真实性的认证,并对发生变化的位置进行定位,鉴此,本文提出了一种点约束分块的矢量地理数据精确认证算法。在认证内容嵌入过程中,首先,按照点约束的方法对矢量地理数据进行分块,并将每块的数据点进行空间位置关系的“之字形”排序,建立数据点之间的位置关系;然后,将相邻点生成的脆弱水印信息嵌入到当前点。在内容精确认证时,比较原始的水印信息与提取的水印信息,判断二者是否相同来鉴别数据是否更新。将本文算法与均匀分块的方法进行了对比实验,结果表明,本文提出的认证算法能实现在数据更新时的精确认证,并可实现要素删除的精确认证,在检测数据变化时可对修改位置进行定位与标记。  相似文献   

9.
在大数据时代,高分辨率对地观测技术实现了对地球表层地理现象和地理过程最为真实、量化、全面覆盖又快速更新的数据化记录,可为地理空间认知研究的新发展奠定时空信息聚合与挖掘计算的基准。地理图斑是影像空间映射到地理空间中对于地理实体的抽象化表达,是构建地理场景和承载地理空间各类信息进而开展模式挖掘的最小单元。本文以地理图斑为基本对象,通过分析其中视觉模拟、符号推测等几类机器学习的协同计算机制,从空间、时间与属性等维度构建了集“分区分层感知”、“时空协同反演”、“多粒度决策”三者于一体的地理图斑智能计算模型,并以在贵州息烽县、广西江州区开展的农业种植结构制图与规划决策为应用案例,探索了地理图斑分布、生长以及功能3种模式的挖掘方法,并进一步设计了动态视角下开展图斑动力模式挖掘的研究思路。  相似文献   

10.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

11.
网络文本蕴含大量隐式地理空间信息,为地理知识获取与知识服务提供了巨大潜能。地理知识图谱是将传统地理信息服务拓展到地理知识服务的关键,也是网络文本蕴含地理信息采集与处理的终极目标。本文系统评述了开放地理语义网、开放地理实体及关系抽取、地理语义网对齐、知识图谱存储方法等地理知识图谱相关主题的研究进展,从网络文本蕴含地理空间信息量与质量评价、地理信息语义理解、空间语义计算模型和异构地理语义网对齐等方面剖析了目前亟需解决的关键科学问题。  相似文献   

12.
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不断涌现新的关系实例,要求语料库及时更新以覆盖更丰富的关系实例。手工构建和更新语料库成本高昂,亟需一种快速构建大规模地理实体关系语料库的方法。本文提出一种基于回标技术的地理实体关系语料库构建方法。首先,参考地理实体分类标准与语义关系、空间关系分类标准,针对地理实体关系的自然语言描述习惯,建立地理实体关系的标注体系;然后,结合精确匹配与模糊匹配策略,提高客体匹配的覆盖率;接着,基于优序图法建立句子打分规则,实现种子三元组到句子映射的定量评价;最后,使用中文百度百科文本验证方法的有效性。实验结果显示,本文方法平均回标成功率为67.83%,关系标注的准确率为76.36%。相比人工构建空间关系标注语料库的过程,本文提出的语料自动构建方法,标注速度快,规模大,为自动扩充标注语料库提出了可行方案。同时,该方法兼顾了地理实体间的语义关系和空间关系,且关系类型不受限,可用于开放式关系抽取任务。  相似文献   

13.
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建。针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型。ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果。在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升。因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法。  相似文献   

14.
耕地地块作为精准农业的重要支撑,现有地块边界大多依靠人工勾绘。随着遥感技术的发展,基于遥感影像自动提取耕地地块成为研究主要方向,其中基于深度学习的方法能够克服传统检测方法难以适应复杂场景的局限而被广泛使用,但现有检测方法仍存在问题,基于深度卷积模型直接识别耕地区域会丢失内部边界、而基于边缘检测模型识别耕地边界时则会同时得到大量无关边界;此外,现有的基于阈值提取地块的策略所提取的地块不够规整,存在内陷的问题。针对上述问题,本研究提出一种基于深度卷积网络和分水岭分割的耕地地块提取方法,从信息检测和地块提取两方面进行改进:① 将耕地边界视作一种地物类别,在深度卷积网络中进行类别概率检测,帮助实现对耕地边界的语义识别。② 基于改进后的D-LinknetXt网络进行检测,其网络架构适合于对耕地边界这类线性目标的提取,同时更换原始D-Linknet网络的残差单元,帮助提高了网络的特征提取能力。③ 基于分水岭分割对耕地地块进行提取,利用了区域分割方法获取边界的封闭性,并且这种以区域为单元进行分割并合并的方式,解决了原有方法在像元尺度上基于阈值提取所遇到的提取地块存在内陷的问题,使地块更规整准确。在一景高分二号影像上进行检验,并设计两类精度指标,从全局边界精度和地块几何精度两方面进行方法性能评估。实验结果表明,本方法的精度优于3种对比方法,在代表边界精度的F1分数上达到了0.933,地块几何精度为0.829。本研究所提出的方法能够更加准确的对耕地地块进行提取,并适用于实际应用中。  相似文献   

15.
针对高空间分辨率遥感影像目标提取中定位精度低、边缘粗糙等问题,提出一种融合目标边缘特征与语义信息的人工坑塘提取网络模型。方法首先利用改进的U-Net语义分割网络模块来提取遥感影像中丰富的目标语义信息,然后拓展上述语义分割网络构建边缘提取子网络来获取遥感影像的多尺度边缘特征,最后借助于编码-解码子网络融合边缘特征与语义信息,实现遥感影像目标的精准提取。将该方法运用到雷州半岛复杂背景条件下人工坑塘提取实验中,实验结果中本文提出的方法在F分数以及边界F分数等评价指标上表现最优,达到97.61%与83.01%,验证了融合高层语义信息结合低层的边缘特征在提升遥感目标提取精确度上的有效性。  相似文献   

16.
随着遥感影像分辨率的提高,植被信息的高精度提取对于了解地表植被变化规律、评价生态区域具有重要意义。针对传统方法跨季节植被提取不完整问题,本文基于高分2号(GF-2)卫星数据,提出一种基于特征分离机制的深度学习语义分割网络植被提取方法。该网络在Densenet的基础增加可分离卷积和空间金字塔结合的特征分离机制来增大感受野,更有效利用植被的特征信息,提升了模型的精度。本文通过构建高精细跨季节植被样本库,使用本文所提方法,完成了遥感影像植被信息提取,并选取总体准确度、F1值和交并比作为评价指标,对不同的传统方法和深度学习方法进行精度对比与分析。实验结果表明,本文方法提取植被的效果较好,其中F1分数达到91.91%,总体准确度达到92.79%,交并比达到85.10%。对高分1号、高分6号和高景1号遥感影像进行植被提取通用性验证,结果表明本文方法具有一定的通用能力,可以从高分辨率遥感影像中准确地、自动地提取植被。本文研究成果可为城市生态环境评价和植被的应用研究提供数据参考。  相似文献   

17.
位置预测技术可以提前预知用户下一时刻的位置,在基于位置的服务(Location-based Service,LBS)领域中发挥着极其重要的作用。现有的位置预测技术大多仅使用用户的地理轨迹,仅使用地理轨迹挖掘出来的用户移动模式易受地理特性的限制缺乏深层次的语义信息。本文基于某商场群体用户的室内轨迹数据和语义信息预测用户下一个时刻语义位置。语义位置预测包括停留区域识别、停留区域语义匹配、语义位置建模。在停留区域识别阶段,为减少室内停留时间不固定对停留区域识别的影响,本研究提出了一种新型的时空凝聚层次聚类算法(Spatial-Temporal Agglomerative Nesting, ST-AGNES),该算法具有思想简单、超参数少、自动生成聚类个数等优点。在语义匹配阶段,引入了吸引度规则,充分利用停留区域所有轨迹点与室内高密度的商铺名称信息做匹配。最后,采用长短型记忆神经网络模型(Long Short-Term Memory,LSTM)挖掘群体用户的语义位置模式并预测用户未来的语义位置,实验预测正确率达到61.3%。  相似文献   

18.
微博中蕴含台风灾害损失信息识别和分类方法   总被引:1,自引:0,他引:1  
社交媒体在灾害信息的实时发布与传播中发挥着越来越重要的作用。在灾害发生过程中,社交媒体中蕴含的实时灾损信息对灾情及时响应和评估有重要意义。然而,这些涉灾文本具有信息破碎度高、文本特征稀疏、标注语料库匮乏等缺点,使得传统的基于监督学习的方法难以有效提取其中的灾损信息。为此,本文提出了一种通过扩展上下文特征和匹配特征词的方法来快速识别和分类社交媒体中蕴含的不同类别的灾损信息。本方法首先基于中文语法规则,抽取小规模不同灾损类别下微博文本中的涉灾关键词构建特征词搭配对。然后,利用词向量模型和已有词库对这些特征词搭配对进行补充和扩展。同时,根据中文词语共现规则,引入外部语料库优化特征词间的语义搭配关系。最终,以此为基础构建台风灾损分类知识库对灾情文本中蕴含的不同类别灾损信息进行识别和分类。本文以2016年9月15日台风“莫兰蒂”登陆事件作为研究案例,以评估本文方法在灾损信息识别和分类上的效果。结果表明,本文方法对微博文本中蕴含的不同类别风灾损失信息的识别和分类效果显著(各类别综合评价指标都达到了0.74以上)。基于灾损信息分类结果,本文绘制了台风影响的时空分布图,从而进一步说明本文方法在灾害损失评估和减灾救灾方面的效用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号