排序方式: 共有24条查询结果,搜索用时 609 毫秒
11.
提出并实现了一种中文姓名信息提取方法,该方法首先根据姓氏和名的用字概率信息,将姓氏作为抽取的触发条件,在文本中初步提取姓名。然后再充分利用中文姓名的上下文信息及姓名用字之间的关联程度的信息,选取特征作为决策树测试的属性列表,并将初步提取出来的姓名是否是真实姓名(bool型的值:yes或no)作为决策树要预测的目标属性,组建基于ID3算法的决策树进一步提取出正确的姓名,实验结果表明,该方法具有很好的召回率和准确率。 相似文献
12.
文本蕴含大量地理位置描述信息,有效融合地理关联信息以实现文本的精细定位是地理信息服务的难点。本文提出一种融合土地利用/覆被信息的描述地理位置的细粒度定位方法:在文本描述地理关联信息(地理位置实体、土地利用/覆被实体与空间关系)抽取、土地利用/覆被精细分类与地理位置粗粒度匹配定位的基础上,使用自然语言空间关系近似转换模型,确定地理位置的细粒度定位范围;基于土地利用/覆被实体及其周边精细分类信息,在该范围内检索匹配,确定地理位置的细粒度定位坐标。本文以野生亚洲象活动/肇事监测文本为例开展实验,并用匹配率与位置精度评价定位质量,结果表明:本文方法显著提升了地理位置的细粒度定位质量,实验精确匹配率(81.51%)、位置误差距离的均值(65.97 m)及其≤50 m的比例(70.50%)均优于国内主流在线地理编码与地名检索服务结合空间关系或其单独使用结果。该方法有助于完善地理位置定位方法体系、提升地理信息空间化质量,并可服务于野生动物活动/肇事监测预警等精细定位任务。 相似文献
13.
近些年来,人机对话系统作为自然语言处理的重要问题之一受到了越来越多的关注.基于大数据的深度学习的方法在对话系统中被广泛应用.本文首先介绍了人机对话系统的研究背景,然后以基于多轮交互的对话系统为例,着重介绍了任务型和非任务型对话系统的主要类型和目前的研究进展,并对评估对话系统的主要方法进行了概述.最后,结合当前研究现状,对多轮交互的人机对话系统的研究方向进行了展望. 相似文献
14.
全球水冲突问题研究进展与热点的可视化分析 总被引:1,自引:1,他引:0
水冲突是发生在国家、州(省)、团体等不同利益主体之间关于水资源获取的矛盾。冷战以来,水冲突相关事件的总体烈度下降,事件数量大幅增长;与此同时,水冲突问题的研究也开始获得广泛关注,研究热度快速提升。水冲突问题关系到区域安全和可持续发展,有必要对相关研究进行梳理。为此,利用非监督机器学习、空间分析以及数据可视化方法,对国内外水冲突相关研究进行梳理,统计了相关研究的空间结构,构建了研究文献语料库,归纳了水冲突研究的主要热点议题。发现:水冲突相关研究具有明显的空间异质性,且不同的议题在时间上呈现不同的演进趋势;水冲突相关研究的主要议题包括:水冲突成因、水冲突分析方法与模型、水冲突解决机制、气候变化对水冲突的影响,以及水霸权主义与国际水法等。 相似文献
15.
网络文本蕴涵地理信息抽取:研究进展与展望 总被引:1,自引:0,他引:1
互联网的普及产生了大量蕴含着丰富地理语义的文本,为地理信息的深度挖掘和知识发现带来了巨大机遇。同时,蕴含地理语义文本的异构性和动态性,使得地理实体的属性数量和种类激增、地理语义关系复杂,对地理信息检索、空间分析和推理、智能化位置服务等提出了严峻的挑战。本文阐述了网络文本蕴含地理信息抽取的技术流程,从地理实体识别、地理实体定位、地理实体属性抽取、地理实体关系构建、地理事件抽取5个方面总结了网络文本蕴含地理信息抽取的进展和关键技术瓶颈,分析了可用于网络文本蕴含地理信息抽取的开放资源,并展望了未来的发展方向。 相似文献
16.
全球气候变化加剧了海洋环境灾害的影响力与破坏力,实时灾情信息获取与分析成为灾害应急处置中的关键环节。与具有延迟性的传统对地观测网络相比,基于互联网的众包地理信息以其实时性在受灾情况评估与灾害应急处置中得到广泛重视。为获取互联网文本中隐含的海洋环境灾害信息,探究灾害对人群行为活动的影响,本文着重关注海洋环境灾害发展的时空过程特性,从灾害链的角度分析灾害发生发展过程中所涉及的诸多要素,在收集整理海洋环境灾害相关知识的基础之上,采用五元组(概念、关系、属性、规则和实例)进行本体的逻辑结构表达,构建了用于信息抽取的海洋环境灾害链本体,其包含描述海洋环境灾害知识体系的海洋环境灾害本体、受到海洋环境灾害作用的地理对象本体以及在灾害发生、发展、结束的时空过程中产生的相应的人类应急处置本体。最后,本文以台风灾害为例,通过台风灾害链知识建模,实现互联网灾害信息抽取与时空变化过程分析。结果表明:基于海洋环境灾害链的互联网文本信息抽取可以获取隐藏在互联网文本中的灾害描述信息,能够分析灾害的发展变化过程及其对人群行为活动的影响,为灾害防治与应急救援提供一定科学支持。 相似文献
17.
随着我国城市化进程的加快,城市内涝灾害愈加频繁,人民的生命和财产安全受到了严重的威胁。然而,城市内涝灾害在愈加频繁的同时,产生了诸如信息获取不及时、制图时效性低、地图信息冗余等问题,难以为救援提供及时响应。基于此,本文提出了一种面向城市内涝场景下的微地图制作方法。首先,调用微博API获取任意时间段内特定主题下的社交媒体文本数据,对数据进行清洗与预处理;接着,选取BiLSTM-CRF模型提取社交媒体中有关城市内涝的地名地址信息;然后,结合Dijkstra算法为用户推荐避开危险路段的最优路径;最后,结合灾害信息与实际场景,制作城市内涝场景下的微地图。实验结果表明:(1)该方法能够有效识别城市内涝点,总体准确率达到92.7%;(2)对比官方发布的积水点,本文提取的积水点与官方积水点大部分重叠,能够有效为传统监测方法提供补充信息;(3)根据所得内涝点生成道路网级别的城市内涝地图,能够克服在海量地理空间信息中可视化冗余的不足,即有效缓解地理信息冗余的问题。由此可知,实时显示城市内涝信息,能够为用户掌握灾害现场的信息提供便利,调动他们参与制作微地图的积极性。与此同时,结合最优路径推荐,能够提高灾害... 相似文献
18.
地名地址是实现跨部门业务协同和实现数据共享的关键纽带,本文通过分析各部门地名地址数据情况,提出数据库设计优化方案,运用自然语言处理等技术,研究并实现了一种多源地名地址数据治理技术方案,构建了标准统一、要素丰富、空间精准的地名地址库。 相似文献
19.
栅格类图表包含了丰富的时空含义,文本信息是其知识特征的主要体现。提出一种基于文本解析的栅格类图表知识抽取方法。首先,通过CRAFT+CRNN的方法,进行图表文本信息的定位与矢量化;其次,在分析大规模样本数据的基础上,解析了常见图表数据的结构特征,并提出采用模板和机器学习2种方法进行文本块的结构类别判断;最后,利用自然语言处理方法,构建栅格类图表的知识标签体系。实验表明,该方法在栅格类图表的文本定位矢量化、文本块的结构判断等方面具有较高的准确率,能够进行栅格图表的知识标签体系构建,抽取图表中包含的知识,为海量数据的快速检索和理解提供支撑。 相似文献
20.
面向旅游社交媒体大数据的分析和挖掘,该文提出一种旅游领域多主题情感词典的构建方法:首先,通过自然语言处理、机器学习,快速提取景区评价数据中旅游主题及其情感倾向,然后基于旅游多主题字典定义覆盖景区9类主题及细粒度种子主题词,最后针对景区情感倾向分析问题,根据词共现模型筛选与主题词典构成搭配的情感词,构建面向旅游领域的多主题情感词典.以海南省A级景区为例,基于上述构建的旅游领域多主题情感词典和景区网络关注度计算结果,对游客评论文本进行信息挖掘,并进一步结合GIS时空数据挖掘及网络关注度分析等方法,分析研究区域旅游景区游览信息的时空分布特征.结果表明,该文方法能有效监测景区各项主题的好评程度时空变化,验证了该方法的实用性和有效性. 相似文献