排序方式: 共有26条查询结果,搜索用时 0 毫秒
1.
2.
科技名词中文译名标准化和规范化工作是推动我国科技进步和科学知识传播的重要基础。新的科学概念和技术名词层出不穷,如何及时发现并确定新生术语的中文译名是一项普遍的社会需求。介绍了一套全新的天文学英语新词自动提取系统。该系统综合使用脚本过滤、术语识别、正则表达匹配等多种方法,能够自动追踪Ar Xiv论文数据库的更新,分析天文学论文的内容,生成推荐术语列表,从而将学科专家从繁重的科技新词收集整理工作中解放出来,把有限的精力集中到更能体现专业素养的新词审定工作当中。这个系统将为推动天文学等基础学科的新词收集,乃至学科标准化等工作发挥积极作用。 相似文献
3.
文本理解是人工智能的一个重要分支,其技术推动了人与计算机之间在自然语言上的有效交互.为了让计算机准确地理解和感知文本数据,文本特征提取是最为基础和关键的步骤之一.基于此,本文介绍文本特征提取研究的发展历史,以及近年来主流特征提取的方法,并对未来的研究方向进行展望.首先,介绍语义最底层的词级表示;接着,总结在词级表示基础上衍生出的句级表示上的研究进展;随后,介绍比词级表示和句级表示更高层的篇分析;最后,通过文本特征提取的一个典型应用——问答系统的介绍,阐述文本特征提取的最新方法和技术在问答系统上的应用,并对未来的研究方向做了展望. 相似文献
4.
5.
设计了一种基于自然语言处理和分层匹配的地理信息服务语义发现框架,实现用户输入关键词与地理信息服务的语义匹配。框架基于Word Net知识库,利用消歧技术确定所提取词汇的含义;根据所提取的信息来源以及相关关系将地理信息服务上下文划分为6个信息层匹配,并使用遗传算法确定各信息层在匹配过程中具有的权重。最后将所提出的发现方法与常用的发现方法做实验验证,结果表明该方法可以提高地理信息服务语义发现的查准率。 相似文献
6.
知识图谱是形式化描述实体及其相互关系的知识系统,其在应急救灾、时空预测决策等方面发挥着重要的作用.灾害应急领域面临数据骤增而应急关键知识匮乏问题,由此从灾害链角度分析地质灾害发展过程中关联的诸多要素,提出了一种自顶向下和自底向上结合的地质灾害链知识图谱构建方法 .首先,基于灾害链角度对地质灾害间复杂形成机理及成链规律进行分析,在已有地质灾害知识基础上,基于自顶向下方法建立了统一的用于信息抽取的地质灾害链本体语义表达框架,包括描述地质灾害知识体系的地质灾害事件本体、承载地质灾害发生的地质环境本体、受地质灾害作用下的地理对象本体及地质灾害在灾前、灾中和灾后时空过程中对应的应急处置方法本体;其次,结合自底向上方法构建数据层,通过知识融合、知识存储对概念、实例与属性等要素及其关联关系进行识别;最后以汶川地震为例并对知识图谱进行可视化表达.结果表明,本方法能有效地对四类要素及其关系进行识别,实现了数据-信息-知识的转换,为地质灾害领域的知识图谱构建提供技术参考. 相似文献
7.
8.
基于空间语义角色的自然语言空间概念提取 总被引:5,自引:1,他引:4
根据空间信息的特点,从定义的空间语义角色入手,通过语义角色标注、短语识别以及概念模式匹配等手段,具体分析了自然语言中的空间实体、实体间空间关系以及空间过程的表达与提取方法。 相似文献
9.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。 相似文献
10.
流动人口的职住情绪能够反映其工作与生活状态。本研究首先基于2017年北京市微博大数据,利用jieba分词结合人工筛选得到流动人口发布的微博文本;其次,对Roberta-wwm-ext-large模型进行迁移学习识别北京全人群与流动人口的微博情绪;然后,结合POI数据与微博发布时间得到流动人口的职住分布;最后,基于微博情绪与职住分布得到流动人口的职住情绪,利用Getis-Ord Gi*挖掘职住情绪的空间聚集模式,采用地理探测器分析影响职住情绪热点分布的因素。实验表明,北京流动人口情绪均值(0.56)稍低于北京全人群(0.57)(P<0.01),但整体表现为积极;从空间分布来看,流动人口在东、西城区情绪均衡,西北部科技创新区情绪相对于流动人口情绪均值较为低落,而东南部中心商务区、文化交流区及国际化社区情绪较高涨;从情绪与职住的关系来看,流动人口的工作情绪与从事的工作类型有关(q=0.03,P<0.05),高新技术产业园、工业园、物流产业园的流动人口从业人员的工作情绪相对于流动人口工作情绪均值较为消极,健康产业园、文化创意产业园、农业园的流动人口从业人员的工作情绪较积极;流动人口的居住情绪与居住环境有关(q=0.06,P<0.1),居住在远郊区的流动人口情绪相对于流动人口居住情绪均值较为消极,居住在近郊高密度的流动人口情绪较为积极。因此,相关部门应重点关注从事高新技术产业、工业、物流产业的流动人口以及居住在远郊区的流动人口。 相似文献