首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文文本中时间信息抽取及规范化方法
引用本文:宋国民,张三强,贾奋励,姜松言.中文文本中时间信息抽取及规范化方法[J].测绘科学技术学报,2019,36(5).
作者姓名:宋国民  张三强  贾奋励  姜松言
作者单位:信息工程大学,河南郑州450001;信息工程大学,河南郑州450001;69340部队,新疆伊犁835000
基金项目:国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金
摘    要:时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。

关 键 词:中文文本  时间  信息抽取  规范化  时间表达式  正则表达式  时间推理
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号