中文文本中时间信息抽取及规范化方法 |
| |
作者姓名: | 宋国民 张三强 贾奋励 姜松言 |
| |
作者单位: | 信息工程大学,河南郑州450001;信息工程大学,河南郑州450001;69340部队,新疆伊犁835000 |
| |
基金项目: | 国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金 |
| |
摘 要: | 时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。
|
关 键 词: | 中文文本 时间 信息抽取 规范化 时间表达式 正则表达式 时间推理 |
本文献已被 CNKI 万方数据 等数据库收录! |
|