地名地址基因的网页文本地名地址提取算法 |
| |
作者姓名: | 杜中波 刘新 宋婷婷 梁冰 周新宇 |
| |
作者单位: | 山东科技大学测绘科学与工程学院,山东青岛,266590;山东科技大学测绘科学与工程学院,山东青岛 266590;山东科技大学山东省基础地理信息与数字化技术重点实验室,山东青岛 266590;中国测绘科学研究院,北京,100036;北京市西城区规划管理信息中心,北京,100035 |
| |
基金项目: | 测绘地理信息公益性行业科研专项;中国测绘科学研究院基本科研业务费专项;西城区科技项目 |
| |
摘 要: | 针对网页文本蕴含着丰富的地名地址空间信息,但因其描述的随机性、多样性,导致信息很难被快速、准确地识别出来的问题。该文在分析网页文本中地名地址组成特点的基础上,考虑地名地址的事件属性,提出了一种基于"地名地址基因"的信息提取方法,依据事件相关度、地名地址的字符长度等提取因子建立提取规则树获取目标地名地址。实际数据测试表明该方法在地名地址提取上更具针对性,提高了效率和准确率。
|
关 键 词: | 地名地址基因 网页信息 事件属性 规则树 |
本文献已被 CNKI 万方数据 等数据库收录! |
|