多源在线地理编码服务分类优化模型 |
| |
引用本文: | 廖薇薇,柳林,周素红,宋广文,李秋萍,刘凯.多源在线地理编码服务分类优化模型[J].热带地理,2018,38(2):255-263. |
| |
作者姓名: | 廖薇薇 柳林 周素红 宋广文 李秋萍 刘凯 |
| |
作者单位: | (1.中山大学地理科学与规划学院 综合地理信息研究中心,广州 510275;2.广州大学地理科学学院 公共安全地理信息分析中心,
广州 510006;3.辛辛那提大学地理系,辛辛那提 OH45221-0131,美国) |
| |
基金项目: | 国家自然科学重点基金项目(41531178);国家自然科学基金优秀青年基金项目(41522104);广东省自然科学基金研究团队项目(2014A030312010);广东省科技计划项目(2015A020217003) |
| |
摘 要: | 利用在线地理编码API解决海量中文地址快速编码问题,在此基础上,利用简单的规则对编码结果进行清洗、标记,最后通过基于系统聚类与随机森林的分类优化模型,将多平台编码结果分类处理、优化。利用广州市盗窃案件地址对模型进行训练与验证,结果表明:相比未处理的编码结果,经模型优化过的编码结果整体位置误差距离减小。高德的地理编码服务有着最好的编码质量,但训练样本的高德编码误差均值仍高达590.43 m,经模型优化后,样本的编码误差均值降至173.73 m,验证样本编码误差均值由554.88 m(高德)降至180.04 m,降低了67.49%,高德90.08%的异常编码结果被清洗优化。对于训练样本与验证样本,模型优化效果相似;对于地址类型不同的案件、位于市区与市郊的案件,模型优化效果相似,说明模型具有一定普适性。该模型能够方便快捷地将海量社会经济信息转化为空间数据,提高编码精度,为地理大数据的研究提供更好的数据支持。
|
关 键 词: | 在线地理编码 数据清洗 系统聚类 随机森林 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《热带地理》浏览原始摘要信息 |
| 点击此处可从《热带地理》下载免费的PDF全文 |
|