首页 | 本学科首页   官方微博 | 高级检索  
     检索      

多源在线地理编码服务分类优化模型
引用本文:廖薇薇,柳林,周素红,宋广文,李秋萍,刘凯.多源在线地理编码服务分类优化模型[J].热带地理,2018,38(2):255-263.
作者姓名:廖薇薇  柳林  周素红  宋广文  李秋萍  刘凯
作者单位:(1.中山大学地理科学与规划学院 综合地理信息研究中心,广州 510275;2.广州大学地理科学学院 公共安全地理信息分析中心, 广州 510006;3.辛辛那提大学地理系,辛辛那提 OH45221-0131,美国)
基金项目:国家自然科学重点基金项目(41531178);国家自然科学基金优秀青年基金项目(41522104);广东省自然科学基金研究团队项目(2014A030312010);广东省科技计划项目(2015A020217003)
摘    要:利用在线地理编码API解决海量中文地址快速编码问题,在此基础上,利用简单的规则对编码结果进行清洗、标记,最后通过基于系统聚类与随机森林的分类优化模型,将多平台编码结果分类处理、优化。利用广州市盗窃案件地址对模型进行训练与验证,结果表明:相比未处理的编码结果,经模型优化过的编码结果整体位置误差距离减小。高德的地理编码服务有着最好的编码质量,但训练样本的高德编码误差均值仍高达590.43 m,经模型优化后,样本的编码误差均值降至173.73 m,验证样本编码误差均值由554.88 m(高德)降至180.04 m,降低了67.49%,高德90.08%的异常编码结果被清洗优化。对于训练样本与验证样本,模型优化效果相似;对于地址类型不同的案件、位于市区与市郊的案件,模型优化效果相似,说明模型具有一定普适性。该模型能够方便快捷地将海量社会经济信息转化为空间数据,提高编码精度,为地理大数据的研究提供更好的数据支持。

关 键 词:在线地理编码  数据清洗  系统聚类  随机森林  
本文献已被 CNKI 等数据库收录!
点击此处可从《热带地理》浏览原始摘要信息
点击此处可从《热带地理》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号