排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
利用在线地理编码API解决海量中文地址快速编码问题,在此基础上,利用简单的规则对编码结果进行清洗、标记,最后通过基于系统聚类与随机森林的分类优化模型,将多平台编码结果分类处理、优化。利用广州市盗窃案件地址对模型进行训练与验证,结果表明:相比未处理的编码结果,经模型优化过的编码结果整体位置误差距离减小。高德的地理编码服务有着最好的编码质量,但训练样本的高德编码误差均值仍高达590.43 m,经模型优化后,样本的编码误差均值降至173.73 m,验证样本编码误差均值由554.88 m(高德)降至180.04 m,降低了67.49%,高德90.08%的异常编码结果被清洗优化。对于训练样本与验证样本,模型优化效果相似;对于地址类型不同的案件、位于市区与市郊的案件,模型优化效果相似,说明模型具有一定普适性。该模型能够方便快捷地将海量社会经济信息转化为空间数据,提高编码精度,为地理大数据的研究提供更好的数据支持。 相似文献
2.
基于犯罪空间分异和建成环境的公共场所侵财犯罪热点预测 总被引:2,自引:0,他引:2
机器学习是当前犯罪热点预测的主流方法,随机森林算法因需要的数据量较小、有较好的预测能力和预测精确度、且有较高的可理解度,更是被广泛应用,代表地理环境和建成环境的多源数据也被广泛用于模型改进的尝试实践中,但这些实践都只考虑研究区整体的预测精度变化情况,并未区分不同区域犯罪热点预测结果的差异及其原因。因此,本文以公共场所侵财犯罪为例,根据历史犯罪分布情况及过往犯罪热点分布规律,将研究区分为稳定高发热点网格、较高发热点网格、偶发热点网格及非热点网格这4类,并依据社会失序理论、日常活动理论和犯罪模式理论,选取城中村范围、路网密度及POI(餐饮、娱乐、商场3类设施)密度这3个具有代表性的协变量加入到随机森林预测模型中,探讨预测结果精度的变化情况。根据2017年26个双周的犯罪热点预测实验的预测结果,得到以下结论:加入协变量后,研究区整体、稳定高发热点网格及较高发热点网格的预测精度都有不同程度的提高,分区模型的精度显著高于整体模型的精度,说明考虑空间分异对提高模型精度起重要作用。 相似文献
3.
基于随机森林和时空核密度方法的不同周期犯罪热点预测对比 总被引:1,自引:0,他引:1
犯罪预测对于制定警务策略、实施犯罪防控具有重要意义。机器学习和核密度是2类主流犯罪热点预测方法,然而目前还鲜有研究对这2类方法在不同时间周期下的犯罪预测效果进行系统比较,本文试图对此进行补充。本文以2013-2016年5月的公共盗窃犯罪历史数据作为输入,分别对比了在接下来2周、1个月、2个月、3个月4个不同时间周期随机森林方法与基于时空邻近性的核密度方法的犯罪热点预测效果,结果发现:在各时间周期上,随机森林分类热点预测方法的面积和案件量命中率均比时空核密度方法准确性高;并且2种方法均能有效地识别犯罪热点中的高发区域,其中在较小范围较短时间内随机森林识别热点中的高发区效率更高,而在较大范围较长时间周期上时空核密度方法识别高发区更优。 相似文献
1