首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于不确定性的大样本集抽样设计
引用本文:柳闻仪,张景雄,刘福江.基于不确定性的大样本集抽样设计[J].地理信息世界,2016(5).
作者姓名:柳闻仪  张景雄  刘福江
作者单位:1. 武汉大学 遥感信息工程学院,湖北 武汉,430079;2. 武汉大学 测绘学院,湖北 武汉,430079;3. 中国地质大学 武汉 信息工程学院,湖北 武汉,430074
基金项目:参与国家自然科学基金项目(41471375,4140011312)
摘    要:本文研究是针对全球森林覆盖变化检测系统的大训练样本选择的优化问题。样本自动标记系统自动标记了"千万个"代表森林和非森林的像元。为了提高精度和效率,我们需要从千万个样本的大样本集中选择对训练分类器有益的样本。本文提出了两种方法:第一种方法是传统的分层等距离采样;第二种方法是基于不确定性的样本优化,通过研究相同样本间的相似性度量指标、样本不确定性度量指标及样本特征空间分布,来实现基于不确定性的训练样本选择策略。实验通过精度评价验证了基于不确定性的采样策略能比传统的分层等距离采样策略获得好的效果。

关 键 词:抽样  支持向量机  训练样本  不确定性  遥感影像分类

Sampling Design for the Large Sample Set Based on Uncertainty
Abstract:The research aims at solving the problem about optimizing large training sample set in global vegetation-classification system. Tens of millions of samples representing forests and non-forests are labeled by automatically training samples procedure. In order to improve the precision and efficiency, key samples should be picked up and this has a large contribution to prediction. Two methods have been put forward in this paper: stratified system sampling strategy and uncertainty-based sample set optimization. The latter one selects training samples based on uncertainty by examining the uncertainty measure of samples and the spatial distribution of their features. Through precision evaluation, the experiments validated that the uncertainty-based sampling strategy can achieve better results than the stratified system sampling strategy.
Keywords:sampling  SVM  training samples  uncertainty  remote-sensing image classification
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号