首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 187 毫秒
1.
蕴含地理事件微博客消息的自动识别方法   总被引:1,自引:0,他引:1  
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。  相似文献   

2.
道路等级不仅反映在路网结构的静态骨架信息上,也蕴含在轨迹数据呈现的动态语义信息上。为解决(OpenStreetMap)OSM路网部分路段及路网生成产品等级缺失问题,本文提出一种顾及路网与轨迹多模特征的道路等级分类方法。首先通过轨迹数据的清洗、地图匹配和基于路名的路网合并实现轨迹点与命名道路的联结;然后以命名道路为分析单元,综合考虑路网及轨迹数据,在系统分析路网结构的道路几何特征、道路分布特征、道路拓扑特征及道路单双向信息基础上,进一步挖掘与融合轨迹数据蕴含的道路宽度、道路车流量、道路速度等静动态特征,形成关于道路等级的描述特征集,作为识别道路等级的基础与依据;最后以随机森林(RF)为基本分类器进行特征选择及模型训练实现道路等级识别。为验证本文方法,选取武汉市汉正街区域及二环区域,基于OSM路网数据及众源轨迹数据开展试验。该方法取得了较好的分类结果,小范围汉正街区域的验证集准确率为91.2%,大范围二环区域的验证集准确率达到80.8%。与单类特征相比,集成路网与轨迹特征极大提高了道路等级分类准确率;与原始路段形式进行道路等级分类相比,以路名重构道路形式进行道路等级分类效果更好。  相似文献   

3.
车载LiDAR点云中包含地面、建筑物、行道树、路灯等丰富地物类别,自动对这些不同类别点云进行分类,对点云中目标的识别、提取及重建都具有重要意义。本文提出了一种基于Gradient Boosting的自动分类方法。该方法首先对车载激光点云进行数据预处理,然后计算点云的协方差矩阵、密度比、高程相关特征、局部平面特征、投影特征等,再计算点云特征直方图与垂直分布直方图,采用K-means方法对这两者分别进行聚类,并将其聚类类别值也作为特征,从而构建出20维的点云特征向量,应用Gradient Boosting分类方法进行自动分类。为了验证本文方法的有效性,从某城镇场景的车载激光点云数据中选取部分代表区域共144W点作为训练数据集,然后选取另一较大区域的点云共312W点作为测试数据集。使用训练好的分类器对测试数据集进行分类,分类结果总体准确率达到了93.38%,耗时631s,说明此分类方法具有较高的分类准确率,同时也具备较高的效率。  相似文献   

4.
特征优选与卷积神经网络在农作物精细分类中的应用研究   总被引:1,自引:0,他引:1  
农作物的精细分类一直是农业遥感领域的热点,对农作物估产和种植结构监管有重要意义。深度学习的出现为农作物分类准确性的提升提供了新的思路。本文提出一种特征优选与卷积神经网络(Convolutional Neural Networks, CNN)相结合的多光谱遥感农作物分类方法,用以解决精细分类问题。实验以哨兵2号遥感影像为数据源,基于多光谱遥感影像的波段反射率与包括归一化植被指数在内的10种植被指数,利用Relief F算法进行特征增强与优选,获取最优特征集,从而设计出基于特征优选的CNN分类方法,并对河南省原阳县主要农作物水稻、玉米、花生进行分类识别与制图,分类精度达到96.39%。同时,选用支持向量机、CNN方法分别对研究区农作物进行分类识别。对比分析3种方法的分类结果,发现本文提出的基于最优特征集的CNN农作物分类方法表现最优,CNN方法次之,支持向量机方法表现最差。实验结果表明:① 利用Relief F算法能够对特征贡献度进行排序,完成特征筛选,得到包含24个特征的最优特征子集,训练精度达到99.89%;② 基于最优特征集的CNN方法能够在最大程度上提取高精度差异性特征,实现对农作物的精细分类,且相比CNN和支持向量机的农作物分类方法,本文方法表现更佳。  相似文献   

5.
港口目标识别是海事船舶监管的重中之重,船舶自动识别系统(Automatic Identification System,AIS)所获取的船舶活动信息,可为港口目标识别提供高时相和高精度的船舶航行数据。为了探究AIS数据在港口目标识别中的应用,提出一种基于多源数据和船舶停留轨迹语义建模的港口目标识别方法。通过数据挖掘和语义信息增强构建船舶停留轨迹语义模型,识别船舶港口停留轨迹;建立基于随机森林的船舶停留方式分类模型,分类船舶泊位停留轨迹和船舶锚地停留轨迹,并利用空间逐级合并方法提取港口泊位和港口锚地;综合船舶泊位停留轨迹、道路、海岸线、水深、土地利用与土地覆盖等数据,顾及情景-领域知识实现港口目标识别。基于2017年96 790艘船舶的超8300万条AIS轨迹记录,应用本文方法识别南海研究区的港口目标。实验结果表明,本文方法对于船舶轨迹停留行为总体分类精度为0.9477, Kappa系数为0.8948。提取出南海研究区447个港口区域,与Google Earth影像叠加验证结果表明,提取结果均位于真实的港口影像内,相较于Natural Earth数据集中包含的南海区域24个港口点位,提取结果的完整性大大增强。因此,基于多源数据和船舶停留语义建模的港口目标识别方法对于港口目标识别具有较高的准确性和完整性。此外,该方法提取的港口区域可为基于遥感影像的港口目标识别提供靶区,从而提高大区域甚至全球范围内港口目标动态识别的效率。  相似文献   

6.
人口空间化数据能够将人口分布更精细地反映在地理空间中,可以为科学研究和政策制定提供更加精细的数据源。本文选取多源遥感数据和兴趣点作为影响环渤海地区人口分布的自变量因子,利用随机森林模型对环渤海地区进行分区密度制图,生成该地区2010年和2020年30 m人口空间化数据,并将结果与WorldPop数据集以及其他地区30 m研究成果进行对比。结果表明:① 本文模拟结果精度整体高于WorldPop数据集10%以上;② 相较于WorldPop数据集,本文人口数据能细致地描述环渤海人口分布的空间异质性;③ 与其他地区30 m研究成果相比,模拟精度也有所提升;④ 遥感建成区数据和兴趣点是环渤海地区人口分布的最重要指示性指标;⑤ 在环渤海地区人口估计方面,社会因素与人口分布有更高的相关性,映射人口分布的主要因素因地区而异。  相似文献   

7.
浮动车轨迹数据已逐渐成为城市交通状态识别的主要数据源之一,但是现有基于浮动车轨迹数据的交通状态识别中多数是应用高精度或是多源轨迹数据。针对稀疏轨迹数据在城市交通状态识别中存在识别精度不高的问题,本文提出一种结合戴维森堡丁指数(DBI)和轨迹相似性度量的动态交通状态划分方法。首先,对轨迹数据和路网数据进行预处理并且建立不同时间片的路段轨迹集合;接着,依据轨迹速度-空间相似性,利用戴维森堡丁指数动态地扩展轨迹的空间维度,并根据轨迹相似性度量方法构建最佳车辆队列;然后,将前后不同的车辆队列进行二次处理,连接组成交通流簇;最后,基于模糊C均值聚类方法将交通流进行划分,实现路段交通状态的识别。采用厦门市厦禾路、湖滨西路和湖滨南路交叉路段上的真实出租车轨迹数据进行测试,结果表明,本文所提方法保证了车辆队列速度分布与原始轨迹速度分布基本一致,相比对比方法Kmeans++和ST-DBSCAN,本文方法均方根误差平均下降了18.77%和21.22%,并且在不同的实验路段表现更加稳定,可有效、可靠地运用稀疏轨迹数据识别城市交通状态,进而实现城市交通状态的精细分析。  相似文献   

8.
为了解决多云雨地区遥感数据时空覆盖缺失的问题,以满足对地块尺度作物种植信息日益迫切的应用需求,本文在遥感图谱认知理论框架下发展了一种基于多星数据协同的地块尺度作物识别与面积估算方法。首先,基于米级高分辨率影像提取农田地块对象;其次,通过对多源中分辨率时序影像的有效化处理和指数计算,获取“碎片化”的高时空覆盖有效数据,并以地块对象为单元构建时间序列;然后,在时序分析基础上,建立多维特征空间,结合作物生长物候特征,构建决策树模型进行作物分类识别与面积计算;最后,以湖南省宁远县为研究区开展了水稻种植信息的提取实验。结果表明:本文方法可在农田地块尺度下实现不同水稻类型的准确识别及其种植面积的精细提取,早、中、晚稻的用户精度分别可达94.33%、90.76%和95.95%,总体分类精度为92.51%,Kappa系数为0.90;早、中、晚稻面积提取精度分别为93.37%、91.23%和95.42%。试验结果证明了本文方法的有效性,为其他作物种植信息的精细提取提供了借鉴。  相似文献   

9.
城市区域内部建筑物较密集,外围建筑物逐渐稀疏,因此大多存在内部区域POI数据密度大,外围区域POI数据密度逐渐减小的现象,在使用均等网格作为识别单元进行城市“三生空间”的识别的过程中,就会出现网格尺度较大导致识别准确率较低或网格尺度较小导致无数据区较多两种情况。针对以上问题,本研究提出一种基于POI数据及四叉树思想的”三生空间”识别方法:综合利用互联网地图POI、行政区划、遥感影像等数据,引入四叉树思想对网格识别单元进行分级;将POI数据与城市建设用地分类和土地利用现状分类进行衔接,对POI进行重分类;综合各类POI的功能和面积,构建POI分类“三生功能”赋分体系,定量识别“三生空间”。以西安市中心城区为实验区进行实例验证,结果显示正确率在95%左右。通过与均等格网识别结果的对比,进一步证明引入四叉树思想对网格进行分级一方面能有效减少无数据区的存在,另一方面能使识别结果准确率大幅提高,为基于POI数据的城市三生空间的识别提供了一种新思路。  相似文献   

10.
录井解释过程中,由于数据特征维度较高和数据集成化能力不足等,需要人工校正录井综合图的岩性剖面。提出一种基于数据挖掘的录井剖面归位解释处理方法,对选取的录井解释数据进行数据清洗,选取有效影响因子,进行基于主成分分析的特征降维;分析录井解释数据特点,选择神经网络算法作为模式挖掘模型;对模式挖掘模型进行表达与解释,将实验获得的最优特征识别模式运用于实际数据。结果表明,采用模式挖掘模型在未知区块的平均识别准确率接近于92%,模型泛化能力相对稳定,对部分常用的岩性的识别准确率接近于95%,与多次人工校正后的归位结果相近。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号