首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.  相似文献   

2.
研究了一种常用的模式分类器——BP神经网络,分析了BP网络的训练及识别过程,提取了能体现声调特性的特征数据组成分类特征向量,设计了具有一个隐含层的3层前馈网络作为分类器,对普通话声调样本库做了分类识别实验,分析了不同隐含层节点数的识别实验结果.实验结果表明,提取的音频特征基本有效,分类效果良好,具有一定的应用价值.  相似文献   

3.
针对人脸识别技术中存在的高维问题、小样本问题和非线性问题展开研究.围绕人脸特征提取,采用基于主成分分析和Fisher线性鉴别来克服在人脸识别中的小样本问题,同时将人脸图像从高维空间映射到低维空间从而解决了高维问题;在分类识别方面,采用具有很强的非线性映射功能的RBF神经网络进行模式分类,能够解决人脸识别中的非线性问题.在ORL人脸数据库上进行的仿真实验表明,该方法进行人脸识别具有较高的识别率.  相似文献   

4.
针对视频序列中人体动作识别存在信息冗余大、准确率低的问题,提出基于关键帧的双流卷积网络的人体动作识别方法.该方法构建了由特征提取、关键帧提取和时空特征融合3个模块构成的网络框架.首先将空间域视频的单帧RGB图像和时间域多帧叠加后的光流图像作为输入,送入VGG16网络模型,提取视频的深度特征;其次提取视频的关键帧,通过不断预测每个视频帧的重要性,选取有足够信息的有用帧并汇聚起来送入神经网络进行训练,选出关键帧并丢弃冗余帧;最后将两个模型的Softmax输出加权融合作为输出结果,得到一个多模型融合的人体动作识别器,实现了对视频的关键帧处理和对动作的时空信息的充分利用.在UCF-101公开数据集上的实验结果表明,与当前人体动作识别的主流方法相比,该方法具有较高的识别率,并且相对降低了网络的复杂度.  相似文献   

5.
随着图像大数据的爆发,特别是用户贡献数据的飞速增长,图像样本的语义内容越来越丰富,标签信息也随之越来越复杂.因此图像多标签学习的研究是近年来学术圈和产业界的研究热点之一,涌现了大量表现优异的方法和技术.基于此,本文将对近年来图像多标签学习上的研究成果进行总结.首先,对多标签学习进行简单介绍,并详述其主流方法的分类;随后,针对目前大数据时代的数据特性,总结了多标签学习面临的新的技术难点及其对应的解决方案;最后,在应用层面上介绍了多标签学习在医学、计算机科学等领域的应用实例.  相似文献   

6.
手势识别作为人机交互的有效手段,成为当前研究的热点话题.针对动态手势识别存在时空多变性、特征复杂性等问题,本文提出了一种基于三维骨骼信息的动态手势识别方法.动态手势具有时间上的差异性和复杂性,极大地影响了动态手势识别的准确率.因此,本文设计了一种动态手势关键帧提取算法,该算法可以提取动态手势关键部分,用于进一步的特征提取.另外,单独分类器的分类效果存在差异性,本文采用多个分类器同时对手势特征进行分类,充分利用了所提取的特征.同时,本文还提出了一种自适应融合算法,可以根据分类精度有效融合不同分类器,提高最终分类效果.最后,通过实验验证了本文提出的动态手势识别框架和方法的有效性.  相似文献   

7.
由于高光谱图像中的地物空间分布具有规整性和局部连续性,同时超像素分割是一种将空间图像分割成多个同质区域的有效方法,因此从超像素的角度进行高光谱图像分类将具有重要意义.本文提出了一种超像素级Gabor特征融合的高光谱图像分类方法,简称为SPGF.首先,使用一组预定义的二维Gabor滤波器与原始高光谱图像进行卷积运算,提取有效特征.同时,利用简单线性迭代聚类(简称SLIC)超像素分割方法将原始高光谱图像划分成互不重叠的超像素.然后,对于每个Gabor特征模块,利用支持向量机分类器进行分类,并使用多数投票策略实现各模块分类结果的融合.最后,使用通过SLIC算法得到的超像素图对分类结果进行修正.在2个真实高光谱数据集上的实验结果表明,本文提出的SPGF方法能够比领域内的一些经典算法获得更高的分类效果.  相似文献   

8.
采用基于Xception卷积神经网络算法构建了一个海雾能见度识别的框架,通过对海雾能见度探测设备同位置摄像头监控图像的采集,将图像样本结合能见度数据进行标签分类,利用迁移学习结合Xception网络进行训练,提取图像能见度特征,构建能见度等级估测模型,实现能见度等级的估测。通过对浙江省宁波市北仑区三山大闸摄像头监控进行图像的采集,抽取万余有效样本进行训练,进行能见度等级识别结果分析,结果显示模型识别精度可达99.36%,验证集准确率可达99.20%。基于Xception算法的海雾能见度等级估测方法如果在数据集健康准确的情况下,能够满足海雾能见度实时性和识别准确率的要求,可以作为未安装能见度探测设备地区的能见度等级辅助监测方法。  相似文献   

9.
为了克服非约束性(光照、表情变化)条件下会大大降低人脸识别率的缺陷,提出一种基于Fisher判别准则的正则化稀疏表示人脸识别算法.首先将人脸图像经过Gabor滤波器滤波得到Gabor幅值图像,提取其统一化的局部二进制直方图,然后利用Fisher判别准则学习得到新的字典,最后通过正则化的稀疏表示判断测试图像所属类.利用AR数据库的数据进行实验的结果表明,与SRC、FDDL、RSC识别算法相比,本文算法在非约束性条件下具有最佳的识别率.  相似文献   

10.
文本理解是人工智能的一个重要分支,其技术推动了人与计算机之间在自然语言上的有效交互.为了让计算机准确地理解和感知文本数据,文本特征提取是最为基础和关键的步骤之一.基于此,本文介绍文本特征提取研究的发展历史,以及近年来主流特征提取的方法,并对未来的研究方向进行展望.首先,介绍语义最底层的词级表示;接着,总结在词级表示基础上衍生出的句级表示上的研究进展;随后,介绍比词级表示和句级表示更高层的篇分析;最后,通过文本特征提取的一个典型应用——问答系统的介绍,阐述文本特征提取的最新方法和技术在问答系统上的应用,并对未来的研究方向做了展望.  相似文献   

11.
经历了两次"人工智能寒冬"之后,机器学习于近十年再次进入大众视野,且有腾飞发展之势,已在图像识别和语音识别系统等实际应用方面取得了巨大成功.从已知数据集中总结关键信息和主要特征,从而对新数据做出准确的识别和预测,分别是机器学习的主要任务和主要目标之一.从这个角度看,将机器学习整合到气候预测的思路切实可行.本文,首先以线...  相似文献   

12.
以VGG16为基准模型,融合批归一化处理、全局平均池化和联合损失函数,提出了一种基于卷积神经网络的高速公路雾天能见度等级分类方法.实验结果表明,改进后的神经网络模型的平均识别正确率达83.9%,相较于其他几种模型具有较高的正确率和较好的收敛性.将模型封装入业务系统后进行业务化检验,其平均识别正确率可达84.9%,且白天...  相似文献   

13.
为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度.  相似文献   

14.
以浙江省2016年1-10月的雷达回波强度数据为基础,分别应用随机森林模型、BP神经网络模型、卷积神经网络模型来预测降雨量并进行对比.建模分析结果表明,随机森林模型预测效果精确度较低,容易低估较大的降雨强度,而BP神经网络和卷积神经网络预测的效果都比随机森林好,特别是卷积神经网络,其预测值与真实值更加接近,且对较大的降雨强度拟合较好.  相似文献   

15.
基于肌电信号的手部动作识别中,肌电信号测量位置的选择直接关系到动作识别的准确率.本文以使用最少的肌电传感器和获得较高的动作识别率为目标,提出一种基于ANOVA (方差分析)和BP神经网络的肌电信号测量位置优选方法.使用4个肌电传感器采集受试者做出指定动作时的肌电信号,提取肌电信号的时域特征,并按测量位置组合构成15个不同的样本进行BP神经网络的训练和测试.采用单因素ANOVA分析测量位置对动作识别结果影响的显著性,采用Tukey HSD将测量位置进行归类,并从动作识别率最高的子集中选择测量位置最少但识别准确率最高的测量位置组合作为最优的肌电信号测量位置.实验结果表明,测量位置对动作识别的结果具有显著的影响,随着测量位置数的增加,动作识别准确率呈上升趋势,最优的测量位置组合为P1+P3+P4,其动作识别准确率为94.6%.  相似文献   

16.
在进行神经网络方法的数字图像识别研究时,针对数字图像的复杂性、神经网络输入数据量巨大和学习收敛速度慢的情况,提出了基于特征的神经网络数字识别方法。设计提取了13个结构特征以组成一个13维的超空间,对13维的超平面空间的整个识别过程采用了神经网络聚类方法(其中聚类数为10),并利用数学软件MATLAB强大的矩阵运算能力和C语言高效的代码实现了数字识别系统模型。实验结果表明,在特征差异不十分明显的情况下,识别时间和识别率仍令人满意。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号