首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对现有地名专名音译中因无法良好获取地名音节划分而导致的准确率低与可用性差等问题,该文提出了基于机器学习的地名专名音译技术。在该技术中,该文对音标生成、音节划分两个关键部分进行了讨论,分别研究了基于循环神经网络的音标生成方法和最小熵的音节切分方法。通过新研究的单词音标生成算法与音标音节切分算法,从两个角度解决了机器对单词音节识别差的问题。经过地名翻译实验,证明了该音译技术比传统方法具有更高的准确率。  相似文献   

2.
针对目前人工翻译地名效率低且西班牙语地名专名自动化音译研究尚为空白等问题,该文通过分析西班牙语语法规则和发音特点,提出基于先验知识的西班牙语地名专名自动化音译方法。通过构建西班牙语地名先验知识库,将先验知识分为实例类先验知识和规则类先验知识,作用于专名音译,分为基于实例类先验知识的音译和基于规则类先验知识的音译,来对西班牙语地名进行专名音译。将该方法应用于西班牙语地名专名音译,结果与翻译软件对比分析,该方法的音译结果符合音译规则,更加规范,准确率高,证实了该方法的可行性。  相似文献   

3.
针对目前我国阿拉伯语地名的机器翻译研究空白,该文通过分析阿拉伯语地名的词法结构以及语音特点,提出了一种关于阿拉伯语地名的机器翻译方法:首先基于点互信息计算公式训练大量地名语料提取常用词;接着通过有向无环图数据结构提取地名模板;然后基于模板匹配解析待译地名词法结构,利用基于音节划分的音译模型音译词法结构中的专名;最后组合输出翻译结果。经过对阿语地名翻译实验,验证了本专用阿拉伯语地名机器翻译方法的有效性,对我国全球地理信息资源建设具有重要的现实意义。  相似文献   

4.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。  相似文献   

5.
毛曦  颜闻  马维军  殷红梅 《测绘科学》2019,44(6):296-300,316
针对现有无法区分地名专名与通名而导致的地名机器翻译准确率低与可用性差等问题,该文提出了基于自然语言注意力机制的地名机器翻译技术。深度学习模型中注意力机制是对于人类认知的模拟。该文通过对于大规模平行语料的训练,针对地名的自然语言特征,建立了地名语言环境约束条件下的注意力机制模型,并将其用于地名翻译过程中的专名与通名区分,从而提高整体的地名翻译精度。经过地名翻译实验,证明了该机器翻译技术比传统方法具有更高的准确率,有助于提高全球地理信息资源建设中地名产品的自动化水平。  相似文献   

6.
为了提高俄语地名翻译效率,本文通过分析俄语语音特点和俄语地名音译规则,构建了俄汉音译对照表,提出了一种俄语地名专名自动快速音译方法。该方法在俄语地名音节切分的基础上,基于正向最大匹配原则,完成切分后子字符串与俄汉音译对照表词条机械匹配,进而实现俄语地名专名音译。经过地名翻译实验,验证了该方法的可行性,对于俄语地名翻译工作具有重要的现实意义。  相似文献   

7.
现有外语地名机器翻译中只有关于音译方面的研究,区分地名通名与专名的研究未开展,造成无法区分地名的通名与专名,外语地名翻译过程中无法正确选择音译与意译的翻译方式,外语地名翻译准确率不高.针对这一问题,提出一种外语地名通专名区分技术.该技术通过对地名词语构建结构树,并对树的叶子节点进行分类来完成通名与专名的区分,从而确定翻译方式.对英国地名进行区分,实验结果证明,该技术可以有效区分外语地名通专名,可辅助进一步的地名翻译,提高翻译精度.  相似文献   

8.
针对大量英文地名急需实现中文翻译及目前英语地名自动翻译研究较少、翻译结果质量低下的问题,该文提出了一种英语地名机器翻译方法。首先对于不同类别地名语料基于点互信息和有向无环图数据结构提取地名模板,然后基于统计模板模型解析地名词法结构实现翻译。实验结果表明:该方法翻译精度相对较高,可有效应用于地名生产。本方法解决了地名翻译中通专名合理区分的难题,同时利用地名类别属性辅助翻译,大大节省了人工成本,对我国地名翻译及生产领域具有一定参考意义。  相似文献   

9.
针对先验知识未能有效指导智能分类、智能分类与样本采集相对独立的问题,提出遥感影像样本自动生成与智能迭代分类方法。首先利用遥感影像及对应的历史解译数据构建样本数据集;其次利用深度卷积神经网络模型进行训练,得到预训练模型;再次利用预训练模型对即时遥感影像进行智能分类,得到智能分类结果;最后将校正后分类结果反馈到样本数据集,完成样本数据集的更新,利用更新后的样本数据集对智能分类模型进行迭代优化,形成模型与样本的优化闭环。试验结果表明:该方法通过样本自动生成与更新,以及模型迭代训练,能够提升智能分类模型精度,为解决先验知识未充分利用、智能分类与样本采集相对独立、分类结果未实时反馈等问题提供思路。  相似文献   

10.
基于车辆轨迹数据的道路信息提取是地理信息领域的热点也是难点之一,传统方法面临着轨迹数据源要求高、道路提取算法复杂、不同道路提取模型参数适应性不强等问题。针对以上问题,提出基于条件生成式对抗网络的轨迹地图向道路地图转换的轨迹-道路转换方法。该方法以轨迹数据与道路数据的对应关系为先验知识,通过"生成-博弈"的不断循环逐渐逼近最优结果,学习优化条件生成式对抗网络模型参数。首先将轨迹数据栅格化处理,然后基于样本数据学习优化条件生成式对抗网络参数,最后将训练好的模型应用到整个实验区域提取道路数据,发现所提方法可以有效地发现新增道路;同时将训练好的轨迹-道路转换模型与栅格化道路提取方法对比,发现所提方法在轨迹稀疏稠密区域都有更强的轨迹数据适应性,且生成的道路精确率更高。  相似文献   

11.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1000000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。  相似文献   

12.
随着遥感卫星技术的快速发展,高光谱图像在环境检测、资源管理、农业预警等领域得到了广泛应用。然而,由于设备误差和大气因素等原因,采集的高光谱图像中常常存在噪声,这会影响后续任务的准确性。因此,高光谱图像去噪成为了一个重要的研究方向。高光谱图像的空间关联、光谱关联和空间—光谱联合关联导致干净的高光谱图像存在低维子空间中。低秩先验是高光谱图像普遍的物理性质,然而基于低秩表示的方法通常需要复杂的参数设置和计算。基于深度学习方法直接从数据中学习到干净图像的先验信息,具有较强的表达能力,但依赖大量数据且缺乏对高光谱图像物理知识如低秩性的有效利用。为了解决这些问题,本文利用高光谱图像的空间—光谱低秩特性,提出一种低秩张量嵌入深度神经网络方法,可以有效去除高光谱图像中的噪声。该方法采用低秩张量分解模块对高光谱图像的特征图进行低秩表示,通过全局池化和卷积等操作完成秩一向量的生成和低秩张量的重构。同时,将低秩张量分解模块与Unet相结合,对浅层特征进行低秩张量表示,以捕捉高光谱图像的空间—光谱低秩特性,提高了模型的去噪能力。当噪声标准差在[0—95]时,算法可以取得41.02 dB的PSNR和0.9888...  相似文献   

13.
排水管道健康状况直接影响整个城市的排水效果,CCTV检测作为目前最为常见的排水管道健康状况检测方法,仍存在自动化程度不高、工作效率低下、严重依赖人工经验等问题。为解决以上问题,本文将当前先进的深度学习技术与地下排水管道缺陷检测技术相结合,提出了一种基于深度学习模型的地下排水管道缺陷智能识别技术。同时,将管道缺陷智能识别与管道检测工作流程紧密结合,实现城市排水管道检测报告的快速自动生成等功能,从而大大提高排水管道缺陷的检测效率。  相似文献   

14.
高光谱遥感是以成像光谱学为基础发展起来的一项综合性遥感技术,它能够同步记录成像区域内地物的空间信息和光谱信号,故而也称为“成像光谱遥感”。高光谱遥感所获取的数据称为“高光谱遥感图像”,相较于传统的遥感数据,高光谱遥感图像具有光谱分辨率高和“图谱合一”的特点,目前已成为遥感工程应用中的重要支撑数据之一。然而,受空间分辨率限制,混合像元(即某一像元内包含多种类型的地物)问题始终限制着高光谱遥感在精细化地物信息提取工作中的作用。混合像元分解(“解混”)是现阶段处理混合像元问题最有效的分析方法,旨在从亚像元角度出发,获取像元中纯净的光谱信号(“端元”),并分析出各类端元在像元内所占的比例(“丰度”)。在遥感领域,为实现地物信息精细化解译,目前已发展出不同类型的解混方法,在一定程度上解决了混合像元问题对遥感定量化分析的制约。如今,随着深度学习的发展,越来越多的先进理论和工具被用于处理混合像元问题,发展出了一类基于深度学习的新型解混方法。这些新方法以光谱混合模型为桥梁,用深度学习方式来解译光谱混合现象。相比于传统的解混方法,基于深度学习的解混方法在隐藏信息的挖掘和利用方面更具优势,对先验知识依赖程...  相似文献   

15.
地名凝结了区域文化及历史过程,蕴涵丰富的文化信息。如何挖掘地名文化信息是一个有趣又重要的问题。结合文本知识、专业知识、先验知识、专家知识与第二次全国地名普查成果数据,通过建立知识库及提取规则,采用数据制图、模型制图、知识制图等制图方法实现中国大陆方言地名、地名通名制图。结果表明,制图结果可以得到相关地名的空间分布范围,揭示区域地名通名的高频词汇特征,可以为区域地名管理、规划、保护与利用提供知识支撑。  相似文献   

16.
针对非均质中低分辨率像元的叶面积指数LAI验证中如何布设基本采样单元ESU的问题,提出基于NDVI先验知识的ESU布设方法,并采用不同植被类型、不同均匀程度的地表作为模拟场,分析对比了方法的精度及稳定性。结果显示,本文方法用NDVI先验知识描述植被的生长空间分布信息,能相对准确地划分植被的不同生长水平,有效降低层内方差。在草地和森林地区的试验中,精度与稳定性均优于传统的随机采样、均匀采样和基于分类图的3种采样方法。因此,本文提出的采样方法为大尺度非均质区域LAI地面验证的采样方案提供了新的设计思路。  相似文献   

17.
李一  刘纪平  罗安 《测绘科学》2018,(10):107-111
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

18.
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。  相似文献   

19.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

20.
针对传统遥感影像目标检测方法效率不高,并且无有效手段对检测信息进行管理利用的问题,提出了在B/S构架下基于深度学习的目标检测及定位方法。通过集成深度学习框架、WebGIS以及数据库,实现了集遥感影像目标检测、展示及管理于一体的目标检测定位系统,满足多用户基于前端浏览器的并发目标检测需求。利用网格划分策略,实现了基于前端的大区域范围的目标快速检测。基于某机场飞机目标及某城市区域运动场目标检测结果表明:本文设计的目标检测定位系统能够在前端实现目标快速检测定位,具有较高检测精度,并可有效管理检测信息,为深度学习循环再利用提供数据支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号