首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。  相似文献   

2.
针对现有地名专名音译中因无法良好获取地名音节划分而导致的准确率低与可用性差等问题,该文提出了基于机器学习的地名专名音译技术。在该技术中,该文对音标生成、音节划分两个关键部分进行了讨论,分别研究了基于循环神经网络的音标生成方法和最小熵的音节切分方法。通过新研究的单词音标生成算法与音标音节切分算法,从两个角度解决了机器对单词音节识别差的问题。经过地名翻译实验,证明了该音译技术比传统方法具有更高的准确率。  相似文献   

3.
针对目前人工翻译地名效率低且西班牙语地名专名自动化音译研究尚为空白等问题,该文通过分析西班牙语语法规则和发音特点,提出基于先验知识的西班牙语地名专名自动化音译方法。通过构建西班牙语地名先验知识库,将先验知识分为实例类先验知识和规则类先验知识,作用于专名音译,分为基于实例类先验知识的音译和基于规则类先验知识的音译,来对西班牙语地名进行专名音译。将该方法应用于西班牙语地名专名音译,结果与翻译软件对比分析,该方法的音译结果符合音译规则,更加规范,准确率高,证实了该方法的可行性。  相似文献   

4.
在境外地名数据库建设过程中,地名翻译是境外地名数据整合的前期基础性工作,但目前缺乏有效的地名翻译解决办法。音译是地名翻译的主要方式,也是地名翻译研究的重点内容。以俄语地名为例,在分析俄语发音特点和音节构成的基础上,制定了较为合理的音节切分方案,并实现俄语地名音节切分,将翻译对象由地名长字母串化简为音节,能够有效降低地名翻译的复杂度,为地名规范化翻译工作提供参考。  相似文献   

5.
现有外语地名机器翻译中只有关于音译方面的研究,区分地名通名与专名的研究未开展,造成无法区分地名的通名与专名,外语地名翻译过程中无法正确选择音译与意译的翻译方式,外语地名翻译准确率不高.针对这一问题,提出一种外语地名通专名区分技术.该技术通过对地名词语构建结构树,并对树的叶子节点进行分类来完成通名与专名的区分,从而确定翻译方式.对英国地名进行区分,实验结果证明,该技术可以有效区分外语地名通专名,可辅助进一步的地名翻译,提高翻译精度.  相似文献   

6.
针对传统人工地名翻译效率低、且囿于翻译者个人水平差异会导致翻译质量参差不齐,现有机器翻译不能有效解决地名翻译规则的交叉型歧义等问题,该文提出基于深度学习与先验知识相结合的英语地名音译技术,对地名翻译中音标生成、音标优化、音节划分3个核心环节进行研究,提出了基于深度学习的音标生成方法、基于先验知识的音标优化方法和基于双向最大匹配的音节划分方法,解决了机器翻译对地名单词音标识别差、汉字译写不规范的问题。实验结果表明,该地名专名音译技术比传统地名翻译方法时效性高、准确率高、翻译规范。  相似文献   

7.
毛曦  颜闻  马维军  殷红梅 《测绘科学》2019,44(6):296-300,316
针对现有无法区分地名专名与通名而导致的地名机器翻译准确率低与可用性差等问题,该文提出了基于自然语言注意力机制的地名机器翻译技术。深度学习模型中注意力机制是对于人类认知的模拟。该文通过对于大规模平行语料的训练,针对地名的自然语言特征,建立了地名语言环境约束条件下的注意力机制模型,并将其用于地名翻译过程中的专名与通名区分,从而提高整体的地名翻译精度。经过地名翻译实验,证明了该机器翻译技术比传统方法具有更高的准确率,有助于提高全球地理信息资源建设中地名产品的自动化水平。  相似文献   

8.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。  相似文献   

9.
针对大量英文地名急需实现中文翻译及目前英语地名自动翻译研究较少、翻译结果质量低下的问题,该文提出了一种英语地名机器翻译方法。首先对于不同类别地名语料基于点互信息和有向无环图数据结构提取地名模板,然后基于统计模板模型解析地名词法结构实现翻译。实验结果表明:该方法翻译精度相对较高,可有效应用于地名生产。本方法解决了地名翻译中通专名合理区分的难题,同时利用地名类别属性辅助翻译,大大节省了人工成本,对我国地名翻译及生产领域具有一定参考意义。  相似文献   

10.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1 000 000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。  相似文献   

11.
目前数字线划图及地名数据库内存在着大量未规范表示的生僻汉字,严重影响了地理信息数据开发应用的准确性和规范性。介绍了运用Opentype字体技术和Unicode编码方法制作生僻字库的一种快捷的技术手段,通过该方法整理出一个调用方便、应用效果好的地名生僻字库。  相似文献   

12.
基于1∶500地形图、1∶2 000地形图、1∶2 000影像图、行政村人口与自然村布点图等数据与其他地名相关资料,对2009年全增城1∶2 000 DLG上的地名数据进行整合、对比,按照《增城数据库管理系统建库标准》要求,提取增城市城乡规划局所需的各级地名数据,并分类、赋代码、赋属性、检查建库。  相似文献   

13.
牛汝辰 《测绘科学》2017,(12):63-68
针对国内对"一国两制"的内在矛盾及其长期性、复杂性和艰巨性认识的不足,以及香港社会出现对"一国两制"的不同声音。该文提出了作为"一国两制"的制定者、主导者的中央政府,应该重新认识"一国两制",加强香港的去殖民化教育,去殖民化教育应从潜移默化的、日常频繁使用的、浓厚殖民色彩的地名更名开始。该文研究了香港殖民色彩地名的历史情况,提出了三步走的更名战略。  相似文献   

14.
地理编码系统中地名地址分词算法研究   总被引:4,自引:0,他引:4  
张林曼  吴升 《测绘科学》2010,35(2):46-48
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。  相似文献   

15.
结合济宁市基础地理信息数据整合及地名地址数据库建设项目介绍了地名地址数据采集方法,并利用先进的自主开发软件程序完成了数据编辑、入库等工作,解决了数据转换、入库数据丢失和错漏的问题,实现了无损转换和无缝衔接,提高了工作效率,为其他地区开展地名地址数据采集和建库工作积累了经验,提供了参考。  相似文献   

16.
建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。  相似文献   

17.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

18.
陈优良  朱倩 《测绘科学》2021,46(2):178-185
针对目前地名文化中客家聚落地名研究的不足,该文从客家迁徙历史的角度,提出了客家地名定性和定量的研究方法,以客家摇篮石城地名为研究对象,采用核密度分析法和多元logit回归模型方法,深入分析石城客家地名的时空分布特征和历史演变因素。结果显示:在时间上,客家地名数量整体呈现上升趋势,增长时间分为5个阶段,隋唐萌芽时期、宋朝大量增长期、元朝缓慢增长期、明朝平稳增长期和清朝快速增长期;在空间上,客家地名分布显现出聚集特征,但聚集程度各异,聚集点和聚集区域随着时间的推移而变化。根据logit模型结果显示,地形、河流、人口和经济等多种因素交融在一起,对客家地名的演化产生了重大而深远的影响。  相似文献   

19.
地理信息数据处于动态变化之中,传统的地理信息数据采集方式由少量专业单位组织,耗时长、效率低,难以满足数据的快速采集和及时更新要求。本文介绍了基于Web平台的志愿者地名地址数据采集方案,由志愿者提交地名地址数据的网站和数据库,利用互联网的高效、开放、共享等特点,实现对海量地理数据的快速采集和更新,是一种高效低廉的地理信息数据采集方式,每个用户既是地理信息的使用者,也是地理信息的提供者,可长期低成本维持地理信息数据的现势性。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号