首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。  相似文献   

2.
为了提高俄语地名翻译效率,本文通过分析俄语语音特点和俄语地名音译规则,构建了俄汉音译对照表,提出了一种俄语地名专名自动快速音译方法。该方法在俄语地名音节切分的基础上,基于正向最大匹配原则,完成切分后子字符串与俄汉音译对照表词条机械匹配,进而实现俄语地名专名音译。经过地名翻译实验,验证了该方法的可行性,对于俄语地名翻译工作具有重要的现实意义。  相似文献   

3.
针对传统人工地名翻译效率低、且囿于翻译者个人水平差异会导致翻译质量参差不齐,现有机器翻译不能有效解决地名翻译规则的交叉型歧义等问题,该文提出基于深度学习与先验知识相结合的英语地名音译技术,对地名翻译中音标生成、音标优化、音节划分3个核心环节进行研究,提出了基于深度学习的音标生成方法、基于先验知识的音标优化方法和基于双向最大匹配的音节划分方法,解决了机器翻译对地名单词音标识别差、汉字译写不规范的问题。实验结果表明,该地名专名音译技术比传统地名翻译方法时效性高、准确率高、翻译规范。  相似文献   

4.
现有外语地名机器翻译中只有关于音译方面的研究,区分地名通名与专名的研究未开展,造成无法区分地名的通名与专名,外语地名翻译过程中无法正确选择音译与意译的翻译方式,外语地名翻译准确率不高.针对这一问题,提出一种外语地名通专名区分技术.该技术通过对地名词语构建结构树,并对树的叶子节点进行分类来完成通名与专名的区分,从而确定翻译方式.对英国地名进行区分,实验结果证明,该技术可以有效区分外语地名通专名,可辅助进一步的地名翻译,提高翻译精度.  相似文献   

5.
针对现有地名专名音译中因无法良好获取地名音节划分而导致的准确率低与可用性差等问题,该文提出了基于机器学习的地名专名音译技术。在该技术中,该文对音标生成、音节划分两个关键部分进行了讨论,分别研究了基于循环神经网络的音标生成方法和最小熵的音节切分方法。通过新研究的单词音标生成算法与音标音节切分算法,从两个角度解决了机器对单词音节识别差的问题。经过地名翻译实验,证明了该音译技术比传统方法具有更高的准确率。  相似文献   

6.
毛曦  颜闻  马维军  殷红梅 《测绘科学》2019,44(6):296-300,316
针对现有无法区分地名专名与通名而导致的地名机器翻译准确率低与可用性差等问题,该文提出了基于自然语言注意力机制的地名机器翻译技术。深度学习模型中注意力机制是对于人类认知的模拟。该文通过对于大规模平行语料的训练,针对地名的自然语言特征,建立了地名语言环境约束条件下的注意力机制模型,并将其用于地名翻译过程中的专名与通名区分,从而提高整体的地名翻译精度。经过地名翻译实验,证明了该机器翻译技术比传统方法具有更高的准确率,有助于提高全球地理信息资源建设中地名产品的自动化水平。  相似文献   

7.
针对目前我国阿拉伯语地名的机器翻译研究空白,该文通过分析阿拉伯语地名的词法结构以及语音特点,提出了一种关于阿拉伯语地名的机器翻译方法:首先基于点互信息计算公式训练大量地名语料提取常用词;接着通过有向无环图数据结构提取地名模板;然后基于模板匹配解析待译地名词法结构,利用基于音节划分的音译模型音译词法结构中的专名;最后组合输出翻译结果。经过对阿语地名翻译实验,验证了本专用阿拉伯语地名机器翻译方法的有效性,对我国全球地理信息资源建设具有重要的现实意义。  相似文献   

8.
针对大量英文地名急需实现中文翻译及目前英语地名自动翻译研究较少、翻译结果质量低下的问题,该文提出了一种英语地名机器翻译方法。首先对于不同类别地名语料基于点互信息和有向无环图数据结构提取地名模板,然后基于统计模板模型解析地名词法结构实现翻译。实验结果表明:该方法翻译精度相对较高,可有效应用于地名生产。本方法解决了地名翻译中通专名合理区分的难题,同时利用地名类别属性辅助翻译,大大节省了人工成本,对我国地名翻译及生产领域具有一定参考意义。  相似文献   

9.
双语地图中地图注记的设计   总被引:1,自引:1,他引:0  
从汉语地名的译写现状出发,对目前采用的两类地名译写方法进行分析,总结了地名翻译过程中的"专名音译,通名意译"的一般原则和相关要点。随后探讨加入英文注记后信息量增加、英文字符和排列等因素带来的双语地图在注记字体、尺寸、字隔、配置四个方面设计上与传统地图的不同之处;并结合编制广州市2010年亚运场馆分布地图的的实践,探讨如何在双语地图中对地物信息进行科学、清晰、美观的语言表达。  相似文献   

10.
在境外地名数据库建设过程中,地名翻译是境外地名数据整合的前期基础性工作,但目前缺乏有效的地名翻译解决办法。音译是地名翻译的主要方式,也是地名翻译研究的重点内容。以俄语地名为例,在分析俄语发音特点和音节构成的基础上,制定了较为合理的音节切分方案,并实现俄语地名音节切分,将翻译对象由地名长字母串化简为音节,能够有效降低地名翻译的复杂度,为地名规范化翻译工作提供参考。  相似文献   

11.
地名凝结了区域文化及历史过程,蕴涵丰富的文化信息。如何挖掘地名文化信息是一个有趣又重要的问题。结合文本知识、专业知识、先验知识、专家知识与第二次全国地名普查成果数据,通过建立知识库及提取规则,采用数据制图、模型制图、知识制图等制图方法实现中国大陆方言地名、地名通名制图。结果表明,制图结果可以得到相关地名的空间分布范围,揭示区域地名通名的高频词汇特征,可以为区域地名管理、规划、保护与利用提供知识支撑。  相似文献   

12.
从境外地名翻译的规则和研究现状出发,探讨地名译写规则库的建立以及地名数据库的设计和建立,并通过原型系统的开发,验证境外地名翻译软件实现的可行性.  相似文献   

13.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。  相似文献   

14.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。  相似文献   

15.
关于小比例尺地图上我国地名罗马化的几点设想   总被引:1,自引:0,他引:1  
曾世英 《地图》1993,(1):8-13
我国地名的罗马化长期存在分歧混乱。《汉语拼音方案》法定后椐以拼写的我国地名,经联合国地名会议通过,已成为中国地名的国际标准。在小比例尺地图上,为了图面清晰,如何处理地名的拼写,本文提出四点建议。 (1)现行汉字版小比例尺地图上,对专名为双音节或多音节的县名的通名县字往往脱落,而当专名为单音节时,通名保留并和专名联写。这在体例上似乎存在矛盾,其实是符合现代汉语习惯的。(2)少数民族自治县行政单位驻地名称大都用一长串汉字称说。现在汉字版地图上有的标全称,有的标简称。在罗马化时以采用简称为宜。(3)台湾方面地名的音译沿用威妥玛式。台湾已于1984年制订了《国语注音符号》第二式,并于1986年公告正式使用。如果它也适用于地名的罗马化,在一国两制的前提下,我们今后出版的地图上也宜采用。(4)现行的地名罗马化的地图集中,对多音节县名只标专名,不见通名,但其所附的地名索引中则专名和通名并列,并分写。而对单音节县名,在图面上专名和通名并列并联写。但在索引中则分写,形成图面和索引的矛盾。国际电信联盟对我国的多音节县名略去通名,对单音节县名则专名和通名并列,并联写。这正和图面相同,有利于地名标准的推广。此外,本文还列举大量统计,说明单音节县名是古代遗留下来的,不合现代汉语习惯。这对今后我国地名的标准化也有深远的参考意义。  相似文献   

16.
针对中文地名数据中存在的“同名异地”“异地同名”等歧义问题,本文提出了一种结合地名知识和位置信息的地名匹配方法。首先基于特征词的规则匹配模式对地名名称结构进行了解析。然后结合地名的位置信息实现中文地名匹配;同时,基于地名的行政区划信息和实体信息关联多源地名数据,构建地名知识库。最后以兴趣点数据为例,基于名称相似度和位置相似度匹配地名数据中的地名信息,并以知识图谱的形式进行存储和表达。  相似文献   

17.
地名知识反映人们对客观世界地理命名实体的描述,如何对地名知识有效地组织和管理,实现语义级别的共享和重用是一项重要的研究课题。顾及人的常识性空间认知和地名的时空特征,提出了一种基于地名本体的地名知识统一形式化表达模型(TKURM),该模型包括地名本体、时空规则库和空间元知识,并对地名本体的地名要素、地名类型、几何形态、空间关系和时态模型做了具体分析。基于TKURM设计了地名知识库的构建流程,并以郑州市行政区划地名知识库为例进行了应用分析。  相似文献   

18.
对扫描地图地名注记的自动提取进行了研究,针对复杂背景扫描地图设计了一种新的地名注记提取方法。首先,运用先验统计知识对地名注记所在要素层进行分割;然后,将文字线组合方法与数学形态学膨胀算法结合实现了地名注记的高效提取。通过大量实验表明,该方法有效地克服了复杂背景下地名注记提取的困难,简单、快速且正确率较高。  相似文献   

19.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1 000 000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。  相似文献   

20.
探讨了地图书籍中中国地名对外翻译的基本原则,表述了国家有关地名管理条例和目前地名对外翻译的发展趋势,针对地名对外翻译中出现不一致的现状,深入地探讨了出现问题的根源,使人们对地名的对外翻译情况有一个比较全面的认识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号