共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。 相似文献
2.
为了提高俄语地名翻译效率,本文通过分析俄语语音特点和俄语地名音译规则,构建了俄汉音译对照表,提出了一种俄语地名专名自动快速音译方法。该方法在俄语地名音节切分的基础上,基于正向最大匹配原则,完成切分后子字符串与俄汉音译对照表词条机械匹配,进而实现俄语地名专名音译。经过地名翻译实验,验证了该方法的可行性,对于俄语地名翻译工作具有重要的现实意义。 相似文献
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
在互联网迅速发展的现代化信息社会,大量地理信息都以非结构化的文本形式存在,而地名识别是挖掘这些地理信息的重要基础。目前已有的地名识别方法主要是从自然语言处理的角度来实现,并没有充分考虑到地名的构成和使用习惯等特征,造成识别率偏低或过拟合等问题。本文引入语言学相关知识,分析中文地名用字特征,在传统的地名专名+通名的结构上,更细致地划分地名的词素类型,总结归纳各词素类型的特征,将这些特征融入条件随机场的方法中,使地名识别问题转化为序列标注问题。并根据中文地名的特征,制定形式化规则,设计基于字的标注规范。在此基础上,设计中文地名特征模板,通过条件随机场模型训练和预测,识别自然语言文本中的中文地名。采用170万字的人民日报标注语料进行实验验证,结果表明本文方法对中文地名识别的召回率、准确率和F值分别达到92.69%、96.73%和94.67%,优于已有研究成果,能为地理信息科学领域的研究和应用提供更有效的地名服务。 相似文献
14.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。 相似文献
15.
关于小比例尺地图上我国地名罗马化的几点设想 总被引:1,自引:0,他引:1
我国地名的罗马化长期存在分歧混乱。《汉语拼音方案》法定后椐以拼写的我国地名,经联合国地名会议通过,已成为中国地名的国际标准。在小比例尺地图上,为了图面清晰,如何处理地名的拼写,本文提出四点建议。 (1)现行汉字版小比例尺地图上,对专名为双音节或多音节的县名的通名县字往往脱落,而当专名为单音节时,通名保留并和专名联写。这在体例上似乎存在矛盾,其实是符合现代汉语习惯的。(2)少数民族自治县行政单位驻地名称大都用一长串汉字称说。现在汉字版地图上有的标全称,有的标简称。在罗马化时以采用简称为宜。(3)台湾方面地名的音译沿用威妥玛式。台湾已于1984年制订了《国语注音符号》第二式,并于1986年公告正式使用。如果它也适用于地名的罗马化,在一国两制的前提下,我们今后出版的地图上也宜采用。(4)现行的地名罗马化的地图集中,对多音节县名只标专名,不见通名,但其所附的地名索引中则专名和通名并列,并分写。而对单音节县名,在图面上专名和通名并列并联写。但在索引中则分写,形成图面和索引的矛盾。国际电信联盟对我国的多音节县名略去通名,对单音节县名则专名和通名并列,并联写。这正和图面相同,有利于地名标准的推广。此外,本文还列举大量统计,说明单音节县名是古代遗留下来的,不合现代汉语习惯。这对今后我国地名的标准化也有深远的参考意义。 相似文献
16.
17.
地名知识反映人们对客观世界地理命名实体的描述,如何对地名知识有效地组织和管理,实现语义级别的共享和重用是一项重要的研究课题。顾及人的常识性空间认知和地名的时空特征,提出了一种基于地名本体的地名知识统一形式化表达模型(TKURM),该模型包括地名本体、时空规则库和空间元知识,并对地名本体的地名要素、地名类型、几何形态、空间关系和时态模型做了具体分析。基于TKURM设计了地名知识库的构建流程,并以郑州市行政区划地名知识库为例进行了应用分析。 相似文献
18.
对扫描地图地名注记的自动提取进行了研究,针对复杂背景扫描地图设计了一种新的地名注记提取方法。首先,运用先验统计知识对地名注记所在要素层进行分割;然后,将文字线组合方法与数学形态学膨胀算法结合实现了地名注记的高效提取。通过大量实验表明,该方法有效地克服了复杂背景下地名注记提取的困难,简单、快速且正确率较高。 相似文献
19.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1 000 000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。 相似文献
20.
探讨了地图书籍中中国地名对外翻译的基本原则,表述了国家有关地名管理条例和目前地名对外翻译的发展趋势,针对地名对外翻译中出现不一致的现状,深入地探讨了出现问题的根源,使人们对地名的对外翻译情况有一个比较全面的认识。 相似文献