共查询到20条相似文献,搜索用时 78 毫秒
1.
针对目前西班牙语地名翻译主要以人工翻译为主,效率低下,翻译质量也会因翻译者的个人情感与水平不同而出现较大差异的问题,该文提出一种西班牙语地名机器翻译的方法,设计了自动翻译流程,并对地名中通专名的区分、翻译模板的构建、专名音译3个核心环节进行研究,设计了基于统计语言模型的未登录地名通名的发现、基于大规模语料库的翻译模板构建与训练、基于双向最大匹配的音节切分方法进行专名音译等方法,实验结果表明,该方法能有效批量翻译西班牙语地名,从而提高西班牙语地名翻译的准确率和效率。 相似文献
2.
3.
针对目前人工翻译地名效率低且西班牙语地名专名自动化音译研究尚为空白等问题,该文通过分析西班牙语语法规则和发音特点,提出基于先验知识的西班牙语地名专名自动化音译方法。通过构建西班牙语地名先验知识库,将先验知识分为实例类先验知识和规则类先验知识,作用于专名音译,分为基于实例类先验知识的音译和基于规则类先验知识的音译,来对西班牙语地名进行专名音译。将该方法应用于西班牙语地名专名音译,结果与翻译软件对比分析,该方法的音译结果符合音译规则,更加规范,准确率高,证实了该方法的可行性。 相似文献
4.
5.
6.
7.
8.
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出了汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。实验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。 相似文献
9.
10.
针对当前单一数据源地名翻译准确率低下的问题,该文从属性相似度等方面出发,利用互联网地名及地图资源,提出了一种基于多数据源的全球地名匹配与翻译方法。设计并开发了基于多数据源的地名翻译工具。使用该方法完成了对全球1∶1 000 000矢量数据的批量化地名数据处理及地名规范化整理。实验证明,使用该方法较大程度减少了地名处理时的人工工作量,提高了地名匹配效率及其准确性,具有一定的工程实用价值。提出了一种基于多数据源的全球地名匹配与翻译方法,一定程度上改善了单一数据源地名翻译准确率与翻译效率低下的问题。 相似文献
11.
目前数字线划图及地名数据库内存在着大量未规范表示的生僻汉字,严重影响了地理信息数据开发应用的准确性和规范性。介绍了运用Opentype字体技术和Unicode编码方法制作生僻字库的一种快捷的技术手段,通过该方法整理出一个调用方便、应用效果好的地名生僻字库。 相似文献
12.
基于1∶500地形图、1∶2 000地形图、1∶2 000影像图、行政村人口与自然村布点图等数据与其他地名相关资料,对2009年全增城1∶2 000 DLG上的地名数据进行整合、对比,按照《增城数据库管理系统建库标准》要求,提取增城市城乡规划局所需的各级地名数据,并分类、赋代码、赋属性、检查建库。 相似文献
13.
针对国内对"一国两制"的内在矛盾及其长期性、复杂性和艰巨性认识的不足,以及香港社会出现对"一国两制"的不同声音。该文提出了作为"一国两制"的制定者、主导者的中央政府,应该重新认识"一国两制",加强香港的去殖民化教育,去殖民化教育应从潜移默化的、日常频繁使用的、浓厚殖民色彩的地名更名开始。该文研究了香港殖民色彩地名的历史情况,提出了三步走的更名战略。 相似文献
14.
地理编码系统中地名地址分词算法研究 总被引:4,自引:0,他引:4
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。 相似文献
15.
结合济宁市基础地理信息数据整合及地名地址数据库建设项目介绍了地名地址数据采集方法,并利用先进的自主开发软件程序完成了数据编辑、入库等工作,解决了数据转换、入库数据丢失和错漏的问题,实现了无损转换和无缝衔接,提高了工作效率,为其他地区开展地名地址数据采集和建库工作积累了经验,提供了参考。 相似文献
16.
肖计划 《测绘科学技术学报》2014,(4)
建立了一个试验用地名库和地理语料库,在此基础上构建对地名用字可信度的统计分析模型。通过分析地名在中文文档中的使用习惯和规律,总结出经常与地名一起使用的且具有地名指示含义的辅助字或词,以此为基础建立地名识别辅助词词库和地名识别的规则库。对地名库和地理语料库的用字进行统计分析,通过设定地名用字可信度概率阈值和辅助词指示作用对文本中潜在地名进行初步的筛选形成候选地名;在粗筛选产生的候选地名基础上结合地名识别规则进一步确认,以提高地名识别的准确率。 相似文献
17.
18.
针对目前地名文化中客家聚落地名研究的不足,该文从客家迁徙历史的角度,提出了客家地名定性和定量的研究方法,以客家摇篮石城地名为研究对象,采用核密度分析法和多元logit回归模型方法,深入分析石城客家地名的时空分布特征和历史演变因素。结果显示:在时间上,客家地名数量整体呈现上升趋势,增长时间分为5个阶段,隋唐萌芽时期、宋朝大量增长期、元朝缓慢增长期、明朝平稳增长期和清朝快速增长期;在空间上,客家地名分布显现出聚集特征,但聚集程度各异,聚集点和聚集区域随着时间的推移而变化。根据logit模型结果显示,地形、河流、人口和经济等多种因素交融在一起,对客家地名的演化产生了重大而深远的影响。 相似文献
19.
地理信息数据处于动态变化之中,传统的地理信息数据采集方式由少量专业单位组织,耗时长、效率低,难以满足数据的快速采集和及时更新要求。本文介绍了基于Web平台的志愿者地名地址数据采集方案,由志愿者提交地名地址数据的网站和数据库,利用互联网的高效、开放、共享等特点,实现对海量地理数据的快速采集和更新,是一种高效低廉的地理信息数据采集方式,每个用户既是地理信息的使用者,也是地理信息的提供者,可长期低成本维持地理信息数据的现势性。 相似文献