首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
地址解析是地理编码的核心任务之一,而混乱的地址标准、随意的中文地址表达给地址解析带来了极大困难。该文提出一种基于条件随机场的非规范化中文地址解析方法。一方面,综合分析各种非规范化地址要素的类型特征,在现有标注体系基础上设计出一套优化的地址要素分类标注体系,并制定特征模板,然后采用自训练半监督学习与人工标注互补融合的策略,获取大量高质量的已标注语料供模型训练;另一方面,挑选已标注语料训练条件随机场模型,实现对地址要素的自动解析。选取广东省博罗县30 000条地址进行算法验证和解析性能评测。实验表明,与其他语料标注方法相比,该方法在获取有效地址解析的同时,显著降低了标注成本。结果表明,该方法适用于地理编码领域中大规模非规范化中文地址的自动解析。  相似文献   

2.
在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。  相似文献   

3.
针对现有方法从微博中识别时空信息精度较低且相对粗略的问题,该文提出基于双向长短期记忆网络和条件随机场(BiLSTM-CRF)与分类分层标注的微博中突发事件时空信息精细识别方法(MFISIE).首先,设计一套适用于微博中突发事件的分类分层时空信息标注体系(CHSIAS),构建微博语料库;然后,结合BiLSTM-CRF构建微博时空信息识别模型,并利用117567条标注的微博语料进行实验.结果表明:与人民日报语料标注体系相比,CHSIAS与CRF、BiLSTM、BiLSTM-CRF 3种方法结合进行时空信息识别,F值均较高,且可获得多层级、精细化的突发事件时空信息,其中,基于BiLSTM-CRF的MFISIE方法的F值(91.2%)最高.使用CHSIAS时,BiL-STM-CRF对时间信息的识别效果最好,其对兴趣点、建筑物和相对位置描述识别结果的F值比BiLSTM方法分别提升了8.8%、6.3%和12.3%,比CRF方法分别提升了7.1%、7.7%和8.9%.MFISIE可更精确地提取微博中突发事件的时空信息,为突发事件应急信息的快速感知与精准应用提供技术支撑.  相似文献   

4.
为有效实施植被信息获取及监测,亟需分类准确及易于推广的植被信息识别技术。本文利用无人机航拍获取植被光学影像,利用深度语义分割技术建构植被种类识别模型,为植被变化动态监测提供准确的植被类别信息。首先,基于安溪县龙门镇崩岗区的采样点,获取20 m航拍高度的无人机影像,构建FCN-VGG19植被识别模型,探讨不同特征融合结构对FCN-VGG19识别性能的影响,测算出各植被的覆盖面积;其次,取安溪县另一取样点的无人机影像作为验证集,分析FCN-VGG19的迁移学习能力,验证模型稳健性。结果表明:(1)基于20 m高度的无人机影像建立的FCN-VGG19-8s模型识别正确率最高,为86. 30%;(2) FCN-VGG19-8s识别精度高于FCN-VGG19-32s;并从测试集中随机抽取一张图,测算该测试图的马尾松覆盖面积为78. 38 m2,芒萁覆盖面积为12. 77 m2,柠檬桉覆盖面积为0. 89 m2;(3)在模型的迁移学习能力试验分析中,当A数据集占训练集的比例下降时,对模型识别B数据集的影响不大;当B数据集的数据量减少时,其识别精度稍有下降,仍有84. 5%。本文基于无人机光学影像,结合深度语义分割模型进行植被识别,以福建安溪县为例验证模型稳健性,分析模型在测算植被覆盖面积的适用性,旨在为植被识别研究提供新思路。  相似文献   

5.
高质量地图点要素标注及自动配置问题是地图制图中的难点之一。为了解决地图点要素标注中的重叠问题,提出基于遗传算法的局部优化功能实现防重叠冲突的地图点要素标注。该文首先通过地图点要素标注的位置分配问题,建立基于点要素的八位置候选模型。其次,针对地图点的防重叠冲突问题,提出地图点标注的重叠数量评价函数和重叠面积评价函数,记录每一次迭代过程中点要素标注的重叠个数和重叠面积,得到标注重叠质量得分,进而得到适应度评分。最后基于3种评分结果建立新的终止条件,将数次迭代后满足该条件的标注设置为最终的配置方案。实验采用随机模拟数据和福州大学城实际数据进行验证,结果表明基于遗传算法和防重叠冲突的点标注配置与一般的标注配置相比,其重叠个数减少了89%。在迭代过程中最后一代相较于第一代的重叠面积减少了75%,标注的适应度提升54.5%。该算法能够有效地计算出群体点标注的近似最优解,显著提升地图标注的美观性和位置平衡性,适用于网络地图和专题地图点要素的自动化标注和配置。  相似文献   

6.
借助携带地理信息的图像数据,标注未知图像的地理信息,是图像视频地理信息系统迫切需要的基于内容的检索工具。传统基于文本的地理信息标注方法主要借助人工完成,效率低下且无法运用于视频GIS检索之中,针对该问题,提出了基于流形结构的图像地理信息标注方法。该方法提取图像的视觉特征作为相似度度量,重构地理图像的流形结构,用以刻画不同视角视图图像的渐进变化规律,建立相同地理位置不同视角图像之间的内部关联,以便携带地理信息的共享。构建地理图像的流形结构需要连续视角变化的地理图像,当已有地理图像视角变化跳跃时,提出利用主动学习策略,通过交互完成视角变化跳跃位置的地理图像补充,同时进行增量式训练,提升地理信息标注方法的泛化能力。实验结果表明,给出携带地理信息的图像,该文方法可以获得相同地理位置处流形结构内的所有地理图像,高效完成地理信息标注。此外,在应对成像视角变化跳跃的情况时,具有较强的鲁棒性。  相似文献   

7.
中文文本中时间信息解析方法   总被引:1,自引:0,他引:1  
探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。  相似文献   

8.
地址编码是基于空间定位技术的一种编码方法,它提供了一种把描述性地址信息转换成地理坐标的方式.院落作为城市最基本的地理实体之一,其地址编码的科学性、合理性对地址匹配有着重要意义.该文通过对院落空间特征分析,总结了院落与内部建筑、周围兴趣点及相邻街道间存在的包含、邻近及关联3种空间关系,在此基础上研究了院落相关地理实体的地址编码方法;最后验证了顾及实体空间关系的地址编码方法对地址匹配的精度和效率都有所提升.  相似文献   

9.
空间索引技术可提供高效的空间数据组织与管理方式,以支撑海量空间数据的挖掘与分析。针对当前空间索引存在的知识体系不明晰、选择难等问题,该文通过文献调查法和CiteSpace工具,依据空间划分及映射方法将空间索引划分为基于树结构、格网、空间填充曲线和地址编码的空间索引四大类,并综述其原理、空间结构、适用范围及在GIS领域的应用,最后对空间索引在数据组织、高效计算、可视化、可靠性等方面的研究进行展望。结论如下:基于树结构的空间索引最具普适性且可以处理多维度及多层次的数据,查询性能依赖于树结构的平衡性及数据的分布;基于格网的空间索引可以均匀划分空间以便于高效范围查询,却不适用于非结构化或动态数据集;基于空间填充曲线的空间索引可以在实现维度压缩的同时保持局部邻近性,但插入或删除数据可能导致整个曲线的重构难以频繁更新;基于地址编码的空间索引将语义地址信息转化为编码信息,便于高效检索,然而语义地址匹配仍存在较大误差和不确定性。研究结果可为空间数据组织和结构设计提供参考。  相似文献   

10.
王凌霄  贾婧 《热带地理》2021,41(4):834-844
目前海岛经济快速发展,为避免海岛建筑无序扩建,了解海岛建筑分布特征尤为重要。机器学习方法是从高分遥感影像提取地物目标的常见方式,然而建筑物遥感特征复杂,机器学习方法出现鲁棒性差、难以充分挖掘深层次特征的弊端。文章提出基于DeepLabv3plus网络模型的深度学习语义分割方法提取海岛建筑,并对网络结构进行改进,使用组归一化(GN)方法替代批归一化(BN)以适合小batch size下的语义分割操作。针对海岛建筑数据量较少的问题,采用迁移学习策略,设计基于多源数据的国内城市建筑数据集的预训练样本智能采集和标注方法,再人工标注中国部分海岛建筑进行算法实验。结果表明,在batch size较小时,基于GN的DeepLabv3plus语义分割算法的平均精度和mIoU均得到提升,能够获得更为精确的像素级海岛建筑提取结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号