首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
对于不同区域、类别的地名地址文本数据,各互联网地图平台提供的在线地理编码与地名检索服务质量参差不齐,用户无法快捷获取地名地址空间化最优结果。该文提出一种基于国内3种主流地图平台的多源在线地理编码与地名检索服务聚合方法,包括数据预处理、最小行政区划提取、地理编码与地名检索服务定位结果获取、最优定位结果选取等内容。以四川省3个地区4类兴趣点作为样本数据,设计了16种地名地址空间化实验,从匹配率、定位精度两方面比较分析各实验结果优劣。结果表明,该文方法显著提升了地名地址空间化质量,具有普适性;相对于单平台地理编码服务,精确匹配率增加了14%~61%,定位精度≤50m的比例增加了15%~43%;定位质量提升幅度与实验数据地址质量呈负相关。  相似文献   

2.
地址解析是地理编码的核心任务之一,而混乱的地址标准、随意的中文地址表达给地址解析带来了极大困难。该文提出一种基于条件随机场的非规范化中文地址解析方法。一方面,综合分析各种非规范化地址要素的类型特征,在现有标注体系基础上设计出一套优化的地址要素分类标注体系,并制定特征模板,然后采用自训练半监督学习与人工标注互补融合的策略,获取大量高质量的已标注语料供模型训练;另一方面,挑选已标注语料训练条件随机场模型,实现对地址要素的自动解析。选取广东省博罗县30 000条地址进行算法验证和解析性能评测。实验表明,与其他语料标注方法相比,该方法在获取有效地址解析的同时,显著降低了标注成本。结果表明,该方法适用于地理编码领域中大规模非规范化中文地址的自动解析。  相似文献   

3.
在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。  相似文献   

4.
多级地理空间网格框架及其关键技术初探   总被引:1,自引:0,他引:1  
为了有效管理、组织和利用海量空间数据,解决存储架构与现有空间数据结构不一致的矛盾,在融合国内外各种球面剖分模型优点基础上,设计了一种多级地理空间网格框架。该网格框架以地图分幅划分方式为基础,利用经纬度间隔对全球进行层次性剖分,形成遥感数据、测绘数据及其他空间数据的统一组织框架。通过对网格单元的地址与属性编码,实现空间数据的直接存储和索引,从而完成对空间信息的无缝拼接与多尺度管理。最后阐述了实现地理空间网格框架的关键技术,包括空时一体化技术、计算集群存储技术和空间索引技术等。  相似文献   

5.
滑坡负样本在统计型滑坡危险度制图中具有重要作用,能抑制统计模型对滑坡危险度的高估。当前滑坡负样本采样方法采集的负样本可信度未知,在负样本采样过程中,极有可能将那些潜在滑坡点错选为负样本,这些假的负样本会降低负样本集的质量和训练样本集的质量,进而影响统计模型的精度。本文基于“地理环境越相似、地理特征越相似”的地理学常识,认为与正样本有着相似地理环境的点极有可能是未来发生滑坡的点;与正样本的地理环境越不相似的点,则越有可能是负样本。基于此假设提出一种基于地理环境相似度的负样本可信度度量方法,将该方法应用于滑坡灾害频发的陇南山区油房沟流域,对油房沟进行滑坡负样本可信度评价制图;使用油房沟流域的滑坡发生初始面来验证该方法的有效性。结果发现:滑坡发生初始面上所有栅格点的负样本可信度平均值为0.26,超过95%的栅格点的负样本可信度都小于0.5,说明本文提出的负样本可信度度量方法合理。  相似文献   

6.
地理距离越相近的空间单元其相似性越高,但传统遥感影像分类常忽略像素空间坐标信息的重要性。该文提出一种将传统空谱信息与像素坐标耦合的遥感影像分类方法,为避免数据过拟合现象,采用随机森林模型对特征进行重要性评估,选取具有代表性的特征。利用不同分辨率的卫星与航空遥感影像数据,基于随机森林、支持向量机和人工神经网络3种模型对该方法进行验证,结果显示:相比传统仅使用光谱和纹理信息,耦合像素坐标信息的遥感影像分类可在一定程度上关注全局地理空间位置信息,利用地理单元越相近则性质越相似规律,提高遥感影像分类效果,在不同样本量、不同模型下的分类精度均有所提升。  相似文献   

7.
对地理信息分类编码的认识与思考   总被引:1,自引:0,他引:1  
面向GIS的地理信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法。该文从地理实体、地理数据与地理信息概念角度 ,探讨地理信息分类编码对象的本质特征 ;简要分析大多数商品化GIS软件中属性数据的表达方式 ,指出地理信息分类编码实质上是从GIS数据组织的概念层次上对属性信息的分类分级 ;提出地理信息分类粒度概念 ,并建立地理信息分类模型 ,列举了在不同视图下的粗粒地理信息分类方案和代码用途 ;提出并讨论地理信息分类编码尚待进一步研究的问题 ,以及国内长期以来难以形成地理信息分类标准的原因。  相似文献   

8.
对地理信息分类编码的认识与思考   总被引:21,自引:0,他引:21  
面向GIS的地理信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法,该文从地理实体,地理数据与地理信息概念角度,探讨地理信息分类编码对象的本质特征;简要分析大多数商品化GIS软件中属性数据的表达方式,指出地理信息分类编码实质上是从GIS数据组织的概念层次上对属性信息的分类分级;提出地理信息分类粒度概念,并建立地理信息分类模型。列举了在不同视图下的粗粒地理信息分类方案和代码用途;提出并讨论地理信息分类编码尚待进一步研究的问题,以及国内长期以来难以形成地理信息分类标准的原因。  相似文献   

9.
地址编码是基于空间定位技术的一种编码方法,它提供了一种把描述性地址信息转换成地理坐标的方式.院落作为城市最基本的地理实体之一,其地址编码的科学性、合理性对地址匹配有着重要意义.该文通过对院落空间特征分析,总结了院落与内部建筑、周围兴趣点及相邻街道间存在的包含、邻近及关联3种空间关系,在此基础上研究了院落相关地理实体的地址编码方法;最后验证了顾及实体空间关系的地址编码方法对地址匹配的精度和效率都有所提升.  相似文献   

10.
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面.但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题.为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力.以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能.  相似文献   

11.
基于FCS框架的城市文化产业景观生态特征及网络关联   总被引:3,自引:1,他引:2  
传统的产业研究多基于数量结构的分析范式,忽视产业集聚形态层面呈现的规律性。论文尝试基于高德地图POI数据,从微观到宏观尺度分析地理嵌套层级关系,构建企业(firm, F)-集群(cluster, C)-系统(system, S)多尺度结合的FCS产业生态分析框架,基于产业分类标准将城市文化产业POI点分为文化艺术、新闻出版、广播影视、体育健身和娱乐休闲5大类,选取济南市城区为案例区,利用500 m蜂巢格网,综合POI点核密度分析、景观产业生态学模型及社会网络分析方法,揭示文化产业点集聚、产业集群景观与产业系统网络关联的特点。研究结论如下:① 通过建立基于POI点数据的文化产业分类体系,利用区位商模型建立从产业点到产业景观的研究手段,拓展文化产业空间研究的新视角;② 济南市文化产业具有连片集中与分散聚集的特点,景观镶嵌体空间形态特征存在区域异质性,不同产业类型彼此交织构成生态网络,系统层面存在耦合关联,其中娱乐休闲业表现出群体数量优势,而广播影视业却扮演着关键物种的角色。相应的发现可为不同层面的产业调控与政策优化提供依据,深化了产业区位分析的理论与方法,拓展了地理微观大数据的应用实践。  相似文献   

12.
成功的生态系统的监测取决于准确的分类结果。本文试图对沼泽湿地的生态特征进行监测。遥感分类常被用于描述生态系统或土地覆盖的格局情况。不同空间分辨率的的遥感影像反映的景观类型,景观特征均存在差异。本文利用不同空间分辨率的遥感影像,对洪河自然保护区湿地生态系统在群落尺度上进行监测。洪河湿地自然保护区是典型的内陆原始沼泽湿地生态系统的保护地,以草本沼泽植被和水生植被为主。根据SPOT-5不同分辨率10 m×10 m、20 m×20 m、30 m×30 m的影像,以及30 m空间分辨率的Landsat TM影像,利用最大似然法(MLC)对洪河保护区进行分类。为了验证分类结果的精度,本文利用航空影像分类数据作为样本,对SPOT-5和TM分类结果进行KAPPA精度验证。由分类结果,得出以下结论:(1)分类结果验证数据对结果的影响很重要;(2)不同传感器的影像对地面生态系统的表达内容不一样,即使是处于相同的光谱波段,同一空间分辨率的情况下。分类结果不仅取决于生态系统类型的多样性和斑块形状,还取决于面积维数和斑块的聚合度。(3)洪河自然保护区核心区湿地保护最好,其次是缓冲区,最差的是实验区。实验区已经有大面积的湿地被人类开垦成农田,湿地生态系统已经退化的很严重。因此,对珍稀生态系统的保护应该与人类的活动区强制的隔离开,才能保护原始湿地生态系统多样性。  相似文献   

13.
国家资源环境数据库信息分类编码及应用模式   总被引:5,自引:0,他引:5  
从资源环境信息分类编码基本概念与分类对象的依据、数据分层与资源环境信息分类以及资源环境概念数据库与逻辑数据库设计角度,描述国家资源环境数据库信息分类编码的概念模式与分类方法,并在优化、整合现有各类专题资源环境与基础地理信息的分类编码方案的基础上,提出国家资源环境数据库综合信息分类与编码应用模式;指出面向GIS的资源环境信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法,它对资源环境数据库视图的建立、系统间的数据共享与互操作具有重要意义;本文还就某些与信息分类编码相关的问题与需要进一步研究的工作进行了讨论.  相似文献   

14.
谢明霞  王家耀  陈科 《地理科学进展》2016,35(11):1360-1368
地理国情分类区划是认知和分析地理国情的有效途径,是研究认识地理国情类型特征、组合及其演变趋势的区域差异和地理国情空间分异的基础。本文通过对地理国情普查的基本统计数据进行分析,制定了地理国情分类区划的指标体系;基于多维尺度分析和聚类分析,构建了地理国情分类区划模型。选择河南省地理国情普查数据,对其进行分类区划实验。通过对地理国情数据进行多维尺度分析,根据分析的可视化结果,可直观地确定地理国情的分类区划数,并将此设置为初始的聚类数;在此基础上进行k均值聚类,可实现河南省地理国情的分类区划,通过对各聚类簇中指标数据特征进行分析,并根据各聚类簇中心对区划各类型进行定义和解释,最后对聚类结果进行空间化表达。结果表明:河南省地理国情可划分为指标数据极值区、指标数据低值区、指标数据中值区和指标数据高值区4类,且根据空间集聚性分析,可判断分类区划的空间集聚效应显著,各区划类型间相互包容和渗透,集聚呈4条西南?东北的条状带。该项工作可为统筹地理国情与区域可持续发展,制定切实可行的区域发展政策提供科学依据。  相似文献   

15.
采用基于风条纹提取风向的方式,利用地球物理模式函数,基于Sentinel-1A数据,通过CMOD5模型反演2017年3、5、7、12月份广东省近海海域风场。将反演结果与实测数据对比,风速普遍比实测风速大,风速反演的平均绝对误差为1.98 m/s,均方根误差为2.74 m/s,相关系数为0.8。其中3、5、7月的风速较为接近,且平均绝对误差和均方根误差都<2 m/s,而12月份平均风速>8 m/s,实测数据与卫星过境时间不完全匹配,导致平均绝对误差和均方根误差都偏大。哨兵一(Sentinel-1A)影像反演结果整体上与实测数据相一致,验证了COMD5反演模型适用于广东省近海高分辨率海洋风场反演,可为下一步估算广东省风能资源储量提供可能。  相似文献   

16.
空间索引技术可提供高效的空间数据组织与管理方式,以支撑海量空间数据的挖掘与分析。针对当前空间索引存在的知识体系不明晰、选择难等问题,该文通过文献调查法和CiteSpace工具,依据空间划分及映射方法将空间索引划分为基于树结构、格网、空间填充曲线和地址编码的空间索引四大类,并综述其原理、空间结构、适用范围及在GIS领域的应用,最后对空间索引在数据组织、高效计算、可视化、可靠性等方面的研究进行展望。结论如下:基于树结构的空间索引最具普适性且可以处理多维度及多层次的数据,查询性能依赖于树结构的平衡性及数据的分布;基于格网的空间索引可以均匀划分空间以便于高效范围查询,却不适用于非结构化或动态数据集;基于空间填充曲线的空间索引可以在实现维度压缩的同时保持局部邻近性,但插入或删除数据可能导致整个曲线的重构难以频繁更新;基于地址编码的空间索引将语义地址信息转化为编码信息,便于高效检索,然而语义地址匹配仍存在较大误差和不确定性。研究结果可为空间数据组织和结构设计提供参考。  相似文献   

17.
利用TM数据提取干旱区土地覆被信息的方法比较   总被引:8,自引:3,他引:5  
以柴达木盆地香日德绿洲作为研究实验区,对该区域ETM遥感数据经过空间分辨率融合、主成分分析等方法进行空间信息增强及专题信息增强处理,组合最佳视觉背景图像,分别在不同背景图像上选择训练样本,利用最大似然法监督分类方法(MLC)、多空间尺度分层聚类(SSHC)和基于知识的模糊聚类方法(KFC)等分类器,分别用各自训练样本初始化各类别信息特征值,形成类别特征值模式库,分别以此为基础对待分样本进行分类,对初分类的结果经过类别合并、碎斑滤除以及重新编码赋色等分类后处理,得到最终分类结果及分类精度评价结果。从所获数据可以得出如下结论:从总体精度和Kappa值可知,SSHC和.KFC分类方法所获结果精度较高,总体精度比MLC分类结果约高于3%,SSHC之结果精度略高于KFC之结果;SSHC、KFC和MLC三种分类方法对该区域地表覆被信息的提取分类中,SSHC分类方法对耕地、石砾地、河滩和荒漠分类结果较好,KFC分类方法对耕地、沙地、河滩和荒漠分类结果较好,MLC分类方法对耕地、河滩和荒漠分类结果较好,三种分类方法对耕地、河滩和荒漠等三种地类的分类精度较高,用户精度都在80%以上,而对沙地和石砾地的分类结果其用户精度大都低于80%。  相似文献   

18.
地理格网编码是高效管理、分析和查询海量地理空间位置数据并提供信息服务中非常重要且基础的工作。GeoHash、Google S2和Uber H3是目前商业应用上3种较常用的地理格网编码方法,该文从地理编码的基本概念及其演变过程出发,介绍当前地理编码所涉及的地理格网剖分和编码运算方法,然后从算法概况、编码方式、编码层级及其对应空间范围等方面对3种方法进行阐释,最后从正多面体选择、剖分单元、填充曲线、编码层级、邻域查询与邻域距离类型和算法应用优缺点等方面进行对比分析,以深入挖掘3种方法的应用价值和前景,可为基于地理位置大数据的研究与应用提供借鉴。  相似文献   

19.
张艳林  李敏  刘宇文  李佳  侯钰婧 《地理科学》2022,42(6):993-1004
基于“学籍信息中的家庭地址承载了学生空间位置”这一假设,通过学籍信息收集了湖南省株洲县小学生的家庭地址,借助高德开放平台提供的地理编码和POI搜索服务,获得到了株洲县小学生的空间位置和分布,并基于最短路径分析和高斯型两步移动搜索法分析了株洲县小学教育资源的空间可达性及其特征,尝试为区域教育资源的空间均衡性分析与规划配置提供新的数据源和方法借鉴。结果表明:① 基于学籍地址和地理编码技术能够较准确地获取株洲县小学生的空间分布。② 株洲县小学生就近入学距离的最大值、平均值和中位数分别为11.83 km、2.10 km和1.81 km,就近入学距离小于2.0 km的学生仅占55.46%,为株洲县兼顾公平和效率的教育资源配置工作带来了挑战。③ 株洲县北部城镇地区因学校数量较多,平均就近入学距离较小,教育资源的空间可达性普遍较高,且空间差异小,均衡性好;而东南部的乡村地区,平均就近入学距离较大,教育资源的空间可达性普遍较低,且空间差异大。④ 基于情景分析,在不造成局地生源稳定性问题的前提下,新增3所学校后,东南部地区的平均就近入学距离和教育资源的空间可达性有很大的改善,龙潭镇和龙门镇的平均入学距离由3784 m和3520 m降低到3116 m和2636 m,教育资源的空间可达性分别由0.0492和0.0982提高到0.0762和0.1496。  相似文献   

20.
国家自然地图数据库信息分类与编码体系   总被引:2,自引:0,他引:2  
朱澈 《地理科学进展》2001,20(Z1):52-62
本文着重研究利用《中华人民共和国国家自然地图集》,作为主要的信息来源,建立“国家自然地图数据库的信息分类与编码体系,分类原则和子分类体系。在此基础上完成了编码方案、分类原则、编码标准和专题编码的结构,同时描述了建立“国家自然地图数据库”的技术路线、地理数据组织、元数据库及数据字典等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号