首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 297 毫秒
1.
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面.但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题.为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力.以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能.  相似文献   

2.
及时有效地从快速更新的交通微博文本中提取位置信息是实现智能交通服务的前提之一.该文分析交通事件文本中常用的位置表达模式,结合有限状态机进行位置模式匹配,提出一种微博文本位置信息提取模型.首先根据微博文本位置信息的句法表达特征,基于线性参照方法提取空间特征词的词性与角色属性,构建位置表达模式,并表达为T rie搜索树结构;其次对微博文本进行分词、词性标注等预处理,利用有限状态机建立位置信息提取模型,实现微博文本位置信息提取;最后以南昌、广州、深圳3个城市9799条路况微博文本为实验数据,验证该模型的有效性.结果表明,该模型的准确率和召回率均达85% 以上,可有效提取交通微博文本中的位置信息.  相似文献   

3.
地址解析是地理编码的核心任务之一,而混乱的地址标准、随意的中文地址表达给地址解析带来了极大困难。该文提出一种基于条件随机场的非规范化中文地址解析方法。一方面,综合分析各种非规范化地址要素的类型特征,在现有标注体系基础上设计出一套优化的地址要素分类标注体系,并制定特征模板,然后采用自训练半监督学习与人工标注互补融合的策略,获取大量高质量的已标注语料供模型训练;另一方面,挑选已标注语料训练条件随机场模型,实现对地址要素的自动解析。选取广东省博罗县30 000条地址进行算法验证和解析性能评测。实验表明,与其他语料标注方法相比,该方法在获取有效地址解析的同时,显著降低了标注成本。结果表明,该方法适用于地理编码领域中大规模非规范化中文地址的自动解析。  相似文献   

4.
中文文本中时间信息解析方法   总被引:1,自引:0,他引:1  
探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。  相似文献   

5.
以广西桂林会仙国家湿地公园核心区为研究区,结合SegNet和低空无人机影像,构建会仙岩溶湿地地物信息提取模型,探讨多分类SegNet模型与融合单分类和双分类SegNet模型分类结果的差别,分析epoch参数设置对模型分类精度的影响。研究结果表明,多分类SegNet模型对会仙岩溶湿地地物的分类结果的Kappa系数和F1分数分别为0.59和0.67,融合单分类和双分类SegNet模型分类结果的Kappa系数和F1分数分别为0.68和0.79;与多分类SegNet模型分类结果精度相比,融合多个单分类和双分类SegNet模型分类结果的F1分数明显增大。因此,融合多个单分类和双分类的SegNet模型更适用于提取会仙岩溶湿地地物信息;构建更优的会仙岩溶湿地地物提取SegNet模型,设置epoch值为10相对更合适。  相似文献   

6.
以中国东北赤峰市美林地区5种典型优势树种为研究对象,采用与当地森林植被生长期相对应的5景Senti-nel-2影像,借助支持向量机模型(SVM)与递归特征消除算法(RFE),根据可见光-近红外波段(VNIR)与不同红边谱段(RE)及红边指数(REVI)组合条件下的森林优势树种可分性测度及结果精度差异,探讨Sentinel-2影像不同红边谱段及其指数特征对区域优势树种遥感识别的影响.结果表明:Sentinel-2影像红边谱段的不同组合方式对不同生长期优势树种识别影响存在显著差异(P<0.05),其中VNIR+B5+B6为生长盛期的最佳组合方式,能够在VNIR基础上将生长盛期的识别精度均值提升约7.71%;叶全变色期是进行优势树种识别的最佳时期(P<0.05),该时期基于VNIR波段的识别精度均值达71.28%,在叠加红边波段B5+B6后提升至75.41%.此外,采用SVM-RFE算法构建适用于不同生长期的最佳REVI组合,其平均识别精度能够在全年5个生长期达到72.00%~84.31%,相比同时期基于RE+VNIR组合的最优识别结果平均提升了10.77%;在此基础上,构建适用于全生长期的优选植被指数PSRI+mSAVI+CIred-edge时间序列,可实现89.03%的平均识别精度,比单时相最佳REVI组合提升了4.72%~17.03%.研究证明Sentinel-2影像红边谱段及其衍生指数特征在区域森林优势树种识别中具有较高的应用价值,可为快速、准确地提取不同生长期森林植被信息提供技术方法参考.  相似文献   

7.
以2020年第6号台风“米克拉”为例,采集了5916条新浪微博作为数据源,综合应用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型、文本情感分析方法和空间分析技术,挖掘、分析台风的灾情时空过程。基于LDA主题模型建立了主题-词矩阵并进行隐含主题聚类,这些微博文本被分为灾损类信息、预警类信息、防御类信息和无关信息;从主题信息和文本情感值两个角度入手,对此次台风事件网络舆情的演化过程进行分析。结果表明:“米克拉”登陆前有大量积极情感的微博,主要包含渴望降雨、降温等信息,此类微博大量分布在漳州、厦门、福州等地区;在台风入境后消极情感的微博大量增多,主要描述道路、树木等受大风和大雨影响的灾损类信息,此类信息的空间位置主要分布在漳州和厦门,能较好地反映台风灾害影响的时空分布。通过对微博主题类别和情感极性进行时空分析,实现台风灾害事件发展趋势的监测,为防灾减灾提供参考依据。  相似文献   

8.
以往的蚀变岩石光谱分类方法包括机器学习模型和浅层神经网络模型,且均使用光谱波形特征作为模型分类依据.小波变换能够将光谱数据转换为频谱图进行奇异性探测,显示光谱瞬态突变信息.该文使用5种不同蚀变类型的石英闪长玢岩光谱数据,通过Symlets小波变换将光谱数据转换为频谱图,作为深度卷积分类模型的基础数据,再利用50层深度残差网络(ResNet50)模型对数据进行分类,并选取准确率、损失值、召回率、精确率以及F1参数对结果进行评价.通过与传统的机器学习方法及其他方法进行比较,证明该模型的准确率和F1参数均优于对比模型,测试集分类准确率达到99.67%,表明该模型对蚀变岩石光谱数据分类的适用性较强,且具有较好的鲁棒性和泛化性.  相似文献   

9.
为了准确地识别红树林中的各种红树物种种群分布区,以广东湛江红树林国家级自然保护区核心区的高桥红树林区为研究区,采用决策树算法、随机森林算法、自适应提升算法、梯度提升决策树算法、极端梯度提升算法和轻量级梯度提升机算法,利用WorldView-2卫星的高分辨率影像数据,构建影像的原始光谱波段、原始光谱波段+植被指数、原始光谱波段+植被指数+纹理特征3种特征组合数据集,识别研究区红树林中的各种红树物种种群分布区,分析各种算法在红树物种识别中的适用性。研究结果表明,5种集成学习算法的分类结果都优于决策树算法,其中,轻量级梯度提升机算法分类结果的分类精度最高,基于WorldView-2影像的8个原始光谱波段+12种植被指数+28种纹理特征,轻量级梯度提升机算法分类结果的总体分类精度值为93.15%,其分配不一致性值为5.07%,数量不一致性值为1.78%;极端梯度提升算法和随机森林算法在红树物种识别中也具有良好的适用性。WorldView-2卫星影像是对红树林中各种红树物种进行遥感分类的理想数据源,其纹理特征能显著提高分类精度,轻量级梯度提升机算法在红树物种识别中具有很大的应用潜力。  相似文献   

10.
国家资源环境数据库信息分类编码及应用模式   总被引:5,自引:0,他引:5  
从资源环境信息分类编码基本概念与分类对象的依据、数据分层与资源环境信息分类以及资源环境概念数据库与逻辑数据库设计角度,描述国家资源环境数据库信息分类编码的概念模式与分类方法,并在优化、整合现有各类专题资源环境与基础地理信息的分类编码方案的基础上,提出国家资源环境数据库综合信息分类与编码应用模式;指出面向GIS的资源环境信息分类编码是在概念水平上解决空间信息分层组织与属性数据库结构设计的重要方法,它对资源环境数据库视图的建立、系统间的数据共享与互操作具有重要意义;本文还就某些与信息分类编码相关的问题与需要进一步研究的工作进行了讨论.  相似文献   

11.
The ever‐increasing number of spatial data sets accessible through spatial data clearinghouses continues to make geographic information retrieval and spatial data discovery major challenges. Such challenges have been addressed in the discipline of Information Retrieval through ranking of data according to inferred degrees of relevance. Spatial data, however, present an additional challenge as they are characteristically made up of geometry, attribute and, optionally, temporal components. As these components are mutually independent of one another, this paper suggests that they be ranked independently of one another. The representation of the results of the independent ranking of these three components of spatial data suggests that representation of the results of the ranking process requires an alternative approach to currently used textual ranked lists: visualisation of relevance in a three‐dimensional visualisation environment. To illustrate the possible application of such an approach, a prototype browser is presented.  相似文献   

12.
可持续发展评判的指标体系是对可持续发展进行科学评判和决策的一个重要组成部分.从经济、社会、人口、资源、环境5个方面构建了由35个指标构成的哈尔滨市的可持续发展指标体系,并对其1995~2004年的可持续发展趋势进行了分析.分析结果表明,哈尔滨市从1995~2004年经济发展一直呈现稳步上升的趋势,社会、人口、环境和资源子系统呈现比较波动的趋势.2000年后,逐渐进入环境质量提高、资源消耗量下降的时期,环境污染、资源消耗与发展的综合指数越来越低,发展趋势也渐好,说明哈尔滨市的可持续发展的能力在不断提高.  相似文献   

13.
14.
王丰龙  刘云刚 《热带地理》2011,31(4):403-408
城市化率在表征城市化水平时受到历时性因素和空间性差异的局限和扭曲;前者表现在城市化率难以衡量城市化发展后期阶段的差异和国内不同时期的城市化政策对城市化率的系统性冲击,后者主要表现在地域分异下的个体效应和规模影响下的尺度效应.针对尺度效应,本文运用反演方法和地图方法,论证了城市化率在表征城市化水平时所受到尺度的两种影响;...  相似文献   

15.
分析了丁坝局部冲刷的过程和特征。以量纲理论为基础,通过对国内外公开发表的试验资料采用多元回归的方法。建立了不漫水丁坝清水冲刷的局部最大冲刷深度的计算公式。公式考虑了水深、流速、坝长、丁坝与水流夹角、坝头边坡、泥沙不均匀性等对冲深有影响的因素。其中,对于泥沙的非均匀性,传统方法很少考虑,一般是将均匀沙、非均匀沙的资料一起来分析,在此对其进行了定量的讨论。最终通过西藏地区公路沿线河流丁坝冲刷的实测数据对理论公式检验,发现计算值与实测值吻合较好,其公式可应用于西藏干线公路沿河路基防护工程丁坝局部冲刷深度计算。  相似文献   

16.
在伟大丝绸之路复兴的新历史阶段背景下,结合全球和区域市场一体化,文章分析了城市群这一最为重要增长极形成的关键因素和先决条件,在此基础上研究了区域空间组织问题。在欧亚地缘战略中哈萨克斯坦具有横贯中西的区位优势,文章综合评估了哈萨克斯坦城市群发展的可能方向、可能存在的负面影响及其影响范围。研究表明,哈萨克斯坦当前的城市化过程具有多维特征,城市群地区人口占总人口比重明显上升,城市的集聚形式预示着定居形式的成熟,并塑造着特有的社会经济空间,如区域核心、对外经济联系的节点、内部基础设施最重要的连接点等。城市群将扮演区域一体化的特殊平台,以城市群为基础,哈萨克斯坦将在新丝绸之路建设中恢复其重要历史地位,它将成为中亚地区贸易、交通、商业与金融、科技创新和旅游的枢纽,以及链接欧亚的桥梁。  相似文献   

17.
18.
"The authors...discuss--on the basis of census statistics and poll results--the three basic trends of Soviet migrational processes (movement to the eastern and northern regions of new development from the country's densely settled regions, mainly central European Russia; constant and sizable rural-to-urban movement; and heavy movement into the country's largest cities and republic and oblast centers), as well as the three main migrational problems (stabilization of the rural population of central European Russia; acclimatization of new settlers in the eastern regions; and activization of the native inhabitants of Central Asia)."  相似文献   

19.
论沙粒两种起动关系与沙粒跃移的双重性   总被引:2,自引:8,他引:2  
研究沙粒两种起动关系是深入认识沙粒两种起动效能的继续和发展。文章分析了沙粒两种起动的不同性质,首次把流体起动界定为风蚀性起动,把跃移质冲击起动界定为置换性起动。认为流体起动具有主动分异性,而冲击起动只有随机分异性。根据这些特性对沙粒两种起动效能和沙粒连续移动提出了新义。认为沙粒跃移具有双重性,跃移质有其冲击地表的一面,也有其大量耗能的一面。沙粒两种起动具有兴衰与共的不可分割关系。地表风蚀是沙粒两种起动优势互补相互促进的结果;而地表堆积有时是跃移质耗能过多引起两种起动互相制约的结果。通过多方论证,将沙粒两种起动效能之由传统的19:1,初步改为4:1乃至3:1。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号