首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
挖掘可表征城市之间联系的信息并进行网络复现,已成为一种研究区域联系的重要研究范式。纪传文本地名的共现网络研究对深化理解历史地理要素、拓展城市网络分析的运用具有重要意义。本文基于对地名共现的空间网络的研究综述,提出基于地名共现词频进行网络分析的改进方法,纳入地名稀缺性及区域优势不对称性测算城市关联度,规避了现有测算方法中缺乏考虑地名稀缺性及边权不对称性所导致的信息失真。在网络复现算法检验上,使用《三国志》地名共现数据集,实现了三国时期州郡网络复现中的地理分布、层级结构表达,同时实现了州郡的区域优势识别。结果表明,新算法相较传统的地名共现算法,其计算结果反映了边权的不对称性,且在有限文本数的效度测试中区位推荐算法提高效度5‰,概率误差低于既有算法,复现地名词频的效果更为稳健。另外,既有算法计算结果均为对称联系,而由区位推荐算法得到的非对称性地域关联数据为判别区域体系的节点层级提供了统计依据。  相似文献   

2.
随着在线电子地图应用的普及,地名信息检索已成为相关研究领域的热点,并取得了丰富的研究成果。然而,这些研究主要侧重于检索效率和文本关键词匹配质量的提高,并未顾及实际应用需求和地名信息检索方法的矛盾。本文通过分析地理实体和地名的特征及关系,提出将二者相融合来研究地名信息检索的形式和方法,从数据特征和应用场景的角度出发,提出顾及地理实体的地名信息检索模式,并实现对其的结构化表达,在该检索模式中将地理实体的属性特征和空间关系作为检索特征项;以检索模式为基础提出了基于地理实体相似度计算的地名信息检索模型,并深入研究了文本型属性与数值型属性综合的属性相似度计算方法,以及定性空间过滤与定量距离计算综合的空间关系相似度计算方法;最后,通过实验验证了顾及地理实体的地名信息检索方法的可行性和检索质量。实验结果表明,该检索方法既能实现精细化和空间化的检索需求,也能保证检索结果的准确度。  相似文献   

3.
基于网络爬虫的地名数据库维护方法   总被引:1,自引:0,他引:1  
目前,我国地名数据库建设存在大、中颗粒度地名集中,小颗粒度地名较为缺乏,地名资料陈旧、时效性较低,简称、别名等非标准地名信息和地名的相对位置信息缺失等问题.而地名数据库的更新维护工作主要通过人工测绘手段完成,存在周期长、成本高、效率低等缺点.针对这一问题,本文以现有地名数据库和空间关系词汇为基础,基于Google搜索引...  相似文献   

4.
网络文本蕴含地理实体关系抽取技术,需要高时效、强鲁棒的关键词提取方法。与监督学习方法相比,无监督学习方法能捕获文本的动态变化特征并发现新增的关系类型,因此备受关注。其中,基于频率的关键词提取方法获得广泛研究,然而,网络文本蕴含的地理实体关系分布稀疏,基于频率的方法难以直接应用于地理实体关系的关键词提取。为解决该问题,本文基于公开访问的网络资源,提出一种语境增强的关键词提取方法。首先,基于在线百科和开放的同义词词典,通过语境合并和语义融合创建增强的语境,以降低语境中词语的稀疏性。接着,Domain Frequency和Entropy频率统计方法从增强语境中自动构建一个大规模语料。然后,基于该语料选择词法特征并统计其权值,用于扩大语境中词语间的差异。最后,使用选择的词法特征度量增强语境中词语的重要性,将权值最大的词语作为描述地理实体关系的关键词,并基于大规模真实网络文本开展实验。实验结果表明:对于地理实体关系的关键词识别,本文方法的平均精度为85.5%,比Domain Frequency和Entropy方法分别提高41%和36%;对于新增关键词识别,本文方法的精度达到60.3%。语境增强的关键词提取方法能有效地处理地理实体关系分布的稀疏性,可服务于网络文本蕴含地理实体关系的抽取。  相似文献   

5.
目前我国地名数据库的建设主要靠传统测绘手段完成,存在周期长、成本高、效率低的缺点。随着地理数据服务的发展,出现了一些在格式、尺度、范围、内容、现势性等方面具有差异性的免费地名数据库。本文提出了一种整合多开源网络地名数据库形成统一格式、多尺度、内容完备、现势性强的矢量地名库的方法。首先通过OGR和数据访问API构建不同文件格式的网络地名库的矢量格式转换模型,然后对多网络地名库进行矢量转换,最后对其进行数据预处理、数据处理、数据分类映射等处理过程建立矢量地名数据库。本文以香港地区的Geonames,GNS,OSM地名数据库整合为例,验证了方法的可行性。  相似文献   

6.
由于人类对现实世界进行认知和概念化的过程存在模糊性,许多人们在日常生活中使用的地名往往是没有明确边界范围的模糊区域。大数据时代的开启,为模糊地名空间范围的确定与表达提供了新思路。本文提出由k最邻近(k NN)离群点检测算法结合高斯混合模型(GMM)的方法,基于多源兴趣点(POI)数据获取模糊地名空间范围边界。该方法具有能有效识别离群点数据、参数敏感度低的特点。最后,分析了多源POI数据的应用对结果的影响。  相似文献   

7.
针对目前地理空间信息变化更新体系存在投入大、时效性差等问题,提出了基于互联网的地理空间变化监测的技术体系,利用互联网本体大、实时性高等优点,设计了地理信息检索词典库和检索算法,实现了从海量互联网信息中提取地理信息变化监测信息,为地理空间信息的更新提供了有效的来源。  相似文献   

8.
社交用户的文本具有地理差异性,并且社交关系密切的用户之间居住位置更近,因而文本和社交网络均可用于推断用户常驻位置。现有基于文本和社交网络的用户常驻位置预测方法对文本的位置指示性特征挖掘不充分,而用户文本中地名等位置指示信息却提供了最有用的位置信号。因此,本文提出一种基于地理命名实体识别(GER)和图卷积神经网络(GCN)的社交用户位置预测方法。首先,通过地理命名实体识别方法对用户文本进行过滤以凸显位置指示性特征;其次,基于提及关系和关注与被关注关系抽取社交网络;再次,结合社交网络和用户文本内容,采用基于图卷积神经网络的方法进行用户常驻位置预测;最后,将GER-GCN与GCN以及最新研究成果进行比较,并探究该模型的小样本学习能力及其影响因素。基于Geotext数据集和2个微博数据集的实验表明:① GER文本过滤方法可显著提升用户位置预测精度;② 在所有实验中,GER-GCN的预测精度最高,并在基准数据集GeoText上比最新研究成果提升1%~2%;③ 在最小监督的现实场景中,本文印证了GER-GCN模型的小样本学习能力,并发现社交网络质量对其小样本学习能力起到决定性作用。实验结果验证了GER-GCN方法的先进性,且该方法符合社交媒体现实场景的应用需求。  相似文献   

9.
世界是一个相互关联的网络。物质、信息、能量等的移动或交换嵌入地理空间形成的地理多元流网络,为从地理和网络角度研究全球性问题提供了新的视角。如何构建多主题、时变的地理多元流网络,识别其网络结构、时变规律和关联模式,并为解决全球性的人口移动、航空交通、国际关系、国际贸易等问题提供支持,是迫切需要解决的问题。本文提出了全球尺度地理多元流网络化挖掘及关联分析的研究框架,包括:多源数据收集与整理、地理多元流网络构建与结构识别、地理多元流网络演化分析、地理多元流网络关联分析。然后,分别对国际关系流网络、国际贸易流网络、全球航班流网络、全球人口移动流网络的相关研究进行综述分析,并结合示例介绍了其研究思路。此外,进一步综述分析了地理多元流关联分析的相关研究并提出了研究思路。本文为全球尺度地理多元流网络研究提供了一套研究框架和思路,并为国际关系、国际贸易、航空交通、人口移动等全球性问题研究提供参考,有望为发展基于“流”的时空分析方法做出基础性贡献。  相似文献   

10.
基于DOM树模型进行网页建模,同时利用深度优先的递归算法对DOM树模型进行遍历.通过将HTML文档转换为DOM树,对其遍历后给树的节点唯一标号来对网页进行分析.为了更直观的分析网页结构还采用图形界面的形式来显示树型DOM文档.实验表明,提出的这种方法能够很好地分析Web页面标记的嵌套结构,并能准确地与转化成DOM树之后的嵌套结构相匹配,从而达到了精确的网页分析和网页节点定位的目的.  相似文献   

11.
针对通过黑白名单匹配的检测方法检测钓鱼页面准确率低的特点,提出基于钓鱼者行为的图状链接结构特征,对钓鱼页面进行分析,引入数据挖掘的频繁子图挖掘算法,对数据库中积累的数万个钓鱼页面进行子图模式挖掘,提取钓鱼页面的共同子图结构特征,检测网络钓鱼行为。实验结果发现,在加入了子图特征的钓鱼页面检测方法中,检出率能达到80%.因此,基于行为的钓鱼页面检测提高了钓鱼页面检测的能力,并且挖掘出的子图模式为钓鱼者的行为提供了依据。  相似文献   

12.
基于灰度共生矩阵的DEM地形纹理特征量化研究   总被引:2,自引:0,他引:2  
 DEM的地形纹理以其表达地形表面的纯粹性与分析数据的可派生性受到越来越多关注。本文选取陕西省10个不同地貌类型区的25m分辨率DEM数据,引入空间灰度共生矩阵(GLCM)对地形表面纹理特征进行定量分析。研究表明,25m分辨率DEM数据的GLCM模型适宜分析间距是大于等于3个栅格大小。各纹理参数中,相关度可用于地形纹理的方向性量化;方差、差的方差、对比度可用于对地形纹理的周期性分析;熵、二阶角矩、逆差矩可用于对地形纹理的复杂性分析。在DEM及其派生数据中,光照模拟数据计算的各纹理参数的平均变异系数最高,表明光照模拟数据最适合于地形纹理特征的量化研究。同时本文提出了一种多参数综合的地形纹理量化方法,通过运用综合周期性和综合复杂性两个指标对不同地形区量化分析,结果表明,这两个指标对不同地形形态响应显著,可用于地形形态分类与识别研究。  相似文献   

13.
GIS空间分析技术在地理数据处理中的应用研究   总被引:2,自引:2,他引:2  
地理空间数据GIS的处理中,空间分析是其分析、模拟、预测和调控过程的基础理论和技术。空间分析大量时空模型的建立与应用是地学分析区域性或全球性地理问题的重要手段,是新的挑战和机遇。作者从空间分析的定义及空间分析的应用研究出发,认为现代地理学的应用离不开空间分析的支撑;另外空间分析日趋成为自然地理学深化研究、应用的重要技术途径。地学数据GIS的分析处理,须与有空间特征的时空模型、数据挖掘、可视化技术整合,以及关注多维信息空间要素关联性的多元应用。  相似文献   

14.
大气二氧化碳是开展全球气候变化和碳循环研究的关键数据。卫星遥感技术与模式模拟相结合的反演方法已成为获取该数据的重要手段,但模式输入参数本身的误差会对大气二氧化碳反演精度产生影响,须在反演算法设计中加以关注。本文利用RTTOV10快速辐射传输模式模拟Aqua/AIRS红外探测仪17个大气二氧化碳反演通道,计算了这些通道上大气顶出射辐射对温度廓线、臭氧廓线、水汽廓线、地表温度和地表发射率的参数误差的不确定性,并与二氧化碳增加0.5%时造成的不确定性进行对比,分析二氧化碳对上述参数误差的敏感性。结果表明,温度廓线误差是干扰AIRS大气二氧化碳反演的主要因素,其次是臭氧廓线误差,而水汽廓线、地表温度和地表发射率的误差对二氧化碳反演的影响在除去个别通道后可忽略不计。最后,本文以通道为单位,确定了各通道上的高敏感参数、敏感参数和不敏感参数,为二氧化碳反演通道的选择和反演算法的设计提供了参考。  相似文献   

15.
以DEM提取流域水系河源的最小误差分析   总被引:2,自引:0,他引:2  
 目前,以水文模型提取流域水系已成为水文科学研究中的热点问题。但用DEM提取流域水系的方法不能解决流域水系唯一性的问题。故本文在没有流域纸质水系图或遥感数据的前提下,提出以DEM提取流域水系的河源最小误差法,即通过建立实际河源与提取水系河源两点之间的距离误差与网格数大小的相互关系,以两点之间误差最小为原则解决流域水系提取唯一性问题。以晋江流域为例,30m分辨率的数字高程模型(DEM)为基础数据,采用河源最小误差法提取了晋江流域水系。结果表明,最小河流长度为42m时,实际河源与提取水系河源的距离误差达到最小,相应的晋江流域的水系分维值为1.389,表明该法是提取流域水系较合理可行的算法。  相似文献   

16.
为了解北碚地区的降水风险规律,减少地区旱涝引起的灾害损失.利用北碚区地面气象观测站的年降水观测资料(1981~2010年),结合信息扩散理论模型,分析北碚地区的降水风险及成因.结果显示:(1)北碚地区降水的概率曲线为单峰型,峰值在1000~1100mm,夏季降水量离散程度比春、秋两季高,存在明显的旱季或涝季.(2)汛期降水量和年降水量的概率分布曲线趋势基本一致,也存在一些差异.(3)降水日分布特征显示雨量从21时开始增加,03时累积雨量为最大值,20时达到最低水平;降水频次从21时开始逐渐增加,并在08时达到最大.在暴雨小时降水量中5mm/h以下的降水次数最多,约占总次数的41%.  相似文献   

17.
我国南海4个青蛤野生群体的形态差异分析   总被引:2,自引:0,他引:2  
用8个形态性状比较我国南海4个野生青蛤群体间的形态变异。聚类分析表明,湛江群体和汕头群体的形态较接近,海口群体的趋异最大。主成分分析表明,主成分1、2、3的贡献率分别为26.441%、21.104%、15.884%,累计贡献率为63.428%。逐步判别分析结果显示,4个群体形态差异显著(P<0.01)。建立了4群体判别函数,其判别准确率P1为51.4%~71.4%,判别分析准确率P2为60%~75.8%,4群体的综合判别率为64.3%。Mantel-test检验结果表明,我国南海青蛤不同地理群体的欧式距离与地理距离没有明显的相关性(r=0.4227,P=0.3910)。  相似文献   

18.
分形理论在地理空间信息的复杂性分析中具有广泛的应用前景,但是强调完全自相似为基础的单一分形维数,难以描述复杂变化的地理目标特征。本文研究表明,与分形维数相比,M-R曲线所包含的更丰富的地理空间特征信息使之成为更值得关注的分形分析对象。在此基础上,本文初步阐述了M-R曲线的性质与地理空间意义,并进一步探讨了M-R曲线的扩展分析方法,包括M-R曲线的函数拟合与分维谱分析。最后以小比例尺地图中河流数据为例,分析了我国长江、黄河两大河流的空间形态特征及其规律。实验表明,在小尺度范围内长江具有更丰富的细节变化,黄河则在更大的尺度上表现出复杂性。  相似文献   

19.
水系分形维数的计算与分析,有助于深入理解其与地貌发育、流域径流和侵蚀产沙等过程之间的关系。从分形维数的计算原理,提出了一种在MATLAB环境下,能够同时计算水系计盒维数和信息维数的方法,改进了现有通过图像分析计算分形维数的不足。采用已知分形维数的规则分形集进行验证,结果表明:该方法单独对图像载体上的目标图形(关注区域)进行处理,不受其与整幅图像的比例的限制能够自动确定最佳的对目标图形进行网格分割覆盖的递减等分条件,计算精度高利用元胞数组实现了网格的自动分割,程序紧凑,可读性增强。最后以泾河、北洛河水系为例,说明了该方法的应用过程。本研究为水系分形维数的科学计算提供了新的思路。  相似文献   

20.
基于日本KiK-net强震动观测记录,以提高计算震中方位角的准确性为目标,研究记录参量(加速度、速度、位移)、计算时间窗和滤波频带对偏振分析方法计算震中方位角结果的影响。结果表明,在该研究的地震数据条件下,采用位移记录、计算时间窗为1s、滤波频带取0.1~20Hz时,可以获得最佳的震中方位角计算结果,震中方位角的计算偏差为45°时所占比例为88%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号