首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 77 毫秒
1.
网络环境下,如何让用户快速发现所需数据是地学数据共享平台长期面临的挑战之一。本文基于国家地球系统科学数据共享平台网站服务器日志数据获取用户搜索行为及数据集访问行为,使用聚类算法挖掘用户行为模式,并基于会话聚类 模式开发在线搜索和访问预测算法。在数据预处理阶段,对原始服务器日志数据进行清洗、用户识别、用户会话识别、搜索词提取。在模式挖掘阶段,采用DBSCAN算法对会话进行聚类。考虑到会话向量值的二元性,聚类算法中的距离采用Jaccard距离函数计算。视每个会话聚类包含的搜索词集合为一个文本,所有用户历史搜索词集合为语料库,统计各聚类中搜索词的TF-IDF值。在线搜索推荐,以搜索词检索各聚类中TF-IDF值,返回TF-IDF值最高的搜索词所属聚类,并给出该聚类的高频项目作为推荐。在线访问推荐,则以用户实时访问向量为查询向量,计算该向量与聚类中心的聚类。根据聚类排序,给出距离最近的聚类,并产生该聚类中高频项目作为推荐。实验结果表明基于TF-IDF和聚类的搜索推荐有较高的准确率和召回率,访问推荐效果基于高频统计的推荐有较大提高。研究可得出以下结论:① 地学共享网用户访问和搜索行为体现了专业性的特点,其行为较普通网站用户可预测性更好;② 对于地学数据共享用户行为预测,需明确定义用户行为,并采用合适的距离函数描述行为相似性;③ 通过搜索词TF-IDF值来预测用户数据需求的方法可行,以此产生的推荐可作为搜索结果的补充。本研究可服务于地学领域数据共享平台建设,提高共享服务质量,也可为其他领域科学数据共享提供技术方法借鉴。  相似文献   

2.
近年来,国内外类似街旁、人人、Foursquare、Gowalla等基于地理位置的移动社交网络(LBSN)发展迅猛,大量用户通过这些服务以签到的方式记录时空行为轨迹,这些个体行为轨迹数据为我们研究用户行为模式以及探究其内在规律提供了巨大的机会和挑战。然而,LBSN用户的相似性并没有从地理位置以及用户轨迹加以考虑,本文提出了基于格网划分的方式对用户空间出行进行相似性分析,通过用户轨迹建模以及相似序列匹配,探索用户出行轨迹的空间相似性度量方法并评估相似权重,最后通过用户好友关系与相似性权重的比对,证明了该方法的有效性。  相似文献   

3.
Internet技术的发展,促进了WebGIS技术的变革。随着网络用户需求的增长,在并发访问密集情况下,WebGIS处理延迟和拒绝服务的现象不可避免,使得端到端的服务质量(Quality of Services,QoS)得不到保证。本文利用云计算技术与WebGIS相结合,建立虚拟云平台服务器,以增强WebGIS服务器的并发处理性能。使用LoadRunner进行仿真实验,体现了云计算平台在WebGIS服务中的优越性。  相似文献   

4.
根据用户的访问记录,以及每次检索输入的关键词、用户的动作来动态更新用户的兴趣点.提出了一个能较好吻合这一思想的数据挖掘模型,以用户的停留时间、访问频率和用户输入的检索关键词为数据对象,进行用户兴趣分析,动态跟踪用户需求意向,简化检索过程,提高WEB资源的使用效率.  相似文献   

5.
基于出租车GPS数据的居民就医时空特征分析   总被引:1,自引:0,他引:1  
城市医疗服务在很大程度上影响着城市居民的生活质量,在公共服务领域中发挥着极其重要的作用。近年来,中国城市化发展过程中产生了海量的大数据,基于这些海量数据分析居民就医出行特征对于优化和改善城市医疗资源布局具有重要意义。本文以北京市主要医疗机构空间位置数据为基础,基于出租车GPS移动轨迹数据,采用时空统计分析方法,研究了出租车出行模式下的居民就医出行时空特征。结果表明,利用医院的OD(Origin-Destination)网络结构特征分析,可以识别出不同医院的服务范围以及受众的时空分布模式。市区尤其是四环以内医院的就医网络密集、紧凑,就医密度较高,而四环以外尤其是郊区周边,就医网络稀疏、分散,医疗资源的级别及地理位置影响了居民的就医倾向。本研究基于浮动车GPS数据开展居民就医时空行为模式挖掘研究,可以为城市医疗资源供需分析和优化配置提供决策支持。  相似文献   

6.
Web环境下地学数据共享用户行为模式分析   总被引:1,自引:0,他引:1  
了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间“热点”分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与“211工程”高校学生的空间分布相关度较高;(2)空间“热点”分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是“热点”区域,但识别的“冷点”区域有较大不同,尤其是数据访问“冷点”分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。  相似文献   

7.
以沈阳市为研究实例,基于手机信令数据,对城市居民个体时空行为活动信息进行深入分析,建立识别用户居住地和就业地的数据清洗规则,提取就业空间分布与职住联系数据。以Mc Millen(2001)提出的就业中心概念为理论依据,建立分析模型,应用核密度、空间自相关、自然间断分级、等值线等方法对就业分布数据进行深度挖掘,识别就业中心,并分析其空间布局特征;从就业规模和功能联系两个维度综合测度就业中心服务效能,构建就业中心等级体系;最后尝试基于就业功能划分城市空间单元,以此探索城市就业空间结构,揭示城市运行的内部机制。  相似文献   

8.
网上地图在线   总被引:3,自引:3,他引:0  
1.空间数据“超级市场”为了方便广大用户查找地理空间数据及有关空间数据加工处理的服务,国内外正在大力发展基于因特网的地理空间信息交换与服务系统,数据提供者可以通过这一系统向用户提供数据和服务,或提供关于数据和服务的信息,帮助用户了解现有的地理空间数据和服务;而用户借助于这种网上系统,寻找和获取感兴趣的空间数据或服务。目前,世界上许多国家和地区以及国际性或区域性组织都已经或正在建立这样的系统。这实际上是通过网络把用户和数据生产单位联系在一起,形成一个由数据用户和数据生产单位或销售部门共同参与的网络化的空间数据“超级市场”。  相似文献   

9.
地理信息Web服务分散于表层网络和深层网络,给服务的查找和获取带来了困难。针对这一现象,研究设计开发了一个顾及深层网络的地理信息Web服务搜索系统。该系统以基于二级匹配的深层网络地理信息Web服务采集方法和顾及用户请求范围的地理信息Web服务检索方法为理论基础,以Lucene.net、Open Layers等开源插件为开发工具,实现了一站式的表层和深层网络服务采集和检索功能,为全球地理信息协作服务平台提供了更为广泛的数据基础。  相似文献   

10.
基于出租车用户出行的功能区识别   总被引:1,自引:0,他引:1  
刘菊  许珺  蔡玲  孟斌  裴韬 《地球信息科学学报》2018,20(11):1550-1561
出租车数据作为城市大数据重要来源,其上车行为和下车行为直接反映城市人群出行行为特征,帮助城市规划者发现城市人群出行规律和城市功能结构。但是出租车数据隐含多维度信息,一维或者二维模型不足以表达和挖掘其蕴含的多维信息,因此本文选择可以承载多维数据的张量模型对出租车OD(上车/下车)数据进行时空模式挖掘。本文将北京六环区域划分为500 m×500 m格网,采用北京市2012年11月1-16日的出租车OD数据,分别构建O点和D点张量,利用张量分解模型从日尺度、时段尺度揭示出租车用户出行时间模式,同时获取不同时段对应的出租车用户出行空间模式,并推测空间模式包含的语义属性。本文结合城市兴趣点(Point of Interest, POI)数据,提高空间模式语义属性推测的准确性,识别出租车用户出行功能区。结果表明:出租车用户出行时间符合工作日和休息日的早高峰、日间、晚高峰以及夜间模式;对应8种时间模式,出租车用户出行包含8种空间模式,每一种空间模式都是对应时间模式下的上下车热点区域,因此空间模式的变化表明城市人群在不同的时间点,到达不同的场所,进行不同的活动,间接表达空间功能的动态变化;区域的功能不是单一静态的,而是随着时间在不断地变化,是不同时段功能的组合。本文揭示出租车OD数据中隐含的出租车用户出行模式和空间功能动态变化,对利用人类行为时空模式研究区域空间功能结构具有科学参考价值。  相似文献   

11.
随着地理信息技术与计算机网络技术的结合和发展,基于全球框架的地理信息服务对海量数据管理的要求越来越高,传统的单中心的关系数据库的管理模式已经不能满足要求。分布式文件系统、半结构化数据库和关系数据库技术优势互补,为海量数据高效管理提供了新的技术思路。本文提出了分布式环境下空间数据一体化存储管理架构,设计了矢量和栅格数据的数据逻辑组织和物理存储模型,通过统一的分层+分块的数据划分规则,实现了矢、栅数据分布式环境下的一体化管理。在该模型中,利用关系数据库和半结构化数据库的特点,对空间索引和实体数据分开管理,有效地提高了数据处理和访问效率。实验表明,该模型具有更高的数据管理能力,可为分布式环境下数据服务中心构建提供一个有效的解决方案。  相似文献   

12.
基于WSRF的网格空间服务及其管理   总被引:1,自引:0,他引:1  
网格技术与空间信息技术的结合,产生了空间信息网格。空间信息网格能够汇集各种空间信息资源,进行一体化管理,支持资源共享,提供"按需服务"的能力。"按需服务"要求能根据用户的要求,提供多样性服务,即能自动发现所有满足用户需求的空间信息资源或其组合,并评估各个资源或其组合,按一定目的选择资源,提供服务。但是由于网格的动态性,使得使用者较难得到现势性很好的空间信息资源的信息,直接影响了空间信息网格"按需服务"的能力。将传统的空间信息服务技术直接融入网格不能解决这一问题。为了解决该问题,提高"按需服务"的可靠性,本文根据支持资源状态和服务分离的网格框架W SRF,提出了W SRF设计网格空间服务及其管理的方案。即在空间信息资源节点,除了将信息资源以标准服务的方式提供使用,还以W SRF的方式组织资源的状态并提供访问和订阅;网格中央节点收集、维护和管理各子节点的服务和资源状态信息,提供信息访问接口以支持"按需服务"所必需的资源选择。最后按照该方案实现了一个简单的空间数据网格。  相似文献   

13.
本文以2005年以来中国科学院遥感与数字地球研究所开放式空间数据共享网站(OSDS)平台的注册用户为研究对象,利用最近邻层次空间聚类方法和地理探测器模型,对各省注册用户量的空间分布特征和差异影响因素进行了分析。分析结果表明,整体上用户空间分布很不均衡,主要集中在东部发达地区和几个在测绘和地理信息科学领域卓有建树的地区,信息、科研和教育是主要影响因素,经济、网络和测绘的单因素影响力较低,而与主要影响因素结合的交互影响得到了提升。因此,多因素共同制约着用户群的空间分布格局和区域不均衡性。应用地理探测器能从宏观上把握遥感学者群体的空间分布特征及其影响因素,其分析结果能够指导数据提供者更有针对性地为用户提供服务,也可为遥感产业调整和空间布局优化提供依据。  相似文献   

14.
科学合作是促进知识传播和共享的重要途径,已有研究表明,地理因素是影响科学合作的主要因素之一。然而,目前针对该问题的研究大多只是从科学计量学的角度,对科学合作强度与地理距离的函数关系进行描述,无法揭示科学合作在空间上的分布特征和内部差异性。因此,本文从地理学的角度,以中国雾霾研究的合作网络为例,通过对文献题录中的位置信息进行解析,将虚拟的科学合作网络映射到地理合作网络。在此基础上,提出了一种考虑地理距离的科学合作网络社区发现方法,挖掘科学合作网络中蕴含的空间聚类特征,从而对科学合作的地域倾向性进行反映。通过比较发现,基于合作频次与地理距离的社区发现算法,能够使社区内部的平均地理距离最小而合作强度最大,既反映了科学合作在地理上的近似性,又体现了科学合作强度特征。该方法能够直观地揭示科学合作中隐含的空间分布模式和联系,对其他复杂网络的地理社区划分也有一定的借鉴意义。  相似文献   

15.
This is an empirical paper that measures and interprets the position of Chinese cities in the world city network in 2010. Building on a specification of the world city network as a′interlocking network′in which business services firms play the crucial role in city network formation, information is gathered about the presence of global service firms in cities. This information is converted into data to provide the′service value′of a city for a firm′s provision of corporate services in a 526(cities)×175(firms) matrix. These data are then used as the input to the interlocking network model in order to measure cities′connectivity and its predominant geographical orientation. Here we focus on the position of some key Chinese cities in this regard, and discuss and interpret results in the context of the urban dimensions of the′opening up′of the Chinese economy.  相似文献   

16.
Globalization and informatization have accelerated city networking process over the world, which makes research on city network a hot topic in the fields of urban geography and economic geography. With Chinese economic structure adjustment and city economic growth, producer services have begun to play an increasingly important role in city-region networking. This paper employs the methodology of world city network to analyze and explain the spatial development characteristics of China’s urban network system based on the data of nationwide producer services enterprise network. The research result indicated that the distribution of producer services network has a positive effect on the development of Chinese city networks. City network connectivity is closely related to the significance of city in producer services development, and the former will gradually decline with the drop of the latter. Accordingly, the 64 cities can be divided into the national central cities, regional central cities, sub-regional central cities and local central cities in accordance with their position and role in the nationwide producer services network. It is concluded that high-grade cities with quality producer services dominate the pattern of Chinese city networks and there emerges three spatial agglomerations of producer services enterprises in Changjiang (Yangtze) River Delta, Zhujiang (Pearl) River Delta and Beijing-Tianjin-Tangshan Economical Region. Moreover, the distribution of different producer services industry varies from city to city, which also affects the characteristics of network development.  相似文献   

17.
空间信息格网框架体系和关键技术分析   总被引:17,自引:1,他引:16  
空间信息格网 (SIG)是格网 (Grid)技术在数字城市等地球信息应用服务领域中的具体应用。本文首先分析了格网兴起的背景以及国内外在格网领域的研究进展 ,然后建立了格网三层体系结构 ,提出了格网操作系统中基于 XML 的格网资源描述语言的资源管理方法和多层格网节点分治式格网任务调度管理方法 ,最后提出了基于空间智能体的空间信息格网的体系结构 ,并且探讨了空间信息格网中空间信息连通性和一致性、空间信息格网的智能化等一系列重点问题。  相似文献   

18.
基于社交媒体数据的城市人群分类与活动特征分析   总被引:1,自引:0,他引:1  
空间信息技术已开始进入全空间信息系统发展阶段,即将空间信息系统的范畴从传统测绘空间扩展到宇宙空间、室内空间、微观空间等可量测空间。位置大数据不仅是全空间信息系统的重要研究对象之一,而且也成为了广域全空间中了解人们生活方式以及城市动态变化的一种有效途径。本文基于社交媒体数据中的位置签到数据,提出一种不同于传统以社会经济属性为依据的城市人群分类方法。首先利用签到数据的时间序列构造矩阵模型;然后,通过分析用户签到活动的时间特征,采用K-means聚类算法和K近邻算法(K-NN)识别出具有不同时空行为特征的城市人群(静态居民、动态居民、通勤者以及访问者);最后,本文根据得到的人群分类结果,通过分析不同类型人群的时空间行为特征,发现不同类型人群时空间行为的差异性与潜在规律性,从而为表征城市人群的组成结构及特征,研究城市时空结构提供一种新的视角。  相似文献   

19.
City networks have been a critical topic in the fields of urban geography and regional economics. Numerous studies have explored city networks, focusing mainly on infrastructure and industrial networks. Unlike traditional urban network of which the major measuring indexes are population sizes and entity industries, online commodity service networks could reflect well the influencing of emerging economies, especially the Internet economy, on city networks. This study analyzes and reveals structural features of China’s city networks through online commodity services, providing the internet economic approach on city networks. Results indicate that the core cities of online commodity service networks are mainly concentrated in eastern coastal areas. In addition, spatial polarization and layer structure of network connections are obvious, descending from the centers in eastern China to peripheral cities in central and western China. Online commodity services of different cities show apparent differences and uncertainties in terms of specialization rates of international connection, which presents a tendency toward diversification. Online commodity service networks are not only associated with goods production, supply, and consumption in physical space but also reflect virtual information, capital, and technology flows, thus providing a new empirical approach for understanding city networks in information and internet economic age.  相似文献   

20.
随着信息通讯技术的发展,手机成为人类日常生活不可缺少的一部分,人类活动逐渐从现实空间延伸至网络空间,在移动互联网时代,网络空间的上网行为与现实空间的出行行为密不可分。当前个体出行行为预测建模较少考虑上网行为与出行行为间的关系,本文提出一种融合上网行为特征的手机用户停留行为预测模型,通过时空约束定义手机用户的停留行为,在考虑个体出行行为时空偏好的同时,融合手机用户使用的APP组合、上网流量、上网次数等上网行为特征以及天气信息等外部特征,从时间、空间的角度进行特征交叉,构建从特征到模型均具有高可解释性的手机用户停留行为预测模型。实验证明:本文模型预测准确率为80.31%,且在融合上网行为特征、天气等外部因素后,比仅使用个体出行特征进行手机用户停留行为预测提升了12.08%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号