首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
Web环境下地学数据共享用户行为模式分析   总被引:1,自引:0,他引:1  
了解科学数据共享用户行为特征对实现高效、精准的数据共享服务具有重要的参考意义。本文基于国家地球系统科学数据共享平台网站服务器日志及服务记录数据,利用空间数据挖掘及Web使用挖掘技术,探索地球系统科学数据共享用户行为模式。在数据预处理阶段,完成用户识别、会话识别、位置识别,并对数据进行空间建模、空间数据库建库。在数据挖掘阶段,分别对用户产生的网页浏览数、会话数、数据集浏览数为对象进行空间“热点”分析,识别用户行为的地域差异。针对用户数据浏览和下载行为,采用FP-growth算法对用户——数据之间进行关联规则挖掘,发现用户对数据关注和使用的高频规律。分析结果表明:(1)该共享平台用户地在国内各省市均有分布,用户最多的3个省(市)分别为北京市、山东省、江苏省,该分布与国内高校学生分布相关程度不高,但与“211工程”高校学生的空间分布相关度较高;(2)空间“热点”分析表明,北京、天津及河北北部无论在网页浏览、数据浏览还是会话量上都是“热点”区域,但识别的“冷点”区域有较大不同,尤其是数据访问“冷点”分布较广,如南方沿海省份、河南省、山东省、四川省等;(3)关联规则挖掘发现多个数据浏览高频项目集以及关联规则。数据下载高频项与数据浏览高频模式较好吻合,但下载行为未表现出明显关联规则。本文提供了一种结合Web使用挖掘和空间数据挖掘的用户行为模式挖掘方法,该方法也可用于其他类型网站的数据挖掘。  相似文献   

2.
地球系统科学数据共享研究与实践   总被引:4,自引:2,他引:2  
分布式、异构科学数据的整合集成与"一站式"共享服务是科学数据共享的关键和难点。首先,提出"创建地球系统科学数据共享联盟,共建、共享"的分散数据资源整合理念和按"总中心-分中心-数据资源点"三个层次的整合架构,然后,在组织模式上保障分布式数据资源的有效整合。即通过"元数据集中管理,数据体分散存储"的策略,从技术上保障分布式数据资源的快速整合。针对地球系统科学不同学科数据资源的特性,设计了地球系统科学数据核心元数据标准及扩展方案,利用MVC(元数据标准模型-显示视图-操作函数)模式实现多标准地学元数据的统一管理和自适应显示。最终,研究面向SOA的分布式地球系统科学数据共享平台,通过"一个总中心,认证中心和若干个分中心",形成物理上分布、逻辑上统一的分布式服务网络,从而为用户提供"一站式"的数据共享服务。  相似文献   

3.
科学数据共享实践:以国家地球系统科学数据中心为例   总被引:2,自引:0,他引:2  
地球系统科学是一门综合性交叉学科,起源于全球变化研究,受益于遥感技术进步,现已进入大数据时代,人工智能技术成为解决地球系统科学前沿问题的新手段。科学数据共享是推动科学发展、提升数据价值的关键,经过长期的探索和实践,全球已形成完善的数据资源管理政策与机制、持续的数据共享服务体系、多元化的科学数据整合模式,并且新的理念不断推动数据共享创新发展,其中“可发现、可访问、可互操作和可重用”原则和数据出版备受推崇。我国颁布了国家层面的政策法规,着重推动国家级科学数据中心建设、科技项目数据资源汇交及数据出版。借鉴国外数据共享经验,结合国内实际发展情况,我国探索出具有中国特色的地球系统科学数据资源分类体系,在元数据、分布式互操作、大数据分析和共享服务等关键技术方面都取得了重大突破。本文以国家地球系统科学数据中心为例,系统梳理了国内地球系统科学领域的数据共享实践进展,详细介绍了国家在地球系统科学领域的数据共享实践及其成效。国家地球系统科学数据共享工作已探索形成成熟稳定的运行服务机制、研制出适用于多源分散地球系统科学数据的标准体系、 建成多学科多时空尺度的地球系统科学数据库群、自主研发海量异构数据共享网络技术体系与服务系统,促进了地球系统科学的科学发展,同时也推动了数据共享理念的传播与推广。然而,数据孤岛现象、共享服务系统标准化程度低、系统技术标准未对接国际规范等问题仍然较为突出,阻碍了地球系统科学数据开放与共享。未来,随着共享个性化需求被激活,定制化的“数据+知识”服务有望成为主流趋势,将给数据共享带来新的机遇和挑战。  相似文献   

4.
近年来,国内外类似街旁、人人、Foursquare、Gowalla等基于地理位置的移动社交网络(LBSN)发展迅猛,大量用户通过这些服务以签到的方式记录时空行为轨迹,这些个体行为轨迹数据为我们研究用户行为模式以及探究其内在规律提供了巨大的机会和挑战。然而,LBSN用户的相似性并没有从地理位置以及用户轨迹加以考虑,本文提出了基于格网划分的方式对用户空间出行进行相似性分析,通过用户轨迹建模以及相似序列匹配,探索用户出行轨迹的空间相似性度量方法并评估相似权重,最后通过用户好友关系与相似性权重的比对,证明了该方法的有效性。  相似文献   

5.
国家地球系统科学数据共享平台(以下简称"本平台")是以分散科研数据整合共享为重点的科技部、财政部首批通过认定的23个国家科技基础条件平台之一。1科技资源概况本平台数据资源以陆地表层系统数据为核心,涉及固体地球、日地系统数据等,总数据量  相似文献   

6.
随着信息通讯技术的发展,手机成为人类日常生活不可缺少的一部分,人类活动逐渐从现实空间延伸至网络空间,在移动互联网时代,网络空间的上网行为与现实空间的出行行为密不可分。当前个体出行行为预测建模较少考虑上网行为与出行行为间的关系,本文提出一种融合上网行为特征的手机用户停留行为预测模型,通过时空约束定义手机用户的停留行为,在考虑个体出行行为时空偏好的同时,融合手机用户使用的APP组合、上网流量、上网次数等上网行为特征以及天气信息等外部特征,从时间、空间的角度进行特征交叉,构建从特征到模型均具有高可解释性的手机用户停留行为预测模型。实验证明:本文模型预测准确率为80.31%,且在融合上网行为特征、天气等外部因素后,比仅使用个体出行特征进行手机用户停留行为预测提升了12.08%。  相似文献   

7.
大数据正在改变捕捉和分析人类活动与行为的方式。多种新兴数据渠道不断涌现,为旅游领域研究提供了大量具有潜在应用价值的数据,克服了传统旅游研究中普遍存在的数据不足问题。本文以地理大数据的研究前沿为基础,明晰地理大数据在旅游领域人类旅游活动、旅游地理环境、旅游人地关系3个方面的理论支撑重点,梳理人类旅游活动/行为数据(UGC、设备数据、交易数据)和旅游地理环境数据(POI、客观环境数据)等地理大数据在旅游领域的创新应用,探讨地理大数据在理论研究更新、多源数据融合、分析方法突破3个方面的挑战和展望,为旅游领域时空认知、理论支撑、建模方法、分析框架等方面研究的深入开展提供一定参考。研究建议在理论上需要将科学研究范式标准化系统化,结合不同的事件和场景创造基于“过程-结构-机制”的中国旅游地理解释体系;数据上需要向大数据与其他数据的互补结合转变;分析技术需要向提高分析方法自适应性、涉入旅游现象特殊性变量的方向转变。  相似文献   

8.
根据用户的访问记录,以及每次检索输入的关键词、用户的动作来动态更新用户的兴趣点.提出了一个能较好吻合这一思想的数据挖掘模型,以用户的停留时间、访问频率和用户输入的检索关键词为数据对象,进行用户兴趣分析,动态跟踪用户需求意向,简化检索过程,提高WEB资源的使用效率.  相似文献   

9.
面向地学计算的资源环境科学数据共享平台的设计   总被引:1,自引:0,他引:1  
目前,在我国的资源环境科学领域中,数据、计算和服务等各种资源存在着共享少、冗余大、标准杂等问题。而信息技术的飞速发展给资源环境科学领域的信息技术基础--地理信息系统带来强大的技术支持。鉴于此,本文以中国科学院资源环境科学数据共享平台建设为例,系统地介绍面向地学科学计算的资源环境科学数据共享平台的设计以及所采用的关键技术--元数据标准/元数据数据库技术、XML/GML技术以及网络会议/多媒体技术等。  相似文献   

10.
面向地震行业,以交互式门户网站提供零障碍、一站式、可视化的地震科学数据共享服务,以使用便捷、高效稳定、扩展性好为目标,对地震数据共享服务平台的系统架构、服务端架构、数据库及其功能进行设计。基于国家科学数据共享工程要求,规范化地震数据检索、可视化、共享模式,实现了多源地震数据共享服务平台的原型系统。系统面向地震行业用户开放,可以促进行业业务工作的开展和地震科技的研究,全面提升地震科学数据的交换、共享、产出效益。  相似文献   

11.
数据网格的发展促进了空间信息的协同合作和资源共享,然而,随着空间数据源呈现出越来越明显的分布性、异构性和动态性特点,如何实现大范围乃至全球范围的无缝集成和应用成为重要的研究课题。空间信息的数据特征和管理机制决定了只有在一个开放的、分布的系统平台上,才能实现全面的管理、共享和使用。本文论述了如何借助数据网格研究分布式空间数据协同操作和控制技术,提供一种服务一致化技术,将各种分布异构的数据资源通过网格化过程来实现数据服务的标准化,为用户提供一致化的接口。并对其中的研究重点进行了详细讨论。  相似文献   

12.
本文提出一种适合三维测绘数据的共享转换与发布的基本流程:数据采集,预处理,初建模,格式转化,再加工,发布。其中原始数据的预处理是重要的一步,作者对重复点,零长度线,零面积面进行了简单删除操作,从而有利于简化数据方便后续处理与展示。最后作者利用共享数据结构对各种通用数据格式进行转换发布,并对各种格式作了简要分析与比较。  相似文献   

13.
船舶行为特征挖掘与预测是水上智能交通系统的重要研究内容,也是交通运输工程领域的关键科学问题。为系统研究基于船舶自动识别系统(Automatic Identification System, AIS)数据的船舶行为特征挖掘与预测的研究现状与发展趋势,本文首先针对Web of Science(WOS)和中国知网(China National Knowledge Infrastructure, CNKI)收录的文献,用知识图谱分析软件VOSviewer对文献关键词进行处理,从文献计量学的角度生成高频关键词的聚类图谱和趋势演化。然后对基于AIS数据的水上交通要素挖掘、船舶行为聚类和船舶行为预测3个主题的研究内容、方法、存在问题进行了系统分析和展望,研究结果表明:① 在基于AIS的水上交通要素挖掘方面,主要集中在对AIS数据中表征船舶行为空间特征和交通流的时间特征单独挖掘分析,缺乏对AIS数据的时间、空间以及环境因素特征的关联挖掘,对于如何进行交通要素的关联融合挖掘研究还有待深入探索;② 在船舶行为聚类方面,研究主要是运用无监督聚类方法研究船舶航迹点和航迹段聚类,得到船舶航行行为模式的时空分布和船舶操纵意图辨识模型,然而融合多维特征的船舶轨迹的相似性计算方法、聚类参数的自适应选取以及船舶行为的语义特征建模有待进一步研究;③ 在船舶行为预测方面,主要集中在基于动力学方程、传统智能算法和深度循环神经网络的船舶行为预测研究,考虑船舶行为的随机性、多样性和耦合性的特点,运用混合神经网络模型以及神经网络与向量机、注意力机制相结合的模型实现多维的船舶航行行为特征的实时预测将是新的研究方向。最后提出了基于语义模型的船舶行为特征挖掘、基于深度卷积神经网络的船舶行为的预测和基于知识图谱的船舶行为特征挖掘和预测结果可视化等有待进一步研究的方向。  相似文献   

14.
交通违法行为是引发交通事故的重要原因,然而现有研究主要关注交通违法行为的整体特征,缺少面向交通违法治理需求的分析框架。本文基于时空热点分析方法,提出从热点区域时间分布特征和典型时段热点区域空间分布特征两个角度识别交通违法行为特征的分析框架,分别用于支撑局部交通违法热点以及全局违法模式的原因分析和精准治理。基于该方法对福州市的机动车和非机动车(含行人)违法行为特征进行了识别分析,结果表明:机动车和非机动车违法行为在时间维度均呈现出9:00和16:00一日双峰特征,在空间维度呈现出“一片区、多热点”的聚集分布特征。二者也存在明显差异,具体表现为:① 在时间维度,非机动车违法行为呈现出更大的变化幅度,高峰时段与中午低谷时段、工作日与周末的违法行为数量差异均明显高于机动车;② 在空间维度,机动车违法行为在商业中心、医院等重要场所和交通枢纽呈现出聚集特征,分布范围更广,而非机动车违法行为则主要在人流量大且人车混行严重的城市中心路口区域呈现聚集特征;③ 不同违法热点地区产生的原因存在差异,需要有针对性制定治理措施。上述发现表明了本文方法能够全面快速识别交通违法行为特征,可以帮助指导城市交通违法行为动态监测分析系统建设,为持续优化城市交通现场执法警力动态分配以及交通违法行为精准治理提供决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号