共查询到16条相似文献,搜索用时 46 毫秒
1.
数据挖掘中关联规则的探讨 总被引:15,自引:0,他引:15
王艳 《成都信息工程学院学报》2004,19(2):172-176
介绍了数据挖掘中关联规则的概念及经典的Apriori算法,以及在Apriori算法基础上的改进算法和数据挖掘的应用领域. 相似文献
2.
应用基于Apriori算法的关联规则挖掘技术对一次卷烟市场调查得到的数据进行分析,找出其中的关联规则,作为正确决策的基础。 相似文献
3.
针对自然资源信息管理分散、网络安全防御能力弱,以及难以追踪溯源威胁攻击行为等问题,本研究在自然资源云中建立了一套安全防护体系,用以整合网络安全资源,强化网络安全态势感知能力,做到攻击敏捷预测、快速回溯。安全防护体系工作效能的提升,核心在于其安全组件检测引擎模块中关联规则算法的改进。首先,在数据采集阶段,通过预处理将威胁告警数据转换为可供机器处理的标准数据格式;其次,在矩阵计算阶段,使用Map Reduce分布式计算框架提升频繁项集的处理效率;最后,以Apriori算法为蓝本,通过单次扫描锁定频繁k项集范围、矩阵向量内积运算、减少冗余候选项集生成三项措施进行算法改进。实验仿真表明:在处理同样容量网络安全多源数据集合,并在相同维度的关联规则矩阵下,本算法处理效率较经典Apriori算法提升3倍以上;随着输入数据集合瞬时容量的逐渐扩增,本算法的时间复杂度稳定,并为增量挖掘算法的一半以下。研究成果可以实现自然资源部网络安全防护工作从传统的“被动挨打”转向“主动防御”的新局面。 相似文献
4.
地理现象的周期性往往掩盖了许多地学规律,这也是地学数据挖掘的一个主要内容.本文以周期表设计了一种时空层次关联规则挖掘方法--PRules-Miner.模型利用周期表的表现形式对时空数据进行组织,并通过两步挖掘过程发现具有"遥相关"地理事物间的变化模式.模型算法分为3个步骤:(1)过滤周期表内无序数据:逐行地提取多周期内... 相似文献
5.
6.
数据空间自相关性对关联规则的挖掘与实验分析 总被引:1,自引:0,他引:1
传统的空间关联规则挖掘,一般足使用属性关联规则的挖掘算法,对空间数据进行泛化处理,不考虑空间数据的空间自相关性,也没有考虑空间自相关与空间关联规则的关系.本文运用改进的Apriori算法对某一数据进行空间关联规则挖掘,并对同一数据进行空间自相关分析,比较两种方法反映的属性的相关性,探讨了数据的空间自相关性对空间关联规则... 相似文献
7.
潘珩 《成都信息工程学院学报》2004,19(4):597-600
通过对汽车销售历史数据进行概化和总结,给出关联规则挖掘算法,并针对具体的事例加以分析,进行各个客户购买属性之间的关联规则的挖掘.可以有效地发掘顾客购买行为和汽车属性之间蕴藏的内在联系.此模型可以用于辅助汽车营销决策. 相似文献
8.
关联规则挖掘在许多领域已有广泛的应用,目前存在许多发现关联规则的算法,但这些算法都认为项目对规则的重要性相同.然而在现实中各个项目的重要性往往不同,决策者往往优先考虑利润较高的项目,而忽略利润较低的项目.分析现有的加权关联规则存在的问题,提出了一种新的加权关联规则模型. 相似文献
9.
针对制约Apriori算法效率的瓶颈问题,提出了一种基于Apriori的改进算法,算法只需要遍历一次事务数据库,避免了Aprori算法多次扫描事务数据库和产生大量的候选项集,同时利用项集的有序性改进了判断连接的方式,优化了连接步骤,减少了判断时间.实验结果表明,改进的Apriori算法在运行效率上有一定的提高. 相似文献
10.
11.
介绍了AprioriHybral算法,针对算法前期工作效率的不足,提出一种基于项目集矩阵的改进算法ISMa-trix-AprioriHybral(ISMA).新算法(ISMA)主要从使用项目集矩阵生成一阶和二阶频繁项目集的角度,对Apriori-Hybral算法进行了优化.还对改进后算法的性能进行了简要的分析,最后通过使用实际数据的测试,验证了改进后算法的效率优于AprioriHybral算法. 相似文献
12.
13.
本文基于全空间信息系统视角,运用复杂网络分析方法,从属性关联关系、时间关联关系、空间关联关系和综合关联关系角度对全球管道天然气贸易复杂网络中主要国家间关联关系进行了挖掘分析和可视化表达。结果表明:管道天然气贸易对战略通道具有路径依赖性和滞后性。贸易格局演化路径稳定,具有明显的“区域小世界”特征。区域资源禀赋差异是管道天然气贸易形成“核心-边缘”网络结构的主要原因。管道天然气贸易主要集中在欧亚大陆。2009年全球管道天然气贸易需求中心集中在欧洲各国,2015年则形成了西欧和中国的双需求核心网络关系。同时,论文基于全球管道天然气贸易复杂网络的挖掘分析和可视化表达,阐述了全空间信息系统的特征,展望了平台的应用。 相似文献
14.
传统空间关联模式以空间谓词作为发现逻辑进行知识发现,会导致关联模式侧重空间位置关联,并且挖掘结果受所建立谓词表的限制,存在所发现模式固定、解释自由度差等问题。本文提出一种不依赖于空间谓词的关联模式发现方法,该方法将空间数据进行格网化表达,对格网化结果以平滑移动的N×N掩膜进行多约束事务化,将传统Apriori算法去除属性自连接,然后对所构建的空间事务化数据库进行关联模式探索,抽取有价值的关联模式。最后,以山西省晋城市长河流域为实证研究区,建立煤、地、水空间事务数据库,给出格网化表达的定量误差,探索其隐含空间关联模式,并以同位模式验证了事务化结果的精度。格网化生成覆盖研究区的64 m格网28 434个,各数据层格网化误差均在5%以内,以耕地为主因子事务化结果共有记录38 310条记录。对抽取的部分关联模式分析表明:发现结果符合长河流域矿农复合区背景下耕地相关的先验知识;该方法能有效提取空间数据及其属性信息中潜在的关联模式,提高了挖掘过程自由度和结果的兴趣度。 相似文献
15.
导航大数据是大量与导航相关且具有泛在导航、定位、授时特征的数据集合。城市环境的特性影响居民的出行活动,而居民出行活动中产生的导航大数据则蕴含了城市环境的时空信息。热点区域空间分布以及热点区域之间的关联性特征是城市环境时空特性的重要组成部分,由客观的环境现状和主观的人为活动造成。通过挖掘导航大数据可以揭示这些特征。本文提出了利用导航大数据的城市热点区域关联性挖掘方法。首先,通过对居民出行的起点和终点坐标进行空间聚类,挖掘城市中的热点区域,并依据点的分布特点对城市热点区域进行离散化;然后,利用基于谱聚类和蚁群算法的方法分析居民出行特征,揭示城市中热点区域之间存在的关联性。本文提出的方法能够充分利用导航大数据对城市动态的感知能力。以上海市2007年2月20日的出租车轨迹数据为例进行分析,结果表明:利用导航大数据分析城市热点区域之间的关联性,可以得到具有紧密关联性的热点区域的空间分布特征;上海市居民出行活动频繁的热点区域被划分为15个内部紧密关联的子图,形成该分布特征的内在机制以及居民流通规律与上海市的土地资源利用及道路交通建设现状密切相关。分析方法和结果可为合理的城市功能区域规划,智慧城市建设等提供决策支持和参考信息。 相似文献