数据挖掘中关联规则挖掘算法的分析研
2020-06-07
来源:易榕旅网
数据库技术●Data Base Technique 数据挖掘中关联规则挖掘算法的分析研究 文/李仕琼 理过程中保证最小分类的错误率,但是其显著 数据挖掘技术在数据处理方 数据挖掘的约束时,要保证实现系统增量式扩 优点就是线性问题。 充,在对用户的实际需求与目标予以明确之后, 需要借助于约束参数,结合约束参数的形式对 一面具有非常重要的作用,随着云 计算、数据融合等技术的不断发 展,需要处理的信息量越来越大, 这就涉及如何处理大规模数据信 息的情形,关于数据挖掘技术与 关联规则挖掘算法的研究越来越 多,本文就主要针对此予以简单 (3)模糊集,模糊集理论中不具备针对 性,在数据处理过程中主要分为两方面的内容, 已当面是不确定的数据,另一方面是不完整数 据,应用模糊集理论进行数据处理时,其处理 起来更加的方便有效。 (4)统计方法,在该种方法中,主要是 些有待解决的问题实施验证,一旦确定相关 数值之后,就可以通过实验的交互式输入实现, 最终较大较优值,该约束机制能够应用于数据 挖掘算法的各个不同阶段,另一方面,在开展 数据的预处理时,要能够保证约束个数的设置 分析研究 对事物的数量进行统计分析,以便于推断其规 律,在查找到事物的数据线索之后,在此基础 上进行假设,并对其可行性进行严重,应用这 【关键词】数据挖掘技术关联规则挖掘算法 种方法的过程中,其中具有的一个显著优点就 是精确性。 计算机等技术在各行各业的应用范围越 2关联规则挖掘算法 ∈越广泛,其中数据库技术在信息处理领域得 在早期关于数据挖掘技术的研究中,研 0了广泛的应用,但是其原有技术中还存在一 究的重点放在数据挖掘模型的建立以及相关算 不足之处,在数据库技术的研究过程中,加 法的研究上,但是应用这种研究方法所得到结 自与数据挖掘技术的结合,对于其应用效率的 果研究结果是比较孤立的,难以取得理想的数 升具有非常重要的作用,下文主要对数据挖 据处理效果,随着关于数据挖掘技术研究的深 6技术与关联规则挖掘算法予以简单探讨。 入,人们发现在开展数据挖掘技术的研究过程 数据挖掘技术 中,想要有效的实现用户相关的挖掘目标,除 了需要加大算法的研究力度之外,还需要制定 数据挖掘技术是一种新型的信息处理技 出特定的实现机制,以便于所制定的挖掘计划 ,与传统技术相比,其具有更高的商业价值, 能够转化成为对一个系统工作的控制,这样才 i过应用该技术能够促使人们从低层次的联机 能促使挖掘项目获得一个理想的挖掘效果,对 }询上升至对数据决策支持分析预测上,以便 于挖掘算法的约束作用,在挖掘算法开展的任 实现更高层次的应用。依据数据挖掘技术知 何阶段都可以实现,并且挖掘算法的基本形式 {类型的不同,可以将其划分为:预测范围知 就是交互式数据,在实际的挖掘算法开展的过 {挖掘、关联范围的知识挖掘、差异范围的知 程中,严格按照相关的计算流程开展才能达到 {挖掘、广义范围的知识挖掘;常用的数据挖 快速、准确完成挖掘任务的目的。 6方法主要有:当代数学分析法、数据集成方 在开展数据挖掘计算的过程中,由于面 、元模式法、证据理论法、数据分析法、近 临着多种因素的影响,并且其中一些因素是难 ^推理法、不确定性推理法、神经网络Neural 以把握的,这直接导致了挖掘算法的结算结果 etwork探索性分析法、遗传算法Genetic 具有不可预测性,因此还需要为挖掘算法添加 lgorithm、信息聚类分析法、数理统计法、 反馈机制,通过有效的反馈机制能够对计算结 算机学习法等;另一方面,数据挖掘技术的 果进行验证,并且能够对算法中的数据进行修 f象也是多种多样的,主要可以分为下列几种 正,在该过程中,不仅要保证所挖掘到数据的 ;媒体数据库、遗产数据库、空间数据库、文 正确性,还需要保证数据是用户所侧重的,这 数据源、异质数据库、时态数据库等。 就需要所挖掘的数据结果不仅具有逻辑上的正 对常用的几种数据挖掘技术进行简单分 确性,还要能够满足用户的主观偏好,既要能 ,主要表现为: 够满足用户的需求,这就需要有效的约束来发 (1)规则归纳,这主要是指对数据开展 现算法中的问题,并及时的开展算法纠正,这 j关的统计,其主要是对数据项中的一些集合 样才能保证所开展的挖掘算法能够满足各方面 i属性进行反映,其中一种比较典型的归纳算 的实际需求。 i就是AQ法,通过应用数据挖掘技术能够及 但是在实际的开展挖掘算法的过程中, f发现数据库中一些潜在的位置信息。 很容易导致陷入到一个误区当中,也就是将关 (2)支持向量机,这主要是指建立在一 注的重点放在一个系统处理所出现的问题上, 数学理论基础上的结构风险,其主要思想为 但是对系统规模大小的控制没有予以足够的重 i过在高空多维空间中寻找一个超平面,然后 视,出现这样的问题会对挖掘算法结果起到反 Z用该超平面将这两类隔开,以便于在数据处 作用,使得相关问题难以很好的解决。在进行 200・电子技术与软件工程Electronic Technology&Software Engineering 在保证数据挖掘结果正确性的同时,能够保持 数据的规模,并且可以将约束机制应用于整个 项目细分之后的子目标,从而实现快速约束。 为了能够更好的解决相关问题,可以对不同类 型的问题加用不用的约束调节,特别是在维度 较高的数据的除了过程中,如果所选择的约束 条件合适,能够有效简化挖掘算法。 在选择约束类型的过程中,时态约束下 的关联规则主要是指:一次数据库扫描挖掘算 法能够在减少一定的I/O个数的基础上,促使 数据量的不断上升,这就会导致计算机内存占 用量的线性增大,因此,ISS容量控制就是关 联规则数据挖掘算法中非常重要的内容,并且 能够有效减少CPU的占用量,为了能够有效 的改善这一问题,可以采取对数据进行分批处 理的方式,通过对数据实时有效的组织,能够 有效的改善数据结构,降低数据内存,并且能 够生成独立的关联规则,在降低计算机硬件资 源占用率的同时,有效改善精确度。 3结束语 数据挖掘技术是一种新型的数据处理技 术,不管是数据挖掘技术还是关联规则挖掘算 法,其中所包含的内容比较多,本文就主要对 其进行了简单分析,对于实际的数据挖掘工作 具有一定的参考价值。 参考文献 【1]刘兴明.浅析数据挖掘技术与关联规则挖 掘算法[J】.无线互联科技,2 014(08). [2】郭玲.数据挖掘技术与关联规则挖掘算法 研究[J】.硅谷,2 014(1 5). 作者简介 李仕琼(1976-),女,四川宁南县人。硕士学位。 现为泸州医学院生物医学37-程系讲师。研究方 向为数据挖掘。 作者单位 泸州医学院数学与信息技术教研室四川省泸 州市646000