数据挖掘作_数据挖掘实现

2020-02-27 其他范文 下载本文

数据挖掘作由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据挖掘实现”。

第二章

2.1使用STATISTIC分析软件中的关联规则对数据集bnkserv.sta中的各类银行服务进行关联分析。使用Statistics菜单下的Data-Mining命令,选择Sequence下的Aociation and Link Analysis模块。通过一系列的变量等的设置,最终得到的频繁项集如表2.11所示: 表2.11

Summary of sequential rules(bnkserv)Min: support = 20.0%, confidence = 10.0%Max.size of an itemset = 10Body==>HeadSupport(%)Confidence(%)1(CKING)==>(SVG)54.1734563.150982(CKING)==>(SVG),(ATM)24.8529628.971553(CKING),(SVG)==>(ATM)24.8529645.876654(CKING)==>(ATM)36.1907142.188185(CKING)==>(CD)20.9861124.463896(SVG)==>(ATM)25.6914041.52508

从表2.11中我们可以看出,这13种银行服务经STATISTIC软件中的关联规则分析总共生成6个频繁项集,其中序列规则If(CKING)Then(SVG)的支持度和置信度是最大的,分别为54.17%、63.15%。每一频繁项集的支持度和置信度一一对应,下面的图2.1-1和图2.1-2比较直观的将各频繁项集的最小支持度和最小置信度表现出来了。

单击“ASCResult”窗口中的“Support graph”就可得到如图2.11所示的结果。

Support bar chartMin: support = 20.0%, confidence = 10.0%Max.size of an itemset = 10图2.11

从该图中我们可以直观、清晰地看出各个规则支持度的大小。例如,同其他规则相比较,If(CKING)Then(CD)的支持度是最小的。

单击“ASCResult”窗口中的“Confidence graph”就可得到如图2.12所示的结果。

Confidence bar chartMin: support = 20.0%, confidence = 10.0%Max.size of an itemset = 10

图2.12 从这个图中我们可以直观、清晰地看出各个规则置信度的大小。例如,同其他规则相比较,If(CKING)Then(CD)的置信度是最小的。

通过对以上各银行服务组合的支持度和置信度的分析,我们发现不同的银行服务组合在总的业务组合中所占的比例不同,据此我们可以推测不同的银行服务组合所面向的客户群不同。

单击“Rule graph”按钮得到图2.13,该图直观清晰的显示出各银行服务组合间的关联性。

Rule graphNode size: Relative support of each itemColor darkne: Relative confidence0.2450.632CDATMBodySVGCKINGCKINGSVGHeadATMCD图2.13 我们以圆点的大小和颜色代表支持度和置信度的大小。从图中我们可以得到与前面相同的结论: CKING和SVG之间的序列关联是最强的;CKING和CD之间的序列关联最弱。

2.2使用STATISTIC分析软件中的关联规则对数据集gz3g.sta中的各3G业务进行关联分析。使用Statistics菜单下的Data-Mining命令,选择Sequence下的Aociation and Link Analysis模块。通过一系列的变量等的设置,最终得到的频繁项集如表2.21所示

《数据挖掘作.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
数据挖掘作
点击下载文档
相关专题 数据挖掘实现 数据挖掘 数据挖掘实现 数据挖掘
[其他范文]相关推荐
    [其他范文]热门文章
      下载全文