数据挖掘期末考试计算题及答案

2022-06-19 来源：易榕旅网

题一：

一阶项目集支持度 a 5 b 4 c 2 d 5 e 3 f 4 g 6 一阶频繁集支持度 a 5 b 4 d 5 f 4 g 6 二阶候选集支持度 ab 3 ad 4 af 2 ag 5 bd 3 bf 1 bg 3 df 3 dg 4 fg 3 二阶频繁集支持度 ad 4 ag 5 dg 4 三阶候选集支持度 adg 4 三阶频繁集支持度 adg 4 题二 Distance(G,A)2=0.1;Distance(G,B)2=0.03;Distance(G,C)2=0.11 Distance(G,D)2=0.12;Distance(G,E)2=0.16;Distance(G,F)2=0.05 G的三个最近的邻居为B,F,A,因此G的分类为湖泊水

Distance(H,A)2=0.03;Distance(H,B)2=0.18;Distance(H,C)2=0.22 Distance(H,D)2=0.03;Distance(H,E)2=0.21;Distance(H,F)2=0.16 H的三个最近的邻居为A,D,F,因此H的分类为冰川水

来源：网络转载

题三

首先计算各属性的信息增益 Gain(Ca+浓度)=0

Gain(Mg+浓度)=0.185 Gain(Na+浓度)=0 Gain(Cl-浓度)=0.32

选择Cl-浓度作为根节点 Cl-浓度高低计算各属性的信息增益 Gain(Ca+浓度)=0 Gain(Mg+浓度)=0.45 冰川水？ Gain(Na+浓度)=0.24 选择Mg+浓度作为节点 Cl-浓度计算各属性的信息增益高低 Gain(Ca+浓度)=0.24 Gain(Na+浓度)=0.91 冰川水 Mg+浓度 Cl-浓度低高高低湖泊水？湖泊水题四 Na+浓度冰川水 Mg+浓度 P(Ca+浓度=低，Mg+浓度=高，Na+浓度=高，Cl-浓度=低|类型=冰川水)*P(冰川低水) 高低高 =P(Ca+浓度=低|类型=冰川水)*P(Mg+浓度=高|类型=冰川水)*P(Na+浓度=高|类冰川水湖泊水型=冰川水)*P(Cl-浓度=低|类型=冰川水)*P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468 P(Ca+浓度=低，Mg+浓度=高，Na+浓度=高，Cl-浓度=低|类型=湖泊水)*P(湖泊水) =P(Ca+浓度=低|类型=湖泊水)*P(Mg+浓度=高|类型=湖泊水)*P(Na+浓度=高|类型=湖泊水)*P(Cl-浓度=低|类型=湖泊水)*P(湖泊水) =0.5*0.25*0.5*1*0.5=0.03123 第一个样本为冰川水 P(Ca+浓度=高，Mg+浓度=高，Na+浓度=低，Cl-浓度=高|类型=冰川水)*P(冰川水) =P(Ca+浓度=高|类型=冰川水)*P(Mg+浓度=高|类型=冰川水)*P(Na+浓度=低|类型=冰川水)*P(Cl-浓度=高|类型=冰川水)*P(冰川水) =0.5*0.75*0.5*0.5*0.5=0.0468

P(Ca+浓度=高，Mg+浓度=高，Na+浓度=低，Cl-浓度=高|类型=湖泊水)*P(湖泊水)

=P(Ca+浓度=高|类型=湖泊水)*P(Mg+浓度=高|类型=湖泊水)*P(Na+浓度=低|类型=湖泊水)*P(Cl-浓度=高|类型=湖泊水)*P(湖泊水) =0.5*0.25*0.5*0*0.5=0 第二个样本为冰川水题五

A,B,C,D,E,F,G之间的距离矩阵如下表来源：网络转载

A B C D E F G A B 1 C D E F 1.5 G 根据距离矩阵建立的树如下题六第一次迭代以A，B作为平均点，对剩余的点根据到A、B的距离进行分配 {A,C,D,E,F,G,H},{B} 计算两个簇的平均点 (6.5,1.7),(4,5) 第二次迭代，对剩余的点根据到平均点的距离进行分配，得到两个簇 {D,E,F,H}和{A,B,C,G} 计算两个簇的平均点 (9.1,0.5),(3.25,3.75) 第三次迭代，对剩余的点根据到平均点的距离进行分配，得到两个簇 B C D E A F G {D,E,F,H}和{A,B,C,G} 由于所分配的簇没有发生变化，算法终止。来源：网络转载

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

数据挖掘期末考试计算题及答案