数据挖掘期末考试计算题及答案.docx

上传人:b****1 文档编号:14300613 上传时间:2023-06-22 格式:DOCX 页数:10 大小:471.92KB
下载 相关 举报
数据挖掘期末考试计算题及答案.docx_第1页
第1页 / 共10页
数据挖掘期末考试计算题及答案.docx_第2页
第2页 / 共10页
数据挖掘期末考试计算题及答案.docx_第3页
第3页 / 共10页
数据挖掘期末考试计算题及答案.docx_第4页
第4页 / 共10页
数据挖掘期末考试计算题及答案.docx_第5页
第5页 / 共10页
数据挖掘期末考试计算题及答案.docx_第6页
第6页 / 共10页
数据挖掘期末考试计算题及答案.docx_第7页
第7页 / 共10页
数据挖掘期末考试计算题及答案.docx_第8页
第8页 / 共10页
数据挖掘期末考试计算题及答案.docx_第9页
第9页 / 共10页
数据挖掘期末考试计算题及答案.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据挖掘期末考试计算题及答案.docx

《数据挖掘期末考试计算题及答案.docx》由会员分享,可在线阅读,更多相关《数据挖掘期末考试计算题及答案.docx(10页珍藏版)》请在冰点文库上搜索。

数据挖掘期末考试计算题及答案.docx

数据挖掘期末考试计算题及答案

 

数据挖掘期末考试计算题及答案

题一:

一阶项目集

支持度

a

5

b

4

c

2

d

5

e

3

f

4

g

6

一阶频繁集

支持度

a

5

b

4

d

5

f

4

g

6

二阶候选集

支持度

ab

3

ad

4

af

2

ag

5

bd

3

bf

1

bg

3

df

3

dg

4

fg

3

二阶频繁集

支持度

ad

4

ag

5

dg

4

三阶候选集

支持度

adg

4

三阶频繁集

支持度

adg

4

 

题二

Distance(G,A)2=0.1;Distance(G,B)2=0.03;Distance(G,C)2=0.11

Distance(G,D)2=0.12;Distance(G,E)2=0.16;Distance(G,F)2=0.05

G的三个最近的邻居为B,F,A,因此G的分类为湖泊水

Distance(H,A)2=0.03;Distance(H,B)2=0.18;Distance(H,C)2=0.22

Distance(H,D)2=0.03;Distance(H,E)2=0.21;Distance(H,F)2=0.16

H的三个最近的邻居为A,D,F,因此H的分类为冰川水

题三

首先计算各属性的信息增益

Gain(Ca+浓度)=0

Gain(Mg+浓度)=0.185

Gain(Na+浓度)=0

Gain(Cl-浓度)=0.32

选择Cl-浓度作为根节点

计算各属性的信息增益

Gain(Ca+浓度)=0

Gain(Mg+浓度)=0.45

Gain(Na+浓度)=0.24

选择Mg+浓度作为节点

计算各属性的信息增益

Gain(Ca+浓度)=0.24

Gain(Na+浓度)=0.91

题四

P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低|类型=冰川水)*P(冰川水)

=P(Ca+浓度=低|类型=冰川水)*P(Mg+浓度=高|类型=冰川水)*P(Na+浓度=高|类型=冰川水)*P(Cl-浓度=低|类型=冰川水)*P(冰川水)

=0.5*0.75*0.5*0.5*0.5=0.0468

P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低|类型=湖泊水)*P(湖泊水)

=P(Ca+浓度=低|类型=湖泊水)*P(Mg+浓度=高|类型=湖泊水)*P(Na+浓度=高|类型=湖泊水)*P(Cl-浓度=低|类型=湖泊水)*P(湖泊水)

=0.5*0.25*0.5*1*0.5=0.03123

第一个样本为冰川水

P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高|类型=冰川水)*P(冰川水)

=P(Ca+浓度=高|类型=冰川水)*P(Mg+浓度=高|类型=冰川水)*P(Na+浓度=低|类型=冰川水)*P(Cl-浓度=高|类型=冰川水)*P(冰川水)

=0.5*0.75*0.5*0.5*0.5=0.0468

P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高|类型=湖泊水)*P(湖泊水)

=P(Ca+浓度=高|类型=湖泊水)*P(Mg+浓度=高|类型=湖泊水)*P(Na+浓度=低|类型=湖泊水)*P(Cl-浓度=高|类型=湖泊水)*P(湖泊水)

=0.5*0.25*0.5*0*0.5=0

第二个样本为冰川水

题五

A,B,C,D,E,F,G之间的距离矩阵如下表

A

B

C

D

E

F

G

A

B

1

C

D

E

F

1.5

G

根据距离矩阵建立的树如下

题六

第一次迭代以A,B作为平均点,对剩余的点根据到A、B的距离进行分配

{A,C,D,E,F,G,H},{B}

计算两个簇的平均点

(6.5,1.7),(4,5)

第二次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇

{D,E,F,H}和{A,B,C,G}

计算两个簇的平均点

(9.1,0.5),(3.25,3.75)

第三次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇

{D,E,F,H}和{A,B,C,G}

由于所分配的簇没有发生变化,算法终止。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2