数据挖掘复习题和答案.docx

上传人:b****8 文档编号:11910496 上传时间:2023-06-03 格式:DOCX 页数:18 大小:1.14MB
下载 相关 举报
数据挖掘复习题和答案.docx_第1页
第1页 / 共18页
数据挖掘复习题和答案.docx_第2页
第2页 / 共18页
数据挖掘复习题和答案.docx_第3页
第3页 / 共18页
数据挖掘复习题和答案.docx_第4页
第4页 / 共18页
数据挖掘复习题和答案.docx_第5页
第5页 / 共18页
数据挖掘复习题和答案.docx_第6页
第6页 / 共18页
数据挖掘复习题和答案.docx_第7页
第7页 / 共18页
数据挖掘复习题和答案.docx_第8页
第8页 / 共18页
数据挖掘复习题和答案.docx_第9页
第9页 / 共18页
数据挖掘复习题和答案.docx_第10页
第10页 / 共18页
数据挖掘复习题和答案.docx_第11页
第11页 / 共18页
数据挖掘复习题和答案.docx_第12页
第12页 / 共18页
数据挖掘复习题和答案.docx_第13页
第13页 / 共18页
数据挖掘复习题和答案.docx_第14页
第14页 / 共18页
数据挖掘复习题和答案.docx_第15页
第15页 / 共18页
数据挖掘复习题和答案.docx_第16页
第16页 / 共18页
数据挖掘复习题和答案.docx_第17页
第17页 / 共18页
数据挖掘复习题和答案.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据挖掘复习题和答案.docx

《数据挖掘复习题和答案.docx》由会员分享,可在线阅读,更多相关《数据挖掘复习题和答案.docx(18页珍藏版)》请在冰点文库上搜索。

数据挖掘复习题和答案.docx

数据挖掘复习题和答案

一、考虑表中二元分类问题的训练样本集

1.整个训练样本集关于类属性的熵是多少?

2.关于这些训练集中a12的信息增益是多少?

3.对于连续属性a3,计算所有可能的划分的信息增益。

4.根据信息增益,a123哪个是最佳划分?

5.根据分类错误率,a12哪具最佳?

6.根据指标,a12哪个最佳?

答1.

P(+)=4/9P(−)=5/9

−4/92(4/9)−5/92(5/9)=0.9911.

 

答2:

(估计不考)

答3:

 

答4:

a1.

答5:

a1:

=2/9.

a2:

=4/9.

,a1.

 

答6:

二、考虑如下二元分类问题的数据集

1.计算信息增益,决策树归纳算法会选用哪个属性

2.计算指标,决策树归纳会用哪个属性?

这个答案没问题

3.从图4-13可以看出熵和指标在[0,0.5]都是单调递增,而[0.5,1]之间单调递减。

有没有可能信息增益和指标增益支持不同的属性?

解释你的理由

,Δ,

,

(a)(b).

贝叶斯分类

1.P(A=1|−)=2/5=0.4,P(B=1|−)=2/5=0.4,

P(C=1|−)=1,P(A=0|−)=3/5=0.6,

P(B=0|−)=3/5=0.6,P(C=0|−)=0;P(A=1)=3/5=0.6,

P(B=1)=1/5=0.2,P(C=1)=2/5=0.4,

P(A=0)=2/5=0.4,P(B=0)=4/5=0.8,

P(C=0)=3/5=0.6.

2.

3.P(A=0)=(2+2)/(5+4)=4/9,

P(A=0|−)=(3+2)/(5+4)=5/9,

P(B=1)=(1+2)/(5+4)=3/9,

P(B=1|−)=(2+2)/(5+4)=4/9,

P(C=0)=(3+2)/(5+4)=5/9,

P(C=0|−)=(0+2)/(5+4)=2/9.

4.P(A=0=1,C=0)=K

5.当的条件概率之一是零,则估计为使用估计概率的方法的条件概率是更好的,因为我们不希望整个表达式变为零。

1.P(A=1)=0.6,P(B=1)=0.4,P(C=1)=0.8,P(A=

1|−)=0.4,P(B=1|−)=0.4,P(C=1|−)=0.2

2.

R:

(A=1=1,C=1).

P()P(−).,P()=P()P(+)(R)P(−)=P(−)P(−)(R).

P(+)=P(−)=0.5P(R),R

P()P(−).

P()=P(A=1)×P(B=1)×P(C=1)=0.192

P(−)=P(A=1|−)×P(B=1|−)×P(C=1|−)=0.032

P(),(+).

3.

P(A=1)=0.5,P(B=1)=0.4P(A=1=1)=P(A)×

P(B)=0.2.,AB.

4.

P(A=1)=0.5,P(B=0)=0.6,P(A=1=0)=P(A=1)×P(B=0)=0.3.AB.

5.

P(A=1=1)=0.2P(A=1)=0.6

P(B=1=+)=0.4.P(A=1)

P(A=1|−)P(A=1=1),AB

.

 

三、使用下表中的相似度矩阵进行单链和全链层次聚类。

绘制树状况显示结果,树状图应该清楚地显示合并的次序。

 

s1,s2,c1,c2.

A2:

=16/32=50.0%(

).

A4:

I.

I=5,5/32=15.6%.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2