非参数统计部分课后习题参考答案.docx

上传人:b****2 文档编号:18446082 上传时间:2023-08-18 格式:DOCX 页数:13 大小:71.33KB
下载 相关 举报
非参数统计部分课后习题参考答案.docx_第1页
第1页 / 共13页
非参数统计部分课后习题参考答案.docx_第2页
第2页 / 共13页
非参数统计部分课后习题参考答案.docx_第3页
第3页 / 共13页
非参数统计部分课后习题参考答案.docx_第4页
第4页 / 共13页
非参数统计部分课后习题参考答案.docx_第5页
第5页 / 共13页
非参数统计部分课后习题参考答案.docx_第6页
第6页 / 共13页
非参数统计部分课后习题参考答案.docx_第7页
第7页 / 共13页
非参数统计部分课后习题参考答案.docx_第8页
第8页 / 共13页
非参数统计部分课后习题参考答案.docx_第9页
第9页 / 共13页
非参数统计部分课后习题参考答案.docx_第10页
第10页 / 共13页
非参数统计部分课后习题参考答案.docx_第11页
第11页 / 共13页
非参数统计部分课后习题参考答案.docx_第12页
第12页 / 共13页
非参数统计部分课后习题参考答案.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

非参数统计部分课后习题参考答案.docx

《非参数统计部分课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《非参数统计部分课后习题参考答案.docx(13页珍藏版)》请在冰点文库上搜索。

非参数统计部分课后习题参考答案.docx

非参数统计部分课后习题参考答案

课后习题参考答案

第一章p23-25

2、

(2)有两组学生,第一组八名学生的成绩分别为x1:

100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x2:

75,87,60。

我们对这两组数据作同样水平a=的t检验(假设总体均值为u):

H0:

u=100H1:

u<100。

第一组数据的检验结果为:

df=7,t值为,单边p值为,结论为“拒绝H0:

u=100。

”(注意:

该组均值为);第二组数据的检验结果为:

df=2,t值为,单边p值为;结论为“接受H0:

u=100。

”(注意:

该组均值为)。

你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。

答:

这个结论不合理(6分)。

因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。

(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。

实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。

本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。

(4分)

第三章p68-71

3、在某保险种类中,一次关于1998年的索赔数额(单位:

元)的随机抽样为(按升幂排列):

4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。

已知1997年的索赔数额的中位数为5064元。

(1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分)

(2)利用符号检验来回答

(1)的问题(利用精确的和正态近似两种方法)。

(10分)

(3)找出基于符号检验的95%的中位数的置信区间。

(8分)

解:

(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。

如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。

(4分)

(2)符号检验(5分)

设假设组:

H0:

M=M0=5064

H1:

M≠M0=5064

符号检验:

因为n+=11,n-=3,所以k=min(n+,n-)=3

精确检验:

二项分布b(14,,

,双边p-值为,大于a=,所以在a水平下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。

查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。

正态近似:

(5分)

np=14/2=7,npq=14/4=

z=(3+/

≈>Za/2=

仍是在a=的水平上无法拒绝零假设。

说明两年的中位数变化不大。

(3)中位数95%的置信区间:

(5064,21240)(8分)

7、一个监听装置收到如下的信号:

0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。

能否说该信号是纯粹随机干扰(10分)

解:

建立假设组:

H0:

信号是纯粹的随机干扰

H1:

信号不是纯粹的随机干扰(2分)

游程检验:

因为n1=42,n2=34,r=37。

(2分)根据正态近似公式得:

U=

(2分)

(2分)

取显著性水平a=,则Za/2=,故接受零假设,可以认为信号是纯粹的随机干扰的。

(2分)

第四章p91-94

1、在研究计算器是否影响学生手算能力的实验中,13个没有计算器的学生(A组)和10个拥有计算器的学生(B组)对一些计算题进行了手算测试.这两组学生得到正确答案的时间(分钟)分别如下:

A组:

28,20,20,27,3,29,25,19,16,24,29,16,29

B组:

40,31,25,29,30,25,16,30,39,25

能否说A组学生比B组学生算得更快利用所学的检验来得出你的结论.(12分)

解、利用Wilcoxon两个独立样本的秩和检验或Mann-WhitneyU检验法进行检验。

建立假设组:

H0:

两组学生的快慢一致;

H1:

A组学生比B组学生算得快。

(2分)

两组数据混合排序(在B组数据下划线):

3,16,16,16,19,20,20,24,25,25,25,25,27,28,29,29,29,29,30,30,31,39,40(2分)

A组秩和RA=1+3*2+5+*2+8++13+14+*3=120;

B组秩和RB=3+*3++*2+21+22+23=156(2分)

A组逆转数和UA=120-(13*14)/2=29

B组逆转数和UB=156-(10*11)/2=101(2分)

当nA=13,nB=10时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。

计算

(2分)

当显著性水平a取时,正态分布的临界值Za/2=(1分)

由于Z

(1分)

4、在比较两种工艺(A和B)所生产的产品性能时,利用超负荷破坏性实验。

记下损坏前延迟的时间名次(数目越大越耐久)如下:

方法:

ABBABABAABAAABABAAAA

序:

1234567891011121314151617181920

用Mann-Whitney秩和检验判断A工艺是否比B工艺在提高耐用性方面更优良(10分)

解、设假设组:

H0:

两种工艺在提高耐用性方面的优良性一致;

H1:

A工艺比B工艺更优良(1分,假设也可用符号表达式)

根据样本数据知nA=13;nB=7(1分),计算

A工艺的秩和RA=1+4+6+8+9+11+12+13+15+17+18+19+20=153;(1分)

B工艺的秩和RB=2+3+5+7+10+14+16=57(1分)

A工艺的Mann-Whitney秩和UA=RA-nA(nA+1)/2=153-(13*14)/2=62(1分)

B工艺的Mann-Whitney秩和UB=RB-nB(nB+1)/2=57-(7*8)/2=29(1分)

当nA=13,nB=7时,样本量较大,超出了附表的范围,不能查表得Mann-Whitney秩和检验的临界值,所以用正态近似。

计算

(2分)

当显著性水平a取时,正态分布的临界值Za/2=(1分)

由于Z

(1分)

第五章p118-121

1、对5种含有不同百分比棉花的纤维分别做8次抗拉强度试验,试验结果如表4所示(单位:

g/cm2):

表4

棉花纤维百分比(%)

15

20

25

30

35

抗拉强度

411

1268

1339

1480

986

705

846

1198

1198

775

493

1057

1339

1268

493

634

916

1198

1480

775

634

1057

1339

1268

352

846

1127

916

986

352

564

775

1480

1127

564

705

634

1268

1480

423

试问不同百分比纤维的棉花其平均抗拉强度是否一样,利用Kruskall—Wallis检验法。

(14分)

解:

建立假设组:

H0:

不同百分比纤维的棉花其平均抗拉强度一样;

H1:

不同百分比纤维的棉花其平均抗拉强度不一样。

(2分)

已知,k=5,n1=n2=n3=n4=n5=8(2分)。

混合排序后各观察值的秩如表4所示:

表4

棉花纤维百分比(%)

15

20

25

30

35

抗拉强度

3

35

28

28

15

35

10

28

15

10

35

15

10

4

R

166

nj

8

8

8

8

8

根据表4计算得:

(6分)

由于自由度k-1=5-1=4,nj=8>5,是大样本,所以根据水平a=,查X2分布表得临界值C=,(2分)

因为Q>C,故以5%的显著水平拒绝H0假设,不同百分比纤维的棉花其平均抗拉强度不一样。

(2分)

7、按照一项调查,15名顾客对三种电讯服务的态度(“满意”或“不满意”)为(15分)

服务

消费者(爱好用“1”表示,不爱好用“0”表示)

合计

A

1

1

1

1

1

1

1

1

0

1

1

1

1

1

0

13

B

1

0

0

0

1

1

0

1

0

0

0

1

1

1

1

8

C

0

0

0

1

0

0

0

0

0

0

0

1

0

0

0

2

合计

2

1

1

2

2

2

1

2

0

1

1

3

2

2

1

23

解:

建立假设组:

H0:

顾客对3种服务的态度无显著性差异;

H1:

顾客对3种服务的态度有显著性差异。

(2分)

本例中,k=3,n=15。

(2分)又因

(5分)自由度k-1=3-1=2,(2分)取显著性水平a=,查X2分布表得临界值c=,(2分)因为Q>C,故以5%的显著水平拒绝H0假设,即顾客对3种服务的态度有显著性差异。

(2分)

8、调查20个村民对3个候选人的评价,答案只有“同意”或“不同意”两种,结果见表1:

表1

候选人

20个村民的评价(“同意”为1,“不同意”为0)

A

1

1

0

0

0

0

1

0

0

0

1

0

0

1

1

0

0

1

1

1

B

0

1

1

0

1

0

1

1

0

0

0

1

0

0

0

1

0

0

0

1

C

0

0

1

1

1

1

0

0

0

0

1

0

1

1

1

1

1

0

1

0

试检验村民对这三个候选人的评价有没有区别

解:

建立假设组:

H0:

三个候选人在村民眼中没有区别

H1:

三个候选人在村民眼中有差别(2分)

数据适合用CochranQ检验(2分)。

而且已知n=20,k=3,∑xi=∑yj=28。

(2分)

计算结果见表3:

表3

3个候选人

20个村民的评价(“同意”为1,“不同意”为0)

Xi

A

1

1

0

0

0

0

1

0

0

0

1

0

0

1

1

0

0

1

1

1

9

B

0

1

1

0

1

0

1

1

0

0

0

1

0

0

0

1

0

0

0

1

8

C

0

0

1

1

1

1

0

0

0

0

1

0

1

1

1

1

1

0

1

0

11

Yj

1

2

2

1

2

1

2

1

0

0

2

1

1

2

2

2

1

1

2

2

28

根据表2计算得:

(2分)

(2分)

取显著性水平a=,查卡方分布表得卡方临界值C=,由于Q

(2分)

第八章P170-171

2.下面是某车间生产的一批轴的实际直径(单位:

mm):

能否表明该尺寸服从均值为10,标准差为的正态分布(分别用K-S拟合检验和卡方拟合检验)。

当n=10,a=时查表得K-S拟合检验的临界值为。

(24分)

解:

建立假设组:

H0:

该车间生产的轴直径服从均值为10,标准差为的正态分布;

H1:

该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)

首先将样本数据按升序排列,并对数据进行标准化处理,即Zi=(xi-10)/(1分),并列在计算表中。

(1)K-S正态拟合检验见表1:

表1K-S拟合检验计算表

样本数据xi

标准化值

Zi

正态区间

正态累计概率

实际累计频率

离差

(1)

(2)

(3)

(4)

(5)

(6)=(4)-(5)

(-∞,-3)

[-3,

[,

[,

[,

[,

[,

[,

[,

[,

-

-

[,∞)

K-S拟合检验统计量取最大的绝对离差Dn=(5分),由于检验统计量小于临界值,所以无法拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。

(2)卡方正态拟合检验见表2:

表2卡方拟合检验计算表

样本数据xi

标准化值

Zi

正态区间

正态概率

预期频数Еi

=(4)×10

小预期频数合并

实际频数Oi

(Oi-Еi)2/Еi

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(-∞,-3)

5

[-3,

[,

[,

[,

[,

[,

2

[,

[,

1

[,

1

-

-

[,∞)

1

合计

-

-

10

由于存在小预期频数,所以要合并,直到预期频数都大于1(见第(6)列),同时计算合并后的实际频数(该步正确2分)。

从表2得卡方检验统计量Q=(6分),自由度df=k-1=5-1=4(2分),查卡方分布表得a=的临界值C=(左尾),右尾临界值(2分),说明检验统计量Q落在肯定域,不能拒绝零假设,即可以说该车间生产的轴直径服从均值为10,标准差为的正态分布(2分)。

第九章p184-186

1、美国在1995年因几种违法而被捕的人数按照性别为:

表1

性别

谋杀

13927

1457

抢劫

116741

12068

恶性攻击

328476

70938

偷盗

236495

29866

非法侵占

704565

351580

偷盗机动车

119175

18058

纵火

11413

2156

从这些罪行的组合看来,是否与性别无关如果只考虑谋杀与抢劫罪,结论是否一样(20分)

解:

本题适合用独立性卡方检验。

建立假设组H0:

犯罪类型与性别无关

H1:

犯罪类型与性别有关

r=7,c=2.自由度df=(7-1)(2-1)=6

a=,查表得X2,6)=

Eij=ni.。

n

计算结果见下表:

 

男(Qi1)

女(Qi2)

合计

Ei1

Ei2

(Qij-Eij)^2/Eij

 

谋杀

13927

1457

15384

抢劫

116741

12068

128809

恶性攻击

328476

70938

399414

303146

偷盗

236495

29866

266361

非法侵占

704565

351580

1056145

偷盗机动车

119175

18058

137233

纵火

11413

2156

13569

X^2=

合计

1530792

486123

2016915

 

 

由于X2=>X2,6)=,所以拒绝零假设,说明罪行与性别有关。

如果只考虑谋杀与抢劫,则

 

男(Qi1)

女(Qi2)

合计

Ei1

Ei2

(Qij-Eij)^2/Eij

 

谋杀

13927

1457

15384

抢劫

116741

12068

128809

116727

X^2=

合计

130668

13525

144193

 

 

由于X2=

(20分)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2