抽样技术课后习题-参考答案-金勇进.doc

上传人:wj 文档编号:13763389 上传时间:2023-06-17 格式:DOC 页数:26 大小:1.49MB
下载 相关 举报
抽样技术课后习题-参考答案-金勇进.doc_第1页
第1页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第2页
第2页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第3页
第3页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第4页
第4页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第5页
第5页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第6页
第6页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第7页
第7页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第8页
第8页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第9页
第9页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第10页
第10页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第11页
第11页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第12页
第12页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第13页
第13页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第14页
第14页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第15页
第15页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第16页
第16页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第17页
第17页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第18页
第18页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第19页
第19页 / 共26页
抽样技术课后习题-参考答案-金勇进.doc_第20页
第20页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

抽样技术课后习题-参考答案-金勇进.doc

《抽样技术课后习题-参考答案-金勇进.doc》由会员分享,可在线阅读,更多相关《抽样技术课后习题-参考答案-金勇进.doc(26页珍藏版)》请在冰点文库上搜索。

抽样技术课后习题-参考答案-金勇进.doc

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r。

然后用r+19999作为被抽选的数。

解析:

等概抽样属于概率抽样,概率抽样具有一些几个特点:

第一,按照一定的概率以随机原则抽取样本。

第二,每个单元被抽中的概率是已知的,或者是可以计算的。

第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此

(1)中只有1~64是可能被抽中的,故不是等概的。

(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值的定义和性质有哪些不同?

解析:

抽样理论和数理统计中关于样本均值的定义和性质的不同

抽样理论

概率统计

定义

性质

1.期望

2.方差

1.期望

2.方差

2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值9.5(千瓦时),206.试估计该市居民用电量的95%置信区间。

如果希望相对误差限不超过10%,则样本量至少应为多少?

解:

由已知可得,N=50000,n=300,,

该市居民用电量的95%置信区间为

[=[475000±1.96*41308.19]

即为(394035.95,555964.05)

由相对误差公式≤10%

可得

即n≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:

由已知得:

又有:

该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:

代入数据计算得:

该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号

文化支出

编号

文化支出

1

200

11

150

2

150

12

160

3

170

13

180

4

150

14

130

5

160

15

100

6

130

16

180

7

140

17

100

8

100

18

180

9

110

19

170

10

240

20

120

估计该小区平均的文化支出,并给出置信水平95%的置信区间。

解析:

由已知得:

根据表中数据计算得:

该小区平均文化支出的95%置信区间为:

即是:

[132.544,156.456]

故估计该小区平均的文化支出=144.5,置信水平95%的置信区间为[132.544,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到=1120(吨),,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。

解析:

由题意知:

=1120

置信水平95%的置信区间为:

代入数据得:

置信水平95%的置信区间为:

[1079.872,1160.872]*350

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差,是确定简单随机抽样所需的样本量。

若预计有效回答率为70%,则样本量最终为多少?

解析:

简单随机抽样所需的样本量

由题意知:

代入并计算得:

故知:

简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到,这些企业去年的平均产量为。

试估计今年该地区化肥总产量。

解析:

由题可知,,

则,该地区化肥产量均值的比率估计量为

该地区化肥产量总值Y的比率估计量为

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:

单位:

编号

文化支出

总支出

编号

文化支出

总支出

1

200

2300

11

150

1600

2

150

1700

12

160

1700

3

170

2000

13

180

2000

4

150

1500

14

130

1400

5

160

1700

15

150

1600

6

130

1400

16

100

1200

7

140

1500

17

180

1900

8

100

1200

18

100

1100

9

110

1200

19

170

1800

10

140

1500

20

120

1300

全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

解析:

由题可知

故平均文化支出的95%的置信区间为

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。

现从中抽取10头,记录重量,3个月后再次测量,结果如下:

单位:

千克

编号

原重量

现重量

1

95

150

2

97

155

3

87

140

4

120

180

5

110

175

6

115

185

7

103

165

8

102

160

9

92

150

10

105

170

用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

解:

由题可知,

故有

所以总体均值的回归估计量为

其方差估计为:

=

=1.097

=

=19.454

显然

所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考)

1解:

(1)不合适

(2)不合适

(3)合适

(4)不合适

2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。

3.根据表中调查数据,经计算,可得下表:

h

1

10

256

0.3033

0.0391

11.2

2867.2

94.4

2

10

420

0.4976

0.0238

25.5

10710

302.5

3

10

168

0.1991

0.0595

20

3360

355.6

总计

30

844

1

16937.2

==20.1

V()=-

=9.7681-0.2962

=9.4719

=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:

n==185.4407185

=n=56,=92,=37

按内曼分配:

n==175

=33,=99,=43

4.根据调查数据可知:

h

1

0.18

0.9

2

0.21

0.933

3

0.14

0.9

4

0.08

0.867

5

0.16

0.933

6

0.22

0.967

==0.924

根据各层层权及抽样比的结果,可得

()==0.000396981

=1.99%

估计量的标准差为1.99%,比例为9.24%

按比例分配:

n=2663

=479,=559,=373,=240,=426,=586

内曼分配:

n=2565

=536,=520,=417,=304,=396,=392

5.解:

由题意,有

==75.79

购买冷冻食品的平均支出为75.79元

又由V()=+

又n=

V()=53.8086

=7.3354

95%的置信区间为[60.63,90.95]。

7.解:

(1)对

(2)错

(3)错

(4)错

(5)对

8.解:

(1)差错率的估计值=70%+30%=0.027

估计的方差v()==3.1967

标准差为S()=0.0179。

(2)用事后分层的公式计算差错率为==0.03

估计的方差为;v()=-=2.5726

9.解:

(1)所有可能的样本为:

第一层

第二层

3,5

0,3

8,15

6,9

3,10

0,6

8,25

6,15

5,10

3,6

15,25

9,15

(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。

用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。

第四章习题

4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:

各户订报数

1

1,2,1,3,3,2,1,4,1,1

19

2

1,3,2,2,3,1,4,1,1,2

20

3

2,1,1,1,1,3,2,1,3,1

16

4

1,1,3,2,1,5,1,2,3,1

20

试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。

解:

由题意得到,,,

故(份)

(份)

(份)

于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。

该辖区总的订阅份数为7500,估计量方差为62700。

4.2某工业系统准备实行一项改革措施。

该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:

单位

总人数

赞成人数

1

51

42

2

62

53

3

49

40

4

73

45

5

101

63

6

48

31

7

65

38

8

49

30

9

73

54

10

61

45

11

58

51

12

52

29

13

65

46

14

49

37

15

55

42

(1)估计该系统同意这一改革人数的比例,并计算估计标准误差。

(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?

解:

题目已知,,

1)由已知估计同意改革的比例

此估计量的标准差为

4.3某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。

财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料:

抽屉编号

票据数

费用额(,百元)

1

42

83

2

27

62

3

38

45

4

63

112

5

72

96

6

12

58

7

24

75

8

14

58

9

32

67

10

41

80

要求以95%的置信度估计该集团办公费用总支出额度置信区间(=0.05)。

解:

已知N=48,n=10,f=,由题意得,,

则办公费用的总支出的估计为(元)

群总和均值(元)

=

=182.43590.4

=72765.44

=269.7507

则的置信度为95%的置信区间为3532.81.96269.7507,即[3004.089,4061.511].

4.4为了便于管理,将某林区划分为386个小区域。

现采用简单随机抽样方法,从中抽出20个小区域,测量树的高度,得到如下资料:

区域编号

数目株数

平均高度(尺)

区域编号

数目株数

平均高度(尺)

1

42

6.2

11

60

6.3

2

51

5.8

12

52

6.7

3

49

6.7

13

61

5.9

4

55

4.9

14

49

6.1

5

47

5.2

15

57

6.0

6

58

6.9

16

63

4.9

7

43

4.3

17

45

5.3

8

59

5.2

18

46

6.7

9

48

5.7

19

62

6.1

10

41

6.1

20

58

7.0

估计整个林区树的平均高度及95%的置信区间。

解:

由已知得,,

整体的平均高度

方差估计值

标准方差

在置信度95%下,该林区的树木的平均高度的置信区间为

4.5某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。

全校共有女生宿舍200间,每间6人。

学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表:

样本宿舍

拍照人数

样本宿舍

拍照人数

1

2

6

1

2

0

7

0

3

1

8

1

4

2

9

1

5

1

10

0

试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。

解:

题目已知,,,,,

在置信度95%下,p的置信区间为

=

4.6上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿舍间的标准差为=326元,宿舍内同学之间的标准差为=188元。

以一位同学进行调查来计算,调查每个宿舍的时间为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?

解:

由已知条件得到以下信息:

(元)(元)(分钟)(分钟)(分钟)

由此得到

,,

因而取最优的,进一步计算

由于总时间的限制,由关系式

得到

计算方程得到,因而取

则最优的样本宿舍数为20间,最优样本学生数为2。

4.7某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住在10个单元中。

现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位):

单元

居民人数

样本量

健身锻炼时间

1

32

4

4,2,3,6

2

45

5

2,2,4,3,6

3

36

4

3,2,5,8

4

54

6

4,3,6,2,4,6

试估计居民平均每天用于锻炼的时间,并给出估计的标准差。

(1)简单估计量

(2)比率估计量

(3)对两种估计方法及结果进行评价。

解:

(1)简单估计

=

=1650,

则,

又,

所以

分别计算

所以,

所以标准差

(2)比率估计

其中

(3)简单估计标准差,比率估计标准差

比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:

即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复:

(1)代码法:

由=可假设=1000000,则M=M列成数据表为:

PSU

M

累计M

代码

1

110

110

1~110

2

18556

18666

111~18666

3

62999

81665

18667~81665

4

78216

159881

81666~159881

5

75245

235126

159982~235126

6

73983

309109

235127~309109

7

76580

385689

309110~385689

8

38981

424670

385690~424670

9

40772

465442

424671~465442

10

22876

488318

465443~488318

11

3721

492039

488319~492039

12

24971

517010

492040~517010

13

40654

557664

517011~557664

14

14804

572468

557665~572468

15

5577

578045

572469~578045

16

70784

648829

578046~648829

17

69635

718464

648830~718464

18

34650

753114

718465~753114

19

69492

822606

753115~822606

20

36590

859296

822607~859296

21

33853

893049

859297~893049

22

16959

910008

893050~910008

23

9066

919074

910009~919074

24

21795

940869

919075~940869

25

59185

1000054

940870~1000054

我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703,615432,791937,921813,738207,176266,405706935470,916904,57891按照范围我们可以知道抽取的PSU9,PSU16,PSU19,PSU24,PSU18,PSU2,PSU8PSU24PSU23PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组;

综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组

(2)拉希里法:

M=78216,N=25,在[1,25]和[1,78216]中分别产生(n,m):

(13,38678),M=4065438678,入样;

(8,57764),M=38981<57764,舍弃,重抽;

(23,13365),M=9066<13365,舍弃,重抽;

(19,38734),M=6949238734,入样;

以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:

2,3,5,6,7,12,13,16,19,24组

5.2解:

由数据可得:

t==20,t,t=38,t=24,t=21;

结合t值数据,我们可以推得Z的值

Z=,Z=0.16,Z=0.32,Z=0.2,Z=0.12,

由公式

样本

1,2

0.273769

1,3

0.217405

1,4

0.283079

1,5

0.243826

2,3

0.166251

2,4

0.213142

2,5

0.243826

3,4

0.603903

3,5

0.53546

4,5

0.243826

5.3解:

设:

=1,则有:

,得到下表:

i

累计

代码

1

0.104

104

104

1—104

2

0.192

192

296

105—296

3

0.138

138

434

297—434

4

0.062

62

496

435—496

5

0.052

52

548

497—548

6

0.147

147

695

549—695

7

0.089

89

784

696—784

8

0.038

38

822

785—822

9

0.057

57

879

823—879

10

0.121

121

1000

880—1000

1

1000

先在[1,1000]中产生第一个随机数为731,再在[1,1000]里面产生第二个随机数为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。

5.4解:

利用汉森-赫维茨估计量对总体总值进行估计:

=20318.8

5.5解:

由题可知

=2+9+3+2+1+6=23

由得下表:

i

指标值

包含概率

1

2

0.1739

0.087

2

9

0.7826

0.3913

3

3

0.2609

0.1304

4

2

0.1739

0.087

5

1

0.087

0.0435

6

6

0.5217

0.2609

由上表显然有<1/2,于是我们可以采用布鲁尔方法:

经计算可得下表:

样本

1,2

0.0068

1,3

0.0153

1,4

0.0097

1,5

0.0046

1,6

0.0397

2,3

0.1607

2,4

0.1046

2,5

0.0512

2,6

0.3613

3,4

0.0153

3,5

0.0074

3,6

0.062

4,5

0.0046

4,6

0.0397

5,6

0.0191

附注:

(2)

样本

1,2

0.0340

1.2613

1,3

0.0133

0.2174

1,4

0.0076

0.174

1,5

0.0038

0.1305

1,6

0.0227

0.3479

2,3

0.051

0.5217

2,4

0.034

0.4783

2,5

0.017

0.4348

2,6

0.1021

0.6522

3,4

0.0113

0.2174

3,5

0.0057

0.1739

3,6

0.034

0.3913

4,5

0.0038

0.1305

4,6

0.0227

0.3479

5,6

0.0113

0.3044

验证:

另外:

代入数据,经计算得到:

5.6解:

i

1

10

7

1.43

2

9

5

1.8

3

5

3

1.67

4

2

1

2

5

4

2

2

平均

6

3.6

1.78

由题可计算出:

(1)

i

1

10

50

10

1.43

2

9

45

9

1.8

3

5

25

5

1.67

4

2

10

2

2

5

4

20

4

2

=11.5

所以有:

=10.0625

(2)

由定义有:

所以得到下表:

i

1

5.148

25.74

1.43

2

6.4

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 成人教育 > 成考

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2