统计课后作业题哈尔滨工业大学MBA课程.docx
《统计课后作业题哈尔滨工业大学MBA课程.docx》由会员分享,可在线阅读,更多相关《统计课后作业题哈尔滨工业大学MBA课程.docx(26页珍藏版)》请在冰点文库上搜索。
统计课后作业题哈尔滨工业大学MBA课程
第一章
3、某大学拟从该校20000名在校生中抽选1000人进行调查,以了解大学生课外生活情况。
调查项目主要包括:
学生所在年级、课外时间的分配、课外活动的形式及占用时间、最喜欢的课外活动等。
请写出这次调查的总体、样本及个体都是什么?
调查总体为该校20000名在校生;
调查样本为所抽选的1000名学生;
调查的个体为该校的每一个学生。
4、根据题3写出调查项目中的数据属于那一种测度水平
调查项目
测度水平
学生所在年级
定序水平的变量
课外时间的分配
定距水平的变量
课外活动形式
定类水平的变量
课外活动占用时间
定距水平的变量
最喜欢的课外活动
定类水平的变量
第二章
9、某集团公司下属40个企业,2002年的产品销售收入数据(单位:
万元)如下:
152
105
117
124
119
108
97
88
129
114
105
116
115
110
123
115
100
87
107
103
103
137
119
138
92
118
120
95
142
136
127
135
117
104
125
112
146
113
108
126
要求:
(1)根据上面的数据进行适当的分组,编制频数分布表,计算出累积频数和累积频率;
(2)按规定,销售收入在125万元以上为先进企业,115万元~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
频数分布表
按销售额分组
企业数
(频数)
向下累计频数
向上累计频数
企业数
(频率)
向下累计频率
向上累计频率
100万元以下
5
40
5
0.125
1.000
0.125
100~110万元
9
35
14
0.225
0.875
0.350
110~120万元
12
26
26
0.300
0.650
0.650
120~130万元
7
14
33
0.175
0.350
0.825
130~140万元
4
7
37
0.100
0.175
0.925
140万元以上
3
3
40
0.075
0.075
1.000
合计
40
——
——
1.000
——
——
按企业优良分组
企业优良
按销售额分组
企业数
(频数)
向下累计频数
向上累计频数
企业数
(频率)
向下累计频率
向上累计频率
先进企业
125万元以上
11
40
11
0.275
1.000
0.275
良好企业
115~125万元
11
29
22
0.275
0.725
0.550
一般企业
105~115万元
9
18
31
0.225
0.450
0.775
落后企业
105万元以下
9
9
40
0.225
0.225
1.000
合计
40
——
——
1.000
——
——
第三章
7、甲、乙两个企业生产三种产品的单位成本和总成资料如下:
产品名称
单位成本
总成本
甲企业
乙企业
A
15
2100
3255
B
20
3000
1500
C
30
1500
1500
试比较哪个企业的总平均成本高并分析其原因。
解:
根据甲、乙两企业的单位成本和总成本可得各产品生产数量:
产品名称
单位成本
总成本
产品数量
甲企业
乙企业
甲企业
乙企业
A
15
2100
3255
140
217
B
20
3000
1500
150
75
C
30
1500
1500
50
50
由此,可得总平均成本:
产品名称
甲企业
乙企业
产品数量
总成本
平均成本
产品数量
总成本
平均成本
A
140
2100
15
217
3255
15
B
150
3000
20
75
1500
20
C
50
1500
30
50
1500
30
合计
340
6600
19.41
342
6255
18.29
由此,看出甲企业的总平均成本高于乙企业的总平均成本,原因在于:
尽管甲、乙企业的各产品的单位成本一样,但是,由于乙企业生产A产品的数量较多,因此,在计算总平均成本时,产生的影响较大,使得乙企业的总平均成本低于甲企业的总平均成本,这说明,在用组平均数进行平均时,其结构(该题中的生产数量)对总平均产生了影响。
8.根据下表数据评价说明甲乙两村平均产量的高低,并说明理由。
按耕作
条件分组
甲村
乙村
播种
面积
比重
(%)
总产量
平均产量
播种
面积
比重
(%)
总产量
平均产量
水田
旱田
650
350
65
35
260000
70000
400
200
675
825
45
55
276750
185625
410
225
合计
1000
100
330000
330
1500
100
462375
308
如果笼统的比较甲乙两村的总平均产量,则甲村的总平均产量(330)高于乙村的总平均产量(308),但是,如果按水田、旱田平均产量分别比较,乙村的平均产量(410,225)高于甲村的平均产量(400,200)。
出现这种现象的原因在于,由于对于耕作土地进行了分组(水田、旱田),因此,在进行平均时,其结构(水旱田的比重)对总平均产生了影响,在这里由于乙村旱田比较较大,因此,乙村的总平均产量低于甲村。
9、某百货公司6月份日销售额数据(单位:
万元)如下:
257
271
272
276
292
284
297
261
268
252
281
303
238
301
273
310
274
263
240
267
322
236
280
249
265
291
269
278
258
295
要求:
(1)计算该百货公司日销售额的均值、中位数和众数;
(2)计算日销售额的标准差;
解:
(1)1.均值=∑日销售额/n=8223/30=274.10万元
2.由于数据n=30,经过排序可知X15=272,X16=273
所以得中位数Me=(X15+X16)/2=(272+273)/2=272.50万元
3.通过观察该组数据发现,所有数据均出现一次,所以该组数据无众数
(2)
X
X-μ
(X-μ)2
236
-38
1452
238
-36
1303
240
-34
1163
249
-25
630
252
-22
488
257
-17
292
258
-16
259
261
-13
172
263
-11
123
265
-9
83
267
-7
50
268
-6
37
269
-5
26
271
-3
10
272
-2
4
273
-1
1
274
0
0
276
2
4
278
4
15
280
6
35
281
7
48
284
10
98
291
17
286
292
18
320
295
21
437
297
23
524
301
27
724
303
29
835
310
36
1289
322
48
2294
∑X=
8223
0.00
13002.70
由此可得:
样本方差
/(n-1)=13002.7/(30-1)=488.369
样本标准差S=
=
=21.174
10.对10名成年人和10名幼儿的身高(单位:
cm)进行抽样调查,结果如下:
成年组
166
169
172
177
180
170
172
174
168
173
幼儿组
68
69
68
70
71
73
72
73
74
75
要求:
(1)要比较成年组和幼儿组的身高差异,应采用什么样的指标?
(2)比较分析哪一组的身高差异大。
解:
(1)可以采用全距R,平均差MAD,方差S2,标准差S,离散系数VS来描述成年组和幼儿组的身高差异。
描述指标
成年组
幼儿组
172.1
71.3
全距R
Xmax-Xmin
14
7
平均差MAD
3.12
2.1
方差S2
17.65
6.23
标准差S
4.2
2.49
离散系数VS
0.024
0.035
(2)从以上结果来看,全距R,平均差MAD,方差S2,标准差S所体现的都是成年组的身高差异较大,但是比较均值不相同两组数据的相对离散程度时,,采用离散系数更为准确一些,因此,从本例中可以看出,儿童组的离散系数较大,也就是说儿童组的身高差异较大。
第五章
3、设已知某果园某种果树每株产量服从正态分布。
随机抽取6株计算其年产量(单位:
kg)为222.2,190.4,201.9,204,256.1,236试以95%的置信度,估计全部果树的平均年产量的置信区间。
解:
由于n=6〈30所以该样本服从n-1的t分布
=(222.2+190.4+201.9+204+256.1+236)/6=218.43
=
=24.53
又已知1-а=0.95,а=0.05查表可得tа/2(n-1)=t0.05/2(5-1)=2.571
则μ的置信区间为(
),
即(218.43±2.571×24.53/
),亦即(218.43±28.21)
从而(190.22,246.64)
所以全部果树在置信度95%的条件下,平均年产量的置信区间为190.22kg至246.64kg。
6、某地区共有奶牛2500头,随机调查了几处共400头,得出每头奶牛的平均年产奶量为3000kg,均方差为300,试以95%的置信度估计该地区牛奶全年总产量的置信区间。
解:
=3000kg,S=300,n=4001-а=0.95,а=0.05
因为n/N=400/2500=0.16﹥0.05,故需考虑用有限修正因子修正,
查表可得zа/2=z0.05/2=1.96,则μ的置信区间为
(
)
即(3000±1.96×
)=(3000±1.96×15×0.9165)
(3000±26.95),即(2973.05,3026.95)
全年牛奶总产量的置信区间为(7432625,7567375)
7、上题中,若400头奶牛中有80%的是优等奶牛,试以95%的置信度估计全区优等奶牛的比例的置信区间。
解:
n
=400×0.8=320,n(1-
)=400×0.2=80都大于5,因为n/N=400/2500=0.16﹥0.05,故需考虑用有限修正因子修正。
所以根据公式
=
=0.8±1.96×0.02×0.9167=0.8±1.96×0.02×0.9167=0.8±0.036
即(0.764,0.836),也就是在95%的置信度区间内,全区优等奶牛的比例置信区间在
(76.4%,83.6%)之间。
11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸的广告家庭占多大比例。
为了估计这个比例,首先要确定对多少个家庭做调查。
该公司希望以90%的置信度对这个比例作出估计,并使估计值处在真正比例附近0.04范围之内。
在一个有15个家庭组成的预备样本中,有35%的响应者指出他们家中某个人看过这种广告,试问应取多大的样本。
解:
由题意可得:
由于预备样本中n=15,是小样本,服从二项分布,所以:
p=0.35
有
,1-а=0.90
查表得
所以应取样本数量
所以应抽取的样本数量为383人。
第六章
7、糖厂用自动打包机打包,每包标准质量是100kg。
每天开工后需要检验一次打包机工作是否正常。
某日开工后测得9包质量如下:
99.398.7100.5101.298.399.799.5102.1100.5,已知包重服从正态分布,试检验该日打包机工作是否正常。
(а=0.05)
解:
根据题意,设:
原假设:
μ=100
备择假设:
μ≠100
有题中数据可知:
n=9,̅S=99.98S=1.212
由于n﹤30,所以构造t统计量:
查表可得
因为t=-0.05﹥
所以落在接受域内,接受原假设,拒绝备择假设,即:
在95%的可靠程度内,该打包机该日的工作正常。
10、1545名男性样本与1691名女性样本用于比较双职工家庭中男女所做家务的数量,研究表明67.5%的男性以及60.8%的女性认为自己那份家务是公平的。
认为自己那份家务是公平的男性的比率比女性的比率大吗?
试用0.05的显著性水平检验。
解:
设男性的比率为
=67.5%女性的比率为
=60.8%
根据题意,设:
原假设:
p1=p2
备择假设:
p1﹥p2
有题中可知:
n1=1545n2=1691а=0.05
所以,得
构造z统计量:
查表得z0.05=1.64
由于z=3.965>z0.05=1.64,落在拒绝域内。
所以拒绝原假设p1=p2,
接受备择假设p1﹥p2
即在0.05的显著性水平上,认为自己那份家务是公平的男性的比率比女性的比率大。
11、某种工作的日工资为正态分布,其平均值为43.20元,标准差为2.50元。
若从这种工作的某家公司随机抽取40名工人并求得平均工资为42.20元,那么可用1%的显著性水平指责这家公司所支付的工资低于该行业的平均水平吗?
试说明你的结果。
解:
根据题意,设:
原假设:
μ=43.20
备择假设:
μ﹤43.20
有题中可知:
σ=2.5,n=40
所以构造z统计量:
查表得z0.01=2.330
由于z=-2.53〈-z0.01=-2.330,
落在拒绝域内,拒绝原假设:
μ=43.20
接受备择假设:
μ﹤43.20
因此,在1%的显著性水平上可指责这家公司所支付的工资低于该行业的平均水平。
第八章
6、某高校教育经费(X)与高校学生人数(Y)连续六年的统计资料如下
教育经费X(万元)
316
343
373
393
418
455
在校学生数Y(万人)
11
16
18
20
22
25
求
(1)建立教育经费与在校生人数的一元线性回归方程;
解:
根据资料,整理得到如下数据
教育经费X(万元)
在校学生数Y(万人)
XY
X2
Y2
1
316
11
3476
99856
121
2
343
16
5488
117649
256
3
373
18
6714
139129
324
4
393
20
7860
154449
400
5
418
22
9196
174724
484
6
455
25
11375
207025
625
合计
2298
112
44109
892832
2210
根据公式可得:
所以求得一元线性回归方程式:
(2)确定教育经费每增加一万元在校生人数变动的95%的置信区间;
=0.93
=12698
查表,得
根据公式,可得教育经费每增加一万元在校生人数变动的95%的置信区间:
(
)=
=(0.07267,0.11839)
即当教育经费每增加一万元,在校人数就平均增加727人至1184人之间,概率为95%。
(3)以90%概率估计教育经费达到480万元时在校人数的置信区间;
X0=480,1-а=0.9
将X0=480代入回归方程式,得:
=-17.92+0.09553×480=-17.92+45.85=27.93
查表当1-а=0.9可得:
则可得Y0的双侧置信区间
(
)
=(
)=(
)
(24.99,30.87)
即当教育经费达到480万元时在校人数的在24.99万人至30.87万人之间变动,概率为90%。
(4)对回归方程的有效性进行检验。
(а=0.1)
由以上数据,可得相关系数
=
=0.9854
这说明X与Y高度相关。
在а=0.1的显著性水平下,根据题意设:
原假设:
ρ=0;
备择假设:
ρ≠0;
构造t统计量
当а=0.1时,
因为t=11.58>2.132=t0.05(4),落在拒绝域内,所以拒绝原假设,接受备择假设,即X与Y具有显著线性相关系数。
9、某电器经销公司在15个城市设有经销处,公司发现彩电销售量与该城市居民户数多少有关系,并希望通过居民户数多少来预测其彩电销售量。
下表是有关彩电销售量与城市户数的统计数据
城市编号
销售量(台)
户数(万户)
1
5425
189
2
6319
193
3
6827
197
4
7743
202
5
8365
206
6
8916
209
7
5970
185
8
4719
179
9
5375
182
10
4500
175
11
3310
161
12
8239
214
13
4596
166
14
3652
163
15
4203
167
求
(1)计算彩电销售量与城市居民户数之间的线性相关系数;
由趋势图可得:
线性回归方程:
Y=100.19X-12745
线性相关系数
=0.971
(2)拟合彩电销售量对城市居民户数的回归直线:
Y=100.19X-12745
(3)决定系数
R2=0.9423
(4)对回归方程的线性关系和回归方程进行显著性检验(а=0.05),并对结果做简要分析。
回归统计
MultipleR
0.970735865
RSquare
0.94232812
AdjustedRSquare
0.937891822
标准误差
448.1416242
观测值
15
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
42659127.03
42659127.03
212.4131485
1.96804E-09
残差
13
2610801.899
200830.9153
总计
14
45269928.93
Coefficients
标准误差
tStat
P-value
Lower95%
Upper95%
下限95.0%
上限95.0%
Intercept
-12744.7475
1282.949373
-9.93394421
1.94295E-07
-15516.3911
-9973.10389
-15516.3911
-9973.10389
户数(万户)
100.1901766
6.874394387
14.57440045
1.96804E-09
85.3389505
115.0414028
85.3389505
115.0414028
第九章
10、某企业2000年各季度销售额和利润率资料如下表
季度
销售额(万元)
销售利润率%
一
220
32
二
240
33
三
250
35
四
280
36
试求2000年年平均利润率。
由题意可得,各季度利润即年度总销售额和总利润,如下表:
季度
销售额(万元)
销售利润率%
利润(万元)
一
220
32
70.4
二
240
33
79.2
三
250
35
87.5
四
280
36
100.8
合计
990
337.9
由此,可得年平均利润率为=337.9/990=34.13%
12、某商店1994年商品销售额为650万元,到2000年要达到1000万元,问应以怎样的递增速度向前发展,才能达到此目标?
如果照此速度向前发展,到2005年商品的销售应是多少?
解:
设以每年X的比率的速度向前发展,则
650(1+x)(2000-1994)=650(1+x)6=1000,得
1+x=1.0745,所以x=0.0745=7.45%
即每年以7.45%的递增速度向前发展,到2000年可达1000万元,
到2005年销售额为:
1000(1+0.0745)5=1432万元
16、某商店1997-1999年各月羽绒服销售额资料如下
1
2
3
4
5
6
7
8
9
10
11
12
1997
36
15
5
0.7
0.2
0.5
0.4
0.3
4
10
30
48
1998
38
17
6
0.9
0.3
0.6
0.8
0.5
6
12
33
42
1999
40
19
6
1
0.8
0.7
1.2
1.5
10
16
40
45
解:
整理得,长期趋势剔除法计算表
年份
月份
销售额
四项(季度)移动平均
移正平均
Y
_
T·C
1997
1
36.00
2
15.00
3
5.00
14.18
9.70
4
0.70
5.23