统计学贾俊平课后习题答案Word文档格式.docx
《统计学贾俊平课后习题答案Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学贾俊平课后习题答案Word文档格式.docx(23页珍藏版)》请在冰点文库上搜索。
12
30.0
26
65.0
7
17.5
33
82.5
110〜120
4
10.0
37
92.5
120〜130
130〜140
140以上
3
7.5
—
(2)某管理局下属40个企分组表
按销售收入分组/万元
企业数/个
先进企'
业
11
27.5
良好企业
一般企业
落后企业
2.3频数分布表如下
某百货公司日商品销售额分组表
按销售额分组/万
元
频数/天
25〜30
6
15.0
30〜35
37.5
35〜40
40〜45
45〜50
直方图(略)。
2.4茎叶图如下
茎
叶
数据个数
1
889
2
011336888999
13569
123667
0127
箱线图(略)。
2.5
(1)排序略。
100只灯泡使用寿命非频数分布
按使用寿命分组/小
时
灯泡个数/只
650~660
660~670
670~680
680~690
690~700
700~710
710~720
720~730
730~740
740~750
13
10
(3)直方图(略)
(4)茎叶图如下
65
18
66
14568
67
134679
68
11233345558899
69
00111122233445566677888899
70
001122345666778889
71
0022335677889
72
0122567899
73
356
74
147
(1)频数分布表如下
按重量分组
频率/包
40〜42
42〜44
44〜46
46〜48
16
48〜50
17
52〜52
52〜54
20
2.6
54〜56
8
56〜58
58〜60
60〜62
(2)直方图(略)。
分组
天数/天
-25~-20
-20~-15
-15~-10
-10~-5
-5~0
0~5
5~10
60
(3)直方图(略)。
2.9
(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10
(1)茎叶图如下
A班
树茎
B班
树叶
59
0448
97
122456677789
97665332110
011234688
23
98877766555554443332100
00113449
6655200
123345
632220
011456
000
(2)A班考试成绩的分布比较集中,且平均分数较高;
B班考试成绩的分
布比A班分散,
且平均成绩较A班低
2.11
(略)
2.12
2.13
2.14
箱线图如下:
(特征请读者自己分析)
2.15
第3章数据的概括性度量
3.1
(1)M0-10;
Me=10;
X=9.6
(2)
Ql=5.5;
Qu-12。
(3)
s=4.2。
(4)
左偏分布。
3.2
(1)M0-19.Me=23。
Ql=5.5;
Qu-12。
X=24;
s=6.65。
(4)SK=1.08;
K=0.77。
(5)略
3.3
(1)略
(2)X=7;
s=0.71。
(3)V!
=0.102;
v2=0.274。
(4)选方法一,因为离散程度小。
3.4
(1)x=274.1(万元);
Me=272.5。
3.5
3.6
3.7
3.8
3.9
Ql=260.25;
Qu=291.25。
(3)s=21.17(万元)。
甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);
原因:
尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
(1)x=426.67(万元);
s=116.48(万元)。
(2)SK=0.203;
K=-0.688。
(1)
(2)两位调查人员所得到的平均身高和标准差应该差不多相
同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
(1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
(2)男生:
X=27.27(磅),s=2.27(磅);
女生:
X=22.73(磅),s=2.27(磅);
(3)68%;
(4)95%。
通过计算标准化值来判断,ZA=0.5,说明在A项测试中
该应试者比平均分数高
出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
日期周一周二周三周四周五周六周日
标准化值Z
-0.6-0.20.4-1.8-2.2
周一和周六两天失去了控制
3.11
(1)离散系数,因为它消除了不同组数据水平高地的影响。
42
(2)成年组身高的离散系数:
Vs—0.024;
172.1
23
幼儿组身高的离散系数:
Vs一0.032;
71.3
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高
的离散程度相对较大。
3.12下表给出了一些主要描述统计量,请读者自己分析。
方法A
方法B
方法C
平均
165.6
128.73
125.53
中位数
165
129
126
众数
164
128
标准偏差
1.75
2.77
极差
最小值
162
125
116
最大值
170
132
3.13
(1)方差或标准差;
(2)商业类股票;
(3)(略)
第4章抽样与参数估计
4.1
(1)200。
(2)5。
(3)正态分布。
(4)2(100-1)。
4.2
(1)32。
(2)0.91。
4.30.79
4.4
(1)X25~N(17,22)o
(2)X!
oo~N(17,1)。
4.5
(1)1.41o
(2)1.41,1.41,1.34o
4.6
(1)0.4o
(2)0.024。
(3)正态分布。
4.7
(1)0.050,0.035,0.022,016。
(2)当样本量增大时,样本比例的标准差越来越小。
4.8
(1)二x=2.14;
(2)E=4.2;
(3)(115.8,124.2)。
4.9(87819,121301)o
4.10
(1)81±
1.97;
(2)81±
2.35;
(3)81±
3.10。
4.11
(1)(24.11,25.89);
(2)(113.17,126.03);
(3)(3.136,3.702)
4.12
(1)(8687,9113);
(2)(8734,9066);
(3)(8761,9039);
(4)(8682,9118)o
4.13(2.88,3.76);
(2.80,3.84);
(2.63,4.01)。
4.14(7.1,12.9)o
4.15(7.18,11.57)。
4.16
(1)(148.9,150.1);
(2)中心极限定理。
4.17
(1)(100.9,123.7);
(2)(0.017,0.183)。
4.18(15.63,16.55)o
4.佃(10.36,16.76)o
4.20
(1)(0.316,0.704);
(2)(0.777,0.863);
(3)(0.456,0.504)。
4.21(18.11%,27.89%);
(17.17%,22.835)。
4.22167
4.23
(1)2522;
(2)601;
(3)268。
4.24
(1)(51.37%,76.63%);
(2)36。
4.25
(1)(2.13,2.97);
(2)(0.015,0.029);
(3)(25.3,42.5)。
4.26
(1)(0.33,0.87);
(2)(1.25,3.33);
(3)第一种排队方式更好
4.2748。
4.28139。
第5章假设检验
5.1研究者想要寻找证据予以支持的假设是新型弦线的平均抗拉强度相对于以
前提高了”所以原假设与备择假设应为:
H。
:
卩兰1035,H1^>
1035。
5.2兀=某一品种的小鸡因为同类相残而导致的死亡率”H。
5>
0.04,
比:
二:
:
0.04。
5.3Ho「—65,H1」=65。
5.4
(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于
60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,
但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产
品;
连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。
X—卩
检验统计量z=%,在大样本情形下近似服从标准正态分布;
s/Un
(2)如果zZ0.05,就拒绝H0
(3)检验统计量z=2.94>
1.645,所以应该拒绝H。
5.6z=3.11,拒绝H0。
5.7t-1.66,不拒绝H0。
5.8z=「2.39,拒绝H0。
5.9t=1.04,不拒绝Ho
5.10z=2.44,拒绝Ho。
5.11z=1.93,不拒绝Ho。
5.12z=7.48,拒绝Ho。
5.132=206.22,拒绝H。
。
5.14F-2.42,拒绝Ho。
第6章方差分析
6.1F=4.6574<
Fom=89215(或P—value=o.o409=。
.。
1),不能拒绝原假设。
6.2F=15.8234kF。
©
=4.579(或P—value=0.00001V。
=0.01),拒绝原假设。
6.3F=10.0984F0.01=5.4170(或P-value=0.000685:
:
=0.01),拒绝原假设。
6.4F=11.7557>
Fo.o5=3.6823(或P-value=0.000849£
口=0.05),拒绝原假设。
6.5F=17.0684aFoe=3.8853(或P-value=0.0003=0.05),拒绝原假设。
Xa—Xb|=44.4—30=14.4ALSD=5.85,拒绝原假设;
Xa—Xc|=44.4-42.6=1.8vLSD=5.85,不能拒绝原假设;
Xb—Xc|=30—42.6=12.6>
LSD=5.85,拒绝原假设。
6.6方差分析表中所缺的数值如下表:
差异源
SS
df
MS
F
P-value
Fcrit
组间
420
210
1.478
0.245946
3.354131
组内
3836
27
142.07
总计
4256
29
F=1.478£
F0.05=3.554131(或P—value=0.245946=0.05),不能拒绝原
假设。
第7章相关与回归分析
7.1
(1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)r=0.920232。
(3)检验统计量t=14.42222.2281,拒绝原假设,相关系数显著。
7.2
(1)散点图(略)。
(2)r=0.8621。
7.3
(1)表示当x=0时y的期望值。
(2)?
!
表示x每变动一个单位y平均下降0.5个单位。
(3)E(y)=7。
7.4
(1)R2=90%。
(2)Se=1。
7.5
(1)散点图(略)。
(2)r=0.9489。
(3)0=0.1181+0.00358X。
回归系数显=0.00358表示运送距离每增加1公里,运送时间平均增加0.00358天。
7.6
(1)散点图(略)。
二者之间为高度的正线性相关关系。
(2)r=0.998128,二者之间为高度的正线性相关关系。
(3)估计的回归方程为:
y=734.69280.308683x。
回归系数?
1二0.308683
表示人均GDP每增加1元,人均消费水平平均增加0.308683元。
(4)判定系数R2=0.996259。
表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。
(5)检验统计量F=1331.692■R=6.61,拒绝原假设,线性关系显著。
(6)?
5000=734.69280.3086835000=2278.1078(元)。
(7)置信区间:
[1990.749,2565.464];
预测区间:
[1580.463,2975.750]。
7.7
(1)散点图(略),二者之间为负的线性相关关系。
(2)估计的回归方程为:
0=430.1892-4.7x。
1=-4.7表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。
(3)检验统计量t=4.95912=2.3060(P-Value=0.001108v・-0.05),拒绝原假设,回归系数显著。
(4)?
8。
=430.1892-4.780=54.1892(次)。
(5)置信区间:
(37.660,70.619);
(7.572,100.707)。
7.8Excel输出的结果如下(解释与分析请读者自己完成)
MultipleR
0.7951
RSquare
0.6322
AdjustedRSquare
0.6117
标准误差
2.6858
观测值
方差分析
回归分析
1223.1403223.140330.93322.79889E-05
残差
18129.84527.2136
19352.9855
Coefficients
tStat
Lower95%
Upper95%
Intercept
49.3177
3.8050
12.9612
0.0000
41.3236
57.3117
XVariable1
0.2492
0.0448
5.5618
0.1551
0.3434
7.9
(1)方差分析表中所缺的数值如下
方差分析表
变差来源
SignificaneeF
回归
1422708.6
354.277
2.17E-09
40158.07
4015.807
1642866.67
(4)r=-0.7746。
(5)拒绝Ho。
7.12
(1)15.95乞E(y)叮8.05。
(2)14.651乞yo乞19.349。
7.13y=46.2915.24X;
441.555空E(y4o)岂685.045。
7.14y=25.03-0.0497捲1.928x2;
预测28.586。
7.15(略)。
7.16
(1)显著。
(2)显著。
(3)显著。
7.17
(1)0=88.63771.6039X1。
(2)0=83.23012.2902X11.3010X2。
(3)不相同。
方程
(1)中的回归系数屛=1.6039表示电视广告费用每增力卩1万元,月销售额平均增加1.6039万元;
方程
(1)中的回归系数
彳=2.2902表示在报纸广告费用不变的条件下,电视广告费用每增加1万
元,月销售额平均增加2.2902万元。
(4)R2=91.91%;
R;
=88.66%。
(5)■-1的P-Value=0.0007,■-2的P-Value=0.0098,均小于:
=0.05,两个回归系数均显著。
7.18
(1)y^-0.591022.3865x1327.6717x2
(2)回归系数y1=22.3865表示降雨量每增加1毫mm,小麦收获量平均
增加22.3865kg/hm2;
2=327.6717表示温度每增加1°
C,小麦收
获量平均增加327.6717kg/mh。
(3)可能存在。
7.19
(1)0=148.70050.8147x,0.8210X20.1350x3。
(2)R2=89.75%;
=87.83%。
(3)SignificaneeF=3.88E-08v:
=0.05,线性关系显著。
(4)■-1的P-Value=0.1311>
=0.05,不显著;
'
2的
P-Value=0.0013v:
=0.05,显著;
3的P-Value=0.0571>
=0.05,不显著。
第8章时间序列分析和预测
61
(1)时间序列图(略)。
(2)13.55%。
(3)1232.90亿元)。
62
(1)时间序列图(略)。
(2)1421.2(公斤/公顷)。
(3)〉=0.3时的预测值:
F2001=1380.18,误差均方二291455;
〉=0.5
时的预测值:
F2001=1407.23,误差均方二239123。
〉=0.5更合适。
63
(1)3期移动平均预测值二630.33(万元)。
(2)=0.3时的预测值:
%=567.95,误差均方二87514.7;
〉=0.4时的预测值:
斤厂591.06,误差均方二62662.5;
=0.5时的预测值:
F19=606.54,误差均方=50236。
〉=0.5更合适
(3)趋势方程£
=239.7321.928&
估计标准误差sY=31.6628。
64
(1)趋势图(略)。
(2)趋势方程Y=145.781.16077'
2001年预测值二3336.89亿元)。
&
5
(1)趋势图(略)
(2)线性趋势方程W=69.520213.9495t,2000年预测值=585.65(万吨)。
66线性趋势:
V=374.1613-0.6137t;
二次曲线:
V=381.6442-1.8272t0.0337t2;
三次曲线:
7=372.56171.0030t-0.1601t20.0036t3。
67
(1)原煤产量趋势图(略)。
(2)趋势方程Y?
=4.58240.9674^-0.0309t2,预测值Y2°
°
1=11.28(亿吨)。
68
(1)图形(略)。
(2)移动平均法或指数平滑法。
(3)移动平均预测=72.49(万元);
指数平滑法预测二72.5(万元)(:
=0.4)。
8.9
(1)略。
(2)结果如下
2001年/月
时间编号
季节指
回归预测
值
最终预测
1.0439
3056.30
3190.48
98
0.9939
3077.50
3058.87
99
0.9593
3098.71
2972.48
0.9398
3119.92
2931.99
101
0.9439
3141.13
2964.88
102
0.9589
3162.33
3032.30
103
0.9287
3183.54