练习题答案12.doc
《练习题答案12.doc》由会员分享,可在线阅读,更多相关《练习题答案12.doc(7页珍藏版)》请在冰点文库上搜索。
第十二章线性回归分析
练习题
一、最佳选择题
1.表示()。
A.Y的离散程度B.对的离散程度C.Y和X的离散程度
D.Y对的离散程度E.X的离散程度
2.用最小二乘法确定直线回归方程的原则是各观察点距直线的()。
A.纵向距离之和最小B.纵向距离的平方和最小C.垂直距离之和最小
D.垂直距离的平方和最小确E.纵向距离的平方和最大
3.Y=14+4X是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重
换成国际单位kg,则此方程()。
A.截距改变B.回归系数改变C.两者都改变D.两者都不改变
E.相关系数改变
4.直线回归系数假设检验,其自由度为()。
A.nB.n-1C.n-2D.2n-1E.2(n-1)
5.当r=0时,=a+bX回归方程中()。
A.a必大于零B.a必等于C.a必等于零
D.a必等于E.a必等于b
6.在多元线性回归分析中,应变量总离均差平方和可以分解为回归平方和与残差平方和
两部分,试回答残差系指()。
A.观察值与估计值之差
B.观察值与平均值之差
C.估计值与平均值的平方和之差
D.观察值与平均值之差的平方和
E.观察值与估计值之差的平方和
二、问答题
1.用什么方法考察回归直线是否正确?
2.简述回归系数方差分析Y的平方和自由度的分解。
3.简述回归分析中Y的标准差与剩余标准差的区别和联系。
4.简述与的区别。
5.举例说明如何用直线回归方程进行预测和控制?
6.直线回归分析时怎样确定自变量和因变量?
7.简述曲线回归常用的几种曲线形式。
三、计算题
1.一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。
现收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。
结果如下表,求直线回归方程并对回归系数作假设检验。
待产妇尿中雌三醇含量与新生儿体重关系
编号尿雌三醇新生儿体重编号尿雌三醇新生儿体重
(mg/24h)(kg)(mg/24h)(kg)
(1)
(2)(3)(4)
(2)(3)
172.517173.2
292.518253.2
392.519273.4
4122.720153.4
5142.721153.4
6162.722153.5
7162.423163.5
8143.024193.4
9163.025183.5
10163.126173.6
11173.027183.7
12193.128203.8
13213.029224.0
14242.830253.9
15153.231244.3
16163.2
2.为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相
关分析。
氟含量(mg/L)X:
0.470.641.001.471.602.863.214.71
患病率(%)Y:
22.3723.3125.3222.2928.5735.0046.0746.08
(1)按此资料绘制散点图?
(2)求直线回归方程并对回归系数作假设检验。
(3)试估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并
说明其含义。
(4)求氟含量为2.00mg/L时,患病率Y值的95%的容许范围,并解释其含义。
练习题参考答案
一、最佳选择题:
1.D2.B3.C4.C5.D6.A
二、问答题
1.答:
用以下三种方法判定:
(1)直线必须通过点(,)。
(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距。
(3)直线是否在自变量X的实测范围内。
2.答:
即,为反应变量的离均差平方和,表示在未考虑与的回归关系时的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和,分别用和表示。
这三个平方和,各有其相应的自由度,其关系为:
,
,,。
3.答:
表示在总体中,当为某一定值时,个体值的波动范围。
而剩余标准差是指当对的影响被扣除后,方面仍有变异。
这部分变异与无关,纯属抽样变异。
当与接近且充分大时,可用代替。
4.答:
是对应的总体均数的一个样本估计值,是反映其抽样误差大小的标准误,其计算公式为;是反映个体值的容许区间大小的,也就是说当总体中为某定值时,值由于随机误差影响在上下波动的范围的大小就取决于标准差,其计算公式为。
5.答:
步骤如下:
(1)根于研究目的确定预报因子()和预报量(),由估计值,收集资料。
(2)建立预报方程,并进行回归系数假设检验。
若P小于检验水准,则回归方程成立。
(3)根据回归方程在实测范围内对进行预测,并计算为某定值时,个体值波动范围(容许区间)。
例如:
1-7岁儿童,为年龄,为体重,可根据年龄预测(估计)体重。
统计控制是利用回归方程进行逆估计,如要求因变量值在一定范围内波动,可以通过控制自变量的取值来实现。
步骤同前。
例如:
针刺哑门穴,进针深度与颈围间存在直线关系,可根据取值达到控制的目的。
6.答:
(1)Ⅰ型回归中,为精密测定和严格控制的变量,为正态变量。
表示原因的为,表示结果的为。
(2)Ⅱ型回归中,、均为服从正态分布的随机变量,互为因果,可计算两个回归方程。
何者为,何者为,根据研究目的确定。
如身高、体重两变量,若目的只是由身高估计体重,则确定为身高,为体重。
7.答:
曲线回归常用的几种曲线形式有:
(1)指数函数(),当>时,随上升而上升;当<时,随上升而下降。
(2)幂函数(),当>时,随上升而上升;当<时,随上升而下降。
(3)对数函数(),当>时,随上升而上升,先快后慢;当<时,随上升而下降,先快后慢。
(4)logistic函数(),当>时,随上升而下降;当<时,随上升而上升。
三、计算题
1.解:
(1)计算获得:
,,,,,
,
代入公式:
(2)回归系数假设检验:
,即孕妇尿中雌三醇含量与产儿体重有直线关系
,即孕妇尿中雌三醇含量与产儿体重无直线关系
由上面的计算结果:
,,
,
所以,
自由度,查t值表,,,按检验水准,拒绝,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。
2.解:
(1)散点图如下
(2)由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算
,,
,,,
回归系数假设检验:
,即氟含量与患病率之间无线性关系
,即氟含量与患病率之间有线性关系
①方差分析(见表):
方差分析表
变异来源
SS
df
MS
F
P
回归
625.983
1
625.983
40.805
<0.01
剩余
92.045
6
15.341
总变异
718.028
7
计算得,查界值表,得P<0.01,按水准,拒绝,接受,可认为氟含量与患病率间有直线关系。
②t检验:
,即氟含量与患病率之间无线性关系
,即氟含量与患病率之间有线性关系
按,查t界值表,得,按水准,拒绝,接受,结论同上。
本题,故可用直线回归方程来描述患病率与增加氟含量的关系。
异常点即对应于()绝对值特大的观测数据见表
残差的计算
序号XY
10.4722.3721.311.06
20.6423.3122.400.91
31.0025.3224.710.61
41.4722.2927.72-5.44
51.6028.5728.560.01
62.8635.0036.65-1.65
73.2146.0738.907.17
84.7146.0848.53-2.45
由散点图及残差分析,第一点(X=1.47,Y=22.29)为可疑的异常点。
根据以上的计算结果,进一步求其总体回归系数的95%可信区间。
总体回归系数的95%可信区间
按回归系数的95%可信区间下限和上限分别代入,得。
回归系数的95%可信区间上、下限对应的两条直线,回归方程为:
(3)估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并说明含义。
当X=2.00mg/L时,的95%可信区间:
(,)=(31.13-2.447×1.39,31.13+2.447×1.39)=(27.73,34.53)
即总体中,氟含量为2.00mg/L时,患病率平均增加31.13mg/L,其95%的可信区间为(27.73,34.53mg/L)。
其含义为:
当氟含量为2.00mg/L时,相应的平均增重服从一个正态分布(此正态分布的样本均数估计值为31.13mg/L),如果从此正态分布中重复抽样100次,这100个可信区间中理论上将有95个区间包含真正的总体均数(虽然这个总体均数真值是未知的)。
(4)求氟含量2.00mg/L时,患病率Y值的95%可信区间,并解释其含义。
当x=2.00mg/L时,,个体Y值的95%可信区间:
(,)=(31.13-2.447×4.16,31.13+2.447×4.16)=(21.95,41.31)
即估计,总体中,氟含量为2.00mg/L时,由95%的患病率增加体重在20.95,41.31mg/L范围内。