练习题答案12.doc

上传人:wj 文档编号:2072555 上传时间:2023-05-02 格式:DOC 页数:7 大小:504KB
下载 相关 举报
练习题答案12.doc_第1页
第1页 / 共7页
练习题答案12.doc_第2页
第2页 / 共7页
练习题答案12.doc_第3页
第3页 / 共7页
练习题答案12.doc_第4页
第4页 / 共7页
练习题答案12.doc_第5页
第5页 / 共7页
练习题答案12.doc_第6页
第6页 / 共7页
练习题答案12.doc_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

练习题答案12.doc

《练习题答案12.doc》由会员分享,可在线阅读,更多相关《练习题答案12.doc(7页珍藏版)》请在冰点文库上搜索。

练习题答案12.doc

第十二章线性回归分析

练习题

一、最佳选择题

1.表示()。

A.Y的离散程度B.对的离散程度C.Y和X的离散程度

D.Y对的离散程度E.X的离散程度

2.用最小二乘法确定直线回归方程的原则是各观察点距直线的()。

A.纵向距离之和最小B.纵向距离的平方和最小C.垂直距离之和最小

D.垂直距离的平方和最小确E.纵向距离的平方和最大

3.Y=14+4X是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重

换成国际单位kg,则此方程()。

A.截距改变B.回归系数改变C.两者都改变D.两者都不改变 

E.相关系数改变

4.直线回归系数假设检验,其自由度为()。

A.nB.n-1C.n-2D.2n-1E.2(n-1)

5.当r=0时,=a+bX回归方程中()。

A.a必大于零B.a必等于C.a必等于零

D.a必等于E.a必等于b

6.在多元线性回归分析中,应变量总离均差平方和可以分解为回归平方和与残差平方和

两部分,试回答残差系指()。

A.观察值与估计值之差

B.观察值与平均值之差

C.估计值与平均值的平方和之差

D.观察值与平均值之差的平方和

E.观察值与估计值之差的平方和

二、问答题

1.用什么方法考察回归直线是否正确?

2.简述回归系数方差分析Y的平方和自由度的分解。

3.简述回归分析中Y的标准差与剩余标准差的区别和联系。

4.简述与的区别。

5.举例说明如何用直线回归方程进行预测和控制?

6.直线回归分析时怎样确定自变量和因变量?

7.简述曲线回归常用的几种曲线形式。

三、计算题

1.一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。

现收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。

结果如下表,求直线回归方程并对回归系数作假设检验。

待产妇尿中雌三醇含量与新生儿体重关系

编号尿雌三醇新生儿体重编号尿雌三醇新生儿体重

(mg/24h)(kg)(mg/24h)(kg)

(1)

(2)(3)(4)

(2)(3)

172.517173.2

292.518253.2

392.519273.4

4122.720153.4

5142.721153.4

6162.722153.5

7162.423163.5

8143.024193.4

9163.025183.5

10163.126173.6

11173.027183.7

12193.128203.8

13213.029224.0

14242.830253.9

15153.231244.3

16163.2

2.为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相

关分析。

氟含量(mg/L)X:

0.470.641.001.471.602.863.214.71

患病率(%)Y:

22.3723.3125.3222.2928.5735.0046.0746.08

(1)按此资料绘制散点图?

(2)求直线回归方程并对回归系数作假设检验。

(3)试估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并

说明其含义。

(4)求氟含量为2.00mg/L时,患病率Y值的95%的容许范围,并解释其含义。

练习题参考答案

一、最佳选择题:

1.D2.B3.C4.C5.D6.A

二、问答题

1.答:

用以下三种方法判定:

(1)直线必须通过点(,)。

(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距。

(3)直线是否在自变量X的实测范围内。

2.答:

即,为反应变量的离均差平方和,表示在未考虑与的回归关系时的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和,分别用和表示。

这三个平方和,各有其相应的自由度,其关系为:

,,。

3.答:

表示在总体中,当为某一定值时,个体值的波动范围。

而剩余标准差是指当对的影响被扣除后,方面仍有变异。

这部分变异与无关,纯属抽样变异。

当与接近且充分大时,可用代替。

4.答:

是对应的总体均数的一个样本估计值,是反映其抽样误差大小的标准误,其计算公式为;是反映个体值的容许区间大小的,也就是说当总体中为某定值时,值由于随机误差影响在上下波动的范围的大小就取决于标准差,其计算公式为。

5.答:

步骤如下:

(1)根于研究目的确定预报因子()和预报量(),由估计值,收集资料。

(2)建立预报方程,并进行回归系数假设检验。

若P小于检验水准,则回归方程成立。

(3)根据回归方程在实测范围内对进行预测,并计算为某定值时,个体值波动范围(容许区间)。

例如:

1-7岁儿童,为年龄,为体重,可根据年龄预测(估计)体重。

统计控制是利用回归方程进行逆估计,如要求因变量值在一定范围内波动,可以通过控制自变量的取值来实现。

步骤同前。

例如:

针刺哑门穴,进针深度与颈围间存在直线关系,可根据取值达到控制的目的。

6.答:

(1)Ⅰ型回归中,为精密测定和严格控制的变量,为正态变量。

表示原因的为,表示结果的为。

(2)Ⅱ型回归中,、均为服从正态分布的随机变量,互为因果,可计算两个回归方程。

何者为,何者为,根据研究目的确定。

如身高、体重两变量,若目的只是由身高估计体重,则确定为身高,为体重。

7.答:

曲线回归常用的几种曲线形式有:

(1)指数函数(),当>时,随上升而上升;当<时,随上升而下降。

(2)幂函数(),当>时,随上升而上升;当<时,随上升而下降。

(3)对数函数(),当>时,随上升而上升,先快后慢;当<时,随上升而下降,先快后慢。

(4)logistic函数(),当>时,随上升而下降;当<时,随上升而上升。

三、计算题

1.解:

(1)计算获得:

,,,,,

代入公式:

(2)回归系数假设检验:

,即孕妇尿中雌三醇含量与产儿体重有直线关系

,即孕妇尿中雌三醇含量与产儿体重无直线关系

由上面的计算结果:

,,

所以,

自由度,查t值表,,,按检验水准,拒绝,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。

2.解:

(1)散点图如下

(2)由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算

,,

,,,

回归系数假设检验:

,即氟含量与患病率之间无线性关系

,即氟含量与患病率之间有线性关系

①方差分析(见表):

方差分析表

变异来源

SS

df

MS

F

P

回归

625.983

1

625.983

40.805

<0.01

剩余

92.045

6

15.341

总变异

718.028

7

计算得,查界值表,得P<0.01,按水准,拒绝,接受,可认为氟含量与患病率间有直线关系。

②t检验:

,即氟含量与患病率之间无线性关系

,即氟含量与患病率之间有线性关系

按,查t界值表,得,按水准,拒绝,接受,结论同上。

本题,故可用直线回归方程来描述患病率与增加氟含量的关系。

异常点即对应于()绝对值特大的观测数据见表

残差的计算

序号XY

10.4722.3721.311.06

20.6423.3122.400.91

31.0025.3224.710.61

41.4722.2927.72-5.44

51.6028.5728.560.01

62.8635.0036.65-1.65

73.2146.0738.907.17

84.7146.0848.53-2.45

由散点图及残差分析,第一点(X=1.47,Y=22.29)为可疑的异常点。

根据以上的计算结果,进一步求其总体回归系数的95%可信区间。

总体回归系数的95%可信区间

按回归系数的95%可信区间下限和上限分别代入,得。

回归系数的95%可信区间上、下限对应的两条直线,回归方程为:

(3)估计氟含量为2.00mg/L时,患病率平均增加多少,计算其95%的可信区间,并说明含义。

当X=2.00mg/L时,的95%可信区间:

(,)=(31.13-2.447×1.39,31.13+2.447×1.39)=(27.73,34.53)

即总体中,氟含量为2.00mg/L时,患病率平均增加31.13mg/L,其95%的可信区间为(27.73,34.53mg/L)。

其含义为:

当氟含量为2.00mg/L时,相应的平均增重服从一个正态分布(此正态分布的样本均数估计值为31.13mg/L),如果从此正态分布中重复抽样100次,这100个可信区间中理论上将有95个区间包含真正的总体均数(虽然这个总体均数真值是未知的)。

(4)求氟含量2.00mg/L时,患病率Y值的95%可信区间,并解释其含义。

当x=2.00mg/L时,,个体Y值的95%可信区间:

(,)=(31.13-2.447×4.16,31.13+2.447×4.16)=(21.95,41.31)

即估计,总体中,氟含量为2.00mg/L时,由95%的患病率增加体重在20.95,41.31mg/L范围内。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2