学年高中数学人教B版 选修12教师用书第1章 12 回归分析.docx
《学年高中数学人教B版 选修12教师用书第1章 12 回归分析.docx》由会员分享,可在线阅读,更多相关《学年高中数学人教B版 选修12教师用书第1章 12 回归分析.docx(16页珍藏版)》请在冰点文库上搜索。
学年高中数学人教B版选修12教师用书第1章12回归分析
1.2 回归分析
1.会用散点图分析两个变量是否存在相关关系.(重点)
2.会求回归方程、掌握建立回归模型的步骤,会选择回归模型.(重点、难点)
[基础·初探]
教材整理1 线性回归模型
阅读教材P10~P12,完成下列问题.
1.回归直线方程
其中
的计算公式还可以写成
=
.
2.线性回归模型
y=bx+a+εi,其中εi称为随机误差项,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量.
设某大学的女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为
=0.85x-85.71,则下列结论中正确的是________(填序号).
(1)y与x具有正的线性相关关系;
(2)回归直线过样本点的中心(
,
);
(3)若该大学某女生身高增加1cm,则其体重约增加0.85kg;
(4)若该大学某女生身高为170cm,则可断定其体重必为58.79kg.
【解析】 回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,
(1)正确;
由回归方程系数的意义可知回归直线过样本点的中心(
,
),
(2)正确;
依据回归方程中
的含义可知,x每变化1个单位,
相应变化约0.85个单位,(3)正确;
用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.
【答案】
(1)
(2)(3)
教材整理2 相关性检验
阅读教材P13~P15例3以上部分,完成下列问题.
1.相关系数
计算
性
质
范围
|r|≤1
线性相关程度
|r|越接近1,线性相关程度越强
|r|越接近0,线性相关程度越弱
2.相关性检验的步骤
(1)作统计假设:
x与Y不具有线性相关关系;
(2)根据小概率0.05与n-2在附表中查出r的一个临界值r0.05;
(3)根据样本相关系数计算公式算出r的值;
(4)作统计推断.如果|r|>r0.05,表明有95%把握认为x与y之间具有线性相关关系.如果|r|≤r0.05,没有理由拒绝原来的假设.
1.判断(正确的打“√”,错误的打“×”)
(1)求回归直线方程前必须进行相关性检验.( )
(2)两个变量的相关系数越大,它们的相关程度越强.( )
(3)若相关系数r=0,则两变量x,y之间没有关系.( )
【解析】
(1)正确.相关性检验是了解成对数据的变化规律的,所以求回归方程前必须进行相关性检验.
(2)错误.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(3)错误.若r=0是指x,y之间的相关关系弱,但并不能说没有关系.
【答案】
(1)√
(2)× (3)×
2.下列结论正确的是( )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①② B.①②③
C.①②④D.①②③④
【解析】 函数关系和相关关系的区别为前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析一种方法,故③错误,④正确.
【答案】 C
[质疑·手记]
预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:
疑问1:
解惑:
疑问2:
解惑:
疑问3:
解惑:
[小组合作型]
回归分析的有关概念
(1)有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程
=
x+
,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确命题的个数是( )
A.1 B.2
C.3D.4
(2)如果某地的财政收入x与支出y满足线性回归方程
=
x+
+ε(单位:
亿元),其中
=0.8,
=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.
【自主解答】
(1)①反映的是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程
=
x+
的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.
(2)由题意可得:
=0.8x+2+ε,当x=10时,
=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴9.5≤
≤10.5.
故今年支出预计不会超过10.5亿.
【答案】
(1)C
(2)10.5
1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.
2.由线性回归方程给出的是一个预报值而非精确值.
3.随机误差的主要来源.
(1)线性回归模型与真实情况引起的误差;
(2)省略了一些因素的影响产生的误差;
(3)观测与计算产生的误差.
[再练一题]
1.下列有关线性回归的说法,不正确的是________(填序号).
【导学号:
37820002】
①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;
②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;
③线性回归方程最能代表观测值x,y之间的关系;
④任何一组观测值都能得到具有代表意义的回归直线方程.
【解析】 只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.
【答案】 ④
线性回归分析
为研究拉力x(N)对弹簧长度y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
x
5
10
15
20
25
30
y
7.25
8.12
8.95
9.9
10.9
11.8
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.
【精彩点拨】
→
→
【自主解答】
(1)散点图如图所示.
(2)将已知表中的数据列成下表:
xi
5
10
15
20
25
30
yi
7.25
8.12
8.95
9.9
10.9
11.8
xiyi
36.25
81.2
134.25
198
272.5
354
x
25
100
225
400
625
900
∴回归直线方程为
=0.18x+6.34.
1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
[再练一题]
2.本题条件不变,若x增加2个单位,
增加多少?
【解】 若x增加2个单位,则
=0.18(x+2)+6.34
=0.18x+6.34+0.36,
故
增加0.36个单位.
[探究共研型]
非线性回归分析
探究1 如何解答非线性回归问题?
【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
探究2 已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?
x
1
2
3
y
3
5.99
12.01
①y=3×2x-1;②y=log2x;
③y=4x;④y=x2.
【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.①作为回归模型最好.
某地区不同身高的未成年男性的体重平均值如下表:
身高x(cm)
60
70
80
90
100
110
体重y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高x(cm)
120
130
140
150
160
170
体重y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立y与x之间的回归方程;
(2)如果一名在校男生身高为168cm,预测他的体重约为多少?
【精彩点拨】 先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
【自主解答】
(1)根据表中的数据画出散点图,如下:
由图看出,这些点分布在某条指数型函数曲线y=
的周围,于是令z=lny,列表如下:
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图,如下:
由表中数据可求得z与x之间的回归直线方程为
=0.693+0.020x,则有
=e0.693+0.020x.
(2)由
(1)知,当x=168时,
=e0.693+0.020×168≈57.57,所以在校男生身高为168cm,预测他的体重约为57.57kg.
两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如
,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.
[再练一题]
3.有一个测量水流量的实验装置,测得试验数据如下表:
i
1
2
3
4
5
6
7
水深h
(厘米)
0.7
1.1
2.5
4.9
8.1
10.2
13.5
流量Q
(升/分钟)
0.082
0.25
1.8
11.2
37.5
66.5
134
根据表中数据,建立Q与h之间的回归方程.
【解】 由表中测得的数据可以作出散点图,如图.
观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数).两边取常用对数,
则lgQ=lgm+n·lgh,
令y=lgQ,x=lgh,那么y=nx+lgm,
即为线性函数模型y=bx+a的形式(其中b=n,a=lgm).
由下面的数据表,用最小二乘法可求得
≈2.5097,
=-0.7077,所以n≈2.51,m≈0.196.
i
hi
Qi
xi=lghi
yi=lgQi
x
xiyi
1
0.7
0.082
-0.1549
-1.0862
0.024
0.1683
2
1.1
0.25
0.0414
-0.6021
0.0017
-0.0249
3
2.5
1.8
0.3979
0.2553
0.1583
0.1016
4
4.9
11.2
0.6902
1.0492
0.4764
0.7242
5
8.1
37.5
0.9085
1.5740
0.8254
1.4300
6
10.2
66.5
1.0086
1.8228
1.0173
1.8385
7
13.5
134
1.1303
2.1271
1.2776
2.4043
∑
4.022
5.1401
3.7807
6.642
于是所求得的回归方程为Q=0.196·h2.51.
[构建·体系]
1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )
x
1
2
3
4
y
1
3
5
7
A.(2,3)B.(1.5,4)
C.(2.5,4)D.(2.5,5)
【解析】 线性回归方程必过样本点的中心(
,
),
即(2.5,4),故选C.
【答案】 C
2.在两个变量y与x的回归模型中,分别选择了4个不同的模型.它们的相关指数R2如下,其中拟合效果最好的模型是( )
A.模型1的相关指数R2为0.98
B.模型2的相关指数R2为0.80
C.模型3的相关指数R2为0.50
D.模型4的相关指数R2为0.25
【解析】 相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高.
【答案】 A
3.如图121所示,有5组(x,y)数据,去掉________这组数据后,剩下的4组数据的线性相关系数最大.
图121
【答案】 D(3,10)
4.为了考查两个变量Y与x的线性相关性,测是x,Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是________.
【导学号:
37820003】
【解析】 相关系数临界值r0.05=0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的范围是(0.553,1].
【答案】 (0.553,1]
5.某种产品的广告费支出x与销售额Y(单位:
百万元)之间有如下对应数据:
x
2
4
5
6
8
Y
30
40
60
50
70
(1)画出散点图;
(2)对两个变量进行相关性检测;
(3)求回归直线方程.
【解】
(1)散点图如图所示
(2)计算各数据如下:
i
1
2
3
4
5
xi
2
4
5
6
8
yi
30
40
60
50
70
xiyi
60
160
300
300
560
r=
≈0.92,查得r0.05=0.878,r>r0.05,故有95%的把握认为该产品的广告费支出与销售额之间具有线性相关关系.
(3)
,
,
于是所求的回归直线方程是
=6.5x+17.5.
我还有这些不足:
(1)
(2)
我的课下提升方案:
(1)
(2)