人B版数学选修23讲义第3章32 回归分析.docx

上传人:b****4 文档编号:7019207 上传时间:2023-05-11 格式:DOCX 页数:13 大小:91.45KB
下载 相关 举报
人B版数学选修23讲义第3章32 回归分析.docx_第1页
第1页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第2页
第2页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第3页
第3页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第4页
第4页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第5页
第5页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第6页
第6页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第7页
第7页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第8页
第8页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第9页
第9页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第10页
第10页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第11页
第11页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第12页
第12页 / 共13页
人B版数学选修23讲义第3章32 回归分析.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

人B版数学选修23讲义第3章32 回归分析.docx

《人B版数学选修23讲义第3章32 回归分析.docx》由会员分享,可在线阅读,更多相关《人B版数学选修23讲义第3章32 回归分析.docx(13页珍藏版)》请在冰点文库上搜索。

人B版数学选修23讲义第3章32 回归分析.docx

人B版数学选修23讲义第3章32回归分析

3.2 回归分析

1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用.

2.会求回归直线方程,并用回归直线方程进行预报.(重点难点)

[基础·初探]

教材整理1 回归直线方程

阅读教材P83~P84探索与研究以上部分,完成下列问题.

1.回归直线方程

其中的计算公式还可以写成=.

2.线性回归模型:

y=bx+a+εi,其中εi称为随机误差项,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量.

设某大学的女生体重y(单位:

kg)与身高x(单位:

cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中正确的是________(填序号).

(1)y与x具有正的线性相关关系;

(2)回归直线过样本点的中心(,);

(3)若该大学某女生身高增加1cm,则其体重约增加0.85kg;

(4)若该大学某女生身高为170cm,则可断定其体重必为58.79kg.

【解析】 回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;

由回归方程系数的意义可知回归直线过样本点的中心(,),B正确;

依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,C正确;

用回归方程对总体进行估计不能得到肯定结论,故D不正确.

【答案】 

(1)

(2)(3)

教材整理2 相关性检验

阅读教材P87~P89例3以上部分,完成下列问题.

1.相关系数

r==

范围

|r|≤1

程度)

|r|越接近1,线性相关程度越强

|r|越接近0,线性相关程度越弱

2.相关性检验的步骤

(1)作统计假设:

x与Y不具有线性相关关系.

(2)根据小概率0.05与n-2在附表中查出r的一个临界值r0.05.

(3)根据样本相关系数计算公式算出r的值.

(4)作统计推断.如果|r|>r0.05,表明有95%的把握认为x与Y之间具有线性相关关系.如果|r|≤r0.05,没有理由拒绝原来的假设.

1.判断(正确的打“√”,错误的打“×”)

(1)求回归直线方程前必须进行相关性检验.(  )

(2)两个变量的相关系数越大,它们的相关程度越强.(  )

(3)若相关系数r=0,则两变量x,y之间没有关系.(  )

【解析】 

(1)√ 相关性检验是了解成对数据的变化规律的,所以求回归方程前必须进行相关性检验.

(2)× 相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.

(3)× 若r=0是指x,y之间的相关关系弱,但并不能说没有关系.

【答案】 

(1)√ 

(2)× (3)×

2.下列结论正确的是(  )

①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

A.①②  B.①②③

C.①②④D.①②③④

【解析】 函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.

【答案】 C

[质疑·手记]

预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:

疑问1:

 

解惑:

 

疑问2:

 

解惑:

 

疑问3:

 

解惑:

 

[小组合作型]

回归分析的有关概念

 

(1)有下列说法:

①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程=x+,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.

其中正确命题的个数是(  )

A.1   B.2

C.3D.4

(2)关于变量y与x之间的回归直线方程叙述正确的是(  )

A.表示y与x之间的一种确定性关系

B.表示y与x之间的相关关系

C.表示y与x之间的最真实的关系

D.表示y与x之间真实关系的一种效果最好的拟合

(3)如果某地的财政收入x与支出y满足线性回归方程=x++ε(单位:

亿元),其中=0.8,=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.【导学号:

62980067】

【自主解答】 

(1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程=x+的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.

(2)回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.

(3)由题意可得:

=0.8x+2+ε,当x=10时,=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴9.5≤≤10.5.

故今年支出预计不会超过10.5亿.

【答案】 

(1)C 

(2)D (3)10.5

1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.

2.由线性回归方程给出的是一个预报值而非精确值.

3.随机误差的主要来源.

(1)线性回归模型与真实情况引起的误差;

(2)省略了一些因素的影响产生的误差;

(3)观测与计算产生的误差.

[再练一题]

1.下列有关线性回归的说法,不正确的是________(填序号).

①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;

②在平面直角坐标系中,用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;

③线性回归方程最能代表观测值x,y之间的关系;

④任何一组观测值都能得到具有代表意义的回归直线方程.

【解析】 只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.

【答案】 ④

线性回归分析

 为研究拉力x(N)对弹簧长度Y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:

x

5

10

15

20

25

30

Y

7.25

8.12

8.95

9.9

10.9

11.8

(1)画出散点图;

(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.

【精彩点拨】 →→

【自主解答】 

(1)散点图如图所示.

(2)将已知表中的数据列成下表:

xi

5

10

15

20

25

30

yi

7.25

8.12

8.95

9.9

10.9

11.8

xiyi

36.25

81.2

134.25

198

272.5

354

x

25

100

225

400

625

900

=17.5,≈9.49,iyi=1076.2,=2275.

∴==≈0.18,

=-=9.49-0.18×17.5=6.34,

∴回归直线方程为=0.18x+6.34.

1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.

2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.

[再练一题]

2.本题条件不变,若x增加2个单位,增加多少?

【解】 若x增加2个单位,则

=0.18(x+2)+6.34=0.18x+6.34+0.36,

故增加0.36个单位.

[探究共研型]

非线性回归分析

探究1 如何解答非线性回归问题?

【提示】 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:

探究2 已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?

x

1

2

3

y

3

5.99

12.01

①y=3×2x-1;   ②y=log2x;

③y=4x;④y=x2.

【提示】 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.①作为回归模型最好.

 某地区不同身高的未成年男性的体重平均值如下表:

身高x(cm)

60

70

80

90

100

110

体重y(kg)

6.13

7.90

9.99

12.15

15.02

17.50

身高x(cm)

120

130

140

150

160

170

体重y(kg)

20.92

26.86

31.11

38.85

47.25

55.05

(1)试建立y与x之间的回归方程;

(2)如果一名在校男生身高为168cm,预测他的体重约为多少?

【精彩点拨】 先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.

【自主解答】 

(1)根据表中的数据画出散点图,如下:

由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=lny,列表如下:

x

60

70

80

90

100

110

z

1.81

2.07

2.30

2.50

2.71

2.86

x

120

130

140

150

160

170

z

3.04

3.29

3.44

3.66

3.86

4.01

作出散点图,如下:

由表中数据可求得z与x之间的回归直线方程为=0.693+0.020x,则有=e0.693+0.020x.

(2)由

(1)知,当x=168时,=e0.693+0.020×168≈57.57,所以在校男生身高为168cm,预测他的体重约为57.57kg.

两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.

[再练一题]

3.有一个测量水流量的实验装置,测得试验数据如下表:

i

1

2

3

4

5

6

7

水深h(厘米)

0.7

1.1

2.5

4.9

8.1

10.2

13.5

流量Q(升/分钟)

0.082

0.25

1.8

11.2

37.5

66.5

134

根据表中数据,建立Q与h之间的回归方程.

【解】 由表中测得的数据可以作出散点图,如图.

观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数).两边取常用对数,

则lgQ=lgm+n·lgh,

令y=lgQ,x=lgh,那么y=nx+lgm,

即为线性函数模型y=bx+a的形式(其中b=n,a=lgm).

由下面的数据表,用最小二乘法可求得≈2.5097,=-0.7077,所以n≈2.51,m≈0.196.

i

hi

Qi

xi=lghi

yi=lgQi

x

xiyi

1

0.7

0.082

-0.1549

-1.0862

0.024

0.1683

2

1.1

0.25

0.0414

-0.6021

0.0017

-0.0249

3

2.5

1.8

0.3979

0.2553

0.1583

0.1016

4

4.9

11.2

0.6902

1.0492

0.4764

0.7242

5

8.1

37.5

0.9085

1.5740

0.8254

1.4300

6

10.2

66.5

1.0086

1.8228

1.0173

1.8385

7

13.5

134

1.1303

2.1271

1.2776

2.4043

41

251.332

4.022

5.1401

3.7807

6.642

于是所求得的回归方程为Q=0.196·h2.51.

[构建·体系]

1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点(  )

x

1

2

3

4

y

1

3

5

7

A.(2,3)B.(1.5,4)

C.(2.5,4)D.(2.5,5)

【解析】 线性回归方程必过样本点的中心(,),

即(2.5,4),故选C.

【答案】 C

2.某产品的广告费用x与销售额y的统计数据如下表:

广告费用x(万元)

4

2

3

5

销售额y(万元)

49

26

39

54

根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(  )

A.63.6万元B.65.5万元

C.67.7万元D.72.0万元

【解析】 样本点的中心是(3.5,42),则=-=42-9.4×3.5=9.1,所以回归直线方程是=9.4x+9.1,把x=6代入得=65.5.

【答案】 B

3.如图321所示,有5组(x,y)数据,去掉点________,剩下的4组数据的线性相关系数最大.

图321

【答案】 D(3,10)

4.为了考查两个变量Y与x的线性相关性,测量x,Y的13对数据,若Y与x具有线性相关关系,则相关系数r绝对值的取值范围是________.

【导学号:

62980068】

【解析】 相关系数临界值r0.05=0.553,所以Y与x若具有线性相关关系,则相关系数r绝对值的取值范围是(0.553,1].

【答案】 (0.553,1]

5.某种产品的广告费支出x与销售额Y(单位:

百万元)之间有如下对应数据:

x

2

4

5

6

8

Y

30

40

60

50

70

(1)画出散点图;

(2)对两个变量进行相关性检验;

(3)求回归直线方程.

【解】 

(1)散点图如图所示.

(2)计算各数据如下:

i

1

2

3

4

5

xi

2

4

5

6

8

yi

30

40

60

50

70

xiyi

60

160

300

300

560

=5,=50,

=145,=13500,iyi=1380

r=≈0.92,查得r0.05=0.878,r>r0.05,故有95%的把握认为该产品的广告费支出与销售额之间具有线性相关关系.

(3)===6.5,

=-=50-6.5×5=17.5,

于是所求的回归直线方程是=6.5x+17.5.

我还有这些不足:

(1) 

(2) 

我的课下提升方案:

(1) 

(2) 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2