陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx

上传人:b****2 文档编号:3493700 上传时间:2023-05-05 格式:DOCX 页数:14 大小:218.08KB
下载 相关 举报
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第1页
第1页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第2页
第2页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第3页
第3页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第4页
第4页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第5页
第5页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第6页
第6页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第7页
第7页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第8页
第8页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第9页
第9页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第10页
第10页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第11页
第11页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第12页
第12页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第13页
第13页 / 共14页
陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx_第14页
第14页 / 共14页
亲,该文档总共14页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx

《陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx》由会员分享,可在线阅读,更多相关《陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx(14页珍藏版)》请在冰点文库上搜索。

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 变量间的相关关系回归分析及独立性检验知识精讲素.docx

陕西省吴堡县吴堡中学高中数学第一章统计案例变量间的相关关系回归分析及独立性检验知识精讲素

变量间的相关关系、回归分析及独立性检验

【知识精讲】

1.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系.

2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.

3.掌握独立检验(只要求2×2列联表)的基本思想、方法简单应用.

4.掌握假设检验和聚类分析的基本思想、方法简单应用.

【基础梳理】

1.相关关系的量:

当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.

2.回归分析:

对具有相关关系的两个变量进行统计分析的方法叫做回归分析.

3.散点图:

表示具有相关关系的两个变量的一组数据的图形叫做散点图.

4.正相关与负相关概念:

如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.

 

6.相关系数:

r=

叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.

7.相关系数的性质:

|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小.

8.独立性检验:

一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

2×2列联表

 

若要推断的论述为H1:

X与Y有关系,可以按如下步骤判断结论H1成立的可能性:

(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.

①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.

②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例

,也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例.“两个比例的值相差越大,H1成立的可能性就越大.”

(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:

①根据实际问题需要的可信程度确定临界值k0;

②利用公式K2=

,由观测数据计算得到随机变量K2的观测值k;

③如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.

【要点解读】

要点七相关关系的判断

【例7】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:

kg).

(1)画出散点图;

(2)判断是否具有相关关系.

【命题立意】考查相关关系的分析方法.

【标准解析】用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系.

【误区警示】正确选择坐标描点,并准确观察散点的实际分布判断两变量的正相关和负相关是常用方法.

【答案】

(1)散点图如右图所示,

 

(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.

【变式训练】(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图

(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图

(2).由这两个散点图可以判断(  )

A.变量x与y正相关,u与v正相关

B.变量x与y正相关,u与v负相关

C.变量x与y负相关,u与v正相关

D.变量x与y负相关,u与v负相关

【标准解析】由图

(1)可知,各点整体呈递减趋势,x与y负相关,由图

(2)可知,各点整体呈递增趋势,u与v正相关.

【技巧点拨】注意正负相关的判断标准.

【答案】C

要点八线性回归分析

【例8】一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:

(1)对变量y与x进行相关性检验;

(2)如果y与x有线性相关关系,求回归直线方程;

(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?

【命题立意】考查线性回归分析方法。

【标准解析】利用相关系数r进行线性相关检验(也可利用散点图).如果线性相关,再求回归直线方程并加以判断.

【答案】

 

【变式训练】假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:

(1)y与x间是否有线性相关关系?

若有,求出线性回归方程;

(2)估计使用年限为10年时的维修费用.

【标准解析】先作出散点图,然后检验相关性,再求其回归直线.

【技巧点拨】对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线.。

【答案】

 

要点九独立性检验

【例9】(2009·辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:

mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:

甲厂:

乙厂:

(1)试分别估计两个分厂生产的零件的优质品率;

(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.

【命题立意】考查由采集样本的数据检验独立性.

【标准解析】利用公式计算K2的值,比较它与临界值的大小关系,来判断事件X与Y是否有关的问题.

【误区警示】图表数据及利用计算数据判断独立性的步骤必须正确理解.

【答案】

(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为

=72%;

乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为

=64%.

(2)所以有99%的把握认为“两个分厂生产的零件的质量有差异”

 

【变式训练】在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.

(1)根据以上数据建立一个2×2列联表;

(2)画出二维条形图;

(3)检验休闲方式是否与性别有关,可靠性有多大.

【标准解析】独立性检验的考查。

【技巧点拨】先由已知条件转化联表及条形图,然后由公式计算k2与临界值的关系。

【答案】

(1)2×2列联表如图:

(2)二维条形图如图:

(3)假设休闲方式与性别无关,则

K2=

≈6.201>5.024,

所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关.

【原创题探讨】

【原创精典1】某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表:

产品类别

A

B

C

产品数量(件)

1300

样本容量

130

由于不小心,表格中A、C产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________件.

【解析】设样本的总容量为x,则

×1300=130,∴x=300.

∴A产品和C产品在样本中共有300-130=170(件).

设C产品的样本容量为y,则y+y+10=170,∴y=80.∴C产品的数量为

×80=800.

【答案】800

【原创精典2】如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为(  )

  A.84,4.84B.84,1.6C.85,4D.85,1.6

【解析】由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为

=85,方差为

[3×(84-85)2+(86-85)2+(87-85)2]=1.6.

【答案】D

【原创精典3】近年来,由于乱砍滥伐,掠夺性使用森林资源,我国长江、黄河流域植被遭到破坏,土地沙化严重,洪涝灾害时有发生.沿黄某地区为积极响应和支持“保护母亲河”的倡议,建造了长100千米,宽0.5千米的防护林.有关部门为掌握这一防护林共约有多少棵树,从中选出10块(每块长1千米,宽0.5千米)进行统计,每块树木数量如下(单位:

棵)

6510063200646006470067300

6330065100666006280065500

请你根据以上数据计算这一防护林共约有多少棵树(结果保留3个有效数字).

【解析】要求学生有用样本估计总体的思想方法,另一方面要求学生有应用数学的意识,这是今后中考命题发展的趋势.

【答案】先计算出

(65100+63200+64600+64700+67300+63300

+65100+66600+62800+65500)=64820.

于是,可以估计这一防护林平均每块约有64820株树.又64820×100=6482000≈6.48×106(株),于是可以估计这一防护林大约共有6.48×106株树.

新动向前瞻

【样题1】已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a、b的取值分别是________.

【解析】∵中位数为10.5,∴

=10.5,a+b=21,

∵x=

=10,

∴s2=

[(10-2)2+(10-3)2+(10-3)2+(10-7)2+(10-a)2+(10-b)2+(10-12)2+(10-13.7)2+(10-18.3)2+(10-20)2].

令y=(10-a)2+(10-b)2=2a2-42a+221=2

2+

当a=10.5时,y取最小值,方差s2也取最小值.∴a=10.5,b=10.5.

【答案】10.5 10.5

【样题2】某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:

“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.

p:

有95%的把握认为“这种血清能起到预防感冒的作用”;

q:

若某人未使用该血清,那么他在一年中有95%的可能性得感冒;

r:

这种血清预防感冒的有效率为95%;

s:

这种血清预防感冒的有效率为5%.

则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上)

①p∧q;②綈p∧q;③(綈p∧綈q)∧(r∨s);④(p∨綈r)∧(綈q∨s).

【解析】由题意,得K2≈3.918,P(K2≥3.841)≈0.05,所以只有p正确,即有95%的把握认为“这种血清能起到预防感冒的作用”,由真值表知①、④为真命题.

【答案】①④

【样题3】①合情推理是由特殊到一般的推理,得到的结论不一定正确,演绎推理是由一般到特殊的推理,得到的结论一定正确;

②一般地,当r的绝对值大于0.75时,认为两个变量之间有很强的线性相关关系,如果变量y与x之间的相关系数r=-0.9568,则变量y与x之间具有线性关系;

③用独立性检验(2×2列联表法)来考察两个分类变量是否有关系时,算出的随机变量K2的值越大,说明“x与y有关系”成立的可能性越大;

④命题p:

∃x∈R使得x2+x+1<0,则綈p:

∀x∈R均有x2+x+1≥0.

其中结论正确的序号为________.(写出你认为正确的所有结论的序号)

【解析】②通过统计假设,查表得结论正确;③参考两个分类变量x和y有关系的可信度表:

k2的值越大,说明“x与y有关系”成立的可能性越大;④正确,命题p:

∃x∈R使得p(x),则綈p:

∀x∈R均有綈p(x).

【答案】②③④

【样题4】出下列四个命题:

①∀x∈R,cosx=sin

+sin

一定不成立;②今年初某医疗研究所为了检验“达菲(药物)”对甲型H1N1流感病毒是否有抑制作用,把墨西哥的患者数据库中的500名使用达菲的人与另外500名未用达菲的人一段时间内患甲型H1N1流感的疗效记录作比较,提出假设H0:

“达菲不能起到抑制甲型H1N1流感病毒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05,说明达菲抑制甲型H1N1流感病毒的有效率为95%;③|a·b|=|a||b|是|λa+μb|=|λ||a|+|μ||b|成立的充要条件;④如右图的茎叶图是某班在一次测验时的成绩:

可断定:

女生成绩比较集中,整体水平稍高于男生.

其中真命题的序号是________.(填上所有真命题的序号)

【解析】对于①,等式展开后可化简为asinx+bcosx=0的形式,可知一定有解;对于②,正确解释是:

有95%的把握认为“达菲对甲型H1N1流感病毒有抑制作用”;对于③,由向量模的性质知不正确.

【答案】④

【样题5】某种产品的广告费支出x与销售额y(单位:

百万元)之间有如下对应数据:

x

2

4

5

6

8

y

30

40

60

50

70

(1)画出散点图;

(2)求回归直线方程;

(3)试预测广告费支出为10百万元时,销售额多大?

【解析】线性回归问题的综合考查。

【答案】

(1)根据表中所列数据可得散点图如下:

(2)列出下表,并用科学计算器进行有关计算.

i

1

2

3

4

5

xi

2

4

5

6

8

yi

30

40

60

50

70

xiyi

60

160

300

300

560

因此,x=

=5,y=

=50,

=145,

=13500,iyi=1380.

于是可得b=

=6.5;

a=y-bx=50-6.5×5=17.5,因此,所求回归直线方程是

=6.5x+17.5.

(3)据上面求得的回归直线方程,当广告费支出为10百万元时,

=6.5×10+17.5=82.5(百万元),

即这种产品的销售收入大约为82.5百万元.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2