高考复习正态分布与线性回归Word格式文档下载.doc

上传人:wj 文档编号:6845987 上传时间:2023-05-07 格式:DOC 页数:15 大小:1.67MB
下载 相关 举报
高考复习正态分布与线性回归Word格式文档下载.doc_第1页
第1页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第2页
第2页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第3页
第3页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第4页
第4页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第5页
第5页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第6页
第6页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第7页
第7页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第8页
第8页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第9页
第9页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第10页
第10页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第11页
第11页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第12页
第12页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第13页
第13页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第14页
第14页 / 共15页
高考复习正态分布与线性回归Word格式文档下载.doc_第15页
第15页 / 共15页
亲,该文档总共15页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

高考复习正态分布与线性回归Word格式文档下载.doc

《高考复习正态分布与线性回归Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《高考复习正态分布与线性回归Word格式文档下载.doc(15页珍藏版)》请在冰点文库上搜索。

高考复习正态分布与线性回归Word格式文档下载.doc

当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系奎屯王新敞新疆相关关系与函数关系的异同点如下:

相同点:

均是指两个变量的关系奎屯王新敞新疆不同点:

函数关系是一种确定的关系;

而相关关系是一种非确定关系;

函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;

而相关关系是非随机变量与随机变量的关系回归分析一元线性回归分析:

对具有相关关系的两个变量进行统计分析的方法叫做回归分析奎屯王新敞新疆通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性奎屯王新敞新疆对于线性回归分析,我们要注意以下几个方面:

(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。

两个变量具有相关关系是回归分析的前提。

(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。

(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。

散点图:

表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度奎屯王新敞新疆粗略地看,散点分布具有一定的规律奎屯王新敞新疆回归直线设所求的直线方程为,abxy+=,其中a、b是待定系数1122211()()()nniiiiiinniiiixxyyxynxybxxxnxaybx=,=niixnx11,=niiyny11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析奎屯王新敞新疆相关系数:

相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把=niniiiniiiyyxxyyxxr11221)()()(=niniiiniiiynyxnxyxnyx1122221)(叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.相关系数的性质:

r1,且r越接近1,相关程度越大;

且r越接近0,相关程度越小.显著性水平:

显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值奎屯王新敞新疆它必须在每一次统计检验之前确定奎屯王新敞新疆显著性检验:

(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数奎屯王新敞新疆在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0奎屯王新敞新疆05或r0奎屯王新敞新疆01;

例如时,0.050.754,0.010.874奎屯王新敞新疆求第3页共15页得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当rr0奎屯王新敞新疆05或r0奎屯王新敞新疆01,认为线性关系不显著奎屯王新敞新疆讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;

通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;

我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到奎屯王新敞新疆题型讲解题型讲解新疆王新敞特级教师源头学子小屋http:

/例例1已知连续型随机变量的概率密度函数+=)2(0)20

(1)0(0)(xxkxxxf,且f(x)0,求常数k的值,并计算概率P(1.52.5)。

分析分析:

凡是计算连续型随机变量的密度函数f(x)中的参数、概率P(ab)都需要通过求面积来转化而求得。

若f(x)0且在a,b上为线性,那么P(ab)的值等于以b-a为高,f(a)与f(b)为上、下底的直角梯形的面积,即1()()()()2Pabfafbba=+。

解解:

1()(0)(02)

(2)PPPP=+=+0(02)0P=+1(0)

(2)(20)(0)

(2)222ffffk=+=+=+21=k;

1(1.52.5)(1.52)(22.5)(1.52)16PPPP=+=。

例例2设),(2NX,且总体密度曲线的函数表达式为:

412221)(+=xxexf,xR。

(1)求,;

(2)求)2|1(|xP及)22121(+xP的值。

分析:

根据表示正态曲线函数的结构特征,对照已知函数求出和。

利用一般正态总体),(2N与标准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。

解:

(1)由于222)2

(2)1(41222121)(+=xxxeexf,根据一般正态分布的函数表达形式,可知=1,2=,故XN(1,2)。

(2))2121()2|1(|+=xPxP2121(12)(12)()()22

(1)

(1)2

(1)120.84131FF+=+=6826.0=。

又)21()221()22121(+=+FFxP22121()()

(2)

(1)22

(2)

(1)10.97720.84131+=+=+8185.0=。

点评:

在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。

通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。

第4页共15页例例3某中学有1000人参加并且高考数学成绩近似地服从正态分布()210,100N,求此校数学成绩在120分以上的考生人数。

(2)0.977)解:

用表示此中学数学高考成绩,则)10,100(2N()()120100120112010.02310PP=120分以上的考生人数为10000.02323点评:

通过公式)()(=xxF转化成标准正态总体,然后查标准正态分布表即可奎屯王新敞新疆例例4将温度调节器放置在贮存着某种液体的容器内,调节器设定在d,液体的温度(单位:

)是一个随机变量,且N(d,0.52).

(1)若d=90,求89的概率;

(2)若要保持液体的温度至少为80的概率不低于0.99,问d至少是多少?

(其中若N(0,1),则

(2)=P

(2)=0.9772,(2.327)=P(2.327)=0.01).分析:

(1)要求P(89)=F(89),N(d,0.5)不是标准正态分布,而给出的是

(2),(2.327),故需转化为标准正态分布的数值.

(2)转化为标准正态分布下的数值求概率p,再利用p0.99,解d.解:

(1)P(89)=F(89)=(5.09089)=

(2)=1

(2)=10.9772=0.0228.

(2)由已知d满足0.99P(80),即1P(80)10.01,P(80)0.01.(5.080d)0.01=(2.327).5.080d2.327.d81.1635.故d至少为81.1635.点评:

(1)若N(0,1),则=N(0,1).

(2)标准正态分布的密度函数f(x)是偶函数,x0时,f(x)为减函数.例例5在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:

(1)提出统计假设:

某种指标服从正态分布N(,2);

(2)确定一次试验中的取值a;

(3)作出统计推断:

若a(3,+3),则接受假设,若a(3,+3),则拒绝假设.某砖瓦厂生产的砖的“抗断强度”服从正态分布N(30,0.8),质检人员从该厂某一天生产的1000块砖中随机抽查一块,测得它的抗断强度为27.5kg/cm2,你认为该厂这天生产的这批砖是否合格?

为什么?

由于在一次试验中落在区间(3,+3)内的概率为0.997,故几乎必然落在上述区间内.于是把=30,=0.8代入,算出区间(3,+3)=(27.6,32.4),而27.5(27.6,32.4).据此认为这批砖不合格.例例6已知测量误差N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8cm的频率大于0.9?

第5页共15页解:

设表示n次测量中绝对误差不超过8cm的次数,则B(n,p).其中P=P(|0.9,n应满足P

(1)=1P(=0)=1(1p)n0.9,n)5671.01lg()9.01lg(=4329.0lg1=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8cm的概率大于0.9.例例7已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:

年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0

(1)求x与y之间的相关系数,并检验是否线性相关;

(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。

分析分析:

(1)使用样本相关系数计算公式来完成;

(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界05.0r比较,若05.0rr则线性相关,否则不线性相关。

解解:

(1)列出下表,并用科学计算器进行有关计算:

i123456789101112131415ix707480788592909592108115123130138145iy5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0iiyx357444544608.4765938.490011401058118813571500.616251766.41885101151515=x,11.10157.151=y,1611251512=iix,55.16281512=iiy,8.16076151=iiiyx。

故蔬菜产量与放用氮肥量的相关系数8643.0)11.101555.1628)(10115161125(11.10101158.1607622=r。

由于n=15,故自由度15-2=13。

由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值514.005.0=r,则05.0rr,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。

(2)设所求的回归直线方程为abxy+=,则0937.01011516112511.10101158.160761515221512151=xxyxyxbiiiii,6463.01010937.011.10=xbya,回归直线方程为)(701.146463.00937.0txy=+=。

求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。

如果会使用第6页共15页含统计的科学计算器,能简单得到=niix1,=niiy1,=niiy12,=niiy12,=niiiyx1这些量,也就无需有制表这一步,直接算出结果就行了。

另外,利用计算机中有关应用程序也可以对这些数据进行处理。

例例8假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:

x23456y2.23.85.56.57.0若由资料可知y对x呈线性相关关系。

试求:

(1)线性回归方程;

(2)估计使用年限为10年时,维修费用是多少?

本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。

(1)列表如下:

i12345ix23456iy2.23.85.56.57.0iiyx4.411.422.032.542.02ix491625364=x,5=y,90512=iix,3.11251=iiiyx于是23.145905453.112552251251=xxyxyxbiiiii,08.0423.15=bxya。

线性回归方程为:

08.023.1+=+=xabxy。

(2)当x=10时,38.1208.01023.1=+=y(万元)即估计使用10年时维修费用是12.38万元。

本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。

如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。

小结小结:

1.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.2.统计中假设检验的基本思想是:

根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:

是拒绝假设,还是接受假设.学生练习学生练习新疆王新敞特级教师源头学子小屋http:

/1.下面哪有个数不为总体特征数的是(D)A.总体平均数B.总体方差C.总体标准差D.总体样本答案:

D2.设随机变量服从二项分布B(6,21),则P(=3)=(A)A.165B.163C.85D.83第7页共15页答案:

A3.设随机变量N(,),且P(C)=P(C),则C等于A.0B.C.D.解析:

由正态曲线的图象关于直线x=对称可得答案为D.答案:

D4.如果随机变量N(,2),且E=3,D=1,则P(11)等于A.2

(1)1B.(4)

(2)C.

(2)(4)D.(4)

(2)解析:

对正态分布,=E=3,2=D=1,故P(11)=(13)(13)=

(2)(4)=(4)

(2).答案:

B5.某厂生产的零件外直径N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9mm和7.5mm,则可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常解析:

根据3原则,在8+31.5=8.45(mm)与831.5=7.55(mm)之外时为异常.答案:

C6.随机变量服从正态分布N(0,1),如果P

(1)=0.8413,求P(10).解:

N(0,1),P(10)=P(05)=1P(x5)=1F(5)=1(385)=1

(1)=11

(1)=

(1)=0.8413.对第二个方案,有xN(6,22),于是P(x5)=1P(x5)=1F(5)=1(265)=1(0.5)=(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.9.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:

广告费用(千元)1.04.06.010.014.0销售额(千元)19.044.040.052.053.0现要使销售额达到6万元,则需广告费用为_(保留两位有效数字)解析:

先求出回归方程y=bx+a,令y=6,得x=1.5万元.答案:

1.5万元第8页共15页10.设随机变量服从N(0,1),求下列各式的值:

(1)P(2.55);

(2)P(-1.44);

(3)P(|1.52)。

一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。

但在标准正态分布表中只给出了00x,即)()(00xxxP=的情形,对于其它情形一般用公式:

(-x)=1-(x);

p(axb)=(b)-(a)及)

(1)(00xxPxxP=等来转化。

(1))55.2

(1)55.2(=PP1(2.55)10.99460.0054;

=

(2))44.1

(1)44.1()44.1(=P0749.09251.01=;

(3)1)52.1

(2)52.1()52.1()52.152.1()52.1|(|=PP8714.019357.02=说明:

说明:

从本题可知,在标准正态分布表中只要给出了00x的概率,就可以利用上述三个公式求出其它情形下的概率。

11某厂生产的圆柱形零件的外径N(4,0.25)。

质检人员从该厂生产的1000件零件中随机抽查一件,测得它的外径为5.7cm。

试问该厂生产的这批零件是否合格?

欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸是在(-3,+3)内,还是在(-3,+3)之外。

由于圆柱形零件的外径N(4,0.25),由正态分布的特征可知,正态分布N(4,0.25)在区间(4-30.5,4+30.5)即(2.5,5.5)之外取值的概率只有0.003,而)5.5,5.2(7.5,这说明在一次试验中,出现了几乎不可能发生的小概率事件,根据统计中假设检验的基本思想,认为该厂这批产品是不合格的。

判断某批产品是否合格,主要运用统计中假设检验的基本思想。

(二)习题

(二)习题+答案答案一、选择题一、选择题某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为)(1021)(200)80(2Rxexfx=,则下列命题不正确的是(B)A该市这次考试的数学平均成绩为80分;

B分数在120分以上的人数与分数在60分以下的人数相同;

C分数在110分以上的人数与分数在50分以下的人数相同;

D该市这次考试的数学成绩标准差为10.设随机变量服从标准正态分布()0,1N,若()1Pp=,则()10P=(D)A.2pB.1pC.12pD.12p设随机变量),(2N,且)()(cPcP=,则c等于(D).0.DCBA设的概率密度函数为2)1(221)(=xexf,则下列结论错误的是(C)(A)1()1(=pp(B)11()11(=pp(C)(xf的渐近线是0=x(D)1=)1,0(N设随机变量服从正态分布()0,1N,记()()xPx=,则下列结论不正确的是(D)A()102=B()()1xx=第9页共15页C()()()210Paaa=D()()()10Paaa=【解】

()()010=,()102=,A正确,B显然正确1)

(2)

(1)()()()()()()(=aaaaaaPaPaaPaP,C正确()()()()112122PaPaaa=D为不正确设随机变量),(2N,且1,3=DE,则)11(P=(B)1)2(2.)4()2(.)2()4(.1)1(2.DCBA如果随机变量)1,0(N,),(2N,那么=(C))(.+DCBA已知随机变量服从正态分布2

(2)N,(4)0.84P=,则(0)P=(A)A0.16B0.32C0.68D,0.84设随机变量服从正态分布(2,9)N,若

(1)

(1)PcPc+=,则c=(B)A.1B.2C.3D.4已知随机变量服从正态分布N(3,a2),则P(3)(D)(A)15(B)14(C)13(D)12如果随机变量N(,2),且E3,D1,那么P(24)等于(B)(其中N(,2)在(,)内的取值概率为0.683;

在(2,2)内的取值概率为0.954;

在(3,3)内的取值概率为0.997)A0.5B0.683C0.954D0.997若(3)=0.9987,则标准正态总体在区间(3,3)内取值的概率为(B)A0.9987B0.9974C0.944D0.8413下图是正态分布N(0,1)的正态分布曲线图,下面4个式子中,能表示图中阴影部分面积的有(C)个1()2a()a1()2a1()()2aa(A)1(B)2(C)3(D)4某学校在一次数学基础测试统计中,所有学生成绩服从正态分布(100,4)N(单位:

分),现任选一名学生,该生成绩在96分到104分内的概率是(D)A

(2)

(2)FFB1

(2)C2

(1)1D2

(2)12、设随机变量服从正态分布N(0,1),p

(1)P,则P(11)(C)A12PB1PC12PD12PyO-ax第10页共15页设两个正态分布2111()(0)N,和2222()(0)N,的密度函数图像如图所示。

则有(A)A1212,B1212,C1212,D1212,设随机变量服从正态分布N(,2)(0),若P(0)P

(1)1,则的值为(D)A1B1C12D12(07安徽卷,10)以()x表示标准正态总体在区间(),x内取值的概率,若随机变量服从正态分布()2,N,则概率()P等于(B)A.()()+B.()()11C.1D.()2+解析:

考查()2,N与()0,1N的关系:

若()2,N,则()2112xxPxxx=解:

或1)1(2答案为B(07全国卷,14):

在某项测量中,测量结果服从正态分布()()21,0N.若在()0,1内取值的概率为0.4,则在()0,2内取值的概率为-。

解法一:

()21,N()()()()11PP=+=第11页共15页021y0.40.4-1.961.96y00.0250.4750.0250.475()()1101110100.50.4P

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 幼儿教育 > 幼儿读物

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2