高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理文档格式.docx
《高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理文档格式.docx》由会员分享,可在线阅读,更多相关《高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理文档格式.docx(18页珍藏版)》请在冰点文库上搜索。
![高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理文档格式.docx](https://file1.bingdoc.com/fileroot1/2023-5/2/59749203-27ef-4aa4-9a70-b33f96d84fbb/59749203-27ef-4aa4-9a70-b33f96d84fbb1.gif)
14
40
10
a
36
b
28
8
34
若抽取学生n人,成绩分为A(优秀),B(良好),C(及格)三个等级,设x与y分别表示数学成绩与物理成绩,例如:
表中物理成绩为A等级的共有14+40+10=64(人),数学成绩为B等级且物理成绩为C等级的共有8人.已知x与y均为A等级的概率是0.07.
(1)设在该样本中,数学成绩的优秀率是30%,求a,b的值;
(2)已知a≥7,b≥6,求数学成绩为A等级的人数比C等级的人数多的概率.
解析▶
(1)由题意知=0.07,解得n=200,
∴×
100%=30%,解得a=18,
易知a+b=30,∴b=12.
(2)由14+a+28>
10+b+34得a>
b+2.又a+b=30且a≥7,b≥6,则(a,b)的所有可能结果为(7,23),(8,22),(9,21),…,(24,6),共18种,而a>
b+2的可能结果为(17,13),(18,12),…,(24,6),共8种,则所求概率P==.
求解古典概型与抽样方法交汇问题的思路
(1)依据题目中抽样方法的信息,提炼需要的信息.
(2)进行统计与古典概型概率的正确计算.
某险种的基本保费为a(单位:
元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度的出险次数的关联如下:
上年度出险次数
1
2
3
4
≥5
保费(元)
0.85a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
概率
0.30
0.15
0.20
0.10
0.05
(1)求一续保人本年度的保费比基本保费高出60%的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
解析▶
(1)设A表示事件“一续保人本年度的保费比基本保费高出60%”,则事件A发生即为当且仅当一年内出险次数大于3,故P(A)=0.1+0.05=0.15.
(2)设B表示事件“一续保人本年度的保费高于基本保费”,则事件B发生当且仅当一年内出险次数大于1,故P(B)=0.2+0.2+0.1+0.05=0.55.
又P(AB)=P(A),故P(A|B)====.
(3)记续保人本年度的保费为X,则X的分布列为
X
P
E(X)=0.85a×
0.30+a×
0.15+1.25a×
0.20+1.5a×
0.20+1.75a×
0.10+2a×
0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
能力2
▶概率与频率分布直方图的综合应用
【例2】PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示.
现将PM2.5值划分为如下等级
PM2.5值
[0,100)
[100,150)
[150,200)
[200,250]
等级
一级
二级
三级
四级
用频率估计概率.
(1)估计该市在下一年的360天中空气质量为一级的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),求治理后的PM2.5值的均值比治理前大约下降了多少.
解析▶
(1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:
[0,50)
[50,100)
频率
0.125
0.375
0.25
由上表可知,如果该市维持现状不变,那么该市下一年的某一天空气质量为一级的概率为0.25,
因此在360天中约有360×
0.25=90(天).
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个.
从这8个数据中随机抽取5个,则这四种天气都有三种情况:
一级天气的数据有2个,其余的均为1个;
二级天气的数据有2个,其余的均为1个;
三级天气的数据有2个,其余的均为1个.
情况有:
++=24种.
而从8个数据中随机抽取5个,有=56种情况.
故所求概率为=.
(3)如果该市维持现状不变,那么该市的PM2.5值的均值约为
E(Y)=25×
0.125+75×
0.125+125×
0.375+175×
0.25+225×
0.125=131.25.
如果该市对环境进行治理,那么该市的PM2.5值X的均值为E(X)=115,
因此该市治理后的PM2.5值的均值比治理前大约下降了16.25.
有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点.概率与统计综合题,无论是直接描述还是利用概率分布表、频率分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键.
从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值.由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.
(1)求这些产品质量指标值落在区间[75,85]内的频率;
(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于区间[45,75)内的产品件数为X,求X的分布列.
解析▶
(1)设这些产品质量指标值落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x,2x.
依题意得(0.004+0.012+0.019+0.030)×
10+4x+2x+x=1,解得x=0.05.
所以这些产品质量指标值落在区间[75,85]内的频率为0.05.
(2)由
(1)得,这些产品质量指标值落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.
从该企业生产的这种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3,p=0.6.
因为X的所有可能取值为0,1,2,3,
且P(X=0)=×
0.60×
0.43=0.064,
P(X=1)=×
0.61×
0.42=0.288,
P(X=2)=×
0.62×
0.41=0.432,
P(X=3)=×
0.63×
0.40=0.216,
所以X的分布列为
0.064
0.288
0.432
0.216
能力3
▶概率与统计案例的综合应用
【例3】某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程的选课意向进行调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;
(2)根据抽取的180名学生的调查结果,完成2×
2列联表,并判断能否在犯错误的概率不超过0.025的前提下认为“科类的选择与性别有关”.
选择自然科学类
选择社会科学类
合计
男生
女生
附:
K2=,其中n=a+b+c+d.
P(K2≥k0)
0.500
0.400
0.250
0.150
0.100
k0
0.455
0.708
1.323
2.072
2.706
0.050
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
解析▶
(1)由条件知,抽取的男生有105人,女生有180-105=75(人),
所以男生选择社会科学类的频率为=,女生选择社会科学类的频率为=.
由题意知,男生总数为1200×
=700,女生总数为1200×
=500,所以估计选择社会科学类的学生人数为700×
+500×
=600.
(2)根据统计数据,可得列联表如下:
60
45
105
30
75
90
180
则K2的观测值k=≈5.1429>
5.024,
所以在犯错误的概率不超过0.025的前提下能认为“科类的选择与性别有关”.
(1)本题常见的错误是对独立性检验思想理解不深刻,做出错误判定.
(2)进行独立性检验时,提出的假设是两者无关.
近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:
患三高疾病
不患三高疾病
男
6
女
(1)请将列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽取9人,其中女性抽取多少人?
(2)为了研究患三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可以在犯错误的概率不超过0.005的前提下认为“患三高疾病与性别有关”.
临界值表:
参考公式:
解析▶
(1)补充列联表如下:
24
12
18
在患三高疾病的人群中抽取9人,则抽取比例为=,
所以女性应该抽取12×
=3(人).
(2)由2×
2列联表,得K2的观测值
k==10>
7.879,
所以可以在犯错误的概率不超过0.005的前提下认为“患三高疾病与性别有关”.
能力4
▶统计与概率的综合应用
【例4】一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列、数学期望E(X)及方差D(X).
解析▶
(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个”,因此
P(A1)=(0.006+0.004+0.002)×
50=0.6,
P(A2)=0.003×
50=0.15,
P(B)=0.6×
0.6×
0.15×
2=0.108.
(2)X可能取的值为0,1,2,3,相应的概率为
P(X=0)=×
(1-0.6)3=0.064,
(1-0.6)2=0.288,
(1-0.6)=0.432,
0.63=0.216.
X的分布列为
因为X~B(3,0.6),所以数学期望E(X)=3×
0.6=1.8,
方差D(X)=3×
(1-0.6)=0.72.
二项分布的期望与方差.
(1)如果X~B(n,p),那么用公式E(X)=np;
D(X)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽然不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aX+b)=aE(X)+b以及E(X)=np求出E(aX+b),同样还可求出D(aX+b).
空气质量指数(AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级:
0~50为优;
51~100为良;
101~150为轻度污染;
151~200为中度污染;
201~300为重度污染;
300以上为严重污染.
一环保人士记录去年某地六月中的10天的AQI的茎叶图如图所示.
(1)利用该样本估计该地六月空气质量为优良(AQI≤100)的天数;
(2)将频率视为概率,从六月中随机抽取3天,记3天中空气质量为优良的天数为ξ,求ξ的分布列.
解析▶
(1)从茎叶图中可以发现样本中空气质量为优的天数为2,空气质量为良的天数为4,
∴该样本中空气质量为优良的频率为=,
从而估计该地六月空气质量为优良的天数为30×
=18.
(2)由
(1)估计六月某天空气质量为优良的概率为,
ξ的所有可能取值为0,1,2,3,且ξ~B.
∴P(ξ=0)==,
P(ξ=1)=×
=,
P(ξ=2)=×
P(ξ=3)==,
故ξ的分布列为
ξ
一、选择题
1.已知随机变量x,y的值如表所示,如果x与y线性相关且回归直线方程为=bx+,那么实数b=().
x
5
A.-B.
C.-D.
解析▶因为=3,=5,由回归直线过样本点的中心(3,5),得5=3b+,所以b=.
2.把样本容量为20的数据分组,分组区间与频数如下:
[10,20),2;
[20,30),3;
[30,40),4;
[40,50),5;
[50,60),4;
[60,70],2.则在区间[10,50)上的数据的频率是().
A.0.05B.0.25
C.0.5D.0.7
解析▶由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为=0.7,故选D.
答案▶D
3.在一个容量为N的总体中抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则().
A.p1=p2<
p3B.p2=p3<
p1
C.p1=p3<
p2D.p1=p2=p3
解析▶由于在三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3,故选D.
4.某地区为了解中学生的日平均睡眠时间(单位:
h),随机选择了n位中学生进行调查,根据所得数据画出样本的频率分布直方图如图所示,且从左到右的第1个、第4个、第2个、第3个小长方形的面积依次构成公差为0.1的等差数列,又第一小组的频数是10,则n等于().
A.80B.90
C.100D.110
解析▶设第1个小长方形的面积为S,
则4个小长方形的面积之和为4S+×
0.1.
由题意知,4S+×
0.1=1,故S=0.1.
又因为=0.1,所以n=100,故选C.
答案▶C
二、填空题
5.从某地高中男生中随机抽取100名同学,将他们的体重(单位:
kg)数据绘制成频率分布直方图(如图).由图中数据可知体重的平均值为kg;
若要从体重在[60,70),[70,80),[80,90]三组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12个人中选两人当正副队长,则这两人体重不在同一组内的概率为.
解析▶由频率分布直方图可知,体重在[40,50)内的男生人数为0.005×
10×
100=5,
同理,体重在[50,60),[60,70),[70,80),[80,90]内的人数分别为35,30,20,10,
所以体重的平均值为
=64.5.
利用分层抽样的方法选取12人,
则从体重在[60,70),[70,80),[80,90]三组内选取的人数分别为12×
=6,12×
=4,12×
=2,则两人体重不在同一组内的概率为=.
答案▶64.5
三、解答题
6.某校从参加高三模拟考试的学生中随机抽取60名分数不低于90分的学生,将其数学成绩(均为整数)分成[90,100),[100,110),…,[140,150]六组后,得到如下部分频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率;
(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,据此,估计这60名学生本次考试的平均分;
(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率.
解析▶
(1)分数在[120,130)内的频率为
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.
(2)估计平均分为
=95×
0.1+105×
0.15+115×
0.15+125×
0.3+135×
0.25+145×
0.05=121.
(3)由题意,在[110,120)分数段的人数为60×
0.15=9.
在[120,130)分数段的人数为60×
0.3=18.
∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,
∴需在[110,120)分数段内抽取2人,并分别记为m,n,在[120,130)分数段内抽取4人,并分别记为a,b,c,d.
则从样本中任取2人的基本事件有{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},{a,b},{a,c},{a,d},{b,c},{b,d},{c,d},共15个.
设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,
则事件A包含的基本事件有{m,n},{m,a},{m,b},{m,c},{m,d},{n,a},{n,b},{n,c},{n,d},共9个.
∴P(A)==.
7.在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如茎叶图所示:
(1)从甲、乙两人中选择一人参加数学趣味知识竞赛,你会选哪位?
请运用统计学的知识说明理由.
(2)从乙的6次成绩中随机选择2次成绩,求选到123分的概率.
解析▶
(1)==112,
==112,
=×
[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-112)2+(124-112)2]=,
[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-112)2+(123-112)2]=,
∴=,>
.
说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,故选择乙同学.
(2)从6个成绩中随机选择2个,共有15个基本事件,分别是{102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113},{105,117},{105,123},{112,113},{112,117},{112,123},{113,117},{113,123},{117,123},
其中满足条件的基本事件有5个,故所求概率P==.
8.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:
(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a和分别表示甲组研发成功和失败;
b和分别表示乙组研发成功和失败.
(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.
解析▶
(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数==;
方差=×
=.
乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数==;
因为>
<
所以甲组的研发水平优于乙组.
(2)记“恰有一组研发成功”为事件E,在所抽得的15个结果中,恰有一组研发