高中数学复习概率统计题型归纳与讲解03 频率分布直方图.docx
《高中数学复习概率统计题型归纳与讲解03 频率分布直方图.docx》由会员分享,可在线阅读,更多相关《高中数学复习概率统计题型归纳与讲解03 频率分布直方图.docx(23页珍藏版)》请在冰点文库上搜索。
高中数学复习概率统计题型归纳与讲解03频率分布直方图
高中数学复习概率统计题型归纳与讲解
专题3频率分布直方图
例1.要调查某地区高中学生身体素质,从高中生中抽取100人进行跳高测试,根据测试成绩制作频率分布直方图如图,现从成绩在[120,140)之间的学生中用分层抽样的方法抽取5人,应从[120,130)间抽取人数为b,则( )
A.a=0.2,b=2B.a=0.025,b=3
C.a=0.3,b=4D.a=0.030,b=3
【解析】解:
由题得10×(0.005+0.035+a+0.020+0.010)=1,所以a=0.030.
在[120,130)之间的学生人数为:
100×10×0.030=30人,
在[130,140)之间的学生人数为:
100×10×0.020=20人,
在[120,140)之间的学生人数为:
100×(10×0.030+0.020)=50人,
又用分层抽样的方法在[120,140)之间的学生50人中抽取5人,即抽取比例为:
,
所以成绩在[120,130)之间的学生中抽取的人数应,30
3,即b=3,
故选:
D.
例2.从某企业生产的某种产品中随机抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值
分组
[70,80)
[80,90)
[90,100)
[100,110)
110,120)
频数
14
20
36
18
12
估计这种产品质量指标值的平均数为(同一组中的数据用该组区间的中点值作代表)( )
A.100B.98.8C.96.6D.94.4
【解析】解:
平均数
0.14×75+0.20×85+0.36×95+0.18×105+0.12×115=94.4.
故选:
D.
例3.“新冠肺炎”席卷全球,我国医务工作者为了打好这次疫情阻击战,充分发挥优势,很快抑制了病毒,据统计老年患者治愈率为71%,中年患者治愈率为85%,青年患者治愈率为91%.如果某医院有30名老年患者,40名中年患者,50名青年患者,则估计该医院的平均治愈率是( )
A.86%B.83%C.90%D.84%
【解析】解:
利用求加权平均数的公式解得:
0.84=84%,
故选:
D.
例4.已知样本数据x1,x2,…,xn(n∈N*)的平均数与方差分别是a和b,若yi=﹣2xi+3(i=1,2,…n),且样本数据y1,y2,…,yn的平均数与方差分别是b和a,则a﹣b=( )
A.1B.2C.3D.4
【解析】解:
由题意得:
,解得:
,故a﹣b=1,
故选:
A.
例5.下面定义一个同学数学成绩优秀的标志为:
“连续5次考试成绩均不低于120分”.现有甲、乙、丙三位同学连续5次数学考试成绩的记录数据(记录数据都是正整数):
①甲同学:
5个数据的中位数为127,众数为120;
②乙同学:
5个数据的中位数为125,总体均值为127;
③丙同学:
5个数据的中位数为135,总体均值为128,总体方差为19.8.
则可以判定数学成绩优秀同学为( )
A.甲、乙B.乙、丙C.甲、丙D.甲、乙、丙
【解析】解:
在①中,甲同学:
5个数据的中位数为127,众数为120,
所以前三个数为120,120,127,则后两个数肯定大于127,
故甲同学数学成绩优秀,故①成立;
在②中,5个数据的中位数为125,总体均值为127,
可以找到很多反例,如:
118,119,125,128,145,
故乙同学数学成绩不优秀,故②不成立;
在③中,5个数据的中位数为135,总体均值为128,总体方差为19.8
设x1<x2<x3<x4,
则丙的方差为
[(x1﹣128)2+(x2﹣128)2+(x3﹣128)2+(x4﹣128)2+(135﹣128)2]=19.8,
∴(x1﹣128)2+(x2﹣128)2+(x3﹣128)2+(x4﹣128)2=50,
∴(x1﹣128)2≤50,
得|x1﹣128|≤5,∴x1≥128﹣5>120,∴丙同学数学成绩优秀,故③成立.
∴数学成绩优秀有甲和丙2个同学.
故选:
C.
例6.若数据x1,x2,…,xn的平均数
3,方差s2=1,则数据2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A.6,6B.9,2C.9,6D.9,4
【解析】解:
由题意若数据x1,x2,…,xn的平均数
3,方差s2=1,
可得x1+x2+…+xn=3n,
则:
2x1+3+x2+3+…+xn+3=2(x1+x2+…+xn)+3n=9n,
所以数据2x1+3,2x2+3,…,2xn+3的平均数为9.
又S2
[(x1﹣3)2+(x2﹣3)2+…+(xn﹣3)2]=1,
所以[(x1﹣3)2+(x2﹣3)2+…+(xn﹣3)2]=n,
所以
[(2x1+3﹣9)2+(2x2+3﹣9)2+…+(2xn+3﹣9)2]
[(x1﹣3)2+(x2﹣3)2+…+(xn﹣3)2]=4,
则数据2x1+3,2x2+3,…,2xn+3的平均数和方差分别为9,4.
故选:
D.
例7.随着城镇化的不断发展,老旧小区的改造及管理已经引起了某市政府的高度重视,为了了解本市甲,乙两个物业公司管理的小区住户对其服务的满意程度,现从他们所服务的小区中随机选择了40个住户,根据住户对其服务的满意度评分,得到A区住户满意度评分的频率分布直方图和B区住户满意度评分的频率分布表.
B区住户满意度评分的频率分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
4
6
10
12
8
(Ⅰ)在图2中作出B区住户满意度评分的频率分布直方图,并通过频率分布直方图计算两区住户满意度评分的平均值及分散程度(其中分散程度不要求计算出具体值,给出结论即可);
(Ⅱ)根据住户满意度评分,将住户和满意度分为三个等级:
满意度评分低于70分,评定为不满意;满意度评分在70分到89分之间,评定为满意;满意度评分不低于90分,评定为非常满意.试估计哪个地区住户的满意度等级为不满意的概率大?
若是要选择一个物业公司来管理老旧小区的物业,从满意度角度考虑,应该选择哪一个物业公司?
说明理由.
【解析】解:
(Ⅰ)作出如图所示的频率分布直方图,
B区住户满意度评分的频率分布直方图如图所示
A区住户满意度评分的平均值为45×0.1+55×0.2+65×0.3+75×0.2+85×0.15+95×0.05=67.5;
B区住户满意度评分的平均值为55×0.1+65×0.15+75×0.25+85×0.3+95×0.2=78.5.
通过比较两区住户满意度评分的频率分布直方图可以看出,B区住户满意度评分比较集中,而A区住户满意度评分比较分散.
(Ⅱ)记D表示事件:
“A区住户的满意度等级为不满意”,记E表示事件:
“B区住户的满意度等级为不满意”,
则P(D)=(0.010+0.020+0.030)×10=0.6,
P(E)=(0.010十0.015)×10=0.25,
所以A区住户的满意度等级为不满意的概率较大.
若是要选择一个物业公司来管理老旧小区的物业,从满意度等级为满意来考虑,应该选择乙物业公司来为小区服务,这样的话小区住户满意度会高一些.
例8.某校在一次期末数学测试中,为统计学生的考试情况,从学校的2000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:
第一组[65,75),第二组[75,85),……第八组[135,145],如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求第七组的频率,并完成频率分布直方图;
(2)用样本数据估计该校的2000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值);
(3)若从样本成绩属于第六组和第八组的所有学生中随机抽取2名,求他们的分差的绝对值小于10分的概率.
【解析】解:
(1)由频率分布直方图得第七组的频率为:
1﹣(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08.
完成频率分布直方图如下:
(2)用样本数据估计该校的2000名学生这次考试成绩的平均分为:
70×0.004×10+80×0.012×10+90×0.016×10+100×0.030×10+110×0.020×10+120×0.006×10+130×0.008×10+140×0.004×10=102.
(3)样本成绩属于第六组的有0.006×10×50=3人,样本成绩属于第八组的有0.004×10×50=2人,
从样本成绩属于第六组和第八组的所有学生中随机抽取2名,
基本事件总数n
10,
他们的分差的绝对值小于10分包含的基本事件个数m
4,
∴他们的分差的绝对值小于10分的概率p
.
例9.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准x,用水量不超过x的部分按平价收费,超出x的部分按议价收费.下面是居民月均用水量的抽样频率分布直方图.
①求直方图中a的值;
②试估计该市居民月均用水量的众数、平均数;
③设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
④如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
【解析】解:
①由概率统计相关知识,各组频率之和的值为1,
∵频率=(频率/组距)*组距,
∴0.5×(0.08+0.16+0.4+0.52+0.12+0.08+0.04+2a)=1,解得:
a=0.3,
∴a的值为0.3;
②由频率分布直方图估计该市居民月均用水量的众数为
2.25(吨),
估计该市居民月均用水量的平均数为:
0.5(0.25×0.08+0.75×0.16+1.25×0.3+1.75×0.4+2.25×0.52+2.75×0.3+3.25×0.12+3.75×0.08+4.25×0.04)=2.035(吨).
③由图,不低于3吨人数所占百分比为0.5×(0.12+0.08+0.04)=12%,
∴全市月均用水量不低于3吨的人数为:
30×12%=3.6(万);
④由频率分布直方图得月均用水量低于2.5吨的频率为:
0.5×(0.08+0.16+0.3+0.4+0.52)=0.73<85%,
月均用水量低于3吨的频率为:
0.5×(0.08+0.16+0.3+0.4+0.52+0.3)=0.88>85%,
∴x=2.5+0.5
2.9(吨).
例10.如图是某校高三
(1)班的一次数学知识竞赛成绩的基叶图(图中仅列出[50,60),[90,100)的数据)和频率分布直方图.
(1)求全班人数以及频率分布直方图中的x,y;
(2)估计学生竞赛成绩的平均数和中位数(保留两位小数).
【解析】解:
(1)分数在[50,60)的频率为0.020×10=0.2,
由茎叶图知,分数在[50,60)之间的频数为5,
所以全班人数为
(人);
分数在[90,100)之间的频数为2,由
,解得y=0.008;
又10x=1﹣10×(0.036+0.024+0.020+0.008),解得x=0.012.
(2)由频率分布直方图,计算平均数为
55×0.2+65×0.24+75×0.36+85×0.12+95×0.08=71.4,
由0.2+0.24+0.36=0.80,所以中位数在[70,80)内,
设中位数为m,则0.20+0.24+(m﹣70)×0.036=0.5,
解得m≈71.67,
所以中位数约为71.67.
例11.某高中数学建模兴趣小组的同学为了研究所在地区男高中生的身高与体重的关系,从若干个高中男学生中抽取了1000个样本,得到如下数据.
数据一:
身高在[170,180)(单位:
cm)的体重频数统计
体重(kg)
[50,55)
[55,60)
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90)
人数
20
60
100
100
80
20
10
10
数据二:
身高所在的区间含样本的个数及部分数据
身高x(cm)
[140,150)
[150,160)
[160﹣170)
[170﹣180)
[180﹣190)
平均体重y(kg)
45
53.6
60
75
(Ⅰ)依据数据一将下面男高中生身高在[170﹣180)(单位:
cm)体重的频率分布直方图补充完整,并利用频率分布直方图估计身高在[170﹣180)(单位:
cm)的中学生的平均体重;(保留小数点后一位)
(Ⅱ)依据数据一、二,计算身高(取值为区间中点)和体重的相关系数约为0.99,能否用线性回归直线来刻画中学生身高与体重的相关关系,请说明理由;若能,求出该回归直线方程;
(Ⅲ)说明残差平方和或相关指数R2与线性回归模型拟合效果之间关系.(只需写出结论,不需要计算)
参考公式:
,
.
参考数据:
(1)145×45+155×53.6+165×60+185×75=38608;
(2)1452+1552+1652+1752+1852﹣5×1652=1000.
(3)663×175=116025,664×175=116200,665×175=116375.
(4)728×165=120120.
【解析】解:
(1)身高在[170,180)的总人数为:
20+60+100+100+80+20+10+10=400,
体重在[55﹣60)的频率为:
,
体重在[70﹣75)的频率为:
,
平均体重为:
52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2
+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,
(2)因为r=0.99→1,线性相关很强,故可以用线性回归直线来
刻画中学生身高与体重的相关,
,
,
,
,
所以回归直线方程为:
,
(3)残差平方和越小或相关指数R2越接近于1,线性回归模型拟合效果越好.
例12.市政府为了节约用水,调查了100位居民某年的月均用水量(单位:
t),频数分布如下:
分组
[0,0.5)
[0.5,1)
[1,1.5)
[1.5,2)
[2,2.5)
[2.5,3)
[3,3.5)
[3.5,4)
[4,4.5]
频数
4
8
15
22
25
14
6
4
2
(1)根据所给数据将频率分布直方图补充完整(不必说明理由);
(2)根据频率分布直方图估计本市居民月均用水量的中位数;
(3)根据频率分布直方图估计本市居民月均用水量的平均数(同一组数据由该组区间的中点值作为代表).
【解析】解:
(1)频率分布直方图如图所示:
(2)∵0.04+0.08+0.15+0.22=0.49<0.5,
∴中位数为2
0.5=2.02,
(3)由频率分布直方图得平均数为:
0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02
=2.02.
例13.某地区100居民的人均用水量(单位:
t)的分组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的众数;(坐标轴单位自定)
(3)当地政府制订了人均月用水量为3t的标准,若超出标准加倍收费,当地政府解释说,85%以上的居民不超出这个标准,这个解释对吗?
为什么?
【解析】解:
(1)
分组
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
(2):
频率分布直方图如下图,由图知,这组数据的众数为2.25.
(3)人均月用水量在3t以上的居民的比例为6%+4%+2%=12%,即大约是有12%的居民月均用水量在3t以上,88%的居民月均用水量在3t以下,因此,政府的解释是正确的.
例14.某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60)…[90,100]后画出如下频率分布直方图.观察图形的信息,回答下列问题:
(Ⅰ)估计这次考试的众数m与中位数n(结果保留一位小数);
(Ⅱ)估计这次考试的及格率(60分及以上为及格)和平均分.
【解析】解:
(Ⅰ)众数是最高小矩形中点的横坐标,所以众数为m=75(分);(3分)
前三个小矩形面积为0.01×10+0.015×10+0.015×10=0.4,
∵中位数要平分直方图的面积,∴
(7分)
(Ⅱ)依题意,60及以上的分数所在的第三、四、五、六组,
频率和为(0.015+0.03+0.025+0.005)*10=0.75
所以,抽样学生成绩的合格率是75%(11分)
利用组中值估算抽样学生的平均分45•f1+55•f2+65•f3+75•f4+85•f5+95•f6
=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71
估计这次考试的平均分是71分.(14分)
例15.为应对新冠疫情,重庆市于2020年1月24日启动重大突发公共卫生事件一级响应机制,要求市民少出门,少聚集,于是快递业务得到迅猛发展.为满足广大市民的日常生活所需,某快递公司以优厚的条件招聘派送员,现给出了两种日薪薪酬方案,
甲方案:
底薪100元,每派送一单奖励1元;
乙方案:
底薪150元,每日前55单没有奖励,超过55单的部分每单奖励10元.
(Ⅰ)请分别求出这两种薪酬方案中日薪y(单位:
元)与送货单数n的函数关系式;
(Ⅱ)根据该公司所有派送员10天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:
日均派送单数
50
54
56
58
60
频数(天)
2
3
2
2
1
回答下列问题:
①根据以上数据,设每名派送员的日薪为X(单位:
元),试分别求出这10天中甲、乙两种方案的日薪X的平均数及方差;
②结合①中的数据,根据统计学的思想,若你去应聘派送员,选择哪种薪酬方案比较合适,并说明你的理由.(参考数据:
172=289,372=1369)
【解析】解:
(1)甲方案,y=100+n;乙方案,y
.
(2),①甲方案中,根据已知表格可计算出日平均派送单数为
,方差为0.2×(50﹣55)2+0.3×(54﹣55)2+0.2×(56﹣55)2+0.2×(58﹣55)2+0.1×(60﹣55)2=9.8,
所以,由
(1)中变量之间的关系,可以指,甲方案的日薪X的平均数为155,方差为9.8.
乙方案中,日薪X的平均数为[5×150+160×2+180×2+200]×0.1=163,日薪方差为0.5×(150﹣163)2+0.2×(160﹣163)2+0.2×(180﹣163)2+0.1×(200﹣163)2=213.4.
(3)若去应聘派送员,我会选择乙方案,从平均数的角度来看,乙方案的平均薪酬更高,同时更有激励作用.
例16.2019年起,全国地级及以上城市全面启动生活垃圾分类工作,垃圾分类投放逐步成为居民的新时尚.为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了某市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:
吨):
“厨余垃圾”箱
“可回收垃圾”箱
“有害垃圾”箱
“其他垃圾”箱
厨余垃圾
300
70
30
80
可回收垃圾
30
210
30
30
有害垃圾
20
20
60
20
其他垃圾
10
20
10
60
(1)分别估计厨余垃圾和有害垃圾投放正确的概率;
(2)假设厨余垃圾在“厨余垃圾”箱、“可回收垃圾”箱、“有害垃圾”箱、“其他垃圾”箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800.当数据a,b,c,d的方差s2最大时,写出a,b,c,d的值(结论不要求证明),并求此时s2的值.
【解析】解:
(1)根据题意,厨余垃圾共300+70+30+80=480吨,
其中投放正确的有300吨,则厨余垃圾投放正确的概率P1
,
有害垃圾共20+20+60+20=120吨,其中投放正确的有60吨,
则害垃圾投放正确的概率P2
;
(2)根据题意,厨余垃圾在四种垃圾箱的投放量分别为a,b,c,d,其中a>0,a+b+c+d=800,
则其平均数
200,
则其方差S2
[(a﹣200)2+(b﹣200)2+(c﹣200)2+(d﹣200)2],
当a=600,b=c=d=0时,s2最大,
而
200,
此时s2
[(600﹣200)2+(0﹣200)2+(0﹣200)2+(0﹣200)2]=120000
例17.某市教育局为了解全市高中学生在素质教育过程中的幸福指数变化情况,对8名学生在高一,高二不同学习阶段的幸福指数进行了一次跟踪调研.结果如表:
学生编号
1
2
3
4
5
6
7
8
高一阶段幸福指数
95
93
96
94
97
98
96
95
学生编号
1
2
3
4
5
6
7
8
高二阶段幸福指数
94
97
95
96
95
94
93
96
(1)根据统计表中的数据情况,分别计算出两组数据的平均值及方差;
(2)请根据上述结果,就平均值和方差的角度分析,说明在高一,高二不同阶段的学生幸福指数状况,并发表自己观点.
【解析】解:
(1)8名学生在高一阶段的幸福指数的平均数为:
(95+93+96+94+97+98+96+95)=95.5,
方差为:
2.25,
8名学生在高二阶段的幸福指数的平均数为:
(94+97+95+96+95+94+93+96)=95,
方差为:
1.5;
(2)①∵
,
∴可以认为这8名学生在高一的平均幸福指数大于在高二的平均幸福指数,
②∵
,
∴可以认为这8名学生在高二的幸福指数的稳定性大于在高一的幸福指数的稳定性.
例18.2020年1月,教育部《关于在部分高校开展基础学科招生改革试点工作的意见》印发,自2020年起,在部分高校开展基础学科招生改革试点(也称“强基计划”).强基计划聚焦高端芯片与软件、智能科技、新材料、先进制造和国家安全等关键领域以及国家人才紧缺的人文社会科学领域,选拔培养有