20届高考数学文二轮复习 第2部分 专题4 第1讲概率与统计.docx
《20届高考数学文二轮复习 第2部分 专题4 第1讲概率与统计.docx》由会员分享,可在线阅读,更多相关《20届高考数学文二轮复习 第2部分 专题4 第1讲概率与统计.docx(33页珍藏版)》请在冰点文库上搜索。
20届高考数学文二轮复习第2部分专题4第1讲概率与统计
第1讲 概率与统计(小题)
热点一 随机抽样
1.随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
2.系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
3.分层抽样满足:
各层抽取的比例都等于样本容量在总体容量中的比例.
例1
(1)(2019·汉中联考)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:
不喜欢
喜欢
男性青年观众
30
10
女性青年观众
30
50
现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢的男性青年观众”的人中抽取了6人,则n等于( )
A.12B.16C.20D.24
答案 D
解析 由题意得,
=
=
,
解得n=24.
(2)(2019·上饶联考)某校高三科创班共48人,班主任为了解学生高考前的心理状况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学号为48,则抽到的最小学号为________.
答案 6
解析 由系统抽样方法从学号为1到48的48名学生中抽取8名学生进行调查,把48人分成8组,
抽到的最大学号为48,它是第8组的最后一名,则抽到的最小学号为第一组的最后一名6号.
跟踪演练1
(1)(2019·漳州质检)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:
32211834297864540732524206443812234356773578905642
84421253313457860736253007328623457889072368960804
32567808436789535577348994837522535578324577892345
若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号为( )
A.522B.324C.535D.578
答案 D
解析 第6行第6列开始的数为808(不合适),436,789(不合适),535,577,348,994(不合适),837(不合适),522,535(重复不合适),578,
则满足条件的6个编号为436,535,577,348,522,578,
则第6个编号为578.
(2)(2019·合肥质检)某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本容量为n的样本,若样本中A型产品有10件,则n的值为( )
A.15B.25C.50D.60
答案 C
解析 某工厂生产的A,B,C三种不同型号产品的数量之比为2∶3∶5,
分层抽样的方法抽取一个容量为n的样本,
则A被抽的抽样比为
=
,
因为A产品有10件,所以n=
=50.
热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示
,频率=组距×
.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
4.对于其他的统计图表,要注意结合问题背景分析其所表达的意思,进而解决所给问题.
例2
(1)(2019·厦门质检)下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )
A.2018年3月的销售任务是400台
B.2018年月销售任务的平均值不超过600台
C.2018年第一季度总销售量为830台
D.2018年月销售量最大的是6月份
答案 D
解析 A项,由图可得3月份的销售任务是400台,
所以A正确.
B项,由图形得2018年月销售任务的平均值为
×(3+2+4+5+8+10+7+4+3+4+1+3)×100=450,所以B正确.
C项,由图形得第一季度的总销售量为300×
+200×1+400×1.2=830(台),所以C正确.
D项,由图形得销售量最大的月份是5月份,为800台,所以D不正确.
(2)(2019·临沂质检)已知8位学生的某次数学测试成绩的茎叶图如图,则下列说法正确的是( )
A.众数为7B.极差为19
C.中位数为64.5D.平均数为64
答案 C
解析 根据茎叶图中的数据知,这组数据的众数为67,A错误;
极差是75-57=18,B错误;
中位数是
=64.5,C正确;
平均数为60+
(-3-1+1+2+7+7+12+15)=65,D错误.
跟踪演练2
(1)已知某高中的一次测验中,甲、乙两个班级的九科平均分的雷达图如图所示,下列判断错误的是( )
A.乙班的理科综合成绩强于甲班
B.甲班的文科综合成绩强于乙班
C.两班的英语平均分分差最大
D.两班的语文平均分分差最小
答案 D
解析 由甲、乙两个班级的九科平均分的雷达图可得:
乙班的理科综合成绩强于甲班,即选项A正确,
甲班的文科综合成绩强于乙班,即选项B正确,
两班的英语平均分分差最大,即选项C正确,
两班地理平均分分差最小,即选项D错误.
(2)(2019·黄冈模拟)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:
将阅读时间不低于30分钟的学生称为“阅读霸”,则下列命题正确的是( )
A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读
C.该校只有50名学生喜欢阅读
D.抽样表明,该校有50名学生为阅读霸
答案 A
解析 根据频率分布直方图可列下表:
阅读时间(分钟)
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60]
抽样人数(名)
10
18
22
25
20
5
抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.
热点三 变量间的相关关系、统计案例
高考中解决变量间的相关关系问题时需注意:
(1)回归直线一定过样本点的中心(
,
).
(2)随机变量K2的观测值k越大,说明“两个变量有关系”的可能性越大.
例3
(1)(2019·皖江联考)某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
由表中数据得线性回归方程
=
x+
中
=-2,预测当温度为-5℃时,用电量的度数约为( )
A.64B.66C.68D.70
答案 D
解析 由已知
=10,
=40,将其代入线性回归方程得40=-2×10+
⇒
=60,故线性回归方程为
=-2x+60,当x=-5时,
=70.
(2)某研究型学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如下表:
使用智能手机
不使用智能手机
总计
学习成绩优秀
4
8
12
学习成绩不优秀
16
2
18
总计
20
10
30
附表:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
经计算K2的观测值k=10,则下列选项正确的是( )
A.有99.5%的把握认为使用智能手机对学习有影响
B.有99.5%的把握认为使用智能手机对学习无影响
C.有99.9%的把握认为使用智能手机对学习有影响
D.有99.9%的把握认为使用智能手机对学习无影响
答案 A
解析 由于K2的观测值k=10>7.879,其对应的值0.005=0.5%,
据此结合独立性检验的思想可知:
有99.5%的把握认为使用智能手机对学习有影响.
跟踪演练3
(1)(2019·长春质检)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:
厘米),上图为选取的15名志愿者身高与臂展的折线图,下图为身高与臂展所对应的散点图,并求得其回归方程为
=1.16x-30.75,以下结论中不正确的为( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
答案 D
解析 A项,身高极差大约为20,臂展极差大于等于25,故正确;
B项,很明显根据散点图以及回归直线得到,身高矮臂展就会短一些,身高高一些,臂展就长一些,故正确;
C项,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但不是准确值,故正确;
D项,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故说法不正确.
(2)(2019·泸州模拟)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线城市
一线城市
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
附表:
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
由K2=
计算得,
K2的观测值k=
≈9.616,
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
答案 C
解析 由题意知,
K2的观测值k≈9.616>6.635,
∴有99%以上的把握认为“生育意愿与城市级别有关”.
真题体验
1.(2019·全国Ⅰ,文,6)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生B.200号学生
C.616号学生D.815号学生
答案 C
解析 根据题意,系统抽样是等距抽样,
所以抽样间隔为
=10.
因为46除以10余6,
所以抽到的号码都是除以10余6的数,
结合选项知,616号学生被抽到.
2.(2018·全国Ⅰ,文,3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
新农村建设前
新农村建设后
新农村建设后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+第三产业收入
(30%+6%)a=36%a
(30%+28%)×2a=116%a
超过经济收入2a的一半
D对
故选A.
3.(2018·全国Ⅲ,文,14)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
答案 分层抽样
解析 因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.
押题预测
1.某市气象部门根据2018年各月的每天最高气温平均值与最低气温平均值(单位:
℃)数据,绘制如下折线图:
那么,下列叙述错误的是( )
A.各月最高气温平均值与最低气温平均值总体呈正相关
B.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
C.全年中各月最低气温平均值不高于10℃的月份有5个
D.从2018年7月至12月该市每天最高气温平均值与最低气温平均值都呈下降趋势
答案 D
解析 由2018年各月的每天最高气温平均值和最低气温平均值(单位:
℃)数据,绘制出折线图,可知:
A项,各月最高气温平均值与最低气温平均值总体呈正相关,故A正确;B项,由图可知全年中,2月的最高气温平均值与最低气温平均值的差值最大,故B正确;C项,全年中各月最低气温平均值不高于10℃的月份有1月、2月、3月、11月、12月,共5个,故C正确;D项,从2018年7月至12月该市每天最高气温平均值与最低气温平均值中,7月至8月呈上升趋势,故D错误.
2.给出如下列联表
患心脏病
患其他病
总 计
高血压
20
10
30
非高血压
30
50
80
总 计
50
60
110
P(K2≥10.828)≈0.001,P(K2≥6.635)≈0.010,参照公式k=
,得到的正确结论是( )
A.有99%以上的把握认为“高血压与患心脏病无关”
B.有99%以上的把握认为“高血压与患心脏病有关”
C.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病无关”
D.在犯错误的概率不超过0.1%的前提下,认为“高血压与患心脏病有关”
答案 B
解析 由列联表中的数据可得K2的观测值
k=
≈7.486>6.635,
根据参考数据
P(K2≥6.635)≈0.01,P(K2≥10.828)≈0.001,
所以有1-0.01=99%的把握认为高血压与患心脏病有关,
即有99%的把握认为高血压与患心脏病有关.
3.某设备的使用年数x与所支出的维修总费用y的统计数据如下表:
使用年数x(单位:
年)
2
3
4
5
6
维修总费用y(单位:
万元)
1.5
4.5
5.5
6.5
7.5
根据上表可得线性回归方程为
=1.4x+
.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用________年.
答案 8
解析 因为
=
=4,
=
=5.1,
故代入线性回归方程可得
=5.1-1.4×4=-0.5,
所以线性回归方程为
=1.4x-0.5,
当y=12时,解得x≈8.9.
A组 专题通关
1.(2019·河北省五个一名校联盟联考)经调查,某市骑行共享单车的老年人、中年人、青年人的比例为1∶3∶6,用分层抽样的方法抽取了一个容量为n的样本进行调查,其中中年人数为12人,则n等于( )
A.30B.40
C.60D.80
答案 B
解析 由题设老年人和青年人人数分别为x,y,
由分层抽样得x∶12∶y=1∶3∶6,解得x=4,y=24,则n=4+12+24=40.
2.某校李老师本学期负责高一甲、乙两个班的数学课,两个班都是50个学生,如图反映的是两个班的本学期5次数学测试中的班级平均分对比情况,根据图中信息,下列结论不正确的是( )
A.甲班的数学平均成绩高于乙班
B.乙班的数学成绩没有甲班稳定
C.下次测试乙班的数学平均分高于甲班
D.在第1次测试中,甲、乙两个班总平均分为78
答案 C
3.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5B.0.6C.0.7D.0.8
答案 C
解析 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为
=0.7.
4.某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2400名学生中抽取30人进行调查.现将2400名学生随机地从1~2400编号,按编号顺序平均分成30组(1~80号,81~160号,…,2321~2400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是( )
A.416B.432C.448D.464
答案 A
解析 设第n组抽到的号码是an,则{an}构成以80为公差的等差数列,
所以a3=a1+80×2=160+a1,
a4=a1+80×3=240+a1,
所以a3+a4=2a1+80×5=432,解得a1=16,
所以a6=16+80×5=416.
5.(2019·郑州质检)若1,2,3,4,m(m∈R)这五个数的平均数等于其中位数,则m等于( )
A.0或5B.0或
C.5或
D.0或5或
答案 D
解析 易知1,2,3,4,m(m∈R)这五个数的平均数为
=
,
当m≤2,其中位数为2,则
=2,解得m=0;
当m≥3,其中位数为3,则
=3,解得m=5;
当2=m,解得m=
.
6.(2019·长春质检)下列命题:
①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③在线性回归方程
=-0.5x+2中,当解释变量x每增加一个单位时,预报变量
平均减少0.5个单位;④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中正确命题的个数是( )
A.1B.2C.3D.4
答案 C
解析 对于①,在回归分析模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好,正确,因为相关指数R2越大,则残差平方和越小,模型的拟合效果越好,①正确;
对于②,两个变量相关性越强,则相关系数的绝对值就越接近于1;
对于③,在线性回归方程
=-0.5x+2中,当解释变量x每增加一个单位时,预报变量
平均减少0.5个单位,正确;
对于④,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大,错误,因为在对分类变量X与Y进行独立性检验时,随机变量K2的观测值k越大,则“X与Y相关”的可信程度越大,故④错误.故选C.
7.(2019·衡水质检)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在[40,90]之间,其得分的频率分布直方图如图所示,则下列结论错误的是( )
A.得分在[40,60)之间的共有40人
B.从这100名参赛者中随机选取1人,其得分在[60,80)的概率为0.5
C.估计得分的众数为55
D.这100名参赛者得分的中位数为65
答案 D
解析 根据频率和为1,计算(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,
得分在[40,60)的频率是0.40,估计得分在[40,60)的有100×0.40=40人,A正确;
得分在[60,80)的频率为0.5,可得从这100名参赛者中随机选取一人,得分在[60,80)的概率为0.5,B正确;
根据频率分布直方图知,最高的小矩形对应的底边中点为
=55,即估计众数为55,C正确.
8.(2019·济宁模拟)如图为某市国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:
套)与成交量(单位:
套)作出如下判断:
①日成交量的中位数是16;②日成交量超过日平均成交量的有2天;③认购量与日期正相关;④10月7日认购量的增幅大于10月7日成交量的增幅.则上述判断正确的个数为( )
A.0B.1C.2D.3
答案 A
解析 7天假期的楼房认购量为91,100,105,107,112,223,276;
成交量为:
8,13,16,26,32,38,166.
对于①,日成交量的中位数是26,故错误;
对于②,日平均成交量为
≈42.7,有1天日成交量超过日平均成交量,故错误;
对于③,根据图形可得认购量与日期不是正相关,故错误;
对于④,10月7日认购量的增幅小于10月7日成交量的增幅,故错误.
9.(2019·广东天河区普通高中测试)为保证树苗的质量,林业管理部门在每年3月12日植树节前都对树苗进行检测,现从甲、乙两种树苗中各抽测了10株树苗的高度(单位:
cm),其茎叶图如图所示,则下列描述正确的是( )
A.甲种树苗的平均高度大于乙种树苗的平均高度,甲种树苗比乙种树苗长得整齐
B.甲种树苗的平均高度大于乙种树苗的平均高度,乙种树苗比甲种树苗长得整齐
C.乙种树苗的平均高度大于甲种树苗的平均高度,乙种树苗比甲种树苗长得整齐
D.乙种树苗的平均高度大于甲种树苗的平均高度,甲种树苗比乙种树苗长得整齐
答案 D
解析 由茎叶图中的数据,可得甲、乙两种树苗抽取的样本高度分别为
甲:
19,20,21,23,25,29,31,32,33,37,
乙:
10,10,14,26,27,30,44,46,46,47,
由已知易得,
甲=
=27,
乙=
=30,
由茎叶图易得s
,
所以乙种树苗的平均高度大于甲种树苗的平均高度,
甲种树苗比乙种树苗长得整齐.
10.利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好该项运动,得出2×2列联表,由计算可得K2≈8.806.
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
参照附表,得到的正确结论是( )
A.