ImageVerifierCode 换一换
格式:DOC , 页数:19 ,大小:2.23MB ,
资源ID:145450      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-145450.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(高一数学《概率与统计》.doc)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

高一数学《概率与统计》.doc

1、概率默统计类第6讲 6.1随机抽样考点1:抽样方法知识点睛一随机抽样随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:1简单随机抽样:从元素个数为的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样简单随机抽样是最简单、最基本的抽样方法抽出办法:抽签法:用纸片或小球分别标号后抽签的方法随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表表中每一位置出现各个数字的可能性相同随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法简单随机抽样必须具备

2、下列特点:简单随机抽样要求被抽取的样本的总体个数是有限的简单随机样本数小于等于样本总体的个数简单随机样本是从总体中逐个抽取的简单随机抽样是一种不放回的抽样简单随机抽样的每个个体被抽取的可能性均为样本获取分为两种,一种是全面统计,一种是样本统计全面统计的例子非常多,比如美国大选,每个州的选民都是通过投票选出每个州的负责人也就是每个人都表达了自己的意见再比如我们调查学生是海淀还是非海淀,我们也是给每个学生打了电话,访谈出结果,每个同学也都表达了自己的意见再比如一些小事,像一群人中午的时候讨论去哪吃饭,每个人都可以说自己喜欢的地方全面统计的好处在于无遗漏,数据准确无偏差,但是缺点也很明显,那就是非常

3、的繁琐、麻烦对于大数据的处理很无力,所以我们需要有样本统计样本统计的意义就是从一个大数据中抽取数据样本分析,通过对样本的分析来估计原数据的性质于是首要的问题就是如何抽样一个合理的抽样方法的基本要求是“平等”,也就是每个个体被抽取的可能性是相同的比如我们发现,老师选出的学生代表很可能不能真正代表全体同学的意见,因为老师选取的一定是自己比较熟悉的学生,这类学生平时一定非常活跃而对于一些比较内向,“存在感”比较低的同学来说,老师可能就不会关注,被选中的可能性就会降低由此可以推知,人为的抽样一般是不靠谱的再比如,现在很多的新闻都有网上的调查,有的媒体通过网上调查的数据来分析广大人民对新闻的反馈这样的调

4、查也是不靠谱的,因为网上调查反映出来的大多是经常上网的人的意见,而对于平时不上网的人就没有调查,所以这样的抽样也是不合理的最常见的合理抽样方式是“抓阄”,这可以保证每个个体都能“等可能”的被选中当然抓阄的方式有很多,比如很多时候我们不需要每个人都去抓一次,我们可以把每个人编一个号,然后由一个人来抽号就可以了比如我们常见的彩票大致就是这个原理不过需要注意的是彩票里面的等可能是对彩票是等可能的,对人不一样,因为一个人可以买很多彩票老师在讲完简单随机抽样后可以让学生做例1的【铺垫】,本小题主要是让学生理解什么是总体,什么是个体,什么是样本容量,因为简单随机抽样比较简单,而且在后边要讲的系统抽样和分层

5、抽样中都要用到,所以这里就不再详细讲解了2 系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样抽出办法:从元素个数为的总体中抽取容量为的样本,如果总体容量能被样本容量整除,设,先对总体进行编号,号码从到,再从数字到中随机抽取一个数作为起始数,然后顺次抽取第个数,这样就得到容量为的样本如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样系统抽样时,当总体个数恰好是样本容量的整数倍时,取;若不是整数时,先从总体中随机地剔除几个个体,使得总体

6、中剩余的个体数能被样本容量整除因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍然相等为随着数量的增大,抓阄的方式效率会比较低当然,随着现在计算机的发展,数据量很大的时候也是可以通过“选号”的方式进行随机抽样课本上提到的系统抽样其实现在已经不怎么使用了不过作为传统意义下的抽样方法,我们还是有必要介绍一下系统抽样的核心是“选出代表”,每个代表会直接代表一个群体的意见系统抽样的方式分为两种,一种是横向抽样,也就是我们教科书上的抽样方式,这种例子非常多,比如军训的时候,可能我们出现过“一到三”报数,这样就把我们分成了“一”“二”“三”三个组,然后就可以随机选一个数“一”,然后所有

7、的“一”就被选中了同样的道理,我们对人,选取一个人的样本,那么我们就需要把总数分成组,每组个人,然后让第一组的人抓阄(为的是随机抽样),比如“”抓到,那么每一组的“”就被选中了另一种系统抽样的方式是“纵向抽样”,它出现的原理是这样的:原始的系统抽样方法会造成直观上的不公平比如我们人里面选人去叙利亚旅游,大家肯定都不愿意去,第一组的人抓阄之后,由于第一组的号被选中,那么每一组的号就都被选中了,其他组的号会认为被第一组的号连累,因为他们是“被”选中的虽然从可能性上说,这没有道理,不过直观上确实有点“躺枪”的意思于是人们改变了方式,也就是纵向系统抽样比如现在我们还是人里面选人去叙利亚,我们把所有人分

8、成组,每组人,然后每组自行推举一个代表上台抓阄,被选中的人所在的组,整组都被选中这样我们每个组都有人去抓阄,也就实现了直观上的公平但是在可能性的角度,横向和纵向抽样都是“等可能”的,没有本质区别老师在讲完系统抽样后就可以让学生做例1的铺垫,例1以及尖子班拓展,这几个题都是系统抽样,老师可以选择几个让学生做做,不一定都让学生做,老师自己选择3 分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样分层抽样的样本具有较强的代表性,而且各层抽

9、样时,可灵活选用不同的抽样方法,应用广泛简单随机抽样(抓阄)和系统抽样都是绝对意义上的公平,但是分层抽样就是相对意义上的公平,因为我们人为的干扰了抽样的过程不过现实意义之下我们统计数据必须进行分层,否则统计数据会闹出笑话常见的一个就是我家房子平米,后来搬过来一个邻居,房子面积是平米,那么我家的生活状况有没有改变实际上没有,但是统计数字可能告诉你,你们的平均面积增加了现实生活中,很多的统计需要分层,比如统计收入水平的时候需要分不同的城市,统计生育问题的时候要分城市和农村,统计化妆品消费水平的时候要分性别等等所以分层抽样就是为了保证每个层面上的公平性,我们按照每个层次占到总体的多少来分配选取的比例

10、这里老师可以开发更多的统计实例,一定要讲出现实意义来老师在讲完分层抽样后可以让学生做例1的铺垫,例1以及目标班专用,让学生熟练掌握分层抽样,因为在以后考试和北京高考中,三个抽样重点考察分层抽样老师在讲完三个抽样后一定要让学生明白什么情况下用什么抽样,这个时候就可以让学生做例1,尖子班拓展经典精讲【铺垫】 为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有( )个名运动员是总体;每个运动员是个体;所抽取的名运动员是一个样本;样本容量为;每个运动员被抽到的概率相等A B C D 从编号为的枚最新研制的某种型号的导弹中随机抽取枚来进行发射实验,若采用每部分选取的

11、号码间隔一样的系统抽样方法,则所选取枚导弹的编号可能是( )A B C D 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有种、种、种、种,现从中抽取一个容量为的样本进行食品安全检测若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A B C D【解析】 B;正确,错误 B; C;【例1】 三种抽样现有以下两项调查:某装订厂装订图书册,要求检验员从中抽取册图书,检查其装订质量状况;某市有大型、中型与小型的商店共家,三者数量之比为为了调查全市商店每日零售额情况,抽取其中家进行调查完成、这两项调查宜采用的抽样方法依次是( )A简单随机抽样法,分层抽样法 B

12、分层抽样法,简单随机抽样法C分层抽样法,系统抽样法 D系统抽样法,分层抽样法用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1160编号,按编号顺序平均分成20组(号,号,号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是 某工厂生产、三种不同型号的产品,产品数量之比依次为现用分层抽样方法抽出一个容量为的样本,样本中种型号产品有件那么此样本的容量 (目标班专用)某校有名学生,型血的有人,型血的有人,型血的有人,为了研究血型与色弱有没有关系,要从中抽取一个人的样本,按分层抽样,型血应抽取的人数为 人【解析】 D;是系统抽样;明显是分层抽样; ;不妨设

13、第1组抽出的号码为,则第16组应抽出的号码是, ;种型号的产品占总体的比例是,则样本容量 该学校型血的人数为,按照分层抽样的抽样比相等得:,解得,即型血应抽取的人数为人6.2用样本估计总体学习了抽样后,需要对收集的这些有代表性的样本数据进行研究,找出有用的信息,然后用这些样本来估计总体这种估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征用来估计的图表和方法有很多种,本版块在初中的基础上来学习频率分布直方图、茎叶图和方差考点2:频率分布直方图知识点睛1列出样本数据的频率分布表和频率分布直方图的步骤:计算极差:找出数据的最大值与最小值,计算它们的差

14、;决定组距与组数:取组距,用决定组数;决定分点:决定起点,进行分组;列频率分布表:对落入各小组的数据累计,算出各小组的频数,除以样本容量,得到各小组的频率绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图,知小长方形的面积组距频率2频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义3总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线总体密度曲线精确地反映了一个总体在各个区域内取值的规律这里主要

15、介绍的就是样本分析方法,直方图就是很重要的一种其实直方图的形成过程就是把数据按大小排序,然后分段截取数据实际生活中最常见的方法就是“画正字”,比如我们收到了一组数据是学生的跳绳次数,我们就可以把次数分成若干组,然后一个一个数据看落在了哪个组里,利用“画正字”的方式看出每组里有几个数,最后画出直方图直方图的主要作用是看出数据的分布变化趋势,很容易表示大量数据,缺点是原始数据不能在图上表示出来通过例2的学习,让学生可以由给出的频率分布直方图算出各组数据的频率和频数,理解横纵坐标代表的意义频率分布折线图和总体密度曲线不需要深究,在频率分布直方图的基础上,简单介绍即可经典精讲【例2】 频率分布直方图某

16、棉纺厂为了了解一批棉花的质量,从中随机抽取了根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间中,其频率分布直方图如图所示,则其抽样的根中,长度在内的频率为_,有_根棉花纤维的长度小于(目标班专用)某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从频率分布直方图中可分析出

17、和分别为( )A,35B,45C,35D,45【解析】 ,;由频率分布直方图可得,长度在内的频率为棉花纤维长度小于20mm的频率为则棉花纤维长度小于20mm的频数为根 (目标班专用)A考点3:茎叶图知识点睛当样本数据较少时,可以用样本分析的另一个常用图表方法茎叶图,这个图主要作用是两组数据的对比一左一右很容易估计出两组数据的对比状况,而且茎叶图是把所有的数据都列出来,精确性上比直方图要好一点,但是对于数据特征的分析不如直方图直观可以结合铺垫讲解知识点,并简单复习一下初中学过的中位数、平均数的概念1制作茎叶图的步骤:将数据分为“茎”、“叶”两部分;将最大茎与最小茎之间的数字按大小顺序排成一列,并

18、画上竖线作为分隔线;将各个数据的“叶”在分界线的一侧对应茎处按一定次序同行列出“按一定次序”一般是按大小顺序,也可以按统计数据的顺序2平均数:平均数是指在一组数据中所有数据之和再除以数据的个数中位数:是指将统计总体当中的各个数据值按大小顺序排列起来,形成一个数列,处于数列中间位置的数据值就称为中位数当数列的项数为奇数时,处于最中间位置的数据值即为中位数;当项数为偶数时,中位数则为处于中间位置的两个数据值的平均数经典精讲【铺垫】某班甲、乙两学生的高考备考成绩如下:甲:乙:用茎叶图表示两学生的成绩;分别求两学生成绩的中位数和平均分【解析】 两学生成绩的茎叶图如图所示将甲、乙两学生的成绩从小到大排列

19、为:甲:,乙:从以上排列可知甲学生成绩的中位数为,乙学生成绩的中位数为甲学生成绩的平均数为,乙学生成绩的平均数为【例3】 茎叶图随机抽取某中学甲,乙两班各名同学,测量他们的身高(单位:),获得身高数据的茎叶图如图,则下列关于甲,乙两班这名同学身高的结论正确的是( )A甲班同学身高在以上的人数较多B甲班同学身高的中位数较大C甲班同学身高的平均值较小D甲、乙班同学身高的平均值一样大【解析】 C;甲班同学身高175以上的有3人,乙班有4人,故而A错误甲班同学身高的中位数为169,乙班同学身高的中位数为故而B错误容易计算得知,故C对考点4:统计数据的数字特征分析样本数据时,我们已经学过了众数、中位数和

20、平均数这些概念,它们都可以用来表示统计数据的特征信息,各有利弊平均数是统计数据一个非常好的特征,它可以利用所有的样本数据,而且比较好算也正因为平均数利用了所有的数据,所以它容易受到一些极端数据的影响比如歌唱比赛时,去掉一个最高分和一个最低分,然后再平均,就是为了避免出现个别评委的极端喜恶,尽量体现评分的准确和公正性再比如公布一个地区的家庭平均收入时,平均数也掩盖了一些极端情况的存在,而这些是不容忽视的怎么样能反映这些极端情况呢,也就是数据的离散程度呢,从运算方便等各方面考虑,引入了方差或标准差来进行衡量知识点睛统计数据的数字特征1用样本平均数估计总体平均数;用样本标准差估计总体标准差:2数据的

21、离散程度可以用极差、方差或标准差来描述:极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度;样本方差描述了一组数据围绕平均数波动的大小,样本的标准差是方差的算术平方根一般地,设样本的元素为,样本的平均数为,定义样本方差为,样本标准差,简化公式:这部分其实没有真正的考察,现在最多也就是通过样本的特征直接套用在整体数据上 寒假班对方差只需要初步理解它存在的意义即可,对方差的直观理解放在春季同步班讲解经典精讲【例4】 方差甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表, 分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( )甲的成绩乙的成绩丙的成绩环数

22、78910环数78910环数78910频数5555频数6446频数4664ABCD【解析】 B;根据题中数据计算;同理得 6.3随机事件概率概率的定义是一个漫长的过程,最开始就是根据经验,对统计事实的认识历史上对概率的理解可以分为三个阶段:第一阶段:大量统计中发生的几率有 多大比如很多数学家都玩过“扔硬币”这个游戏,而且还统计了结果,如图大家发现,扔了很多很多次之后,结 果都差不多是正反面各占一半,所以大家认为硬币出正面的概率是可能有人觉得这个做法很无聊,但是这只是概率的现象,是一个结果层面的东西,并不是概率的本质不过现在计算机在估计概率的时候也是用这样的方法进行多次的实验,最终估计出一个结果

23、第二阶段:人们开始想一些复杂的问题这里面著名的问题有两个,一个是赌徒分金问题(注:两个赌徒玩掷硬币,规定正面则甲加一分,反面则乙加一分,谁先得到分谁就可以赢得一袋金币,现在进行到甲乙,警察来了,说不让赌了,那么这些金币该怎么分(【解析】按照的比例分;假设警察没有来,则乙赢的概率为:,甲赢的概率为:,应该按照的比例分金币),另一个问题是掷两个骰子,至少有一个的概率(【解析】:)这些问题基本上是很难通过实验来得出结论,毕竟情景比较复杂,这就促使人们要从概率的理论角度入手解决费马在概率的定义方面做出了杰出的贡献,因为他引入了“等可能”这个概念就是我们需要先认同一些基本的“等可能”的条件,然后再由此出

24、发考虑复杂情况第三阶段:古典概型有弊端,因为古典概型的必然要求是要把一个事件分解成若干等可能的基本事件,不过有些问题中这件事是做不到的比如打靶问题所以才有了几何概型这个概念之后随着函数论的发展,我们用函数基础定义概率的时候我们就有了新的概率理论后续的离散型随机变量说的就是这个阶段的问题建议老师在一开始教学的时候强化概率的直观解释比如:掷硬币模型,再比如:猜黑白(俗称手心手背)其实这就是利用了概率均等的原理进行的我们可以想一想,手心手背其实是很有效的一个等概率选取方式另外,猜拳也是一个非常有效的等概率选取方式这些概率其实挺难算的,不过我们可以让学生直观的理解概率的意义同样的问题还有:【趣题】1甲

25、乙两个人去公园,公园有个景点,在这个景点中两个人各自独立的选取个,假定甲和乙同时出发,游览每一个景点的时间都是相同的,那么他们在最后一个景点相遇的概率是多少?【解析】下面有三种方法,老师在给学生讲本讲的时候可以讲法一,法二和法三供老师参考:法一:从概率意义的直观理解,考虑甲最后在的一个景点,乙最后在任何一个景点的可能性相同,恰好在甲所在的景点的概率为法二:甲最后一个景点为号景点的概率都为,乙最后一个景点为号景点的概率也为,故他们最后一个景点为同一个景点的概率为法三:他们参观景点的所有顺序有种,每种参观景点的顺序出现的可能性相同,故在最后一个景点相遇的情况有,故所求概率为2华约的自招考题:个人传

26、球,每个人都等概率的传给其他人,由甲开始第一次传球,设为传球次数,次传球后球在甲手里的概率记为,问当趋向于无穷的时候,趋向于多少?【解析】下面有两种方法,老师在给学生讲本题的时候可以讲法一,法二供老师参考: 法一:从概率意义的直观理解,因为每个人都等可能的传给其他人,所以球在甲手里的概率为,传次球后球在甲手里的概率依然为法二:记表示事件“经过次传球后,球在甲手中”,则有,所以与的关系式为, 设,对比得于是式可以变形为,从而是公比为的等比数列,其首项为故有, 由可得另外还可以介绍一些概率不能直观解释的例子:比如生日悖论:世界上任取个人,他们至少有两个人生日在同一天的概率是多少?请见下图(转自维基

27、百科)由此可见,当取到个人的时候,概率已经超过了,选取人的时候,概率应该在左右还有一个例子:乒乓球体育比赛中规定:如果双方得分是,那么一方至少要得分才能获胜,也就是至少比对方多两分那么这种“延球”制相对于没有延球制度,到底是对强者更有利,还是帮助弱者有更大的机会翻身呢?(【解析】延球制度对强者更有利;假设强者很强,则再比赛一局有可能强者胜也有可能弱者胜,但是再比赛两局或者比赛无穷多局,肯定是强者赢的概率更大),这些其实都是通过直观解释概率比较复杂的问题接下来我们可以定义事件:考点5:随机事件的概率知识点睛一事件1必然现象与随机现象必然现象是在一定条件下必然发生某种结果的现象;随机现象是在相同条

28、件下,很难预料哪一种结果会出现的现象例子:判断以下现象是否为随机现象某路口单位时间内通过“宝马”牌轿车的车辆数;边形的内角和为;某同学竞选学生会主席成功;一名篮球运动员每场比赛所得的分数答案:是随机现象2试验:我们把观察随机现象或为了某种目的而进行的实验统称为试验,把观察结果或实验的结果称为试验的结果一次试验是指事件的条件实现一次3事件在同样的条件下重复进行试验时,始终不会发生的结果,称为不可能事件;在每次试验中一定会发生的结果,称为必然事件;在试验中可能发生,也可能不发生的结果称为随机事件通常用大写英文字母来表示随机事件,简称为事件建议老师和学生强调,我们其实可以把任何一件事情看成一个事件,

29、但是我们必须把事件说的准确比如我们不能说抛硬币是一个事件,而“抛一次硬币出现了正面”才是一个事件,因为这样我才能定义这个事件的概率再比如说我们不能说“掷骰子”是一个事件,我们必须说“掷一次骰子出现了偶数”是一个事件简单的说就是我们对事件的描述必须是准确的,有结果的基本事件放到古典概型里再讲,老师在讲完事件后就可以让学生做例5,这道题是考查事件的二随机事件的概率计算1如果事件同时发生,我们记作,简记为;2概率的统计定义:一般地,在次重复进行的试验中,事件发生的频率,当很大时,总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做事件的概率,记为从概率的定义中,我们可以看出随机事件的概率满足:当是必然事件时,当是不可能事件时,3互斥事件与事件的并互斥事件:不可能同时

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2