概率论与数理统计案例.doc
《概率论与数理统计案例.doc》由会员分享,可在线阅读,更多相关《概率论与数理统计案例.doc(47页珍藏版)》请在冰点文库上搜索。
概率论与数理统计案例
概率论部分:
案例1邮局开设多少服务窗口合理
案例2国家邮政局发行贺年(有奖)明信片的利润计算
案例3彩民获奖的概率问题
案例4人寿保险问题
案例5免费抽奖问题
案例6双色球彩票中奖概率的理论计算与验证
案例7公交大巴车门高度如何设计
案例8怎样由脚印长度估计罪犯身高
案例9生日问题
案例10排队等待问题
案例11传送带效率问题
案例12商品订货
案例13交货时间为随机变量的存贮模型。
案例14轧钢问题续集
案例15销售量为随机的存储模型(报童卖报问题)
案例16到货时间为随机的存储模型(报童卖报问题)
案例17随机性人口模型
案例18捕鱼问题
案例19足球门的危险区域
案例20利用蒙特卡洛方法(随机模拟)计算积分
统计部分
案例21计算常用描述性统计量,绘制常用统计图
案例22卡方分布问题:
案例23工程师的建议是否应采纳
案例24化妆品销售量的预测
案例25假设检验(配对样本的t检验,本题目源于2012年全国大学生数学建模竞赛A题)
案例26气候预测
案例27蠓虫的分类模型
案例1邮局开设多少服务窗口合理
某居民区有n个人,设有一个邮局,开m个服务窗口,每个窗口都在办理所有业务。
m太小则经常排长队。
m太大又不经济。
假定在每一指定时刻,这n个人中每一个是否去邮局是独立的。
每个人在邮局的概率都是p。
现要求“在营业中任一时刻每个窗口的排队人数(包括正在被服务的那个人)不超过s”这个事件的概率不小于(一般取)则至少需开设多少窗口?
利用伯努利分布解决这个问题
设事件
由题设条件知
由于为两两互斥事件。
故
找一个最小的自然数,使上面不等式成立。
此就是问题的答案。
案例2国家邮政局发行贺年(有奖)明信片的利润计算
有一张某年邮政贺年(有奖)明信片的奖号“E03组586897”可知:
编号000001到999999是一组,同一英文字母打头的估计可达99组,而英文字母有26个,最多可有99=2574组。
经摇奖后,每组中奖号码是:
一等奖(3000元)768691929617009949
二等奖(1000元)3379378768
三等奖(300元)61222258
四等奖(50元)127
五等奖(4元)46
纪念奖(0.5元邮票)7
有奖明信片每张售价0.5元,普通明信片售价0.25元(算作有奖明信片的成本)。
下面计算国家邮政局在这个项目上将获利多少。
设随机变量为每张明信片可能获得的奖金额,则其分布律为(n=999999)
0.5
4
50
300
1000
3000
P
于是每张明信片的期望奖金为
邮政局从每张明信片上平均能赚:
0.5-0.299-0.25=0.021(元)
在整个项目上将能获利:
0.021(万元)
案例3彩民获奖的概率问题
近年来“彩票飓风”席卷中华大地,巨额诱惑使越来越多的人加入到“彩民”的行列,目前流行的彩票主要有“传统型”和“乐透型”两种类型。
“传统型”采用“10选6+1”方案:
先从6组0~9号球中摇出6个基本号码,每组摇出一个,然后从0~4号球中摇出一个特别号码,构成中奖号码。
投注者从0~9十个号码中任选6个基本号码(可重复),从0~4中选一个特别号码,构成一注,根据单注号码与中奖号码相符的个数多少及顺序确定中奖等级。
以中奖号码“abcdef+g”为例说明中奖等级,如表一(X表示未选中的号码)。
表一
中奖
等级
10选6+1(6+1/10)
基本号码特别号码
说明
一等奖
abcdefg
选7中(6+1)
二等奖
abcdef
选7中(6)
三等奖
abcdeXXbcdef
选7中(5)
四等奖
abcdXXXbcdeXXXcdef
选7中(4)
五等奖
abcXXXXbcdXXXXcdeXXXXdef
选7中(3)
六等奖
abXXXXXbcXXXXXcdXXXXXdeXXXXXef
选7中
(2)
“乐透型”有多种不同的形式,比如“33选7”的方案:
先从01~33个号码球中一个一个地摇出7个基本号,再从剩余的26个号码球中摇出一个特别号码。
投注者从01~33个号码中任选7个组成一注(不可重复),根据单注号码与中奖号码相符的个数多少确定相应的中奖等级,不考虑号码顺序。
又如“36选6+1”的方案,先从01~36个号码球中一个一个地摇出6个基本号,再从剩下的30个号码球中摇出一个特别号码。
从01~36个号码中任选7个组成一注(不可重复),根据单注号码与中奖号码相符的个数多少确定相应的中奖等级,不考虑号码顺序。
这两种方案的中奖等级如表二。
表二
中奖
等级
33选7(7/33)
36选6+1(6+1/36)
基本号码特别号码
说明
基本号码特别号码
说明
一等奖
●●●●●●●
选7中(7)
●●●●●●★
选7中(6+1)
二等奖
●●●●●●○★
选7中(6+1)
●●●●●●
选7中(6)
三等奖
●●●●●●○
选7中(6)
●●●●●○★
选7中(5+1)
四等奖
●●●●●○○★
选7中(5+1)
●●●●●○
选7中(5)
五等奖
●●●●●○○
选7中(5)
●●●●○○★
选7中(4+1)
六等奖
●●●●○○○★
选7中(4+1)
●●●●○○
选7中(4)
七等奖
●●●●○○○
选7中(4)
●●●○○○★
选7中(3+1)
注:
●为选中的基本号码;★为选中的特别号码;○为未选中的号码。
参考答案:
彩票方案可将其分为四类,:
10选6+1(6+1/10)型、:
选型、:
选型和:
选无特别号型,分别给出各种类型方案的彩民获各奖项的概率公式:
----彩民中第等奖的概率,;
:
10选6+1(6+1/10)型
,,
:
选型
,,,,
,,。
:
选型
,,,,
,,。
:
选无特别号型
,,,,。
各种方案的各个奖项获奖概率及获奖总概率计算如下表:
方案
6+1/10
2×10-7
8×10-7
1.8×10-5
2.61×10-4
3.42×10-3
4.1995×10-2
-----
0.045695
7/29
6.40705×10-7
4.48494×10-6
9.4184×10-5
2.8255×10-4
2.8255×10-3
4.7092×10-3
0.029825
0.037742
6+1/29
6.40705×10-7
1.4096×10-5
8.4573×10-5
8.8880×10-4
2.2200×10-3
1.4800×10-2
0.019734
0.037742
7/30
4.91207×10-7
3.43845×10-6
7.5646×10-5
2.2694×10-4
2.3828×10-3
3.9714×10-3
0.026476
0.033137
7/31
3.80290×10-7
2.66203×10-6
6.1227×10-5
1.8368×10-4
2.0205×10-3
3.3675×10-3
0.023572
0.029208
7/32
2.97101×10-7
2.07971×10-6
4.09913×10-5
1.4974×10-4
1.722×10-3
2.8700×10-3
0.021047
0.025832
7/33
2.34080×10-7
1.63856×10-6
4.0964×10-5
1.2289×10-4
1.4747×10-3
2.4578×10-3
0.018843
0.022941
7/34
1.85887×10-7
1.30121×10-6
3.3831×10-5
1.0149×10-4
1.2687×10-3
2.1145×10-3
0.016916
0.020436
7/35
1.48709×10-7
1.04097×10-6
2.8106×10-5
8.4318×10-5
1.0961×10-3
1.8269×10-3
0.015224
0.018261
7/36
1.19794×10-7
8.38556×10-7
2.3480×10-5
7.0439×10-5
9.5092×10-4
1.5849×10-3
0.013736
0.016367
6+1/36
1.19794×10-7
3.47402×10-6
2.0844×10-5
2.9182×10-4
7.2954×10-4
6.5659×10-3
0.008755
0.016367
7/37
9.71301×10-8
6.79911×10-7
1.9717×10-5
5.9152×10-5
8.2813×10-4
1.3802×10-3
0.012422
0.014710
6/40
2.6053×10-7
1.5632×10-6
5.1584×10-5
1.2896×10-4
2.0634×10-3
2.7512×10-3
0.028428
0.033425
5/60
1.831×10-7
9.155×10-7
4.9437×10-5
9.8874×10-5
2.6202×10-3
2.6202×10-3
0.045416
0.050806
案例4人寿保险问题
随着中国经济的突飞猛进,快速发展,人们越来越重视自身的健康保护,特别是人寿保险事业,在近十年的时间里从无到有,再到发展成具有现在的众多实力强劲保险公司。
人寿保险已经日益深入人心,购买人寿保险已经是人们自我保护和预防自身突发事件的一种重要的手段。
人们自然会问,自己交很少的钱,而一旦自己发生变故,保险公司会赔付超过自己所交保金百倍的赔偿金,那么保险公司会不会一次而赔本呢?
答案当然是否定的,否则保险公司不都会纷纷倒闭了么。
下面以某人寿保险公司的保费赔偿方式运用概率统计的方法分析。
在2500个同年龄段同社会阶层的人参加某保险公司的人寿保险。
以往的统计资料显示,在一年中,每个人死亡的概率为万分之一(0.0001)。
每个参加保险的人一年付给保险公司120元的保险费,而在死亡时其家属可从保险公司领取2万元。
分析以下几个问题:
保险公司亏本的概率;
保险公司一年获利不少于10万元的概率;
给出保险公司亏本的可能性分析。
参考解答:
设随机变量表示第个参保人的情况,即,因此服从两点分布,于是一年中死亡人数,又由于很大因此可用近似,若使用中心极限定理又近似有。
(1)
(2)
(3)分析参保人数与保险公司亏本的关系:
,近似有
令(十万分之一),
则,即,这就是说至少要有64个人参保才能保证人寿保险公司不会亏损。
注:
类似的也可分析保费设为多少比较合适或赔偿费设定为多少比较合适。
案例5免费抽奖问题
中国的市场经济日益繁荣昌盛,市场竞争越来越激烈,此时各大商家为了追求高利润,在竞争中立于不败之地,推出了各种各样的营销策略和促销手段,其中“免费抽奖”、“有奖酬宾”对消费者而言,颇具诱惑力和吸引力。
这确实是商家的让利销售呢?
还是“羊毛出在羊身上”呢?
请看某商家的具体操作程序:
第一步:
把该公司所有商品价格上扬30%,即原来卖100元的商品,现在卖130元;
第二步:
凡在该商场买100元商品者,可免费抽奖一次;
第三步:
抽奖方式:
箱中有20个球,10个白球,10个红球。
从中摸出10个球,根据所摸出的球的颜色确定中奖的等级,中奖的等级、物品和金额如下表所示:
(所有奖品均免费赠送)
等级
颜色
奖品
价值
1
10个白球或10个红球
电磁炉一台
1000元
2
1红9白或1白9红
不锈钢餐具一套
100元
3
2红8白或2白8红
沐浴露一瓶
30元
4
3红7白或3白7红
毛巾一条
5元
5
4红6白或4白6红
香皂一块
2元
6
5红5白
透明皂一块
1元
许多消费者看到头奖后急切的想消费一把,碰碰运气,结果如何呢?
多数人是拿着香皂或透明皂“悻悻然而去也”。
偶尔有人得个二等奖获三等奖,便被销售人员大肆宣传一番,煽动更多的人趋之若鹜。
请分析免费抽奖是否真的免费?
从概率的角度为消费者提供合理的建议。
参考解答:
各等级的中奖概率为:
;;;
;;.
用随机变量表示抽奖后的中奖金额,则平均中奖金额(元),
顾客购买100元的商品,由于提价的缘故,多付了23.08元,而中奖的期望仅仅为3.2元,可见还是“羊毛出在羊身上”,并且商家还因此获得了高利润。
消费者看到商家的抽奖促销时还是要三思而后行啊!
案例6双色球彩票中奖概率的理论计算与验证
中国福利彩票“双色球”开奖号码由6个红色球号码和1个蓝色球号码组成。
红色球号码从1~33中随机选择;蓝色球号码从1~16中随机选择。
游戏规则如表1.1-1所列。
表1.1-1双色球彩票的游戏规则
奖级
中奖条件
说明
红色球号码
蓝色球号码
一等奖
选6+1中6+1
二等奖
选6+1中6+0
三等奖
选6+1中5+1
四等奖
选6+1中5+0或4+1
五等奖
选6+1中4+0或3+1
六等奖
选6+1中2+1或1+1或0+1
试计算各等奖的中奖概率,收集多期开奖数据进行验证,并根据收集到的数据研究蓝色球号码的频率分布。
参考解答:
理论概率计算
用表示中得等奖,则各等奖的中奖概率分别为
验证
验证方法:
从网上查询某期开奖数据,计算各等奖的频率,与理论概率进行对比验证。
验证结果略。
蓝色球号码的频率分布
对2003年第1期至2009年第15期开奖数据的蓝色球号码统计如下:
取值
1
2
3
4
5
6
7
8
频数
50
57
57
41
56
46
52
43
频率
5.95%
6.79%
6.79%
4.88%
6.67%
5.48%
6.19%
5.12%
取值
9
10
11
12
13
14
15
16
频数
64
43
62
49
58
57
56
49
频率
7.62%
5.12%
7.38%
5.83%
6.90%
6.79%
6.67%
5.83%
注:
计算过程中需要借助于MATLAB软件。
案例7公交大巴车门高度如何设计
汽车设计手册中指出:
人的身高服从正态分布,根据各国统计资料,可得各国,各民族男子身高的。
对于中国人,现要求上下车时要低头的人不超过。
车门需要多高?
设大巴车门为为乘客的身高,则,根据题意
,即,
由,查表得
故即车门设计高度为1.9米即可。
案例8怎样由脚印长度估计罪犯身高
警察收集到的罪犯脚印,通过公式:
身高=脚印长度算出罪犯身高,此公式是如何推导出来的?
设一个人身高为X,脚印长度为Y。
作为二维随机变量(X,Y)来研究。
由于影响人类身高与脚印的随机因素是大量的,相互独立的,且各因素的影响又是微小的,可以叠加的。
故由中心极限定理知(X,Y)可以近似看成服的二维正态分布。
现已知罪犯的脚印长度y,要估计其身高就需要计算条件期望,
条件密度为
这是正态分布的密度函数,因此
如果按中国人的相应参数代入上式,即可得出以脚印作自变量的身高近似公式。
案例9生日问题
如果说你们班级里有50人,那么我愿意和你打赌,你们班级里至少有一对生日相同的人,你愿意站在我的反面和我打赌吗?
如果说你能够清楚的找到基本事件,分析好复杂事件包含了多少个基本事件,就能够通过有理数的除法计算出概率,当然,分析清楚基本事件不可缺少的就是一种顺序的观点,可能有时候,用顺序的观点看问题会产生一些不必要的麻烦,但是往往在你忽略了顺序的时候,产生了一种错觉,于是就是你的先进的思想在这里就因为你的大意退化到了中世纪以前的水平。
那么充分小心的你,可能也会犯错误,甚至会感到头疼,因为记数也是一门技术,不一定都很简单。
好了言归正传,我们仍然讨论这个关于生日的赌局。
我看起来是有着十分的把握(或者说接近十分的把握,因为十分就成了必然事件,显然,你看得出这个不是一个必然的事件,严格的说我有接近十分的把握),如果你曾经了解过一些关于这个问题的结论,你也可能不会愿意和我打赌,那么我们是如何来处理这个问题呢?
我们想通过来两个经典的案例来说明这个问题。
设有n个人,每个人都等可能的被分配到N个房间中的任意一间去住(n∈N)求下列事件的概率。
(1)指定的n个房间各有一个人住;
(2)恰好有n个房间,其中各住一个人.
先看清楚的问题是这个里面的基本事件是什么呢?
是把n个人随机的安排到N个房间里的所有的情况,分别记n个人为a1,a2,……,an,房间为A1,A2,……,AN每个安排的结果作为一个基本事件,比如,可以把所有的人放到房间A1里,把第一个房间里放一个人假定是a1,这个就是一个基本事件,也就是每个安排的结果都是一个基本事件。
那么有多少个这样的基本事件呢?
我们就得借助于乘法原理了,可以考虑到整个的安排是分步进行的,先安排a1,再安排a2,依次下去,这个中间的顺序是没有问题的,因为我们只关心某人在某个房间,而不关心他是先到还是后到。
第一个人可以有N个房间选住,第二个人仍然有N个房间选住,……也就是说每个人都有N种可能的情况,于是,所有的人的可能的情况就是N。
这就是基本事件的个数,这个里面也谈到了一个有关于顺序的问题,我们自行的把这个事件里面安排进了顺序,这是一个重要的思想方法,也是我们上次强调的重点,那么,用这个方法来解释关于袜子的顺序问题就简单得多了,只不过,你拿出的第一支袜子有三种情况,而第二次就只剩下两种了,与这里面的每个都是N种的选择方式不同。
接下来统计我们需要的有利事件的个数,我们要求是指定的n个房间各有一个人住,那么,关于这n个房间的安排问题就不用我们操心了,我们只是看一下人与房间的搭配问题,这似乎与选取袜子没有什么区别,于是,就可以得出概率:
再对这个问题进行总结,如果你再次的面临这种问题的时候,就要按号入座的找好谁是房子,谁是人。
或者我们也可以抽象一些,集合A有n个元素,集合B有N个元素,n∈N那么,从集合A到集合B的映射有多少个,就是相当于基本事件的个数,那么,我们的有利事件,就是从集合A到集合B的一个含有n个元素的确定的子集的一一映射的个数,就是n!
个,那么以后用映射的观点来处理就可以了,看看那一个问题是映射。
我们再来探讨第二个问题,看看两者之间的细微的差别是什么?
在第二个问题当中提到了一个“恰好”,我们如何来解释呢?
显然这个词是与“指定”构成对比的。
也就是强调我们要为这n个人先选出n个房间来,再进行处理,换到映射的观点,就是要从B中确定n个元素的子集,这个过程也是有很多的,再把这些子集重复第一题的过程,就是全体的有利事件的个数,于是,问题就归结为统计这些子集的个数,很简单的就可以得出有n!
个,那么概率就应该是。
剩下的就是具体的计算了,好了,回味一下,你体会到了什么?
你可能感觉到一些困难,如果你没有感到困难的话就太好了,这个问题在历史上称为“分房问题”,我们可以进一步的拓展这个问题,据说在物理中就有一些非常有用的应用。
现在考虑有关n个人生日问题的事情,这个里面那里什么是基本事件呢?
那一定是n个人的生日情况的所有可能性,也就是把与前面提到的分房问题的第一问相同,那么生日相同(即同月同日出生)的具体的有利事件的个数如何来统计呢?
看来稍微有些麻烦,我们需要了解的是,两个人,或者两个人以上的生日相同,就得认为是对这个事情很有帮助的例证,那么,我们把这个事情分为几类,只有两个人生日相同,只有三个人生日相同,等等,当然还有一些几组两个人的生日都相同的情况,事情就会变得尤其复杂,而且各类之间有交叉的地方还要注意避免,问题足以烦得你失去信心,我们能否换个角度来考虑。
我们完全可以考虑这个事件的反面,其实,如果计算一下你获胜的概率仍然可以表示出我获胜的机会的大小,那么对于你只有一种情况有利,就是所有人的生日都不相同,于是你就可以得到这将是一个上面分房问题叙述的第二类问题,那么你获胜的概率就可以计算出来了:
(记N=365,闰年就不记了,直接套用前面的结论就可以了)。
可以借助你的结论得出至少两人生日相同的概率即:
这次只需要计算就可以了,
n
20
30
40
50
60
70
80
概率
0.411
0.706
0.891
0.970
0.994
0.999
0.9999
看来事情的结果对于选择打赌的你有些不利,如果班级里超过50人,几乎就是必然的规律了。
这可能极大的冲击了你的视觉,原因很简单,我们只是在意与自己生日相同的情况,确切的说,只是关注于在n个人中,至少有一个人的生日是特定的某一天的概率,这个不会很大,应该是,随着人数的增长,这个比率会平稳的增长,当然,这个与上述的表格的数据的差别是很大的,表格中的数据增长是不均匀的但是你把这个习惯主观的推广了,问题就出现了。
这里面从反面入手,巧妙的运用分房问题的思路解决了这个问题,这种思想方法要学会运用。
案例10排队等待问题
超市门口平行排列若干收款台,顾客带着商品在收款台前排队等候验货付款。
我们看到,平常顾客较少时只有少数几个收款台工作,排队人数不多而且相当稳定,下班高峰时顾客增加,队伍增长,收款台增开,排队人数回到原来水平。
排队人数不仅与收款台的数目有关,也与顾客的多少、服务的快慢有关,而且后者是随机改变的。
建立数学模型描述这些变量间的关系。
对于实际问题,学生都是比较感兴趣的,我们要抓住时机,引导他们进入问题,开动脑筋,启发思维。
在这个案例中,顾客到达规律、服务时间和排队的规则都是随机的,不确定的,属于一个随机服务模型。
为了解决这个问题,我们必须提出一些必要的假设,引入一些必须的符号,使问题数学化。
1、顾客到达规律
假设在时间内到达1个顾客的概率与成正比,比例系数为,到达2个及2个以上顾客的概率为;在不相交的时间区间内到达的顾客数相互独立;顾客源是无限的。
由此,我们得到在内到达的顾客数服从Poisson分布,即到达个顾客的概率为,平均到达率为;记为第一个顾客到达时刻,则服从指数分布,即
,
记顾客相继到达时刻为,间隔为
,根据指数分布的无后效性,相互独立且同分布,而平均到达间隔为。
2