概率论基础知识及其在matlab中的实现.doc

资源描述

概率论基础知识及其在matlab中的实现.doc

《概率论基础知识及其在matlab中的实现.doc》由会员分享，可在线阅读，更多相关《概率论基础知识及其在matlab中的实现.doc（10页珍藏版）》请在冰点文库上搜索。

概率论基础知识及其在matlab中的实现.doc

第三章概率论基础知识及其在matlab中的实现

概率论与应用数理统计十就是研究随机现象统计规律性的一门科学，本章学习随机及其发生的概率，多维随机变量的分布规律，参数估计与假设检验，方差分析与回归分析等概率统计的基本方法以及它们在MATLAB中实现方法。

3．1随机时间及其概率

3．1．1古典概率及其模型

由古典概率的定义知，古典概率基于这样两个原则：

（1）所有可能发生的结果只有有限个；

（2）每一种可能出现的结果机会是相同的。

在MATLAB中提供了一个在[0,1]区间上均匀分布的随机函数rand,其命令格式为：

命令格式1：

rand（N）

功能：

返回一个的随机矩阵

命令格式2：

rand（N,M）

功能：

返回一个的随机矩阵

命令格式2：

rand（P1,P2,…,Pn）

功能：

返回一个的随机矩阵

可以用计算机模拟掷硬币这一过程，为了模拟硬币出现正面或反面，规定随机数小于0.5时为反面，否则为正面，可以用round（）函数将其变成0—1矩阵，然后将整个矩阵的各元素值加起来再除以总的原始个数即为出现正面的概率。

round（）函数的命令格式为：

命令格式：

round（x）

功能：

对向量或矩阵x的每个分量四舍五入取整。

现以联系掷10000次硬币为例，重复做100次试验模拟出现正面的概率。

在matlab中的程序如下：

fori=1：

100

a（i）=sum（sum（round（rand（100））））/10000；

end

mx=max（a）；

mn=min（a）；

ma=mean（a）；

a,mx,mn,ma

在该程序输出的四项中，a为实验100次中每次出现正面的频率，mx和mn分别为100次实验中出现正面频率的最大值和最小值，ma为100次试验出现正面的平均频率。

运行结果如下：

这里要输入结果

下面介绍MATLAB中取整的几个函数命令：

（1）命令格式：

fix（x）

功能：

对x朝零方向取整

（2）命令格式：

floor（x）

功能：

对x朝负无穷大方向取整

（3）命令格式：

ceil（x）

功能：

对x朝正无穷大方向取整

3．1．2统计概率及其模型

由于古典概率是建立在事件发生的等可能基础上的概率，而现实生活中许多现象的出现并不是等可能的。

例如某品种的玉米，当种下一粒后，其发芽与不发芽的机会并不相同。

那么，这个概率就不能建立在等可能基础上，即不能使用古典概率的定义。

而统计概率的定义是建立在频率基础上的，就是说某事件出现频率如果稳定在某数值附近，则称数值为该事件出现的概率。

由于统计概型中的概率是一个理论上的数值，实际问题中根本无法直接得到该数值，因而通常在试验次数充分多时，利用频率值近似代替概率值。

在掷硬币的试验中，在试验次数充分多的情况下，掷硬币出现正面和反面的频率均在0.5左右，故出现正面和反面的概率均为0.5。

下面来看掷硬币时，当样本容量分别为

n=10，100，1000，10000，100000，1000000

时频率的变化。

在MATLAB中实现时程序代码如下：

forI=i：

a（i）=sum（round（rand（1,10-i）））/10^I；

end

运算结果为：

这里输入运算结果

从上面运行的结果中可以看出，当样本容量不够大时，其频率的波动范围很大，即频率不够稳定，即使有时达到0.5，但最大时已达到0.9，然而随着样本容量的增加，频率的波动范围越来越小，相差仅有左右。

3．1．3条件概率、全概率公式与伯努利概率

若事件B的发生会影响到事件A的发生，则事件B发生的条件下，事件A发生的概率称为条件概率，条件的概率的计算公式为：

若事件A的发与事件B的发生与否没有关系，即事件B发生与否不会影响到事件A的发生，反之亦然，则称事件A与事件B是相互独立的，这时有：

例1袋中有10只球，其中白球7只，黑球3只。

分有放回和无放回两种情况，分三次取球，每次取一个，分别求：

（1）第三次摸到了黑球的概率，

（2）第三次才摸到黑球的概率，（3）三次都摸到了黑球的概率。

解当有放回地摸球时，由于三次摸球互不影响，因此三次摸球相互独立，从理论上可以求得：

（1）第三次摸到黑球的概率为；

（2）第三次才摸到黑球的概率为；（3）三次都摸到黑球的概率为。

在MATLAB中模拟这一过程时，可在[0，1]区间上产生三次随机数来模拟三次摸球，当随机数小于0.7时可认为摸到了白球，否则认为摸到了黑球。

重复次分别求上述三种情况出现的概率。

程序如下：

a=round（rand（1000000,3）–0.2）；

fori=1：

b=a（1：

10^i,3；

c（i）=sum（b）/（10^i）；

end

fori=1：

b=（~a（1:

10^i,1））&（~a（1:

10^i,2））&a（1:

10^i,3）;

d（i）=sum（b）/（10^i）;

end

forI=1:

b=a（1:

10^i,1）&a（1:

10^i,2）&a（1:

10^i,3）;

e（i）=sum（b）/（10^i）;

end

运行结果为:

这里加入运行结果

执行结果中c为第三次摸到黑球的概率,d为第三次才摸到黑球的概率,e为三次都摸到黑球的概率.可以看到,随着试验次数的增加,其频率都会逐渐稳定在理论值附近.

当无放回地摸球时,由于第二次摸球会受到第一次的影响,而第三次摸球又会受到前两次的影响,因而三次摸球相互影响,并不独立.从理论上可求得:

（1）第三次摸到黑球的概率为,

（2）第三次才摸到黑球的概率为

（3）三次都摸到了黑球的概率为

用计算机模拟该过程时,在[0,1]区间模拟第一次摸球,当值小于0.7时认为摸到了白球,否则认为摸到了黑球;第二次摸球时由于少了一个球,故可在区间长度为0.9的区间上模拟,若第一次摸到白球,可将区间设为[0.1,1],否则区间设为[0,0.9];第三次摸球可依次类推,其模拟程序如下:

a=rand（1000000,3）;

a（:

1）=round（a（:

1）–0.2）;

a（:

2）=round（a（:

2）*0.9–0.2–0.1*（（a:

1）–1））;

a（:

3）=round（a（:

3）*0.8–0.2–0.1*（a（:

1）–1）–0.1*（a（:

2）–1））;

fori=1:

b=a（1:

10^i,3）;

c（i）=sum（b）/（10^i）;

end

fori=1:

b=（~a（1:

10^i,1））&（~a（1:

10^i,2））&a（1:

10^i,3）;

d（i）=sum（b）/（10^i）;

end

fori=1:

b=a（1:

10^i,1）&a（1:

10^i,2）&a（1:

10^i,3）;

e（i）=sum（b）/（10^i）;

end

运行结果为

上面在理论上计算第三次摸到黑球的概率时,用到了全概率公式:

若构成一个完备事件组,且事件的发生总是伴随着事件中的某一个发生而发生,则

下面将用到伯努利概型,所谓伯努利概型是指:

在相同条件下,进行次独立重复试验,每次试验只有事件A发生或不发生两种结果,且

这里第三次摸到黑球的四种情况分别是:

{白,白,黑},{白,黑,黑},{黑,白,黑},{黑,黑,黑}.这四种情况构成了完备事件组.现考虑下面问题:

（1）当不放回时,已知第三次摸到了黑球,问前两次是黑球的概率为多少?

（2）若有放回地连续摸10次,则恰有三次摸到黑球的概率是多少?

第一问是一逆概率问题,由逆概率公式即贝叶斯公式得到其概率应为

第二问则属伯努利概型,这里A为{摸到的是黑球},故,.于是由二项概率公式有,10次有放回摸球中,恰有三次摸到黑球的概率为

在MATLAB中实现这两个过程的程序如下:

a=rand（100000,3）;

a（:

1）=round（a（:

1）–0.2）;

a（:

2）=round（a（:

2）*0.9–0.2–0.1*a（:

1）–1））;

a（:

3）=round（a（:

3）*0.8–0.2–0.1*（a（:

1）–1）–0.1*（a（:

2）–1））;

fori=1:

b=a（1:

10^I,3）;

c（i）=sum（b）;

b=a（1:

10^i,1）&a（1:

10^i,2）&a（1:

10^i,3）;

d（i）=sum（b）;

e（i）=d（i）./c（i）;

end

这里添加运行结果

a=round（rand（1000000,10）–0.2）;

forI=1:

b=sum（a（1:

10^i,:

）,2）–3;

c（i）=sum（-b）/910^I）;

end

3.2随机变量的分布及其数字特征

随机变量的统计行为完全决定于其概率分布,按随机变量的取值不同,通常可将其分为离散型\连续型和奇异型三大类.由于奇异型在实际应用中很少遇到,因此只讨论离散型和连续型两类随机变量的概率分布及其数字特征.

3.2.1离散型随机变量的分布及其数字特征

如果随机变量X的所有可能取值为有限个或无穷可列个,则称X为离散型随机变量.设X的所有可能值为,并且X取这些值的概率为

则称其为随机变量X的概率分布.它满足下面的性质:

（1）,,

（2）

称为累积概率分布.

在研究随机变量时,主要就是研究随机变量的概率分布、累积分布和分布的数字特征。

常用的离散型随机变量的分布有：

二项分布、泊松分布和超几何分布。

1、超几何分布

若随机变量X的所有可能取值为0,1,…，n,其概率分布为

，

其中，则称X服从参数为和的二项分布，记作。

二项分布的数学期望为，方差为。

在MATLAB中提供的二项分布的统计函数有：

binopdf（）、binocdf（）、binoinv（）、binornd（）以及计算二项分布均值和方差的函数binostat（），它们命令格式如下：

命令格式：

binopdf（X,N,P）

功能：

计算二项分布的密度函数。

其中X为随机变量，N为独立试验的重复数，P为事件发生的概率。

命令格式：

binocdf（X,N,P）

功能：

计算二项分布的累积分布函数。

其中X为随机变量，N为独立试验的重复数，P为事件发生的概率。

命令格式：

binoinv（X,N,P）

功能：

计算二项分布的逆累积分布函数。

其中X为随机变量，N为独立试验的重复数，P为事件发生的概率

命令格式：

binornd（N,P,m,n）

功能：

产生服从二项分布的阶随机矩阵。

其中N为独立试验的重复数，P为事件发生的概率，m和n分别是所产生随机矩阵的行数和列数。

若不指定m和n，则返回一个随机数；若指定m和n，则返回一个服从二项分布的阶随机矩阵。

命令格式：

binostat（N,P）

功能：

求二项分布的数学期望与方差。

N为独立试验的重复数，P为事件发生的概率。

例1x=0:

0.1:

binoinv（x,10,1.7）

ans=

binoinv（x,10,0.3）

ans=

binoinv（x,50,0.7）

ans=

binoinv（x,50,0.3）

ans=

例2生成一个或多个服从二项分布的随机数

binornd（10,0.7）

ans=6

binornd（10,0.7,5,10）

ans=

这里都需要给出答案

例3求二项分布的数学期望（e）和方差（d）

[ed]=binostat（10,0.3）

e=3d=2.1000

[e,d]=binostat（20,0.7）

e=14d=4.2000

2、泊松分布

如果随机变量的概率分布为

，

其中为常数，则称X服从参数为的泊松分布，记作，泊松分布的数学期望，方差

在MATLAB中，提供如下有关泊松分布的统计函数：

命令格式：

poisspdf（X,LMD）

功能：

求泊松分布的密度函数。

其中X为随机变量，LMD为参数。

命令格式：

poisscdf（X,LMD）

功能：

求泊松分布的累积分布函数。

其中X为随机变量，LMD为参数。

命令格式：

poissinv（Y,LMD）

功能：

求泊松分布的逆累积分布函数。

其中Y为显著概率值，LMD为参数。

功能：

求泊松分布的密度函数。

其中X为随机变量，LMD为参数。

命令格式：

poissrnd（LMD,M,N）

功能：

产生服从泊松分布的随机数。

其中LMD为参数，M和N为产生随机矩阵的行数和列数。

功能：

求泊松分布的密度函数。

其中X为随机变量，LMD为参数。

命令格式：

poisstat（LMD）

功能：

求泊松分布的数学期望与方差。

其中LMD为参数。

可以利用逆累积概率分布函数求一定显著概率条件下，泊松分布假设检验临界值

x=0：

0.1：

1；

poissinv（x,5）

ans=

poissinv（x,10）

ans=

poissinv（x,100）

ans=

在MATLAB中求服从泊松分布的随机数及数学期望与方差如下：

poissrnd

（1）ans=1

poissrnd（5）ans=5

poissrnd（5,5,10）

ans=

输入结果

[e,d]=poisstat（5）

e=5d=5

[e,d]=poisstat（10）

e=10d=10

3、超几何分布

如果随机变量X所有可能取值为，X的概率分布为

，，

其中整数>0，且，则称X服从参数为的超几何分布，记作

MATLAB中超几何分布的统计函数为：

命令格式：

hygepdf（M,n,k,N）

功能：

求超几何分布的密度函数。

命令格式：

hygepcdf（M,n,k,N）

功能：

求超几何分布的累积分布函数。

命令格式：

hygeinv（P,n,k,N）

功能：

求超几何分布的逆累积分布函数

命令格式：

hygestat（n,k,N）

功能：

求超几何分布的数学期望与方差

命令格式：

hygernd（n,k,N,mr,mc）

功能：

产生满足超几何分布的随机数。

其中mr和mc分别为所产生随机矩阵的函数和列数。

Mr和mc省略时产生一个随机数。

用逆累积概率分布函数求一定显著概率条件下，超几何分布假设检验临界值的程序如下：

x=0:

0.1:

hygeinv（x,10,5,6）

ans=

hygeinv（x,15,5,9）;

ans=

hygeiv（x,20,8,10）

ans=

这里要写运算结果

求服从超几何分布的随机数及数学期望与方差的程序如下：

hygernd（15,7,9）ans=5

hygernd（15,7,9,5,10）

ans=

[e,d]=hygestat（15,7,9）

e=4.2000d=0.9600

[e,d]=hygestat（20,8,10）

e=4d=1.2632

3．2．2连续型随机变量的分布及其数字特征

设随机变量X的分布函数为F（x），若存在非负函数，使对任意实数，有

则称X为连续型随机变量，并称为X的概率密度，它满足下面性质：

（1）

（2）

（3）

（4）

最后一点和离散型随机变量截然不同，它表明概率为零的事件并不一定是不可能事件。

常用的三种连续型随机变量的概率分布是均匀分布、指数分布和正态分布。

1、均匀分布

若连续型随机变量X的概率密度为

则称X在区间上服从参数为和的均匀分布，记作。

MATLAB中提供的均匀分布的函数如下：

命令格式：

unifpdf（X,A,B）

功能：

求均匀分布的密度函数。

其中X为随机变量，A、B为均匀分布参数。

命令格式：

unifcdf（X,A,B）

功能：

求均匀分布的累积分布函数。

其中X为随机变量，A、B为均匀分布参数。

命令格式：

unifinv（P,A,B）

功能：

求均匀分布的逆累积分布函数。

其中P为概率值，A、B为均匀分布参数。

命令格式：

unirnd（A,B,m,n）

功能：

产生服从均匀分布的随机数。

其中A、B为均匀分布参数，m和n为生成随机数矩阵的行数和列数。

命令格式：

unifstat（A,B）

功能：

求均匀分布的数学期望与方差。

其中A、B为均匀分布参数

2、指数分布

如果随机变量X的概率密度为

其中为常数，则称X为服从参数为的指数分布，记作。

MATLAB中指数分布的函数如下：

命令格式：

exppdf（X,L）

功能：

求指数分布的密度函数。

其中X为随机变量，L为参数。

命令格式：

expcdf（X,L）

功能：

求指数分布的累积函数。

其中X为随机变量，L为参数。

命令格式：

expinv（P,L）

功能：

求指数分布的逆累积分布函数。

其中P为显著概率，L为参数。

命令格式：

exprnd（X,L,m,n）_

功能：

产生服从指数分布的随机数。

其中X为随机变量，L为参数，m和n为随机数矩阵的行数和列数。

命令格式：

expstat（L）

功能：

求指数分布的数学期望和方差。

其中L为参数。

3、正态分布

如果随机变量X的概率密度为

其中均为常数，且，则称X服从参数为和的正态分布，记作

，当时，称X服从标准正态分布，记作。

MATLAB中提供的正态分布的函数如下：

命令格式：

normpdf（X,M,C）

格式：

求正态分布的密度函数。

其中X为随机变量，M为正态分布参数，C为参数。

命令格式：

normcdf（X,M,C）

功能：

求正态分布的累积分布函数。

其中X为随机变量，M为正态分布参数，C为参数。

命令格式：

norminv（P,M,C）

格式：

求正态分布的逆累积分布函数。

其中P为显著概率，M为正态分布参数，C为参数。

命令格式：

normrnd（M,C,m,n）

格式：

产生服从正态分布的随即数。

其中M为正态分布参数，C为参数，m和n为随即矩阵的行数和列数。

命令格式：

normstat（M,C）

功能：

求正态分布的数学期望和方差。

其中M为正态分布参数，C为参数。

在MATLAB中求标准正态分布的密度函数及累积分布函数和一般正态分布的密度函数及累积分布函数的程序如下：

x=-4:

0.01:

y=normpdf（x,0,1）;z=normcdf（x,0,2）;

subplot（2,2,1）;plot（x,y,’k’）;

axis（[-4,4,-0.1,0.5]）;

subplot（2,2,2）;plot（x,z,’k’）;

axis（[-4,4,-0.1,1.1]）;

展开阅读全文