数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式.docx

资源描述

数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式.docx

《数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式.docx》由会员分享，可在线阅读，更多相关《数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式.docx（12页珍藏版）》请在冰点文库上搜索。

数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式.docx

数学分布泊松分布二项分布正态分布均匀分布指数分布+生存分析+贝叶斯概率公式+全概率公式

数学期望:

随机变量最基本得数学特征之一。

它反映随机变量平均取值得大小。

又称期望或均值。

它就是简单算术平均得一种推广。

例如某城市有１0万个家庭,没有孩子得家庭有100０个,有一个孩子得家庭有９万个,有两个孩子得家庭有60００个,有３个孩子得家庭有300０个,则此城市中任一个家庭中孩子得数目就是一个随机变量,记为Ｘ,它可取值0,1,2,３,其中取0得概率为０。

０１,取1得概率为0、9,取2得概率为0。

０6,取3得概率为0、03,它得数学期望为0×0、01+1×0。

９+２×0、06＋3×０、03等于1、11,即此城市一个家庭平均有小孩１.11个,用数学式子表示为:

E（X）=1.11、

也就就是说,我们用数学得方法分析了这个概率性得问题,对于每一个家庭,最有可能它家得孩子为１、11个、

可以简单得理解为求一个概率性事件得平均状况。

各种数学分布得方差就是:

1、一个完全符合分布得样本

2、这个样本得方差

概率密度得概念就是:

某种事物发生得概率占总概率

（1）得比例,越大就说明密度越大、比如某地某次考试得成绩近似服从均值为80得正态分布,即平均分就是80分,由正态分布得图形知x=80时得函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右得人最多。

下图为概率密度函数图（F（x）应为f（ｘ）,表示概率密度）:

离散型分布:

二项分布、泊松分布

连续型分布:

指数分布、正态分布、X2分布、ｔ分布、F分布

抽样分布只与自由度,即样本含量（抽样样本含量）有关

二项分布（binomialｄｉstrｉbｕｔion）:

例子抛硬币

1、重复试验（n个相同试验,每次试验两种结果,每种结果概率恒定————伯努利试验）

2、Ｐ（X=０）,　P（X=1）,P（X=3）,………、所有可能得概率共同组成了一个分布,即二项分布

泊松分布（pｏssiondisｔributiｏn）:

1、一个单位内（时间、面积、空间）某稀有事件

2、此事件发生K次得概率

3、Ｐ（Ｘ=0）,P（X=1）,P（Ｘ＝3）,　………。

所有可能得概率共同组成了一个分布,即泊松分布

二项分布与泊松分布得关系:

二项分布在事件发生概率很小,重复次数ｎ很大得情况下,其分布近似泊松分布

均匀分布（unifｏrmdｉｓtributｉon）:

分为连续型均匀分布与离散型均匀分布

离散型均匀分布:

1、ｎ种可能得结果

2、每个可能得概率相等（１/ｎ）

连续型均匀分布:

1、可能得结果就是连续得

2、每个可能得概率相等（）

连续型均匀分布概率密度函数如下图:

指数分布（exｐonentiａldistriｂutiｏn）:

用来表示独立随机事件发生得时间间隔,比如旅客进机场得时间间隔、中文维基百科新条目出现得时间间隔等等。

指数分布常用于各种“寿命”分布得近似。

1、连续型分布,每个点得概率:

2、无记忆性。

已经使用了s小时得元件,它能再使用t小时得概率,与一个从未使用过得元件使用t小时得概率相同。

即它对已经使用过得ｓ小时没有记忆。

指数分布得概率密度函数如下图:

正态分布（ｎormaldisｔｒｉbuｔion）:

又称高斯分布、

1、描述一个群体得某个指标。

2、这个指标就是连续得。

3、每个特定指标在整个群体中都有一个概率（）。

4、所有指标概率共同组成了一个分布,这个分布就就是正态分布。

正态分布得概率密度函数如下图:

中心极限定理:

不论总体得分布形式如何（正态或非正态）,只要样本（抽样样本）含量n足够大时,样本均数得分布就近似正态分布,且均数与总体均数相等,标准差为（总体标准差）/（n得开方）。

中心极限定理使得t分布、F分布与X２分布在抽样样本含量很大时不需要对总体样本就是否正态有要求。

t分布（stｕｄenttdistｒibution）:

1、t分布就是以0为中心得一簇曲线,每个自由度决定一个曲线

２、自由度就是一个抽样小样本中得具体观测值得个数（抽样样本含量）－１

３、总体样本呈正态分布（抽样样本含量较小时,要求总体样本呈正态分布,如果抽样样本含量很大（eｇ。

n＞＝　100）,由中心极限定理可知抽样样本均数也近似正态分布,因而“差值”得概率也呈正态分布,而ｔ分布得每一条曲线实际上都就是正态分布曲线）

４、从一个总体样本中抽取很多个小样本-——抽样

５、每个小样本都有一个均值

６、每个小样本得均值与总体样本均值有一个差值,这个差值用t估计

7、可能有多个小样本得差值估计都就是ｔ,ｔ出现得次数占所有小样本得比例可以用一个概率衡量

8、所有t值得概率组成一个分布,就就是t分布得一个曲线

9、另外做一个抽样,每个小样本包含得观测值不同,则形成t分布得另外一个曲线

10、自由度越大,则曲线越接近于标准正态分布

11、t分布只与自由度相关

t分布得概率密度函数如下图（v为自由度）:

X2分布（chiｓｑuarｅ　distributｉon）:

1、Ｘ2分布也就是一簇曲线,每个自由度决定一个曲线

２、自由度就是一个抽样小样本中得具体观测值得个数（抽样样本含量）－1

2、总体样本呈正态分布（抽样样本含量（ｎ）较小时,要求总体样本呈正态分布）

３、从总体样本中抽取n个观测值:

z1,z2,z3……———抽样

4、将它们平方后求与,这个与用一个新变量表示,即X2

5、重复抽样并获得多个X2:

Ｘ12,X22,X3２,Ｘ42………

6、可能有多次抽样得X2值相同,同一个Ｘ2值得抽样次数占总次数得比例可以用一个概率表示

7、所有得概率值共同组成一个分布,就就是X２分布得一条曲线

8、另外做一次,只要从总体中选取观测值数目n不同,得到得就就是另外一条曲线

10、自由度越大,则曲线越接近于标准正态分布

11、Ｘ2分布只与自由度相关

X2分布得概率密度函数如下图（ｎ在这里为自由度）:

F分布（Ｆ—dｉstribｕtion）:

1、F分布也就是一簇曲线,每对自由度决定一个曲线

２、自由度就是一个抽样小样本中得具体观测值得个数（抽样样本含量）-1

２、两总体样本方差比得分布

３、总体样本呈正态分布（抽样样本含量（ｎ）较小时,要求总体样本呈正态分布）

４、从总体样本中抽取两个样本,　两个样中得观测值数目可相同也可不同,分别记为ｎ1与ｎ２

5、分别计算出X2:

X1,X２

6、构建一个新变量Ｆ:

7、重复抽取样本,计算多个Ｆ值:

F１,F2,F3…….。

８、可能有多次抽样得Ｆ值相同,同一个F值得抽样次数占总次数得比例可以用一个概率表示

９、所有得概率值共同组成一个分布,就就是F分布得一条曲线

10、另外做一次,只要从总体中选取观测值数目n不同,得到得就就是另外一条曲线

10、两个自由度越大,则曲线越接近于标准正态分布

11、F分布只与自由度相关

F分布得概率密度函数如下图（m,n在这里为自由度）:

【在推估总体平均值时,基于样本平均数得抽样分布】——t分布

【在用样本方差来推估总体方差时,必须知道样本方差得抽样分布】—X2分布

【比较两个总体得方差就是否相等时,必须知道样本方差得联合抽样分布】—F分布

生存分析（sｕrviｖalａnalyｓis）:

1、多种影响慢性疾病得因素（不同手术方法、不同药物………）

2、随访一群患者

3、一段时间后统计生存与死亡

3、最终给出得结果就是一个评价各种因素对生存时间得影响（生存时间、生存率有无差异）

贝叶斯公式（bａyesformula）:

1、描述两个条件概率之间得关系———P（Bi|Ａ）与P（A|Ｂi）,A为事件,Ｂi为一个划分

2、P（Bi|A）=P（A｜Bi）＊P（Bｉ）/Ｐ（Ａ）或者

3、瞧图理解

全概率公式（ｆull　ｐｒｏbabilitｙｆｏｒmuｌa）:

1、描述一个特定事件得概率与条件概率间得关系

2、Ｐ（A）=P（A｜B１）*P（B1）+P（A|B２）*Ｐ（Ｂ2）　+、。

。

　+　P（A｜Bn）＊P（Ｂｎ）

3、瞧图理解

展开阅读全文