概率论复习提纲.docx

资源描述

概率论复习提纲.docx

《概率论复习提纲.docx》由会员分享，可在线阅读，更多相关《概率论复习提纲.docx（16页珍藏版）》请在冰点文库上搜索。

概率论复习提纲.docx

概率论复习提纲

第一章随机事件和概率

（11）减法公式

P（A-B）=P（A）-P（AB）

当BA时，P（A-B）=P（A）-P（B）

当A=Ω时，P（）=1-P（B）

第二章随机变量及其分布

（5）八大分布

0-1分布

P（X=1）=p,P（X=0）=q

二项分布

在重贝努里试验中，设事件发生的概率为。

事件发生的次数是随机变量，设为，则可能取值为。

，其中，

则称随机变量服从参数为，的二项分布。

记为。

当时，，，这就是（0-1）分布，所以（0-1）分布是二项分布的特例。

泊松分布

设随机变量的分布律为

，，，

则称随机变量服从参数为的泊松分布，记为或者P（）。

泊松分布为二项分布的极限分布（np=λ，n→∞）。

超几何分布

随机变量X服从参数为n,N,M的超几何分布，记为H（n,N,M）。

几何分布

，其中p≥0，q=1-p。

随机变量X服从参数为p的几何分布，记为G（p）。

均匀分布

设随机变量的值只落在[a，b]内，其密度函数在[a，b]上为常数，即

a≤x≤b

其他，

则称随机变量在[a，b]上服从均匀分布，记为X~U（a，b）。

分布函数为

a≤x≤b

0，x

1，x>b。

当a≤x1

。

指数分布

0,,

其中，则称随机变量X服从参数为的指数分布。

X的分布函数为

x<0。

记住积分公式：

正态分布

设随机变量的密度函数为

，，

其中、为常数，则称随机变量服从参数为、的正态分布或高斯（Gauss）分布，记为。

具有如下性质：

1°的图形是关于对称的；

2°当时，为最大值；

若，则的分布函数为

。

参数、时的正态分布称为标准正态分布，记为，其密度函数记为

，，

分布函数为

。

是不可求积函数，其函数值，已编制成表可供查用。

Φ（-x）＝1-Φ（x）且Φ（0）＝。

如果~，则~。

。

第三章二维随机变量及其分布

（2）期望的性质

（1）E（C）=C

（2）E（CX）=CE（X）

（3）E（X+Y）=E（X）+E（Y），

（4）E（XY）=E（X）E（Y），充分条件：

X和Y独立；

充要条件：

X和Y不相关。

（3）方差的性质

（1）D（C）=0；E（C）=C

（2）D（aX）=a2D（X）；E（aX）=aE（X）

（3）D（aX+b）=a2D（X）；E（aX+b）=aE（X）+b

（4）D（X）=E（X2）-E2（X）

（5）D（X±Y）=D（X）+D（Y），充分条件：

X和Y独立；

充要条件：

X和Y不相关。

D（X±Y）=D（X）+D（Y）±2E[（X-E（X））（Y-E（Y））]，无条件成立。

而E（X+Y）=E（X）+E（Y），无条件成立。

协方差

对于随机变量X与Y，称它们的二阶混合中心矩为X与Y的协方差或相关矩，记为，即

与记号相对应，X与Y的方差D（X）与D（Y）也可分别记为与。

相关系数

对于随机变量X与Y，如果D（X）>0,D（Y）>0，则称

为X与Y的相关系数，记作（有时可简记为）。

||≤1，当||=1时，称X与Y完全相关：

完全相关

而当时，称X与Y不相关。

以下五个命题是等价的：

①；

②cov（X,Y）=0;

③E（XY）=E（X）E（Y）;

④D（X+Y）=D（X）+D（Y）;

⑤D（X-Y）=D（X）+D（Y）.

协方差矩阵

混合矩

对于随机变量X与Y，如果有存在，则称之为X与Y的k+l阶混合原点矩，记为；k+l阶混合中心矩记为：

（6）协方差的性质

（i）cov（X,Y）=cov（Y,X）;

（ii）cov（aX,bY）=abcov（X,Y）;

（iii）cov（X1+X2,Y）=cov（X1,Y）+cov（X2,Y）;

（iv）cov（X,Y）=E（XY）-E（X）E（Y）.

（7）独立和不相关

（i）若随机变量X与Y相互独立，则；反之不真。

（ii）若（X，Y）～N（），

则X与Y相互独立的充要条件是X和Y不相关。

第五章大数定律和中心极限定理

（1）大数定律

切比雪夫大数定律

设随机变量X1，X2，…相互独立，均具有有限方差，且被同一常数C所界：

D（Xi）

特殊情形：

若X1，X2，…具有相同的数学期望E（XI）=μ，则上式成为

伯努利大数定律

设μ是n次独立试验中事件A发生的次数，p是事件A在每次试验中发生的概率，则对于任意的正数ε，有

伯努利大数定律说明，当试验次数n很大时，事件A发生的频率与概率有较大判别的可能性很小，即

这就以严格的数学形式描述了频率的稳定性。

辛钦大数定律

设X1，X2，…，Xn，…是相互独立同分布的随机变量序列，且E（Xn）=μ，则对于任意的正数ε有

（2）中心极限定理

列维－林德伯格定理

设随机变量X1，X2，…相互独立，服从同一分布，且具有相同的数学期望和方差：

，则随机变量

的分布函数Fn（x）对任意的实数x，有

此定理也称为独立同分布的中心极限定理。

棣莫弗－拉普拉斯定理

设随机变量为具有参数n,p（0

第六章样本及抽样分布

（1）数理统计的基本概念

总体

在数理统计中，常把被考察对象的某一个（或多个）指标的全体称为总体（或母体）。

我们总是把总体看成一个具有分布的随机变量（或随机向量）。

个体

总体中的每一个单元称为样品（或个体）。

样本

我们把从总体中抽取的部分样品称为样本。

样本中所含的样品数称为样本容量，一般用n表示。

在一般情况下，总是把样本看成是n个相互独立的且与总体有相同分布的随机变量，这样的样本称为简单随机样本。

在泛指任一次抽取的结果时，表示n个随机变量（样本）；在具体的一次抽取之后，表示n个具体的数值（样本值）。

我们称之为样本的两重性。

第七章参数估计

（1）点估计

矩估计

设总体X的分布中包含有未知数，则其分布函数可以表成它的k阶原点矩中也包含了未知参数，即。

又设为总体X的n个样本值，其样本的k阶原点矩为

这样，我们按照“当参数等于其估计量时，总体矩等于相应的样本矩”的原则建立方程，即有

由上面的m个方程中，解出的m个未知参数即为参数（）的矩估计量。

若为的矩估计，为连续函数，则为的矩估计。

极大似然估计

当总体X为连续型随机变量时，设其分布密度为，其中为未知参数。

又设为总体的一个样本，称

为样本的似然函数，简记为Ln.

当总体X为离型随机变量时，设其分布律为，则称

为样本的似然函数。

若似然函数在处取到最大值，则称分别为的最大似然估计值，相应的统计量称为最大似然估计量。

若为的极大似然估计，为单调函数，则为的极大似然估计。

（2）估计量的评选标准

无偏性

设为未知参数的估计量。

若E（）=，则称为的无偏估计量。

E（）=E（X），E（S2）=D（X）

有效性

设和是未知参数的两个无偏估计量。

若，则称有效。

一致性

设是的一串估计量，如果对于任意的正数，都有

则称为的一致估计量（或相合估计量）。

若为的无偏估计，且则为的一致估计。

只要总体的E（X）和D（X）存在，一切样本矩和样本矩的连续函数都是相应总体的一致估计量。

（3）区间估计

置信区间和置信度

设总体X含有一个待估的未知参数。

如果我们从样本出发，找出两个统计量与，使得区间以的概率包含这个待估参数，即

那么称区间为的置信区间，为该区间的置信度（或置信水平）。

单正态总体的期望和方差的区间估计

设为总体的一个样本，在置信度为下，我们来确定的置信区间。

具体步骤如下：

（i）选择样本函数；

（ii）由置信度，查表找分位数；

（iii）导出置信区间。

已知方差，估计均值

（i）选择样本函数

（ii）查表找分位数

（iii）导出置信区间

未知方差，估计均值

（i）选择样本函数

（ii）查表找分位数

（iii）导出置信区间

方差的区间估计

（i）选择样本函数

（ii）查表找分位数

（iii）导出的置信区间

第八章假设检验

基本思想

假设检验的统计思想是，概率很小的事件在一次试验中可以认为基本上是不会发生的，即小概率原理。

为了检验一个假设H0是否成立。

我们先假定H0是成立的。

如果根据这个假定导致了一个不合理的事件发生，那就表明原来的假定H0是不正确的，我们拒绝接受H0；如果由此没有导出不合理的现象，则不能拒绝接受H0，我们称H0是相容的。

与H0相对的假设称为备择假设，用H1表示。

这里所说的小概率事件就是事件，其概率就是检验水平α，通常我们取α=，有时也取或。

基本步骤

假设检验的基本步骤如下：

（i）提出零假设H0；

（ii）选择统计量K；

（iii）对于检验水平α查表找分位数λ；

（iv）由样本值计算统计量之值K；

将进行比较，作出判断：

当时否定H0，否则认为H0相容。

两类错误

第一类错误

当H0为真时，而样本值却落入了否定域，按照我们规定的检验法则，应当否定H0。

这时，我们把客观上H0成立判为H0为不成立（即否定了真实的假设），称这种错误为“以真当假”的错误或第一类错误，记为犯此类错误的概率，即

P{否定H0|H0为真}=；

此处的α恰好为检验水平。

第二类错误

当H1为真时，而样本值却落入了相容域，按照我们规定的检验法则，应当接受H0。

这时，我们把客观上H0。

不成立判为H0成立（即接受了不真实的假设），称这种错误为“以假当真”的错误或第二类错误，记为犯此类错误的概率，即

P{接受H0|H1为真}=。

两类错误的关系

人们当然希望犯两类错误的概率同时都很小。

但是，当容量n一定时，变小，则变大；相反地，变小，则变大。

取定要想使变小，则必须增加样本容量。

在实际使用时，通常人们只能控制犯第一类错误的概率，即给定显著性水平α。

α大小的选取应根据实际情况而定。

当我们宁可“以假为真”、而不愿“以真当假”时，则应把α取得很小，如，甚至。

反之，则应把α取得大些。

第一章讲随机事件及其概率的一些相关公式和运用。

很多高中就有涉及，如果你真理不清其中的关系，我建议可以先画韦恩图取得一个感性的认识，再去推导记忆公式。

我把公式分为两类：

基本公式，条件概率公式。

当然基本概念是必须搞清楚的，这一章大多数基本概念大家都比较熟悉，除了条件概率相对陌生。

我相信大家都不会存在概念上的问题。

基本公式就是一些定律和性质公式，已经很熟悉的公式跳过，相对陌生的重点记忆一下，会用就行了。

目测比较陌生的也就是德·摩根率的两个公式和任意n个事件的并集概率公式。

条件概率那一节主要是理解记忆全概率公式和贝叶斯公式，课后相关习题会做就达到要求了。

独立事件这一部分记得它的条件就够了，做题需要用的时候能用上就可以了。

这儿强调一下，注意区别一下相互独立事件和互斥事件、对立事件的关系，尤其注意一下各个随机事件概率之间的数量关系。

第二、三、四章都是讲随机变量的相关计算，首先注意分清离散型随机变量和连续性随机变量的相关表示方法和称谓。

比如f（x）和P（X=xi），相同含义，离散型叫做概率分布律，而连续性称谓概率密度函数，类似的还有许多。

掌握两类函数中各自的基本函数。

离散型：

0-1分布（x~B（1,p）），二项分布（x~B（n,p）），几何分布，泊松分布（x~π（λ）这个比较陌生，重点看看）；连续性：

均匀分布（x~U（a，b）），正态分布（x~N（μ，σ2）），指数分布（这个也相对陌生，重点看看）。

熟记这些基本分布的表达式、均值和方差。

掌握表征随机变量的一些量，诸如概率密度函数（概率分布律），概率分布函数（第二章）；联合分布律，联合概率分布函数，边缘分布律（边缘概率密度），边缘分布函数（第三章）；均值，方差，协方差，相关系数（第四章）等，注意各自表征的含义，区别一维和二维，特别留意均值和方差的相关性质。

理想的效果：

会灵活地实现边缘概率密度、边缘分布函数和联合概率密度、联合分布函数之间转换计算，计算方差、均值、协方差、相关系数，掌握切皮雪夫不等式和中心极限定理的应用，另外还有涉及条件分布，和的分布，max，min，Y=g（x）等分布的计算，其实都有现成公式来辅助计算。

概率论所学的知识也就是上面这些，数理统计部分学得很少，我归纳了一下，掌握一下这些就行：

1.样本统计量。

均值、方差、K阶原点矩和中心矩。

2.卡方分布，t分布，F分布

3.样本矩估计法，极大似然估计法。

展开阅读全文