特殊情形:
若X1,X2,…具有相同的数学期望E(XI)=μ,则上式成为
伯努利大数定律
设μ是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数ε,有
伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,且E(Xn)=μ,则对于任意的正数ε有
(2)中心极限定理
列维-林德伯格定理
设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:
,则随机变量
的分布函数Fn(x)对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
设随机变量为具有参数n,p(0
第六章样本及抽样分布
(1)数理统计的基本概念
总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。
我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体
总体中的每一个单元称为样品(或个体)。
样本
我们把从总体中抽取的部分样品称为样本。
样本中所含的样品数称为样本容量,一般用n表示。
在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。
在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。
我们称之为样本的两重性。
第七章参数估计
(1)点估计
矩估计
设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。
又设为总体X的n个样本值,其样本的k阶原点矩为
这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。
若为的矩估计,为连续函数,则为的矩估计。
极大似然估计
当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。
又设为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体X为离型随机变量时,设其分布律为,则称
为样本的似然函数。
若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。
若为的极大似然估计,为单调函数,则为的极大似然估计。
(2)估计量的评选标准
无偏性
设为未知参数的估计量。
若E()=,则称为的无偏估计量。
E()=E(X),E(S2)=D(X)
有效性
设和是未知参数的两个无偏估计量。
若,则称有效。
一致性
设是的一串估计量,如果对于任意的正数,都有
则称为的一致估计量(或相合估计量)。
若为的无偏估计,且则为的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区间估计
置信区间和置信度
设总体X含有一个待估的未知参数。
如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即
那么称区间为的置信区间,为该区间的置信度(或置信水平)。
单正态总体的期望和方差的区间估计
设为总体的一个样本,在置信度为下,我们来确定的置信区间。
具体步骤如下:
(i)选择样本函数;
(ii)由置信度,查表找分位数;
(iii)导出置信区间。
已知方差,估计均值
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
未知方差,估计均值
(i)选择样本函数
(ii)查表找分位数
(iii)导出置信区间
方差的区间估计
(i)选择样本函数
(ii)查表找分位数
(iii)导出的置信区间
第八章假设检验
基本思想
假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设H0是否成立。
我们先假定H0是成立的。
如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。
与H0相对的假设称为备择假设,用H1表示。
这里所说的小概率事件就是事件,其概率就是检验水平α,通常我们取α=,有时也取或。
基本步骤
假设检验的基本步骤如下:
(i)提出零假设H0;
(ii)选择统计量K;
(iii)对于检验水平α查表找分位数λ;
(iv)由样本值计算统计量之值K;
将进行比较,作出判断:
当时否定H0,否则认为H0相容。
两类错误
第一类错误
当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。
这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即
P{否定H0|H0为真}=;
此处的α恰好为检验水平。
第二类错误
当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。
这时,我们把客观上H0。
不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即
P{接受H0|H1为真}=。
两类错误的关系
人们当然希望犯两类错误的概率同时都很小。
但是,当容量n一定时,变小,则变大;相反地,变小,则变大。
取定要想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。
α大小的选取应根据实际情况而定。
当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如,甚至。
反之,则应把α取得大些。
第一章讲随机事件及其概率的一些相关公式和运用。
很多高中就有涉及,如果你真理不清其中的关系,我建议可以先画韦恩图取得一个感性的认识,再去推导记忆公式。
我把公式分为两类:
基本公式,条件概率公式。
当然基本概念是必须搞清楚的,这一章大多数基本概念大家都比较熟悉,除了条件概率相对陌生。
我相信大家都不会存在概念上的问题。
基本公式就是一些定律和性质公式,已经很熟悉的公式跳过,相对陌生的重点记忆一下,会用就行了。
目测比较陌生的也就是德·摩根率的两个公式和任意n个事件的并集概率公式。
条件概率那一节主要是理解记忆全概率公式和贝叶斯公式,课后相关习题会做就达到要求了。
独立事件这一部分记得它的条件就够了,做题需要用的时候能用上就可以了。
这儿强调一下,注意区别一下相互独立事件和互斥事件、对立事件的关系,尤其注意一下各个随机事件概率之间的数量关系。
第二、三、四章都是讲随机变量的相关计算,首先注意分清离散型随机变量和连续性随机变量的相关表示方法和称谓。
比如f(x)和P(X=xi),相同含义,离散型叫做概率分布律,而连续性称谓概率密度函数,类似的还有许多。
掌握两类函数中各自的基本函数。
离散型:
0-1分布(x~B(1,p)),二项分布(x~B(n,p)),几何分布,泊松分布(x~π(λ)这个比较陌生,重点看看);连续性:
均匀分布(x~U(a,b)),正态分布(x~N(μ,σ2)),指数分布(这个也相对陌生,重点看看)。
熟记这些基本分布的表达式、均值和方差。
掌握表征随机变量的一些量,诸如概率密度函数(概率分布律),概率分布函数(第二章);联合分布律,联合概率分布函数,边缘分布律(边缘概率密度),边缘分布函数(第三章);均值,方差,协方差,相关系数(第四章)等,注意各自表征的含义,区别一维和二维,特别留意均值和方差的相关性质。
理想的效果:
会灵活地实现边缘概率密度、边缘分布函数和联合概率密度、联合分布函数之间转换计算,计算方差、均值、协方差、相关系数,掌握切皮雪夫不等式和中心极限定理的应用,另外还有涉及条件分布,和的分布,max,min,Y=g(x)等分布的计算,其实都有现成公式来辅助计算。
概率论所学的知识也就是上面这些,数理统计部分学得很少,我归纳了一下,掌握一下这些就行:
1.样本统计量。
均值、方差、K阶原点矩和中心矩。
2.卡方分布,t分布,F分布
3.样本矩估计法,极大似然估计法。