数理统计的基本概念与抽样分布.pptx
《数理统计的基本概念与抽样分布.pptx》由会员分享,可在线阅读,更多相关《数理统计的基本概念与抽样分布.pptx(56页珍藏版)》请在冰点文库上搜索。
中南大学数学与统计学院第1章数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布应用统计数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布例:
某筋每天可以生某型筋钢厂产号钢10000根,筋每天需要生程行控制,钢厂对产过进对产品的量行。
如果把筋的强度作筋质进检验钢为钢量的重有指,于是量管理人需要做如下质标质员方面的工作第一,生出的筋的强度行,对产来钢进检测获得必要的据。
数第二,通抽取的部分据行整理、对过样获数进分析推出并断这10000根筋的量是否合乎要钢质求。
1.2总体、个体、样本总体、个体、样本1.2.1总体与个体我们把所研究对象的全体称为总体或母体。
组成总体的每个单元称为个体总体X可看作一个随机变量,称X的概率分布为总体分布,称X的数字特征为总体的数字特征,对总体进行研究就是对总体的分布或对总体的数字特征进行研究.1.2.2样本从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量.样本具有二重性:
随机性和确定性定义定义1.1设总体X的样本满足独立性:
每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立;代表性:
样本中每一个个体都与总体X有相同分布。
则称此样本为简单随机样本。
进行有放回抽样就是简单随机样本,无放回抽样就不是简单随机样本。
但N很大,n相对较小时无放回抽样得到的样本可以近似看作简单随机样本.称样本的分布为样本分布。
如果为简单随机样本,为总体X的分布函数,则样本分布有比较简单的形式。
),.,(1nXX)(xF它完全由总体X的分布函数确定),(),221121nnnxXxXxXPxxxF(1122()()()nnPXxPXxPXx=LninixFxXP)(11)(11如果总体中服从均匀分布则()00()01nnnxxFxxxqqq
(1)00()()101nnxxFxxxqqqq其分布密度为其它00)
(1)(xnxxfnnn其它00)()
(1)1(xxnxfnn充分统计量例:
某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为)外,其它都是合格品(记为)。
当厂长问及检查结果时检验员可作如下两种回答:
(1)10件中有两件不合格;
(2)前两件不合格。
这两种回答反映了检验员对样本的两种不同的加工方法。
其所用的统计量分别为1,121XXniXi,4,3,0显然,第二种回答是不能令人满意的,因为统计量不包含样本中有关p的全部信息。
而第一种回答是综合了样本中有关p的全部信息。
因为样本提供了两种信息:
(1)10次检验中不合格品出现了几次;
(2)不合格品出现在哪几次试验上。
1011;IiXT212XXT),(1021XXX第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的.充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。
或者说充分统计量包含了有关总体或有关参数的全部信息.考虑样本的分布),(1021XXX111122101010101111010(,)()
(1)
(1)
(1)iiiixxiiiixxTTPXxXxXxPXxpppppp-=-=-邋=-=-照L由于且是服从二项分布故11112210101110101111010(,)()
(1)
(1)
(1)iiiixxiiiixxttPXxXxXxTtPXxpppppp-=-=-邋=-=-照L1T111101110()
(1)tttPTtCpp-=-它与无关p111111111112210101110101010101010(,|)
(1)/
(1)
(1)/
(1)1iixxtttttttttPXxXxXxTtppCppppCppC-=邋-=-=L定义1.3设总体X的分布为一个含未知参数的分布族,是X的一个样本。
是一个统计量,对给定的t,样本在的条件下的条件分布与参数无关,则称统计量T是参数的充分统计量。
:
FtT),.,(1nXX),.,(1nXX),.,(1nXXTT上例的一般情况是设是来自0-1分布的一个简单随机样本,其中,则是参数的充分统计量。
xxxXP1)1()(1,0x01qqniiXT1),.,(1nXX由定义可得定理1.1设是参数的充分统计量,是单值可逆函数,则也是参数的充分统计量。
)(ts)(Ts),.,(1nXXTT当总体为连续型总体时,充分统计量要用条件分布密度来描述。
奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别充分统计量的方法:
因子分解定理。
定理1.2(因子分解定理)设样本的联合分布为一个含未知参数的分布族,则是一个充分统计量当且仅当存在这样的两个函数:
(1)与无关的非负函数;
(2)与有关,且仅与统计量T的值有关的非负函数使得其中在离散总体的情况下表示样本的分布列,在连续总体的情况下表示样本的分布密度。
),.,(1nXXTT:
),.,(1nxxf),.,(1nXXh),.,(1nxxTg),.,(),.,(),.,(111nnnxxTgxxhxxf),.,(1nxxf例设是来自分布,即它的分布密度为的一个简单随机样本,其中则分别是参数的充分统计量),(21nXXX),(2N221()2,1()2xfxemsmsps-=,0xs-+,0ms-+21211,()nniiiiTXTXX=-邋2,ms解:
样本的联合分布密度为如果令由因子分解定理知是的充分统计量。
),(21nXXX222221222,()(,)
(2)exp()22nnTnXfxxxmsmpsss-=-L1),(21nxxxh12(,)ngTxxxqL222222()
(2)exp()22nTnXmpsss-=-),(21TT),(2例设总体X的分布密度为是X的一个简单随机样本,试证明最小顺序统计量的充分统计量。
),(21nXXX2);(xxfx0
(1)Xq是证:
样本的联合分布密度为如果令由因子分解定理知是的充分统计量。
12(,)nXXXL1212212(,),0,()nnnnfxxxxxxxxxqqq=+LLL122121(,)(,)nnhxxxxxx=LL12(,)ngTxxxqL
(1),0nxqq=2021)2()2(xxtedtexXPxXP0x,0,00,21)(2xxexfx2Xl)2(22X假定子样是简单随机子样,则且它们之间相互独立,故有22
(2)iXlc2122
(2)niinXXnllc=t分布分布构造性的方式定义定义1.6设,且X与Y相互独立,记则也是一个随机变量,它所服从的分布称为自由度为n的t分布,记为)1,0(NX)(2nYnYXT)(ntT它的密度函数为与参数n有关,不同的n其图形也有差异1221()2()
(1),()2nnxfxxnnnp+-+G=+-()0,()2nTDTnE=+()可以证明这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布221lim()2xnfxep-=分布分布构造性的方式定义定义1.设,且X与Y相互独立,记则也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为2()Xmc)(2nYXmFYn=(,)FFmn它的密度函数为它与m,n有关,其图形也有一定差异0,00,)1()()2()2()2()(2122xxxnmxnmnmnmxfnmmm容易得到若,则),(nmFF1(,)FnmF例设试证明:
证明:
由t分布的构造性定义知,存在相互独立的变量和,使得于是,仍相互独立,由分布的定义知结论成立(),Ttn2(1,)TFnnYXT2221XXTYnYn=2XY与分位数:
定义1.6设X为连续型随机变量,其密度函数为,对,如果存在数满足则称为此分布的分位数分位数的几何意义可用图形表示,它的值可查表得到,不同的分布有不同的分位数,有不同的表可查)(xf10xdxxfxXP)()(xa-x常见的分位数有它们的值可以通过附表1、附表2、附表3、附表4查得2,(),(),(,)ZntnFmnaaaac分位数具有性质
(1)
(2)(3)当n足够大时(一般n45)有近似公式)()(,11ntntZZ),
(1),(1mnFnmF2(),2tnZnnZaaaac+换例:
查表求下列分位数的值0.050.9752220.050.990.050.050.990.050.050.99,(10),(10),(50)(10),(10),(100)(9,10),(9,10),ZZtttFFccc抽样分布定理定理1.1设总体,为X的一个简单随机样本,为样本均值与样本方差,则有:
(1)
(2),(2NX12(,)nXXXL2,SX),(2nNX);1()1(222nsn(3)相互独立;(4)2XS与)1(ntnSX定理1.2设有两个总体与,从两个总体与中分别独立抽取容量为m,n的简单样本,记为样本的样本均值与方差,为样本的样本均值与方差,则()),(211NX),(222NY),(21mXXX),(21nYYY2,XSX),(21mXXX),(21nYYY2,YSY)1,0()()(222121NnmYX例1.8设总体,分别从X中抽取容量为10与15的两个独立样本,求它们的均值之差的绝对值大于0.3的概率)3,20(NX例1.设总体,是从总体中抽取的简单随机样本,选取常数c,d使得并求出n.(0,1)XN),(521XXX)()()(22542321nXXdXXXc中南大学数学与统计学院中南大学数学与统计学院ThankYou!