关于Poisson分布的检验Word格式.docx

上传人:b****4 文档编号:6389604 上传时间:2023-05-06 格式:DOCX 页数:36 大小:34.49KB
下载 相关 举报
关于Poisson分布的检验Word格式.docx_第1页
第1页 / 共36页
关于Poisson分布的检验Word格式.docx_第2页
第2页 / 共36页
关于Poisson分布的检验Word格式.docx_第3页
第3页 / 共36页
关于Poisson分布的检验Word格式.docx_第4页
第4页 / 共36页
关于Poisson分布的检验Word格式.docx_第5页
第5页 / 共36页
关于Poisson分布的检验Word格式.docx_第6页
第6页 / 共36页
关于Poisson分布的检验Word格式.docx_第7页
第7页 / 共36页
关于Poisson分布的检验Word格式.docx_第8页
第8页 / 共36页
关于Poisson分布的检验Word格式.docx_第9页
第9页 / 共36页
关于Poisson分布的检验Word格式.docx_第10页
第10页 / 共36页
关于Poisson分布的检验Word格式.docx_第11页
第11页 / 共36页
关于Poisson分布的检验Word格式.docx_第12页
第12页 / 共36页
关于Poisson分布的检验Word格式.docx_第13页
第13页 / 共36页
关于Poisson分布的检验Word格式.docx_第14页
第14页 / 共36页
关于Poisson分布的检验Word格式.docx_第15页
第15页 / 共36页
关于Poisson分布的检验Word格式.docx_第16页
第16页 / 共36页
关于Poisson分布的检验Word格式.docx_第17页
第17页 / 共36页
关于Poisson分布的检验Word格式.docx_第18页
第18页 / 共36页
关于Poisson分布的检验Word格式.docx_第19页
第19页 / 共36页
关于Poisson分布的检验Word格式.docx_第20页
第20页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

关于Poisson分布的检验Word格式.docx

《关于Poisson分布的检验Word格式.docx》由会员分享,可在线阅读,更多相关《关于Poisson分布的检验Word格式.docx(36页珍藏版)》请在冰点文库上搜索。

关于Poisson分布的检验Word格式.docx

中都有广泛的应用.如110报警台24小时接到的报警次数、一定时间内发生的意

外事件次数或灾害次数、布匹上的疵点数目、放射性物质放射出的粒子数目等.

1.2研究方法及目的

由于向110报警台的报警是一次次到来的;

自然灾害是一次次发生的;

射性粒子是一个个射出的;

进入商场的人是一个个到来的,,它们都可以看成

是一种于随机时刻到来的“质点流”.要对其进行研究,首先,必须收集到有效

的数据.其次,由于得到的样本数据通常是实验或统计而来,因此它不能完全的反映事物的本质.我们主要对部分数据进行抽取分析,根据部分数据对全体数据做出推断及判断.

因此,研究单位时间内产生的诸多随机变量有助于当事者们对各种新措施、新技术作出更为科学合理的决策.例如,商场每个时段到达的人数不一,通过调查可以确定哪个时段是人流的高峰期,可以在这个时段做一些宣传或促销产生的

效益就会比其他时段高,并有效控制成本,使其用最小的投入换来最大的收益.

2Poisson分布检验的步骤及基本理论

2.1检验步骤

2.1.1数据整理

进行Poisson分布的检验时,首先要对收集到的数据进行整理.假设收集到

单位时间的量为x1,x2,x3xn,然后把这些量按从小到大顺序排列起来,并查

出其频数稍加整理制成表格如下:

表1

单位时间的量

xi

,

频数pi

p0

p1

p2

pi

其中满足:

x1

x2

xn

0p01p1

2.1.2用图像对样本数据进行模拟

由于图形比较直观,而且样本数据在一定程度上能有效反映总体的分布规

律,故可以用样本数据的图像模拟通过对比,对该分布进行初步判断.

泊松分布的图形一般为左偏,但随数值的增大,图形趋于对称.

图1

2.1.3检验得出结论

2.2检验的基本理论

2.2.1假设检验

假设检验是对总体的分布函数形式或分布的某些参数作出某些可能的假设,然后根据所得的样本数据,对假设的正确性作出判断.

假设检验的步骤:

①根据问题建立原假设和备择假设

原假设是设总体参数等于某一数值,而备则假设是根据研究的目的来确定:

可采用双侧检验,也可采用单侧检验.确定单、双侧检验的同时,也就确定了接受域和拒绝域的位置.

②选择适当的样本统计量,并确定以H0为真时的抽样分布

这一步是假设检验的关键,需要根据已知条件找到一个包含待检验总体参数和样本数据的已知分布,并计算出统计量的数值.

③选定显著性水平,确定临界值

应在抽样之前就确定下来,根据单、双侧检验的情况,将放置一侧或双侧.然后根据第二步骤中所选择统计量服从的分布,查相应分布表,确定临界

值.

④进行判别,得出结论

将第二步计算的数值与第三步得到的临界值进行比较,根据判别原则,作出结论.

2.2.2最大似然估计及拟合优度2检验

3

最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立

同分布的.下面我们具体描述一下最大似然估计:

首先,假设x1,x2,,xn为独立同分布的样本,θ为模型参数,f为我们所使

用的模型,遵循我们上述的独立同分布假设.参数为θ的模型f产生上述样本可

表示为

f(x1,x2,,xn|)f(x1|)f(x2|)f(xn|)

在上面的假定模型且参数是未知的基础上,这时,我们已知的有

x1,x2,,xn,未知的有θ,所以似然函数定义为:

n

L()f(x1,x2,,xn|)

f(xi|),

i

L()称为样本的似然函数.倘若存在一个值?

,使得在

?

时有

L(x1,x2,,xn

|?

)maxL(x1,x2,,xn|

则称?

是的一个极大似然估计值,简记为MLE.

在实际应用中通常采用的是两边取对数,得到公式如下:

lnL()

lnf(xi|),

由于ln(x)是x的单调增函数,因此,使对数似然函数lnL()达到最大与L()

达到最大是等价的.

令dlnL()0,即可解出的极大似然估计值?

d

若总体X是具有参数0的泊松分布,X1,X2,,Xn为来自总体X的一个样

本,则似然函数为:

x

L()

xi!

e

)i1en

i1

4

lnxi!

n

xi)ln,dlnL()

令dlnL()

,得如下方程:

0,从中解得:

?

xi,

ni

又d2lnL(

)|

n2

0,于是参数

的最大似然估计为:

x.

d2

2拟合优度的检验,是通过2统计量来检验变量的实际分布是否与理论分布相同.所谓拟合优度,是指实际观察的频数与期望(理论)频数相似的程

度.2检验可以对各种假设的分布进行检验.在对各种分布进行检验时,应将各

变量值做适当分类,使每一类别的期望频数大于等于5.在选定类别时,如果变量值是有限个,则可以将其每一个取值作为一个类别;

如果变量值可以取无限个,

则通过适当合并,将其变为有限个区间,把每一个区间视为一类.

2.2.3P值检验

所谓P值,是指在一个假设检验问题中,利用观测值能够做出拒绝原假设选择的最小显著性水平,如果p值小于显著性水平,则相应的检验统计量的值

落入拒绝域中.其检验规则为:

若p值,则拒绝原假设H0;

若p值,则接受原假设H0.

2.2.4Poisson分布检验

设总体X服从具有参数为

0的泊松分布,X1,X2,X3,

Xn为其样本.

考虑检验问题:

H0

:

0;

H1:

0,现有

p(xi;

een

enexp(xi)ln

(xi!

其中Tx1,x2,,xn

xi,b()ln

5

1n

h(x1,x2,,xn)n,c()e

1,Tc1&

c2

因此(x1,x2,

xn)

bi,T

cj,j1,2

0,c1T

c2

E0

Xi

(x1,x2,,xn)

M(0,0)E0

(x1,x2,,xn)

当H0为真时,统计量T

服从参数为n0的泊松分布,E(T)

n0,则

c11(n0)jen0

(n0)jen0

b1(n0)c1en0

b2(n0)c2en0

j0

j!

jc21

c1!

c2!

n0

c11j(n0)jen0

j(n0)jen0

b1c1(n0)c1en0

b2c2(n0)c2en0

j!

c1!

c2!

在一般情况下上述方程不易求解,但当0不接近于零而n又不很小时,统计量

U

的渐进分布为正态分布

N(0,1),则

P0

Xin0u

Xin0

u

对一切实数u都渐近地成立(这是因为正态分布具有对称性)

.因此,b1,b2,c1,c2

由下式确定:

c11(n0)jen0

3关于Poisson分布检验的三个案例及实际研究

3.1案例分析

3.1.1论反腐败与泊松分布

腐败现象作为当今社会的一种非常态,它的发生、出现引起了广大群众的

6

关注.调查显示最近几年科级腐败正在加剧,小官受贿成隐患.据悉,某检察院工作人员对某经济较落后省的320个底层官员在一年时间内的受贿金额调查纪录

如下表所示.根据这些数据(金额0表示未受贿,金额1表示受贿金额大于0小于等于1,其余类同)检验受贿金额是否服从泊送分布.

表21年内320个官员受贿金额(万元)统计表

8

9

10

15

47

70

81

52

25

16

320

来源于参考文献[6]

用折线图像模拟数据如下:

官员受贿频数图

100

80

60

人数系列1

40

20

1234567891011

受贿金额

图2

从图形走势看,为左偏凸值分布,与泊松分布较为相似,可初步判定为泊松分布.

在理论上,这里我们需要检验的是在一年的时间段内受贿官员的受贿金额是否服从泊送分布,所以可以假设

H0:

一年的时间内受贿官员的受贿金额服从泊送分布;

H1:

一年的时间内受贿官员的受贿金额不服从泊送分布;

,式中:

是未知参数.

我们知道泊送分布的概率密度函数为f(Xx)

x!

如果假设为真时,可以根据本数据估计.由上表的数据可以的到在320个底层

官员中,平均每一官员受贿的金额(万元),即

3.0

因此,可以用?

作为的估计值,即得到为真时的概率密度函数

3xe3

f(Xx)

根据该密度函数,就可以计算出在每一个官员的受贿金额为各个类别出现的概

率,这些概率值可通过泊送分布表查得

.例如,在一年内受贿金额为

0万元的官

员人数的概率是f(X

0)

0.498,受贿金额为1万元的概率是f(X1)

0.1494

等.然后用查出的概率分别乘以样本容量

n(n

320),就可以得到各类别期望的频

数.例如,在320个官员中受贿金额为

0万元的期望频数是

0.0498

15.936.

下表列出了

2统计量的计算过程.

表3

2统计量的计算过程

为真时的

实际频数

期望频数

(ni

ei)2

f(X

xi)

ni

einf(X

ei

15.936

0.0550

47.808

0.0137

0.2240

71.68

0.0394

1.2118

0.1680

53.76

0.0576

0.1008

32.256

1.6322

0.0504

16.128

1.0159

0.0216

6.912

0.0081

2.592

0.9812

0.0027

0.864

10万元以上

0.0012

0.384

合计

1.0000

5.0068

我们注意到表中,受贿金额为8,9和10万元次及以上金额的期望频数都小

于5,所以将这三类归于受贿金额为7万元的合并为一类,所以合并之后的类别

数k8.这时2统计量为

ei)2

需要注意的是:

根据Pearson定理,上式的

2统计量服从自由度为k

r

的2

分布,其中k时类别的个数,r是估计的总体参数的个数.在这里k

8,r

1(只

估计了一个参数

),所以自由度为k

r1

8116.于是,当

0.05

时,

查表可得

(6)12.592.对于样本的

值,因为

(6)落在接受域中.所

以接受H0,拒绝H1,即在一年的时间中该地区官员的受贿金额是服从泊松分布

的.

大家熟知当n很大,p很小时的二项分布趋于泊松分布.按照泊松分布的规律,一项非正常态现象的出现除了在总体中的概率很小外,其最明显的特征则是常常集中分布.通过上面检验和大量案例表明,腐败现象作为社会现象中的一种非正常态,其发生和发展呈泊松分布规律,特点是总体上的稀有性和局部的密集

性加偶然性,具体表现有“前腐后继案”、“串案”、“窝案”等形式.因此治理腐败:

一是要尽早发现,尽快惩前毖后;

二是不能搞扩大化;

三是要综合治理.

其次表明,泊松分布密集出现的概率跟社会体制有关,尤其是在经济转型、社会发生变革的时期容易出现。

比如我国正处于向社会主义市场经济的过渡时

期,法制不健全,各项改革和管理措施还跟不上形势发展的需要,所以腐败现象就表现得比较明显和集中。

若从历史长河中看,这种过程还是短暂的,从全局来看它也只集中在某些特定的行业和领域,而大部分时间和大部分领域都是正常的,都是非腐败的。

3.1.2卢瑟福散射实验

卢瑟福散射是近代物理科学发展史中最具影响力的重要实验之一。

1909年卢瑟福(L.E.Rutherford)和其合作者盖革(H.Geiger)与马斯(E.Marsden)进行的粒子散射实验,为原子的核式模型奠定了实验基础。

他们在云雾实验室观察镭所发射出的粒子数目.记录了2608个相等时间

间隔(他们以7.5秒为一个时间段)内观测了一放射性物质镭放射的粒子数x,

表4

xi

11

57

203

383

525

532

408

273

139

45

27

来源于参考文献[7]

在上表中的ni是观测到i个粒子的时间间隔数(最后一项已经合并).若要

检验观测的数据服从泊松分布这一假设(0.05),则:

k

因为对参数为的泊松分布是:

P(Xk)e,k0,1,2

k!

根据上表原始数据可以算得最大似然估计?

x3.870

而?

3.870的泊松分布通过计算机计算及查表(泊松分布函数表)可得下表:

表5

npi

(ninpi)

0.209

54.5

0.1147

0.0807

210.5

02672

0.1562

407.4

1.4614

0.2015

525.5

0.0005

0.1950

508.6

1.0766

0.1509

393.5

0.5343

0.0973

253.8

1.4525

0.0538

140.3

0.0120

0.0260

67.8

7.6673

0.0112

29.2

0.1658

0.0053

11.2

0.1286

0.0022

5.7

0.0158

总和

2608

12.8967

因此

12.8967,

其自由度为

12-1-1=10,对

0.05查(

2分布分位数

22

p(n)表)得0.05(10)18.307,所以我们接受H

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2