正态分布的前世今生.docx

上传人:b****3 文档编号:6580554 上传时间:2023-05-10 格式:DOCX 页数:18 大小:246.61KB
下载 相关 举报
正态分布的前世今生.docx_第1页
第1页 / 共18页
正态分布的前世今生.docx_第2页
第2页 / 共18页
正态分布的前世今生.docx_第3页
第3页 / 共18页
正态分布的前世今生.docx_第4页
第4页 / 共18页
正态分布的前世今生.docx_第5页
第5页 / 共18页
正态分布的前世今生.docx_第6页
第6页 / 共18页
正态分布的前世今生.docx_第7页
第7页 / 共18页
正态分布的前世今生.docx_第8页
第8页 / 共18页
正态分布的前世今生.docx_第9页
第9页 / 共18页
正态分布的前世今生.docx_第10页
第10页 / 共18页
正态分布的前世今生.docx_第11页
第11页 / 共18页
正态分布的前世今生.docx_第12页
第12页 / 共18页
正态分布的前世今生.docx_第13页
第13页 / 共18页
正态分布的前世今生.docx_第14页
第14页 / 共18页
正态分布的前世今生.docx_第15页
第15页 / 共18页
正态分布的前世今生.docx_第16页
第16页 / 共18页
正态分布的前世今生.docx_第17页
第17页 / 共18页
正态分布的前世今生.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

正态分布的前世今生.docx

《正态分布的前世今生.docx》由会员分享,可在线阅读,更多相关《正态分布的前世今生.docx(18页珍藏版)》请在冰点文库上搜索。

正态分布的前世今生.docx

正态分布的前世今生

正态分布的前世今生(六)——正态分布的近代发展

时间:

2012-11-1322:

10来源:

我爱自然语言处理作者:

rickjin围观:

646次

【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。

花开两朵,各表一枝。

上面说了围绕正态分布在概率论中的发展,现在来看看正态分布在数理统计学中发展的故事。

这个故事的领衔主演是AdolpheQuetelet和高尔顿(Galton)。

由于高斯的工作,正态分布在误差分析迅速确定了自己的定位,有了这么好的工具,我们可能拍脑袋就认为,正态分布很快就被人们用来分析其它的数据,然而事实却出乎我们的意料,正态分布进入社会领域和自然科学领域,可是经过一番周折的。

首先我要告诉大家一个事实:

误差分析和统计学是两个风马牛不相及的两个学科。

当然这个事实存在的时间是19世纪初之前。

统计学的产生最初是与“编制国情报告”有关,主要服务于政府部门。

统计学面对的是统计数据,是对多个不同对象的测量;而误差分析研究的是观测数据,是对同一个对象的多次测量。

因此观测数据和统计数据在当时被认为两种不同行为获取得到的数据,适用于观测数据的规律未必适用于统计数据。

19世纪的统计数据分析处于一个很落后的状态,和概率论没有多少结合。

而概率论的产生主要和赌博相关,发展过程中与误差分析紧密联系,而与当时的统计学交集非常小。

将统计学与概率论真正结合起来推动数理统计学发展的便是我们的统计学巨星Quetelet。

Quetelet这名字或许不如其它数学家那么响亮,估计很多人不熟悉,所以有必要介绍一下。

Quetelet是比利时人,数学博士毕业,年轻的时候曾追谁拉普拉斯学习过概率论。

此人学识渊博,涉猎广泛,脑门上的桂冠包括统计学家、数学家、天文学家、社会学家、国际统计会议之父、近代统计学之父、数理统计学派创始人。

Quetelet的最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究。

1831年,Quetelet参与主持新建比利时统计总局的工作。

他开始从事有关人口问题的统计学研究。

在这种研究中,Quetelet发现,以往被人们认为杂乱无章的、偶然性占统治地位的社会现象,如同自然现象一样也具有一定的规律性。

Quetelet搜集了大量关于人体生理测量的数据,如体重、身高与胸围等,并使用概率统计方法来对数据进行数据分析。

但是当时的统计分析方法遭到了社会学家的质疑,社会学家们的反对意见主要在于:

社会问题与科学实验不同,其数据一般由观察得到,无法控制且经常不了解其异质因素,这样数据的同质性连带其分析结果往往就有了问题,于是社会统计工作者就面临一个如何判断数据同质性的问题。

Quetelet大胆地提出:

把一批数据是否能很好地拟合正态分布,作为判断该批数据同质的依据。

Quetelet提出了一个使用正态曲线拟合数据的方法,并广泛的使用正态分布去拟合各种类型的数据。

由此,Quetelet为正态分布的应用拓展了广阔的舞台。

正态分布如同一把屠龙刀,在Quetelet的带领下,学者们挥舞着这把宝刀在各个领域披荆斩棘,攻陷了人口、领土、政治、农业、工业、商业、道德等社会领域,并进一步攻占天文学、数学、物理学、生物学、社会统计学及气象学等自然科学领域。

正态分布的下一个推动力来自生物学家高尔顿,当正态分布与生物学联姻时,近代统计学迎来了一次大发展。

高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究遗传进化问题。

受Quetelet的启发,他对正态分布怀有浓厚的兴趣,开始使用正态分布去拟合人的身高、胸围、以至考试成绩等各类数据,发现正态分布拟合得非常好。

他因此相信正态曲线是适用于无数情况的一般法则。

然而,对高尔顿而言,这个无处不在的正态性给他带来一些困惑。

他考察了亲子两代的身高数据,发现遵从同一的正态分布,遗传作为一个显著因素是如何发挥作用的?

1877年,高尔顿设计了一个叫高尔顿钉板(quincunx,或者Galtonboard)的装置,模拟正态分布的性质用于解释遗传现象。

如下图中每一点表示钉在板上的一颗钉子,它们彼此的距离均相等。

当小圆球向下降落过程中,碰到钉子后皆以1/2的概率向左或向右滚下。

如果有n排钉子,则各槽内最终球的个数服从二项分布B(n,1/2),当n较大的时候,接近正态分布。

高尔顿钉板

设想在此装置的中间某个地方AB设一个挡板把小球截住,小球将在AB处聚成正态曲线形状,如果挡板上有许多阀门,打开一些阀门,则在底部形成多个大小不一的正态分布,而最终的大正态分布正式这些小正态分布的混合。

高尔顿钉板解释遗传现象

高尔顿利用这个装置创造性的把正态分布的性质用于解释遗传现象。

他解释说身高受到显著因素和其它较小因素的影响,每个因素的影响可以表达为一个正态分布。

遗传作为一个显著因素,类似图中底部大小不一的正态分布中的比较大的正态分布,而多个大小不一正态分布累加之后其结果任然得到一个正态分布。

高尔顿在研究身高的遗传效应的时候,同时发现一个奇特的现象:

高个子父母的子女,其身高有低于其父母身高的趋势,而矮个子父母的子女,其身高有高于其父母的趋势,即有“回归”到普通人平均身高去的趋势,这也是“回归”一词最早的含义。

高尔顿用二维正态分布去拟合父代和子代身高的数据,同时引进了回归直线、相关系数的概念,从而开创了回归分析这门技术。

可以说,高尔顿是用统计方法研究生物学的第一人,他用实际行动开拓了Quetelet的思想;为数理统计学的产生奠定了基础。

无论是Quetelet还是高尔顿,他们的统计分析工作都是以正态分布为中心的,在他们的影响下,正态分布获得了普遍认可和广泛应用,甚至是被滥用,以至有些学者认为19世纪是正态分布在统计学中占统治地位的时代。

数理统计三剑客

最后,我们来到了20世纪,正态分布的命运如何呢?

如果说19世纪是正态分布在统计学中独领风骚的话,20世纪则是数理统计学蓬勃发展、百花齐放的时代。

1901年,高尔顿和他的学生卡尔.皮尔逊(KarlPearson)、韦尔登(W.F.RWeldon)创办《生物计量(Biometrika)》杂志,成为生物统计学派的一面旗帜,引导了现代数理统计学的大发展。

统计学的重心逐渐由欧洲大陆向英国转移,使英国在以后几十年数理统计学发展的黄金时代充当了领头羊。

在20世纪以前,统计学所处理的数据一般都是大量的、自然采集的,所用的方法以拉普拉斯中心极限定理为依据,总是归结到正态。

到了19世纪末期,数据与正态拟合不好的情况也日渐为人们所注意:

进入20世纪之后,人工试验条件下所得数据的统计分析问题,日渐被人们所重视。

由于试验数据量有限,那种依赖于近似正态分布的传统方法开始招致质疑,这促使人们研究这种情况下正确的统计方法问题

在这个背景之下,统计学三大分布χ2分布、t分布、F分布逐步登上历史舞台。

这三大分布现在的理科本科生都很熟悉。

在历史上,这三个分布和来自英国的现代数理统计学的三大剑客有着密切的关系。

第一位剑客就是卡尔.皮尔逊(KarlPearson),手中的宝剑就是χ2分布。

χ2分布这把宝剑最早的锻造者其实是物理学家麦克斯韦,他在推导空气分子的运动速度的分布的时候,发现分子速度在三个坐标轴上的分量是正态分布,而分子运动速度的平方v2符合自由度为3的χ2分布。

麦克斯韦虽然造出了这把宝剑,但是真正把它挥舞得得心应手、游刃有余的是皮尔逊。

在分布曲线和数据的拟合优度检验中,χ2分布可是一个利器,而皮尔逊的这个工作被认为是假设检验的开山之作。

皮尔逊继承了高尔顿的衣钵,统计功力深厚,在19世纪末20世纪初很长的一段时间里,一直被数理统计武林人士尊为德高望重的第一大剑客。

第二位剑客是戈塞特(Gosset),笔名是大家都熟悉的学生氏(Student),而他手中的宝剑是t分布。

戈塞特是化学、数学双学位,依靠自己的化学知识进酿酒厂工作,工作期间考虑酿酒配方实验中的统计学问题,追谁卡尔.皮尔逊学习了一年的统计学,最终依靠自己的数学知识打造出了t分布这把利剑而青史留名。

1908年,戈塞特提出了正态样本中样本均值和标准差的比值的分布,并给出了应用上及其重要的第一个分布表。

戈塞特在t分布的工作是开创了小样本统计学的先河。

第三位剑客是费希尔(R.A.Fisher),手持F分布这把宝剑,在一片荒芜中开拓出方差分析的肥沃土地。

F分布就是为了纪念费希尔而用他的名字首字母命名的。

费希尔剑法飘逸,在三位剑客中当属费希尔的天赋最高,各种兵器的使用都得心应手。

费希尔统计造诣极高,受高斯的启发,系统的创立了极大似然估计剑法,这套剑法现在被尊为统计学参数估计中的第一剑法。

费希尔还未出道,皮尔逊已经是统计学的武林盟主了,两人岁数相差了33岁,而戈塞特介于他们中间。

三人在统计学擂台上难免切磋剑术。

费希尔天赋极高,年少气盛;而皮尔逊为人强势,占着自己武林盟主的地位,难免固执己见,以大欺小;费希尔着实受了皮尔逊不少气。

而戈塞特性格温和,经常在两人之间调和。

毕竟是长江后浪推前浪,一代新人换旧人,在众多擂台比试中,费希尔都技高一筹,而最终取代了皮尔逊成为数理统计学第一大剑客。

由于这三大剑客和统计三大分布的出现,正态分布在数理统计学中不再是一枝独秀,数理统计的领地基本上是被这三大分布抢走了半壁江山。

不过这对正态分布而言并非坏事,我们细看这三大分布的数学细节:

假设独立随机变量Xi∼N(0,1),Yj∼N(0,1)(i=1…n,j=1…m),则满足三大分布的随机变量可以如下构造出来

你看这三大分布哪一个不是正态分布的嫡系血脉,没有正态分布就生不出χ2分布、t分布、F分布。

所以正态分布在19世纪是武则天,进入二十世纪就学了慈禧太后,垂帘听政了。

或者,换个角度说,一个好汉三个帮,正态分布如果是孤家寡人恐怕也难以雄霸天下,有了统计学三大分布作为开国先锋为它开疆拓土,正态分布真正成为傲世群雄的君王。

20世纪初,统计学这三大剑客成为了现代数理统计学的奠基人。

以哥塞特为先驱,费歇尔为主将,掀起了小样本理论的革命,事实上提升了正态分布在统计学中的地位。

在数理统计学中,除了以正态分布为基础的小样本理论获得了空前的胜利,其它分布上都没有成功的案例,这不能不让人对正态分布刮目相看。

在随后的发展中,相关回归分析、多元分析、方差分析、因子分析、布朗运动、高斯过程等等诸多统计分析方法陆续登上了历史舞台,而这些和正态分布密切相关的方法,成为推动现代统计学飞速发展的一个强大动力。

Via:

我爱自然语言处理

正态分布的前世今生(五)——正态分布的进一步发展

时间:

2012-11-1317:

33来源:

我爱自然语言处理作者:

rickjin围观:

511次

【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。

19世纪初,随着拉普拉斯中心极限定理的建立与高斯正态误差理论的问世,正态分布开始崭露头角,逐步在近代概率论和数理统计学中大放异彩。

在概率论中,由于拉普拉斯的推动,中心极限定理发展成为现代概率论的一块基石。

而在数理统计学中,在高斯的大力提倡之下,正态分布开始逐步畅行于天下。

1.论剑中心极限定理

先来说说正态分布在概率论中的地位,这个主要是由于中心极限定理的影响。

1776年,拉普拉斯开始考虑一个天文学中的彗星轨道的倾角的计算问题,最终的问题涉及独立随机变量求和的概率计算,也就是计算如下的概率值

在这个问题的处理上,拉普拉斯充分展示了其深厚的数学分析功底和高超的概率计算技巧,他首次引入了特征函数(也就是对概率密度函数做傅立叶变换)来处理概率分布的神妙方法,而这一方法经过几代概率学家的发展,在现代概率论里面占有极其重要的位置。

基于这一分析方法,拉普拉斯通过近似计算,在他的1812年发表的名著《概率分析理论》中给出了中心极限定理的一般描述:

[定理Laplace,1812]假设ei(i=1,…n)为独立同分布的测量误差,具有均值μ和方差σ2。

如果λ1,…,λ2为常数,a>0,则有

理科专业的本科生学习《概率论与数理统计》这门课程的时候,除了学习棣莫弗-拉普拉斯中心极限定理,通常还学习如下中心极限定理的一般形式:

[Lindeberg-Levy中心极限定理]设X1,…,Xn独立同分布,且具有有限的均值μ和方差σ2,则在n→∞时,有

多么奇妙的性质,随意的一个概率分布中生成的随机变量,在序列和(或者等价的求算术平均)的操作之下,表现出如此一致的行为,统一的规约到正态分布。

概率学家们进一步的研究结果更加令人惊讶,序列求和最终要导出正态分布的条件并不需要这么苛刻,即便X1,…,Xn并不独立,也不具有相同的概率分布形式,很多时候他们求和的最终的归宿仍然是正态分布。

一切的纷繁芜杂都在神秘的正态曲线下被消解,这不禁令人浮想联翩。

中心极限定理恐怕是概率论中最具有宗教神秘色彩的定理,如果有一位牧师拿着一本圣经向我证明上帝的存在,我是丝毫不会买账;可是如果他向我展示中心极限定理并且声称那是神迹,我会很乐意倾听他的布道。

如果我能坐着时光机穿越到一个原始部落中,我也一定带上中心极限定理,并劝说部落的酋长把正态分布作为他们的图腾。

中心极限定理虽然表述形式简洁,但是严格证明它却非常困难。

中心极限定理就像一张大蜘蛛网,棣莫弗和拉普拉斯编织了它的雏形,可是这张网上漏洞太多,一个多世纪来,数学家们就像蜘蛛一样前赴后继,努力想把所有的漏洞都补上。

在十九世纪,珀松(Poission)、狄利克莱(Dirichlet)、柯西(Cauchy)、贝塞尔(Bessel)这些大蜘蛛都曾经试图对把这张网上的漏洞补上。

从现代概率论来看角度,整个十九世纪的经典概率理论并没有能输出一个一般意义下严格的证明。

而真正把漏洞补上的是来自俄罗斯的几位蜘蛛侠:

切比雪夫(Chebyshev)、马尔可夫(Markov)和李雅普诺夫(Lyapunov)。

俄罗斯是一个具有优秀的数学传统的民族,产生过几位顶尖的的数学家,在现代概率论的发展中,俄罗斯的圣彼得堡学派可以算是顶了半边天。

把漏洞补上的严格方案的雏形是从切比雪夫1887年的工作开始的,不过切比雪夫的证明存在一些漏洞。

马尔可夫和李雅普诺夫都是切比雪夫的学生,马尔科夫沿着老师的基于矩法的思路在蜘蛛网上辛勤编织,但洞还是补得不够严实;李雅普诺夫不像马尔可夫那样深受老师的影响,他沿着拉普拉斯当年提出的基于特征函数的思路,于1901年给出了一个补洞的方法,切比雪夫对这个方法大加赞赏,李雅普诺夫的证明被认为是第一个在一般条件下的严格证明;而马尔科夫也不甘示弱,在1913年基于矩法也把洞给补严实了。

20世纪初期到中期,中心极限定理的研究几乎吸引了所有的概率学家,这个定理俨然成为了概率论的明珠,成为了各大概率论武林高手华山论剑的场所。

不知道大家对中心极限定理中的“中心”一词如何理解,许多人都认为"中心"这个词描述的是这个定理的行为:

以正态分布为中心。

这个解释看起来确实合情合理,不过并不符合该定理被冠名的历史。

事实上,20世纪初概率学家大都称呼该定理为极限定理(LimitTheorem),由于该定理在概率论中处于如此重要的中心位置,如此之多的概率学武林高手为它魂牵梦绕,于是数学家波利亚(Polya)于1920年在该定理前面冠以"中心"一词,由此后续人们都称之为中心极限定理。

论剑中心极限定理

数学家们总是及其严谨苛刻的,给定了一个条件下严格证明了中心极限定理。

数学家就开始探寻中心极限定理成立的各种条件,询问这个条件是否充分必要条件,并且进一步追问序列和在该条件下以什么样的速度收敛到正态分布。

1922年Lindeberg基于一个比较宽泛容易满足的条件,给中心极限定理提出了一个很容易理解的初等证明。

这个条件我们现在称之为Lindeberg条件。

然后概率学家Feller和Levy就开始追问Lindeberg条件是充分必要的吗?

基于Lindeberg的工作,Feller和Levy都于1935年独立的得到了中心极限定理成立的充分必要条件,这个条件可以用直观的非数学语言描述如下:

[中心极限定理充要条件]假设独立随机变量序列Xi的中值为0,要使序列和S=∑ni=1Xi的分布函数逼近正态分布,以下条件是充分必要的:

1如果Xi相对于序列和S的散布(也就是标准差)是不可忽略的,则Xi的分布必须接近正态分布

2对于所有可忽略的Xi,取绝对值最大的那一项,相对于可忽略项这个子序列和的散布,这个绝对值也是可忽略的

事实上这个充分必要条件发现的优先权,Feller和Levy之间还出现了一定的争论。

在Levy证明这个充分必要条件的过程中,Levy发现了正态分布的一个有趣的性质。

我们在数理统计中都学过,如果两个独立随机变量X,Y具有正态分布,则S=X+Y也具有正态分布。

奇妙的是这个定理的逆定理也成立:

[正态分布的血统]如果X,Y是独立的随机变量,且S=X+Y是正态分布,那么X,Y也是正态分布。

正态分布真是很奇妙,就像蚯蚓一样具有再生的性质,你把它一刀两断,它生成两个正态分布;或者说正态分布具有及其高贵的优良血统,正态分布的组成成分中只能包含正态分布,而不可能含有其它杂质。

1928年Levy就猜到了这个定理,并使用这个定理于1935年对中心极限定理的充分必要条件作了证明。

但是Levy却无法证明正态分布的这个看上去及其简单的再生性质。

直到1936年Cramer才给出了证明。

中心极限定理成为了现代概率论中首屈一指的定理,事实上中心极限定理在现代概率论里面已经不是指一个定理,而是指一系列相关的定理。

统计学家们也基于该定理不断的完善拉普拉斯提出的元误差理论(thehypothesisofelementaryerrors),并据此解释为何世界上正态分布如此常见。

而中心极限定理同时成为了现代统计学中大样本理论的基础。

via:

我爱自然语言处理

正态分布的前世今生(四)——正态分布的各种推导

时间:

2012-11-1317:

20来源:

我爱自然语言处理作者:

rickjin围观:

566次

【编者注】几乎所有的经济模型都有假设前提,学过计量经济学的同学都知道古典假设,而正态分布又在假设中占有十分重要的作用,小编偶然间在我爱自然语嫣处理这个博客中发现了《正态分布前世今生》的系列文章,文章以名人、故事为主线简单的描述了正态分布的前世今生,这里特推荐给大家。

在介绍正态分布的后续发展之前,我们来多讲一点数学,也许有些人会觉得枯燥,不过高斯曾经说过:

“数学是上帝的语言”。

所以要想更加深入的理解正态分布的美,唯有通过上帝的语言。

造物主造物的准则往往是简单明了的,只是在纷繁芜杂的万物之中,我们要发现并领会它并非易事。

之前提到过,17-18世纪科学界流行的做法,是尽可能从某种简单明了的准则(firstprinciple)出发作为我们探求的起点,而后来的数学家和物理学家们研究发现,屡次从一些给定的简单的准则出发,我们总是被引领到了正态分布的家门口,这让人感觉到正态分布的美妙。

达尔文的表弟高尔顿是生物学家兼统计学家,他对正态分布非常的推崇与赞美:

”我几乎不曾见过像误差呈正态分布这么激发人们无穷想象的宇宙秩序“。

当代两位伟大的概率学家Levy和Kac都曾经说过,正态分布是他们切入概率论的初恋情人,具有无穷的魅力。

如果古希腊人知道正态分布,想必奥林匹斯山的神殿里会多出一个正态女神,由她来掌管世间的混沌。

要拉下正态分布的神秘面纱展现她的美丽,需要高深的概率论知识,本人在数学方面知识浅薄,不能胜任。

只能在极为有限的范围内尝试掀开她的面纱的一角。

棣莫弗和拉普拉斯以抛钢镚的序列求和为出发点,沿着一条小径把我们第一次领到了正态分布的家门口,这条路叫作中心极限定理,而这条路上风景秀丽,许多概率学家都为之倾倒,这条路在20世纪被概率学家们越拓越宽。

而后数学家和物理学家们发现:

条条曲径通正态。

著名的物理学家E.T.Jaynes在他的名著《ProbabilityTheory,theLogicofScience》(中文书名翻译为《概率论沉思录》)中,描绘了四条通往正态分布的小径。

曲径通幽处,禅房花木深,让我们一起来欣赏一下四条小径上的风景吧。

1.高斯的推导(1809)

第一条小径是高斯找到的,高斯以如下准则作为小径的出发点

误差分布导出的极大似然估计=算术平均值

设真值为θ,x1,…,xn为n次独立测量值,每次测量的误差为ei=xi−θ,

假设误差ei的密度函数为f(e),则测量值的联合概率为n个误差的联合概率,记为

L(θ)=L(θ;x1,…,xn)=f(e1)…f(en)=f(x1−θ)…f(xn−θ)

为求极大似然估计,令

整理后可以得到

由于高斯假设极大似然估计的解就是算术平均xˉ,把解带入上式,可以得到

(*)式中取n=2,有

由于此时有x1−xˉ=−(x2−xˉ),并且x1,x2是任意的,有此得到

(*)式中再取n=m+1,并且要求x1=…=xm=−x,xm+1=mx,则有xˉ=0,并且

所以得到

g(mx)=mg(x)

而满足上式的唯一的连续函数就是g(x)=cx,从而进一步可以求解出

由于f(x)是概率分布函数,把f(x)正规化一下就得到正态分布函数。

2.Herschel(1850)和Maxwell(1860)的推导

第二条小径是天文学家Hershcel和物理学家麦克斯韦(Maxwell)发现的。

1850年,天文学家JohnHerschel在对星星的位置进行测量的时候,需要考虑二维的误差分布,为了推导这个误差的概率密度分布f(x,y),Herschel设置了两个准则:

x轴和y轴的误差是相互独立的,即误差的概率在正交的方向上相互独立

误差的概率分布在空间上具有旋转对称性,即误差的概率分布和角度没有关系

这两个准则对于Herschel考虑的实际测量问题看起来都很合理。

由准则1,可以得到f(x,y)应该具有如下形式

f(x,y)=f(x)∗f(y)

把这个函数转换为极坐标,在极坐标下的概率密度函数设为g(r,θ),有

f(x,y)=f(rcosθ,rsinθ)=g(r,θ)

由准则2,g(r,θ)具有旋转对称性,也就是应该和θ无关,所以g(r,θ)=g(r),

综合以上,我们可以得到

取y=0,得到g(x)=f(x)f(0),所以上式变为

则有

则从这个函数方程中容易求解出h(x)=ax2,从而可以得到f(x)的一般形式如下

而f(x)就是正态分布

而f(x,y)就是标准二维正态分布函数。

1860年,我们伟大的物理学家麦克斯韦在考虑气体分

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 电力水利

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2