水文统计方法Word文档下载推荐.docx

上传人:b****4 文档编号:6513790 上传时间:2023-05-06 格式:DOCX 页数:17 大小:28.69KB
下载 相关 举报
水文统计方法Word文档下载推荐.docx_第1页
第1页 / 共17页
水文统计方法Word文档下载推荐.docx_第2页
第2页 / 共17页
水文统计方法Word文档下载推荐.docx_第3页
第3页 / 共17页
水文统计方法Word文档下载推荐.docx_第4页
第4页 / 共17页
水文统计方法Word文档下载推荐.docx_第5页
第5页 / 共17页
水文统计方法Word文档下载推荐.docx_第6页
第6页 / 共17页
水文统计方法Word文档下载推荐.docx_第7页
第7页 / 共17页
水文统计方法Word文档下载推荐.docx_第8页
第8页 / 共17页
水文统计方法Word文档下载推荐.docx_第9页
第9页 / 共17页
水文统计方法Word文档下载推荐.docx_第10页
第10页 / 共17页
水文统计方法Word文档下载推荐.docx_第11页
第11页 / 共17页
水文统计方法Word文档下载推荐.docx_第12页
第12页 / 共17页
水文统计方法Word文档下载推荐.docx_第13页
第13页 / 共17页
水文统计方法Word文档下载推荐.docx_第14页
第14页 / 共17页
水文统计方法Word文档下载推荐.docx_第15页
第15页 / 共17页
水文统计方法Word文档下载推荐.docx_第16页
第16页 / 共17页
水文统计方法Word文档下载推荐.docx_第17页
第17页 / 共17页
亲,该文档总共17页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

水文统计方法Word文档下载推荐.docx

《水文统计方法Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《水文统计方法Word文档下载推荐.docx(17页珍藏版)》请在冰点文库上搜索。

水文统计方法Word文档下载推荐.docx

(2)概率

在数学中有两个分支,即概率论和数理统计。

研究随机事件统计规律的学科称为概率论。

由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。

概率是表示统计规律的方式。

用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。

针对不同的情况,概率有不同的定义。

按照数理统计的观点,事物和现象都可以看为是试验的结果。

如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为

式中P(A)——随机事件A的概率;

n——进行试验可能发生结果的总数;

m——进行试验中可能发生事件A的结果数。

例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。

因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;

同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。

如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。

按照上述公式,Z的概率

像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。

故按上面公式确定的事件概率称为古典概率。

在客观世界里中,随机事件并不都是等可能性的。

如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。

一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。

为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义。

在同样条件下进行试验,将事件A出现的次数μ称为频数,将频数μ与试验次数n的比值称为频率,记为P(A),则

大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。

概率的统计定义如下:

在一组不变的条件下,重复作n次试验,记μ是事件A发生的次数,当试验次数很大时,如果频率μ/n稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作

P(A)=p

(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。

概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。

前述的必然事件和不可能事件发生的可能性也可以用概率表示。

必然事件的概率等于(表示事件必然发生);

不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);

一般随机事件的概率介于0和之间。

对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。

如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。

如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。

类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。

如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。

下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。

12.什么是随机变量,怎样表示随机变量的概率分布

要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。

但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。

实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。

而这样做,需要对随机事件定量化地表示,为此引入随机变量。

按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。

如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。

又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。

随机变量的数学定义为:

在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。

随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……xn,即X表示随机取值的系列x1、x2、……xn)。

随机变量可以分为两类:

(1)离散型随机变量

如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。

离散型随机变量不能在两个相邻随机变量取值之间取值。

离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。

(2)连续型随机变量

如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。

比如,某一个长途汽车站,每隔30分钟有一班车发往某地。

对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。

连续型随机变量是普遍存在的。

水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。

对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。

随机变量取值与其概率的对应关系称为随机变量的概率分布。

对于离散型随机变量,可以用列举的方式表示它的概率分布。

列举的方法可以是列表,画图等。

我们的文字教材中举了例子。

对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。

比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。

实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。

从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。

为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。

在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。

对于一个随机变量,大于或等于不同数值的概率是不同的。

当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。

这一函数称之为随机变量的概率分布函数。

分布函数的公式为

F(x)=P(X≥x)

式中X——随机变量;

x——随机变量X的取值;

P(X≥x)——随机变量X取值大于或等于x的概率;

F(x)——随机变量X的分布函数。

随机变量的分布函数可用曲线的形式表示。

在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。

分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。

对于连续性随机变量,还有另一种表示概率分布的形式——概率密度函数。

按照概率论的定义,概率密度函数是分布函数的导数。

概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。

在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。

用公式表示,水文变量频率和概率密度函数之间的关系可以写为

(字幕)

此式中,F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。

如前述,水文变量的分布函数可以用频率曲线表示。

类似地,概率密度函数也可以用概率密度函数曲线表示。

因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图表示。

图中,左边是概率密度函数曲线,右边是频率曲线。

图中两边的纵坐标均表示随机变量的取值,左边的横坐标表示概率密度函数值,右图的横坐标表示频率。

左边随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。

因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右边中的F(xi)等于左图中xi以上的阴影面积。

从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。

这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。

对这张图里面表示的各种关系大家一定要弄清楚。

13.经常听到“多少年一遇的洪水”、“多少年一遇的干旱”这样的提法,如何正确理解

工程中,习惯上常用洪水、潮汐等水文现象的“重现期”来表示其频率【即累计频率】,“重现期”以年为单位,俗称“XX年一遇”,都是工程和生产上,用来表示随机变量统计规律的概念。

“重现期”表示在长时间内,随机事件发生的平均周期。

即在很长的一段时间内,随机事件平均多少年发生一次。

“重现期”这个名词听起来很通俗,但需注意理解:

第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。

说某一条河流发生了“百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。

重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。

不能理解为百年一遇的洪水每隔100年一定出现一次。

实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。

第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。

对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。

如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。

第三,水利工程中所说的重现期,是指对工程不利情况的重现期。

对于洪水、多水的情况,水越大对工程越不利。

此时,重现期是指水文随机变量大于或等于某一数值这一随机事件发生的平均周期。

如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为

因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P≤50%。

对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。

按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为

(P≥50%)

因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P≥50%。

14.什么是统计参数,什么是理论频率曲线,统计参数和理论频率曲线有什么作用

(1)统计参数。

知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。

但在实际工作里,求出概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。

但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。

在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。

在文字教材中介绍了以下几种最常用的统计参数:

1)均值

均值又称为期望,它表示随机变量平均数的概念;

2)均方差、和离势系数Cv

均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数是一个无因次的量,排除了随机变量自身大小的影响;

3)偏态系数Cs

偏态系数反映随机变量的分布对于均值是否对称。

Cs是一个无因次量;

4)众数

众数是随机变量取值概率最大,或者概率密度函数最大的数;

5)中位数

随机变量大于或等于以及小于或等于中位数的概率都为。

文字教材中介绍了以上面统计参数的定义式。

统计参数可简明地表示随机变量概率分布的特性。

文字教材的图表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。

由图可以看到,当随机变量分布的类型不变的时候,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变时,如果均值增大,表明随机变量取值的平均水平增高,概率密度函数曲线沿横轴向右平行移动;

如果离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;

如果偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs<

0时,分布的均值

小于众数Eo(X),分布称为负偏,Cs>

大于众数Eo(X),分布称为正偏(水文变量的分布大多数是正偏)。

(2)理论概率曲线

客观世界中的随机变量具有不同的概率分布规律。

经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。

具有数学表达式的频率曲线称为理论频率曲线。

理论频率曲线对应于以后将要介绍的经验频率曲线。

在文字教材里,介绍了两种最为常用的理论频率曲线:

1)正态分布

文字教材的图是正态分布的概率密度函数曲线。

该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。

正态分布有两个参数,即均值μ和均方差σ,当这两个参数确定后,分布就唯一确定了。

实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。

如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。

2)皮尔逊Ⅲ型分布

文字教材的图是皮尔逊Ⅲ型分布概率密度函数曲线。

英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文里面用得较多,称为皮尔逊Ⅲ型分布。

皮尔逊Ⅲ型分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。

皮尔逊Ⅲ型分布有3个参数,这3个参数和统计参数均值、离势系数Cv、偏态系数Cs之间,存在着函数关系。

所以,只要能够确定皮尔逊Ⅲ型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。

我们文字教材的第5章第1节对正态分布和皮尔逊Ⅲ型分布的概率密度函数公式、概率密度函数曲线、分布的性质等都作了介绍。

为了实际应用皮尔逊Ⅲ型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。

在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。

因皮尔逊Ⅲ型分布的概率密度函数十分复杂,进行积分相当困难。

为了能够在实际工作中运用皮尔逊Ⅲ型分布,有人制作了皮尔逊Ⅲ型分布的积分表格,我们文字教材中介绍的福斯特—雷布京表就是这样的表格。

幅斯特—雷布京表又叫做离均系数Ф值表,文字教材中介绍了离均系数Ф的概念,以及使用福斯特—雷布京表的方法,并提供了例题。

当确定了皮尔逊Ⅲ型分布的统计参数以后,可以按照Cs值从离均系数Ф值表查到对应于某一个频率P的离均系数Ф,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。

亦即,确定了皮尔逊Ⅲ型分布的统计参数后,就可以借助离均系数Ф值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。

为了更方便地进行频率分析计算,又有人根据皮尔逊Ⅲ型分布的离均系数表制作了模比系数表。

模比系数是随机变量取值x与均值

的比值。

如用k表示模比系数,则

运用皮尔逊Ⅲ型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。

离均系数Ф值表和模比系数表已作为第5章的附表编入文字教材。

这两个表是经常要用到的,应熟练掌握它们的使用方法。

关于理论频率曲线,还有一个问题需要说明一下,就是所谓理论频率曲线只是一些具有数学表达式频率曲线。

把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。

用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。

15.什么是总体和样本,什么是抽样误差

客观世界中存在着许多具有随机性的事物。

在数理统计中,把所研究的对象的全体称为总体,把总体中的每一个基本单位称为个体。

如一条河流,当我们研究年径流量的时候,河流有史以来的各年年径流量的全体就是总体,各个年的年径流量就是个体。

如果所研究的随机事物对应着实数,则总体就是一个随机变量(可以记为X),而个体就是随机变量的一个取值(可以记为xi)。

一般情况下,总体是未知的。

或者,因为不能对总体进行普查研究,总体实际上是无法得到。

比如,我们无法掌握一条河流在其形成以来漫长时期内所有年份的年径流量。

我们也不能对工地上所有的钢筋都进行破坏性试验检验钢筋的强度。

为了了解和掌握总体的统计规律,通常是从总体中抽取一部分个体,对这部分个体进行观察和研究,并且由这部分个体对总体进行推断,从而掌握总体的性质和规律。

这种方法称为抽样法。

从总体中抽取的部分个体称为样本。

当总体是随机变量的时候,所抽取的每一个样本是一组数字。

比如随机变量X的一个样本Xj就由数字x1,x2,…,xi,…xn组成。

样本里面包含个体的个数n,称为样本容量。

当抽取样本时随意抽取,不带有任何主观成分时,所得到的样本称为随机样本。

水文变量总体是无限的,现有的水文观测资料可以认为是水文变量总体的随机样本。

样本只是总体的一部分,由样本来推断总体的统计规律显然会有误差。

这种由样本推断总体统计规律而产生的误差称为抽样误差。

一般说来,样本容量增大的时候,样本的抽样误差会减小。

所以,应当尽可能地增大样本容量。

16.什么是水文变量的经验频率曲线,它有什么意义

实测水文变量系列是水文变量总体的样本。

如将水文变量系列的各个变量从大到小顺序排列,则每一个变量都有一个序号m。

某一个水文变量的序号m不但表示了变量在样本里面的大小顺序,而且表示了在样本里面,取值大于或等于这个变量个体的个数,即累计次数。

变量序号m和样本n的比值则表示在样本里面,变量大于或等于某一个变量的频率,简称频率,如果把频率记作P,则有

频率P表示在样本里面,变量取值大于等于某个变量这一事件出现的机会或可能性。

但是,由样本求出的频率还不能作为总体的频率。

文字教材中介绍了,用样本频率计算公式估算总体频率时,可能出现不合理的情况。

按照数理统计理论,从样本推断总体的统计规律的时候,应当使用无偏估计计算式,或者说,从样本计算总体的各种统计参数的时候,应当计算总体统计参数的无偏估计值。

只有用无偏估计值作为总体统计参数的估算值才是合理的。

如果从总体里面抽取大量的样本,对各个样本都用无偏估计计算式计算总体某种统计参数的估算值,则计算所得到的统计参数估算值将形成一个新的随机变量,这个随机变量的均值恰等于总体的统计参数,这就是无偏估计的含义。

文字教材中介绍了,按照现行的水文计算规范,应当采用数学期望公式估算水文变量总体的概率。

数学期望公式就是频率的无偏估计计算式,它和样本频率的计算公式是不同的。

因为以上频率是由实测资料计算出来的,故习惯上称之为经验频率。

水文变量的经验频率可用曲线的形式表示,称为经验频率曲线。

17.适线法它的基本思路是什么

适线法是现行水文频率计算的基本方法。

由实测水文变量系列求得的经验频率曲线,是对水文变量总体概率分布的推断和描述。

但如直接把经验频率曲线用于解决工程实际问题,还存在着一定的局限性。

因我国目前的水文实测资料一般不超过几十年,算出的经验频率至多相当于几十年一遇。

而在工程规划设计里面,常需要确定更为稀遇的水文变量值,这些稀遇值无法从经验频率曲线直接查出。

为解决这样的问题,目前的做法是借助于理论频率曲线对经验频率曲线进行延长,求得稀遇洪水或枯水水文特征值的频率分布。

为了借助理论频率曲线对经验频率曲线进行延长,需要找到一条和水文变量经验频率点据拟合比较好的理论频率曲线,即该曲线在实测资料范围内表示出的统计规律和实测资料是一致的。

同时认为,该理论频率曲线能够表示水文变量总体的统计规律,这就是适线法的基本思路。

18.适线时,如何估算和调整水文变量的统计参数

如前述,理论频率曲线是具有数学表达式的频率曲线,理论频率曲线的参数和随机变量的统计参数有一定关。

所以,为了延长经验频率曲线,首先应当估算随机变量的统计参数,有了统计参数,便可确定理论频率曲线。

因水文变量的总体是未知的,故对其统计参数不能够直接计算。

但如掌握了水文变量的实测资料,则可将实测资料作为样本,并由样本推求水文变量总体的统计参数。

由实测资料推求水文变量总体的统计参数的时候,也必须使用无偏估计计算式。

在我国,理论频率曲线一般采用皮尔逊Ⅲ型曲线。

文字教材介绍了估算皮尔逊统计参数的时候应当采用的计算公式,同时介绍了,直接由公式计算水文变量总体的

值误差很大,故对于

一般是拟定一个

的倍比,按倍比确定

值。

在适线时,应当按照统计参数变化对理论频率曲线的影响趋势有

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2