ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:150.68KB ,
资源ID:7771836      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7771836.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(第五章水文统计的基本知识及方法.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

第五章水文统计的基本知识及方法.docx

1、第五章水文统计的基本知识及方法第五章 水文统计的基本知识及方法研究内容:主要有频率计算与相关分析。频率计算,包括随机变量及其概率分布、水文频率曲线、适线法等;相关分析,包括简相关与复相关。研究目的:研究河川径流的统计规律,预估径流的变化趋势,以满足水利水电工程规划、设计、施工和运行管理的需要。第一节 概述概率论与数理统计是一门研究客观事物偶然性(随机性)规律的学科。由于水文现象一般都具有偶然性的特点,所以,可以用数理统计的原理和方法分析研究它的变化规律。这种方法称为水文统计法。工程水文计算中运用水文统计法,不仅合理,而且是必要的。例如,流域开发,首先要搞清未来河流水量的多少;设计拦河坝、堤防工

2、程需要知道未来时期当地洪水的大小。这些都要求对未来长期的径流形势做出估计。如果所建工程计划使用100年,那么就要对未来100年的径流形势做出估计。但是,由于影响径流的因素众多,难以基于必然现象的规律,应用成因分析法对径流做出这样长期的时序定量预报,而只能基于统计规律,运用数理统计方法对径流做出概率预估,以满足工程设计的需要。 第二节 概率的基本概念一、试验和事件 在概率论中, 对随机现象的测验叫做随机试验,随机试验的特点是限定条件,重复做。随机试验的结果称为事件。根据事件发生的可能性,事件可以分为三类:1、必然事件:在一定试验条件下,试验结果中必然会发生的事件;2、不可能事件:在一定试验条件下

3、,试验结果中决不会发生的事件;3、随机事件:在一定试验条件下,试验结果中可能发生也可能不发生的事件。 二、概率随机事件出现的可能性或机率叫概率。随机事件A发生的概率用P(A)表示,以百分数计。显然,必然事件概率为1;不可能事件的概率为0;随机事件的概率介于0和1之间。如果某试验可能发生的结果总数是有限的,并且所有结果出现的可能性是相等的,称之为古典概型事件。在古典概型事件中,如果可能发生的结果总数为n,而事件A有其中的m个结果,则随机事件A发生的概率P(A)为:P(A)=m/n 5-1水文事件一般不能归为古典概型事件。它们的概率一般只能通过多次观测试验来推求,这种概率称为经验概率,也称频率。三

4、、频率 设事件A在n次重复试验中出现了m次,则比值:W(A)=m/n 5-2称为事件A在n次试验中出现的频率。频率在一定程度上反映了事件出现的可能性大小。事件A发生的概率是理论值,而频率是经验值,在试验中事件发生的频率通常不等于概率。但随着试验次数的增加,频率有趋近概率的规律。这一点不仅可以从理论上证明,如大数定理,而且可以通过随机试验验证,如掷硬币试验。因此,水文上常用事件发生的频率作为概率的近似值。四、概率加法定理和乘法定理1、概率加法定理 事件(A+B)表示事件A与B的和事件,包括事件A发生或事件B发生以及两事件同时发生。加法定理公式: P(A+B)=P(A)+P(B)P(AB) 5-3

5、式中: P(A+B) 事件A与事件B的和事件发生的概率; P(A) 事件A发生的概率; P(B) 事件B发生的概率;P(AB)事件A与B同时发生的概率。若事件A与B不可能同时发生,则称为互斥事件。互斥事件加法定理公式:P(A+B)=P(A)+P(B) 5-42、概率乘法定理两事件积的概率,表示两事件共同出现的概率,它等于其中一事件的概率乘以另一事件在前一事件发生的条件下发生的条件概率,即: P(AB)=P(A)P(BA) 5-6或P(AB)=P(B)P(AB) 5-7 若事件A的发生对事件B发生的概率没有影响,即:P(BA)P(B)或P(AB)P(A),则称这两个事件是相互独立的;它们共同出现

6、的概率等于事件A的概率乘以事件B的概率,即 P(AB)P(A)P(B) 5-5第三节 随机变量及其概率分布一、随机变量 表示随机试验结果的量称为随机变量,常用大写英文字母来表示,并用相应的小写字母来表示随机变量的具体取值。随机变量可分为两类:即离散型随机变量和连续型随机变量。1、离散型随机变量:若随机变量仅能取得某区间内的一些间断的数值,则称为离散型随机变量;2、连续性随机变量:若随机变量可以取得某区间内的任何数值,则称为连续性随机变量。随机变量取值的全体称为总体,总体中的一部分称为样本。二、随机变量的概率分布 随机变量可以取得总体中的任何值,但是取某一值都有一定的概率,随机变量的取值与取该值

7、的概率之间有一定的对应关系。这种对应关系称为概率分布。1、离散型随机变量概率分布的表示 离散型随机变量的概率分布一般以分布列表示,如表5-3-1。 表5-3-1离散型随机变量及其概率分布Xx1x2xiP(X=xi)p1p2pi2、连续型随机变量概率分布的表示对于连续型随机变量,其取值是无限多的,恰好取某个值的概率都非常小,趋近于零,因此,讨论这样的问题没有意义,一般研究区间概率问题。水文学关心随机变量取值大于等于某一定值的概率,即P(Xx),而该概率是x的函数,由此,定义了分布函数和密度函数。、 分布函数 设事件Xx 的概率用P(Xx)来表示,它是随随机变量取值x而变化的,所以p(Xx)是x的

8、函数,称为随机变量x的分布函数,记为F(x),即: F(x)=P(Xx) 它代表随机变量X取值大于等于某一定值x的概率。其几何图形如图5-4(b)所示,图中纵坐标表示变量x,横坐标表示概率分布函数值F(x),在数学上称此曲线为概率分布曲线,水文统计中称为频率曲线。 密度函数 为了应用方便,人们又定义了密度函数。分布函数一阶导数的负值称为密度函数,记为f(x),即: 密度曲线的图形习惯以纵坐标表示变量x ,横坐标表示概率密度函数值f(x) ,如5-4(a)所示。 显然,分布函数与密度函数有以下关系: F(x)=P(Xx)= (5-10)其对应关系可在图5-4中看出来。 图5-4(a)概率密度函数

9、(b)概率分布函数三、随机变量的统计参数 表示随机变量统计特征的数字,称为随机变量的统计参数。 统计参数有总体统计参数与样本统计参数之分。水文计算中常用的统计参数有均值、离差系数和偏差系数。1、均值(平均数) 均值表示随机变量的平均水平,反映其位置特征。对于离散型随机变量其均值为: (5-11)式中xi随机变量的某一具体取值;Pi随机变量取第i个值的概率。如果取值为等概率,其均值即为算术平均数: 对于连续型随机变量,其均值用期望值E(x)表示: E(x)= (5-12)式中a是总体的最小值,b是是总体中的最大值2、离差系数随机变量的离散特征一般用均方差表示: (5-13) 均方差越大表示离散程

10、度越大。但是,当随机变量量纲不同时,均方差则难以反映离散程度的大小。因此,水文学定义离差系数表示离散程度。水文计算中用均方差与均值之比作为衡量系列相对离散程度的一个参数,称为离差系数,用Cv表示,其计算式为: (5-14)式中Kixi/ ,称为模比系数。3、偏差系数 偏差系数作为衡量随机变量取值对称特征的参数,用CS表示,其计算式为: (5-15)当随机变量取值对于 对称时,CS0;当随机变量取值对于 不对称时,称为有偏。这时,CS0;若CS0,称为正偏;若CS0,称为负偏。三、几种常用的概率分布曲线 水文上把常用的随机变量概率分布曲线称为水文频率曲线,我国统计中广泛应用的频率曲线有两种类型,

11、即正态分布和皮尔逊型分布。我国水文计算中常用的频率分布线型为皮尔逊型(P-型)。(一)正态分布正态分布具有如下形式的概率密度函数: 其中:(x) (5-16) 式中:均值; 均方差; e - 自然对数的底。正态分布的密度曲线有以下几个特点:单峰;对于平均数对称,CS0;CS0,正偏;CS0,负偏;曲线两端趋于,即以x轴为渐近线。正态分布密度函数中只包含两个参数:均值 和均方差。可以证明:上式说明区间的面积占全面积的68.3(见图5-10),3区间的面积占全面积的99.7。换言之,服从正态分布的随机变量,取值在区间的概率为68.3,取值在3区间的概率为99.7。正态分布的上述性质经常用于误差分析

12、。图5-10 正态分布密度曲线(二)皮尔逊(P)型曲线 1、皮尔逊型曲线的概率密度函数 皮尔逊型曲线是一条一端有限一端无限的不对称单峰、正偏曲线(见图5-11),其概率密度函数为: (4-4-2) 式中:()的伽玛函数; 、a0分别为皮尔逊型分布的三个参数。图5-11 皮尔逊型概率密度曲线显然,三个参数确定以后,该密度函数随之确定。可以推证,这三个参数与常用的三个参数 、Cv、CS具有如下关系: 因此,皮尔逊型频率曲线的密度函数可表示为以、Cv、CS为参数的函数。2、皮尔逊型频率曲线及其绘制水文计算中,一般需要求出指定频率P所对应的随机变量取值xp,这就需要对密度函数进行积分,确定其下限xp,

13、即: (5-18) 令,可变换成下面的积分形式: (5-19)式(5-19)中被积函数只含有一个待定参数CS,其它两个参数、Cv都包含在中,是标准化变换。因此,只需要给定一个Cs值,便可从式(4-4-7)通过积分求出P与之间的关系值。对于若干个给定的Cs值,P与的对应值可制成表,该表已先后由美国福斯特和前苏联雷布京制作出来,见附表2皮尔逊型频率曲线的离均系数值表,查表可由CS求出相应频率的值,进而可计算出该频率对应的x值: 附表2 皮尔逊型频率曲线的离均系数值表(摘录)P(%)Cs0.115205080959999.90.03.092.331.640.840.00-0.84-1.64-2.33

14、-3.090.13.231.672.00.84-0.02-0.85-1.62-2.25-2.950.23.382.471.700.83-0.03-0.85-1.59-2.18-2.810.33.522.541.730.82-0.05-0.85-1.55-2.10-2.670.43.672.621.750.82-0.07-0.85-1.52-2.03-2.540.53.812.681.770.81-0.08-0.85-1.40-1.96-2.400.63.962.751.800.80-0.10-0.85-1.45-1.88-2.270.74.102.821.820.79-0.12-0.85-1.

15、42-1.81-2.140.84.242.891.840.78-0.13-0.85-1.38-1.74-2.020.94.392.961.860.77-0.15-0.85-1.35-1.66-1.901.04.533.021.880.76-0.16-0.85-1.32-1.59-1.79例题:(1)已知某地区多年平均年降雨量1000mm,Cv0.5,Cs1.0,设年降雨量的概率分布符合皮尔逊型,试求概率P为1的年雨量值。由CS1.0, P=1查值表,得1%3.02,所以X1%=(1%Cv+1) =(3.020.5+1)1000mm2510mm(2)已知某流域最大1日雨量的80.0mm,Cv0.

16、5,Cs3.5 Cv,则该流域P=1%的最大一日雨量为多少? 由CS3.5 Cv=1.75, P=1查值表,得1%2.74,所以X1%=(1%Cv+1) =(2.740.5+1)80mm189.6mm3、皮尔逊型频率曲线的应用 在频率计算时,由已知的CS值,查值表得出不同的P的值,然后利用已知的、Cv,通过公式即可求出与各种P相应的x值,从而可绘制出皮尔逊型频率曲线。 当Cs等于Cv的一定倍数时,为了应用方便,P-型频率曲线的模比系数KP也已制成表格,见附表3皮尔逊型频率曲线的模比系数KP值表。频率计算时,由已知的CS和CV可以从附表2中查出与各种频率P相对应的KP值,然后即可算出与各种频率对

17、应的xp=KP。如上例,由CS2Cv,Cv0.5,P1,查KP值表,可得K1%2.51,所以X1%K1%2.511000mm2510mm。有了P和x 的一些对应值,即可绘制出皮尔逊型频率曲线。附表3 皮尔逊型频率曲线的模比系数KP值表 (摘录,Cs = 2Cv)P(%)Cs0.1152050759095990.051.161.121.081.041.000.970.940.920.890.101.341.251.171.081.000.930.870.840.780.201.731.521.351.160.990.860.750.700.590.302.191.831.541.240.970.

18、780.640.560.440.402.702.151.741.310.950.710.530.450.300.503.272.511.941.380.920.640.440.340.210.603.892.892.151.440.890.560.350.260.130.704.563.292.361.500.850.490.270.180.080.805.303.712.571.540.800.420.210.120.040.906.084.152.781.580.750.350.150.080.021.006.914.613.001.610.690.290.110.050.01第四节 统计

19、参数估算在概率分布函数中一般都有一些参数, 例如皮尔逊III型分布曲线中就包含有 均值、变差系数Cv、偏态系数Cs三个统计参数。为了确定概率分布函数, 就得估计出这些参数。一、矩法矩法是通过矩和参数之间的关系,来估计频率曲线参数的一种方法。无偏估计公式如下: 二、三点法三点法是在绘制的经验频率曲线上任取三点,其坐标为(x1,p1)、(x2,p2)和(x3,p3),由式(4-4-12)可以建立3个方程,联解三个方程组成的方程组,便可以求得三个参数。 从理论上讲,P1、P2、P3可以任取,但在实际工作中一般取:P15,P250,P395。图5-4-1 三点法在经验频率曲线上取点示意图 在解方程组的

20、过程中,引入一个系数S,该系数称为偏度系数显然,S是Cs的函数,其关系已制成表 - P = 55095% 时S与Cs关系表,计算出s后,就可从表中查出相应的Cs值。解方程组可得:(4-5-7) 而 (4-5-8)式中值可由值表中查出,由此得到皮尔逊型频率曲线的三个统计参数。附表4 三点法用表 P = 55095% 时S与Cs关系表S01234567890.00.000.040.080.120.160.200.240.270.310.350.10.380.410.450.480.520.550.590.630.660.700.20.730.760.800.840.870.900.940.981.

21、011.040.31.081.111.141.181.211.251.281.311.351.380.41.421.461.491.521.561.591.631.661.701.740.51.781.811.851.881.921.951.992.032.062.100.62.132.172.202.242.282.322.362.402.442.480.72.532.572.622.662.702.762.812.862.912.970.83.023.073.133.193.253.323.383.463.523.600.93.703.803.914.034.174.324.494.724

22、.945.43三、抽样误差用样本的统计参数来估计总体统计参数时存在一定的误差,这种误差是由于抽样引起的,称为抽样误差。 误差的均方差称为均方误。显然,均方误越大,抽样误差也越大。皮尔逊型分布用矩法估算参数时,可用、分别代表、Cv和Cs的均方误,其计算公式为: (5-28) (5-29) (5-30) (5-31) 由上述公式可见,各式的分母中都含有n,n为样本容量。可见,样本容量越大,其抽样误差就越小。第五节 现行水文频率计算方法适线法一、经验频率 由实测资料计算的频率称为经验频率,经验频率计算采用公式:式中:m为水文变量由大到小排列并按自然数顺序编出的序号n为样本容量。二、重现期由于频率较为

23、抽象,水文上常用重现期来代替频率。所谓重现期是指某随机变量重复出现的平均周期,单位为年,用符号T表示。重现期为T,习惯上又称作T年一遇。频率P与重现期T的关系如下:1、暴雨、洪水问题,关心的是超概率事件,则: (年) (5-32)例如P=0.5%的设计洪水,用式5-32计算,其重现期为200年,可称此洪水为200年一遇的设计洪水。例如某堤防按20年一遇防洪标准设计,其相应的设计频率P=1/T100%,即P=1/20100%=5%。2、干旱、枯水问题,关心的是不及概率事件,则(年) (5-33)例如P=80%的枯水流量,用式5-33计算,其重现期为5年,可称此为5年一遇的枯水流量。3、有关说明1

24、00年一遇暴雨或洪水,是指大于或等于这样的暴雨或洪水在长时期内平均100年可能发生1次,而不能认为每隔100年必然遇上1次。三、机率格纸频率计算所用的格纸称为机率格纸,此种格纸横坐标的两端分格较稀而中间较密,纵坐标为均匀分格。之所以采用这样的机率格纸,是因为将频率曲线绘在普通方格纸上,实际意义较大的两端特别陡峭,应用起来极不方便,而绘在机率格纸上,两端的坡度变缓,使用起来就比较方便了。这种机率格纸的分格是按正态分布曲线能绘制成直线来划分的,所以,当Cs=0时,频率曲线在机率格纸上为一直线。四、统计参数对频率曲线形状的影响为了避免配线时调整参数的盲目性,必须了解皮尔逊型分布的统计参数对频率曲线形

25、状的影响。1、 均值对频率曲线形状的影响 当皮尔逊型频率曲线的Cv和Cs不变时,均值增大,频率曲线会升高。如下图所示。不同均值对频率曲线的影响图2、变差系数cv对频率曲线形状的影响当皮尔逊型频率曲线的均值和Cs不变时,Cv增大,频率曲线会变陡。如下图所示。图5-12 Cs=1.0时,各变差系数Cv对频率曲线的影响3、偏态系数Cs对频率曲线形状的影响当皮尔逊型频率曲线的均值和Cv不变时,Cs增大,频率曲线会上部陡、下部缓、中间弯。如下图所示。图5-13 偏态系数Cs对频率曲线的影响五、适线法的步骤1、点绘经验频率点据(把资料从大到小排列,按自然数顺序编号,按P=计算经验频率,以变量值为纵坐标、以

26、相应的经验频率值为横坐标,在机率格纸上点绘出点据);2、用无偏估计公式计算均值、变差系数;3、假定一个Cs(年径流问题Cs=23Cv,暴雨、洪水问题Cs=2.54 Cv);4、选定线型,一般用皮尔逊型;5、根据三个统计参数查值表或K值表,计算出各频率对应的变量值,点绘出一条皮尔逊型曲线;6、分析皮尔逊型曲线与经验点据的拟合情况,如果满意,则该曲线对应的三个统计参数就作为总体参数的估计值。如果不满意,则修改参数,再画一条皮尔逊型曲线拟合,直到满意为止。适线法软件介绍:用EXCEL软件分析计算(见例题)第六节 相关分析一、概述1相关分析及其目的 分析和建立随机变量之间相互关系的过程称为相关分析。相关分析可以用来延长和插补短系列资料。2相关的种类 按照随机变量

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1