ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:28.84KB ,
资源ID:20720247      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/20720247.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(水文统计方法Word下载.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

水文统计方法Word下载.docx

1、随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。(2)概率在数学中有两个分支,即概率论和数理统计。研究随机事件统计规律的学科称为概率论。由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。概率是表示统计规律的方式。用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。针对不同的情况,概率有不同的定义。按照数理统计的观点,事物和现象都可以看为是试验的结果。如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为式中 ?P(A)随机事件A的概率;n? 进行试验可能发

2、生结果的总数;? m? 进行试验中可能发生事件A的结果数。例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。按照上述公式,Z的概率像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。故按上面公式确定的事件概率称为古典概率。在客观世界里中,随机事件并不都是等可能性

3、的。如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义 。在同样条件下进行试验,将事件A出现的次数 称为频数,将频数与试验次数n的比值称为频率,记为P(A),则大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。概率的统计定义如下:在一组不变的条件下,重复作n次试验,记是事件A发生的次数,当试验次数很大时,如果频率/n稳定地在某一数值p的附近摆动,而且一般

4、说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作P(A)=? p ?(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。前述的必然事件和不可能事件发生的可能性也可以用概率表示。必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。如果条件发生了变化,即使试验的次数再多,也

5、不能求得随机事件真正的概率。如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。12什么是随机变量,怎样表示随机变量的概率分布?要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。但因影响水资源的因素十分众多和复杂,目前还难

6、于通过成因分析,对水资源进行准确的长期预报。实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。而这样做,需要对随机事件定量化地表示,为此引入随机变量。按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对

7、应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、xn,即X表示随机取值的系列x1、x2、xn)。随机变量可以分为两类:(1)离散型随机变量如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。离散型随机变量不能在两个相邻随机变量取值之间取值。离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。(2)连续型随机变量如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。比如,某一个长途汽车站,每隔

8、30分钟有一班车发往某地。对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。连续型随机变量是普遍存在的。水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。随机变量取值与其概率的对应关系称为随机变量的概率分布。对于离散型随机变量,可以用列举的方式表示它的概率分布。列举的方法可以是列表,画图等。我们的文字教材中举了例子。对于连

9、续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。对于一个随机变量,大于或等于不同数值的概率是不同的。当随机变

10、量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。这一函数称之为随机变量的概率分布函数。分布函数的公式为 ?F(x)= P(Xx)?式中?X 随机变量;x 随机变量X的取值;P(Xx) 随机变量X取值大于或等于x的概率;F(x) 随机变量X的分布函数。随机变量的分布函数可用曲线的形式表示。在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。对于连续性随机变量,还有另一种表示概率分布的形式概率密度函数。按照概率论的

11、定义,概率密度函数是分布函数的导数。概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。用公式表示,水文变量频率和概率密度函数之间的关系可以写为(字幕)此式中, F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。如前述,水文变量的分布函数可以用频率曲线表示。类似地,概率密度函数也可以用概率密度函数曲线表示。因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应

12、关系可以用文字教材的图5.3表示。图5.3中,左边是概率密度函数曲线,右边是频率曲线。图中两边的纵坐标均表示随机变量的取值,左边的横坐标表示概率密度函数值,右图的横坐标表示频率。左边随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右边中的F(xi)等于左图中xi以上的阴影面积。从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。对这张图里面表示的各种关系大家一定要弄清楚。13经常听到“多少年一遇的洪水”、“多少年

13、一遇的干旱”这样的提法,如何正确理解?工程中,习惯上常用洪水、潮汐等水文现象的“重现期”来表示其频率【即累计频率 】,“重现期”以年为单位,俗称“XX年一遇”,都是工程和生产上,用来表示随机变量统计规律的概念。“重现期”表示在长时间内,随机事件发生的平均周期。即在很长的一段时间内,随机事件平均多少年发生一次。“重现期”这个名词听起来很通俗,但需注意理解:第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。说某一条河流发生了 “百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。不能理解为

14、百年一遇的洪水每隔100年一定出现一次。实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。第三,水利工程中所说的重现期,是指对工程不利情况的重现期。对于洪水、多水的情况,水越大对工程越不利。此时,重现期是指水文随机变量大于或等于某一数值这

15、一随机事件发生的平均周期。如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P50%。对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为(P50 %)因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P50%。14什么是统计参数,什么是理论频率曲线,统计参数和理

16、论频率曲线有什么作用?(1)统计参数。知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。但在实际工作里,求出概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。在文字教材中介绍了以下几种最常用的统计参数:1)均值均值又称为期望,它表示随机变量平均数的概念;2)均方差、和离势系数Cv均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数

17、是一个无因次的量,排除了随机变量自身大小的影响;3)偏态系数Cs偏态系数反映随机变量的分布对于均值是否对称。Cs是一个无因次量;4)众数众数是随机变量取值概率最大,或者概率密度函数最大的数;5)中位数随机变量大于或等于以及小于或等于中位数的概率都为0.5。文字教材中介绍了以上面统计参数的定义式。统计参数可简明地表示随机变量概率分布的特性。文字教材的图5.5表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。由图5.5可以看到,当随机变量分布的类型不变的时候,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变时,如果均值增大,表明随机变量取值的

18、平均水平增高,概率密度函数曲线沿横轴向右平行移动;如果离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;如果偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs大于众数Eo(X),分布称为正偏(水文变量的分布大多数是正偏)。(2)理论概率曲线客观世界中的随机变量具有不同的概率分布规律。经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。具有数学表达式的频率曲线称为理论频率曲线。理论频率曲线对应于以后将要介绍的经验频率曲线。在文字教材里,介绍了两种最为常用的理论频率曲线:1)正态分布文字教材的图5.6是正态分布的概率密度函数曲线

19、。该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。正态分布有两个参数,即均值和均方差,当这两个参数确定后,分布就唯一确定了。实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。2)皮尔逊型分布文字教材的图5.7是皮尔逊型分布概率密度函数曲线。英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文里面用得较多,称为皮尔逊型分布。皮尔逊型

20、分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。皮尔逊型分布有3个参数,这 3个参数和统计参数均值、离势系数Cv、偏态系数Cs之间,存在着函数关系。所以,只要能够确定皮尔逊型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。我们文字教材的第5章第1节对正态分布和皮尔逊型分布的概率密度函数公式、概率密度函数曲线、分布的性质等都作了介绍。为了实际应用皮尔逊型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。因皮尔逊

21、型分布的概率密度函数十分复杂,进行积分相当困难。为了能够在实际工作中运用皮尔逊型分布,有人制作了皮尔逊型分布的积分表格,我们文字教材中介绍的福斯特雷布京表就是这样的表格。幅斯特雷布京表又叫做离均系数值表,文字教材中介绍了离均系数的概念,以及使用福斯特雷布京表的方法,并提供了例题。当确定了皮尔逊型分布的统计参数以后,可以按照Cs值从离均系数值表查到对应于某一个频率P的离均系数,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。亦即,确定了皮尔逊型分布的统计参数后,就可以借助离均系数值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。为了更方便地进行频率分析计算,又有人

22、根据皮尔逊型分布的离均系数表制作了模比系数表。模比系数是随机变量取值x与均值的比值。如用k表示模比系数,则运用皮尔逊型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。离均系数值表和模比系数表已作为第5章的附表编入文字教材。这两个表是经常要用到的,应熟练掌握它们的使用方法。关于理论频率曲线,还有一个问题需要说明一下,就是所谓理论频率曲线只是一些具有数学表达式频率曲线。把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。1

23、5什么是总体和样本,什么是抽样误差?客观世界中存在着许多具有随机性的事物。在数理统计中,把所研究的对象的全体称为总体,把总体中的每一个基本单位称为个体。如一条河流,当我们研究年径流量的时候,河流有史以来的各年年径流量的全体就是总体,各个年的年径流量就是个体。如果所研究的随机事物对应着实数,则总体就是一个随机变量(可以记为X),而个体就是随机变量的一个取值(可以记为xi)。一般情况下,总体是未知的。或者,因为不能对总体进行普查研究,总体实际上是无法得到。比如,我们无法掌握一条河流在其形成以来漫长时期内所有年份的年径流量。我们也不能对工地上所有的钢筋都进行破坏性试验检验钢筋的强度。为了了解和掌握总

24、体的统计规律,通常是从总体中抽取一部分个体,对这部分个体进行观察和研究,并且由这部分个体对总体进行推断,从而掌握总体的性质和规律。这种方法称为抽样法。从总体中抽取的部分个体称为样本。当总体是随机变量的时候,所抽取的每一个样本是一组数字。比如随机变量X的一个样本Xj就由数字x1,x2,xi,xn组成。样本里面包含个体的个数n,称为样本容量。当抽取样本时随意抽取,不带有任何主观成分时,所得到的样本称为随机样本。水文变量总体是无限的,现有的水文观测资料可以认为是水文变量总体的随机样本。样本只是总体的一部分,由样本来推断总体的统计规律显然会有误差。这种由样本推断总体统计规律而产生的误差称为抽样误差。一

25、般说来,样本容量增大的时候,样本的抽样误差会减小。所以,应当尽可能地增大样本容量。16什么是水文变量的经验频率曲线,它有什么意义?实测水文变量系列是水文变量总体的样本。如将水文变量系列的各个变量从大到小顺序排列,则每一个变量都有一个序号m。某一个水文变量的序号m不但表示了变量在样本里面的大小顺序,而且表示了在样本里面,取值大于或等于这个变量个体的个数,即累计次数。变量序号m和样本n的比值则表示在样本里面,变量大于或等于某一个变量的频率,简称频率,如果把频率记作P,则有频率P表示在样本里面,变量取值大于等于某个变量这一事件出现的机会或可能性。但是,由样本求出的频率还不能作为总体的频率。文字教材中

26、介绍了,用样本频率计算公式估算总体频率时,可能出现不合理的情况。按照数理统计理论,从样本推断总体的统计规律的时候,应当使用无偏估计计算式,或者说,从样本计算总体的各种统计参数的时候,应当计算总体统计参数的无偏估计值。只有用无偏估计值作为总体统计参数的估算值才是合理的。如果从总体里面抽取大量的样本,对各个样本都用无偏估计计算式计算总体某种统计参数的估算值,则计算所得到的统计参数估算值将形成一个新的随机变量,这个随机变量的均值恰等于总体的统计参数,这就是无偏估计的含义。文字教材中介绍了,按照现行的水文计算规范,应当采用数学期望公式估算水文变量总体的概率。数学期望公式就是频率的无偏估计计算式,它和样

27、本频率的计算公式是不同的。因为以上频率是由实测资料计算出来的,故习惯上称之为经验频率。水文变量的经验频率可用曲线的形式表示,称为经验频率曲线。17适线法它的基本思路是什么?适线法是现行水文频率计算的基本方法。由实测水文变量系列求得的经验频率曲线,是对水文变量总体概率分布的推断和描述。但如直接把经验频率曲线用于解决工程实际问题,还存在着一定的局限性。因我国目前的水文实测资料一般不超过几十年,算出的经验频率至多相当于几十年一遇。而在工程规划设计里面,常需要确定更为稀遇的水文变量值,这些稀遇值无法从经验频率曲线直接查出。为解决这样的问题,目前的做法是借助于理论频率曲线对经验频率曲线进行延长,求得稀遇

28、洪水或枯水水文特征值的频率分布。为了借助理论频率曲线对经验频率曲线进行延长,需要找到一条和水文变量经验频率点据拟合比较好的理论频率曲线,即该曲线在实测资料范围内表示出的统计规律和实测资料是一致的。同时认为,该理论频率曲线能够表示水文变量总体的统计规律,这就是适线法的基本思路。18适线时,如何估算和调整水文变量的统计参数?如前述,理论频率曲线是具有数学表达式的频率曲线,理论频率曲线的参数和随机变量的统计参数有一定关。所以,为了延长经验频率曲线,首先应当估算随机变量的统计参数,有了统计参数,便可确定理论频率曲线。因水文变量的总体是未知的,故对其统计参数不能够直接计算。但如掌握了水文变量的实测资料,则可将实测资料作为样本,并由样本推求水文变量总体的统计参数。由实测资料推求水文变量总体的统计参数的时候,也必须使用无偏估计计算式。在我国

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1