图4-4-4(c)皮尔逊密度曲线形状变化图
(4)当a>2,即Cs<
时,密度曲线呈铃形,起点处曲线与x轴相切,右端无限,如图4-4-4(d)所示。
图4-4-4(d)皮尔逊密度曲线形状变化图
不同偏态系数情况下,其分布密度曲线形状差异很大,Cs大于等于2时为乙型,Cs大于零小于2时为铃形。
2、皮尔逊Ⅲ型频率曲线及其绘制
水文计算中,一般需要求出指定频率P所相应的随机变量取值xp,也就是通过对密度曲线进行积分,即
(4-4-4)
求出等于及大于xp的累积频率P值。
直接由式(4-4-4)计算P值非常麻烦,实际做法是通过变量转换,变换成下面的积分形式 :
(4-4-5)
式(4-4-5)中被积函数只含有一个待定参数Cs,其它两个参数
、Cv都包含在Φ中。
Φ是标准化变量,
称为离均系数。
Φ的均值为0,标准差为1。
因此,只需要假定一个Cs值,便可从式(4-4-5)通过积分求出P与Φ之间的关系。
对于若干个给定的Cs值,Φ和P的对应数值表先后由美国福斯特和前苏联雷布京制作出来,见附表1"皮尔逊Ⅲ型频率曲线的离均系数Φ值表"。
由Φ就可以求出相应频率P的x值:
(4-4-6)
附表1(摘录)
在频率计算时,由已知的Cs值,查Φ值表得出不同的P的Φ,然后利用已知的
、Cv,通过式(4-4-6)即可求出与各种P相应的x,从而可绘制出皮尔逊Ⅲ型频率曲线。
三、经验频率曲线
上述各种频率曲线是用数学方程式来表示的,属于理论频率曲线。
在水文计算中还有一种经验频率曲线,是由实测资料绘制而成的,它是水文频率计算的基础,具有一定的实用性。
1、经验频率曲线的绘制
根据实测水文资料,按从大到小的顺序排列,然后用经验频率公式计算系列中各项的频率,称为经验频率。
以水文变量x为纵坐标,以经验频率P为横坐标,点绘经验频率点据,根据点群趋势绘出一条平滑的曲线,称为经验频率曲线。
有了经验频率曲线,即可在曲线上求得指定频率P的水文变量值x
对经验频率的计算,目前我国水文计算广泛采用的是数学期望公式:
(4-4-13)
式中p-等于和大于xm的经验频率;
m-xm的序号,即等于或大于xm的项数;
n-系列的总项数。
2、经验频率曲线存在的问题
经验频率曲线计算工作量小,绘制简单,查用方便,但受实测资料所限,往往难以满足设计上的需要。
为此,提出用理论频率曲线来配合经验点据,这就是水文频率计算适线法。
四、频率与重现期的关系
频率曲线绘制后,就可在频率曲线上求出指定频率p的设计值xp。
由于"频率"较为抽象,水文上常用"重现期"来代替"频率"。
所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇。
根据研究问题的性质不同,频率P与重现期T的关系有两种表示方法。
1、当为了防洪研究暴雨洪水问题时,一般设计频率P<50%,则:
T=1/P (4-4-6)
式中:
T―重现期,年;P―频率,%。
2、水库兴利调节研究枯水问题时,设计频率P>50%,则
T=1/(1-P) (4-4-7)
第五节频率曲线参数估计方法
实际上,可以通过观测得到若干年份的资料(也称实测样本)。
在总体线型确定的情况下,需要由某种参数估计方法依据实测样本估计总体参数,从而可以计算不同标准的设计值。
目前水文中Pearson-III型参数估计方法主要有矩法、概率权重矩法、权函数法和适线法等。
在我国《水利水电工程设计洪水计算规范》(1993)中要求使用目估适线法(含优化适线法)作为最终确定参数估计值的方法,而矩法、概率权重矩法、权函数法只用于适线法参数初值的估计。
考虑到两种新方法概率权重矩法、权函数法较为复杂,故本节主要介绍矩法和抽样误差的概念,下节再介绍适线法。
一、矩法
矩法是用样本矩估计总体矩,并通过矩和参数之间的关系,来估计频率曲线参数的一种方法。
前述,一阶原点矩的计算公式就是均值
,均方差σ的计算式为二阶中心矩开方,偏态系数Cs计算式中的分子则为三阶中心矩。
它们与相应的总体同名参数相比,不一定相等,平均上说,Cv,Cs往往会偏小。
因此,需要将上述公式加以修正,修正后的参数计算式为:
(4-5-1)
(4-5-2)
(4-5-3)
(4-5-4)
二、抽样误差
用一个样本的统计参数来代替总体的统计参数是存在一定误差的,这种误差是由于从总体中随机抽取的样本与总体有差异而引起的,与计算误差不同,称为抽样误差。
抽样误差的大小由均方误来衡量。
计算均方误的公式与总体分布有关。
对于皮尔逊Ⅲ型分布且用矩法估算参数时,用
、
、
、
分别代表
、
、Cv和Cs样本参数的均方误,则它们的计算公式为
(4-5-5)
(4-5-6)
(4-5-7)
(4-5-8)
由上述公式可见,抽样误差的大小,随样本项数n、Cv、和Cs的大小而变化。
样本容量大,对总体的代表性就好,其抽样误差就小,这就是为什么在水文计算中总是想方设法取得较长的水文系列的原因。
第六节水文频率计算适线法
适线法(或称配线法)是以经验频率点据为基础,在一定的适线准则下,求解与经验点据拟合最优的频率曲线参数,是我国估计水文频率曲线统计参数的主要方法。
适线法主要有两大类,即目估适线法和优化适线法。
目估适线法
1、目估配线法的作法与步骤
目估配线法又称目估适线法,是以经验频率点据为基础,给它们选配一条符合较好的理论频率曲线,并以此来估计水文要素总体的统计规律。
具体步骤如下:
----将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率)
----选定水文频率分布线型(一般选用皮尔逊Ⅲ型)。
----先采用矩法或其它方法估计出频率曲线参数均值和Cv的初估值,而Cs凭经验初选为Cv的倍数,有时也直接用矩法估计。
----根据拟定的均值、Cv和Cs,查附表1,计算
值。
以水文变量取值为纵坐标,经验频率为横坐标,即可得到频率曲线。
将此线画在绘有经验点据的图上,看与经验点据配合的情况。
若不理想,可通过调整Cv和Cs点绘频率曲线。
----最后根据频率曲线与经验点据的配合情况,从中选出一条与经验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数的估值。
----求指定频率的水文变量设计值。
2、统计参数对频率曲线的影响
为了避免配线时调整参数的盲目性,必须了解皮尔逊Ⅲ型分布的统计参数对频率曲线的影响。
----均值对频率曲线的影响
当皮尔逊Ⅲ型频率曲的两个参数Cv和Cs不变时,由于均值的不同,可以使频率曲线发生很大的变化,
----变差系数Cv对频率曲线的影响
为了消除均值的影响,我们以模比系数K为变量绘制频率曲线,如图
图4-6-2 Cs=1.0时,各种Cv对频率曲线的影响
4-6-2所示。
图中Cs=1.0。
Cv=0时,随机变量的取值都等于均值,此时频率曲线即为k=1的一条水平线,随着Cv的增大,频率曲线的偏离程度也随之增大,曲线显得越来越陡。
---偏态系数Cs对频率曲线的影响
图4-6-3表示Cv=0.1时种种不同的Cs对频率曲线的影响情况。
从图中可以看出,正偏情况下,Cs愈大,均值(即图中k=1)对应的频率愈小,频率曲线的中部愈向左偏,且上段愈陡,下段愈平缓。
应用程序实例:
这是一个P-Ⅲ频率曲线目估适线的可执行程序。
通过调整Cv、Cs两个参数,点线拟合状况会发生变化。
第七节相关分析
一、相关关系的概念
1、相关的意义与应用
自然界中有许多现象之间是有一定联系的。
按数理统计法建立上述两个或多个随机变量之间的联系,称之为相关关系。
把对这种关系的分析和建立称为相关分析。
相关分析可以用来延长和插补短系列。
2、相关的种类
根据变量之间相互关系的密切程度,变量之间的关系有三种情况:
即完全相关、零相关、统计相关。
----完全相关(函数关系)
两变量x与y之间,如果每给定一个x值,就有一个完全确定的y值与之对应,则这两个变量之间的关系就是完全相关(或称函数相关)。
完全相关的形式有直线关系和曲线关系两种,如图4-7-1所示。
图4-7-1完全相关示意图
----零相关(没有关系)
两变量之间毫无联系,或某一现象(变量)的变化不影响另一现象(变量)的变化,这种关系则称为零相关或没有关系,如图4-7-2所示。
图4-7-2零相关示意图
---相关关系
若两个变量之间的关系界于完全相关和零相关之间,则称为相关关系或统计相关。
当只研究两个变量的相关关系时,称为简相关;当研究3个或3个以上变量的相关关系时,则称为复相关。
在相关的形式上,又可分为直线相关和非直线相关,如图4-7-3所示。
(a)直线相关 (b)曲线相关
图4-7-3
3.相关分析的内容
相关分析(或回归分析)的内容一般包括三个方面:
(1)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;
(2)确定变量间的数量关系――回归方程或相关线;
(3)根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析。
二、一元线性相关
1、相关图解法
设xi和yi代表两系列的观测值,共有n对,把对应值点绘于方格纸上,得到很多相关点。
如果相关点的平均趋势近似直线,即可通过点群中间及
、
)点绘出相关直线,
2、相关计算法
为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。
简直线相关方程的形式为:
y=a+bx (4-7-1)
式中x――自变量;
y――倚变量;
a、b―待定常数。
待定常数a、b由观测点与直线拟合最佳,利用最小二乘法进行估计。
最后得到如下形式的回归方程:
(4-7-2)
式中
、
――x、y系列的均方差;
、
――x、y系列的均值;
r――相关系数,表示x、y两系列间的线性关系密切程度,计算式为
(4-7-3)
此式称为y倚x的回归方程,它的图形称为y倚x的回归线,如图4-7-4的(a)线所示。
若以y求x,则要应用x倚y的回归方程,如图4-7-4的(b)线所示。
x倚y的回归方程为:
(4-7-4)
一般y倚x与x倚y的两回归线并不重合,但有一个公共交点(
)。
3、相关分析的误差
---