2气象统方法-复习思考题Word文档下载推荐.doc
《2气象统方法-复习思考题Word文档下载推荐.doc》由会员分享,可在线阅读,更多相关《2气象统方法-复习思考题Word文档下载推荐.doc(6页珍藏版)》请在冰豆网上搜索。
对于这种状态要素,可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
对于这种定量数据要素,主要用相关系数选择预报因子或因子集,并用t_检验方法检验其可靠性。
18、如果序列的__自_相关系数为较大正值,表明序列具有_高持续性_;
如果序列的滞后自相关系数接近0或为负值,表明序列无持续性。
如果两变量本身有强持续性或高自相关,t_检验的自由度不能用,需要计算有效自由度,取更_严格的标准进行相关系数的检验,以免得到虚假的不可靠的相关。
19、气象变量场EOF分析是把原变量场分解为空间函数和时间函数两部分,用为数较少的不相关的典型模态,代替原始的气候变量场。
20、利用一元线性回归方法进行线性趋势分析中,回归系数b的符号说明了气候变量x的趋势倾向。
当b>
0说明随时间的增加,变量x是呈(上升或下降)趋势;
b值的大小反映了上升或下降的速率,b的绝对值越大,表明直线越(倾斜或平缓)。
21、检验两地气候是否有显著差异,可针对这两个地区某气象资料的平均值和方差这两个基本统计量进行显著性检验。
22、对多要素资料的数据矩阵进行分析时,研究变量之间的相互关系,称为R型分析,而研究样本之间关系的称为_Q型分析,相应的在系统聚类分析中,也可分为R型聚类和_Q型聚类。
二、判断题
1、相关系数是标准化变量的协方差。
()
2、若相关系数通过显著性检验就说明总体一定存在线性相关。
3、对于一元线性回归来说,回归方程的检验与相关系数的检验一致。
4、预报量95%的置信区间表示真值有95%的概率落在该区间内。
5、在多元线性回归方程中,若某个因子对预报量y的作用不显著,则它前面的系数近似为0。
6、显著性水平控制了犯“第二类错误”(以假为真)的概率。
三、简答题
1、简述资料正态化的必要性和常用的资料正态化处理方法。
答:
必要性是:
各类统计预报模型和统计检验方法(F\t\u\x2检验)要求资料是符合正态分布。
年\月平均气温\气压\多雨地区的月降水量符合.日降水和少雨地区月降水通常偏态。
旬\候降水不一定。
处理方法:
1、立方根或四次方根;
2.双曲正切转换(纠正课本公式)--旬降水。
3、化为有序数后的正态化转换(标准化和正态化)
2、简述显著性检验的基本思想。
抽样会产生抽样误差,利用样本资料进行分析时,不能仅凭样本资料的结果就对总体特征做出判断,而要鉴别其结果是否为总体的特征。
首先对总体的参数或分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理。
原理是利用“小概率事件在一次试验中几乎是不发生的”来接受假设或者否定假设,是一种带有概率性质的“反证法”。
在原假设为真时拒绝元假设,称为第一类错误(以真为假),其出现的概率通常记作a,原假设为假时接受原假设,称为第二类错误,其出现的概率通常记作B,这种限定犯第一类错误的最大概率a,不考虑犯第二类错误的概率B的检验就称为显著性检验,概率a称为显著性水平。
3、简述利用多元线性回归方程进行预报的步骤。
答:
1)确定预报量并选择恰当的因子
2)根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关阵,以及因子与预报量交叉积向量)
3)解线性方程组定出回归系数
4)建立回归方程并进行统计显著性检验
5)利用已出现的因子值代入回归方程作出预报量的估计,求出预报值的置信区间
4、逐步回归中逐步剔除法与逐步引入法的主要缺点分别是什么?
逐步剔除法的主要缺点是计算量很大
逐步引入法的主要缺点是计算量很小,但不一定保证最后的方程是最优的。
5、请写出多元回归方程中预报因子数目增多的优缺点。
优点:
一般而言,回归方程中包含的因子个数越多,回归平方和就越大,残差平方和越小,残差方差的估计就越小,预报值的置信区间就越小,方程一般也较容易通过检验。
缺点:
1、因子增多,计算量增大,计算时间增多
2、方程中若含有对y不起作用或作用极小的因子,残差平方和不会由于这些变量的增多而减少多少,相反由于Q自由度减小,残差方差估计值增大,使预报置信区间估计值增大。
3、由于存在对预报量y影响不显著地因子,随之带来许多其他与与预报量无关的随机因素,影响回归方程的稳定性反而使预报效果下降。
1、试举例说明哪些方法(不少于三种)可以进行气候变化趋势分析?
1)线性倾向估计;
2)滑动平均;
3)二次平滑;
4)累积距平
2、简述回归分析与相关分析的区别。
(1)相关分析中,变量x变量y处于平等的地位;
回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。
(2).相关分析中所涉及的变量x和y都是随机变量;
回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。
(3).相关分析主要是描述两个变量之间线性关系的密切程度;
回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
四、计算分析
1、已知预报量y:
长江中下游夏季(6-8月)降水量,预报因子x1:
冬季(12月-翌年2月)北太平洋涛动指数;
x2:
1月太平洋地区极涡面积指数;
x3:
5月西太平洋副高脊线,样本容量n=44。
现建立y关于x1、x2、x3的多元回归方程,分析结果如表2所示。
1)试写出回归方程的表达式,并给出预报值95%的置信区间。
由表2,Y=287.435+2.496x1-0.195x2-2.901x3;
2)简要说明回归方程是否通过显著性检验。
设显著性水平为0.05。
由方差分析表,在0.05显著性水平下,F值为4.191或P值0.011,通过显著性检验。
3)试问各预报因子是否显著?
4)y与各x因子的复相关系数为多少?
回归方程的判决系数为多少?
并简要说明其代表的意义。
表2多元回归分析结果表
方差分析
df
SS
MS
F
SignificanceF
回归分析
3.000
201569.234
67189.745
4.191
0.011
残差
40.000
641325.198
16033.130
总计
43.000
842894.432
Coefficients
标准误差
tStat
P-value
Intercept
287.435
295.875
0.971
0.337
X1
2.496
1.210
2.063
0.046
X2
-0.195
0.217
-0.898
0.375
X3
-2.901
1.061
-2.733
0.009
回归统计
MultipleR
0.489
RSquare
0.239
AdjustedRSquare
0.182
126.622
四、计算题
1、试计算变量x、y的简单相关系数,并进行显著性检验。
已知显著性水平=0.05下的临界相关系数=0.709。
n
1
2
3
4
5
6
7
8
x
10
15
13
17
22
y
-8
9
-5
-2
解:
x=(10+15+13+17+7+3+1+22)/8=11y=(-8+3+1+9+4+6-5-2)/8=1
x=-1y=-9Sx=
42
20
68
-43
-85
-10-6
-11-3
五、综合分析题
第一模态方差贡献15.5%
1、请判断图中EOF分析的对象是原始场、距平场还是标准化距平场?
是距平场
2、请给两幅图加上图题。
图一中国夏季降水异常EOF分析第一模态空间型。
图二中国夏季降水异常EOF分析第一模态时间系数。
3、请试分析图中的特征。
答中国夏季降水异常EOF分析第一模态空间型主要反映了长江流域与华南及华北地区的降水异常的反位相变化,而其他地方的数值较小,说明这些地方夏季降水的方差较小。
中国夏季降水异常EOF分析第一模态时间系数则具有较明显的年际变化,其值在0线上下振荡。
说明,当时间系数为正时,长江流域降水偏多时,华南及华北地区降水偏少。
这与我国夏季东部降水的三雨带变化相对应。
23、气候变化上通常说的异常,可以用距平这个基本统计量来描述,它反映数据偏离平均值的状况,把资料处理成该统计量的形式,叫做资料的_中心化化。
24、对资料做标准化可以消除单位量纲不同造成的影响,其表达式为,标准化以后资料的均方差为1。
25、在对回归问题进行方差分析时,预报量的方差可以表示成回归方差与误差(残差)方差之和。
26、寻找合适的条件概率作为天气预报指标需要满足两个经验性条件,一是P(A/B)>
P(A)或P(A/B)<
<
P(A),它保证了事件A与B事件有一定的联系;
第二是P(A/B)→1或者P(A/B)→0,它保证了预报指标有一定的准确率。
27、气象中一些气象要素,如冰雹、晕、雾等天气现象,气象资料中仅记录为“有”或“无”可用“1”或“0”二值数字化表征,这类变量可看成离散型随机变量。
对于这种状态要素,可以用_条件概率____选择预报因子并且用二项分布检验预报因子的可靠程度。
气温、气压及降水量等气象要素,观测值在正、负无穷之间,这种类型要素可看成为连续型随机变量。
对于这种定