地理学数学方法.docx
《地理学数学方法.docx》由会员分享,可在线阅读,更多相关《地理学数学方法.docx(25页珍藏版)》请在冰豆网上搜索。
地理学数学方法
地理学数学方法试卷1
一、填空题(本题共10小题,满分16分。
)
1、 计量地理学的研究对象大致有 、 、
)三个方面。
2、 根据其测度标准,可以将品质标志数据划分为 、
、 )三种类型。
3、 统计分组能反映出地理现象的 。
4、 是运用分组法的关键。
5、 目前公认的最短路径的最好求解方法是 。
6、 回归分析所研究的地理数学模型,依要素(变量)的多少可分为 )和 )。
7、 用数学的方法,以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法,称为 。
8、 投入产出分析,又称“部门平衡”法,或称“产业联系”分析,是由美国经济学家( 在本世纪30年代最早提出来的。
9、 在地理数据的分布性质中,最重要的两个性质是( 和 。
10、 是进行投入产出分析的前提。
二、简答题(本题共3小题,满分24分。
)
1、对一个给定的研究区域来说,地理要素分布的中项中心和平均中心如何确定?
2、在聚类分析过程中,为什么常常要对原始数据进行处理?
3、简述判别分析的费歇准则与贝叶斯准则。
三、统计指标与参数的计算(本题共1小题,满分10分。
)
在海岸的几个测点上测得海岸带潮差和海岸距大陆架边缘的距离如表
表1 观测数据表
测点序号
平均潮差△H
至150m等深线的
最短距离(km)
1
3.34
780
2
2.56
510
3
0.89
172
4
1.57
232
5
0.75
138
6
1.40
210
7
0.99
90
试求:
平均潮差和至150m等深线的最短距离的平均数、方差、标准方差、变异系数。
(要求保留两位有效数字)
四、线性回归模型的建立(本题共1小题,满分20分。
)
现将某地区的商业网点的零售额情况列于表2中,试用一元线性回归方法建立回归模型,求出相关系数并预测2006年的零售额。
(要求写出详细的计算过程,数值只需保留两位有效数字)
表2 某地区商业网点零售额统计表
年份(x)
2000
2001
2002
2003
2004
2005
零售额(y)
(亿元)
32.3
33.6
36.3
39.4
42.3
46.0
五、完成投入产出表(本小题共1小题,满分30分。
)
设某地国民经济分为A、B、C、D四个部门,并知道部门间的直接消耗系数如下表所示:
A
B
C
D
A
0.20
0.15
0.08
0.03
B
0.15
0.40
0.25
0.20
C
0.05
0.08
0.04
0.10
D
0.08
0.05
0.07
0.19
试完成下列投入产出表的编制:
中间产品
最终产品
总产品
A
B
C
D
中
间
消
耗
A
80
B
C
400
D
295
增加值
320
总产出
(**要求写出详细的计算步骤)
试卷1答案
一、填空题(本题共10小题,满分16分。
)
1、 空间与过程的研究、生态研究、区域研究
2、 有序数据、二元数据、名义尺度数据
3、 质的差别
4、 正确地选择分组标志
5、 标号法
6、 一元地理回归模型、多元地理回归模型
7、 趋势面分析
8、 列昂惕(捷)夫
9、 集中性、离散性
10、编制投入产出表
二、简答题(本题共3小题,满分24分。
)
1、答:
(1)中项中心是两条相互垂直的直线的交叉点,这两条直线一般取南北向和东西向,每条直线把点状分布的点子二等分。
(2分)
(2)平均中心:
也可称为分布重心,其确定方法如下:
①任意在分布图上作x轴和y轴,通常这种数轴画在分布点的西侧和南侧;(2分)
②确定每一点的坐标;(2分)
③计算x坐标、y坐标的平均值,其平均值就是平均中心(重心)的坐标。
(2分)
2、答:
聚类分析是根据各变量的观测值予以分类的,它涉及到通过各种途径和手段所得到的有意义的地理数据。
(1分)由于要素(或指标)的量纲、数量级和数量变化幅度的差异,(1分)如用原始数据进行聚类分析,就会将不同性质、不同量纲、不同数量变化幅度的数值都统计在一起,(1分)这样就有可能突出某些数量级特别大的变量对分类的作用,而压低甚至排除了某些数量级很小的变量对分类的作用。
(1分)
为避免这些弊病,而有利于分析、对比和使分类清晰,常对原始数据进行适当和必要的处理或变换;(2分)就可以消除量纲的不同和使每一变量都统一在某种共同的、相对均匀化的数值范围内。
(2分)
3、答:
费歇准则:
应用费歇准则进行判别分析时,要对原始数据进行线性组合,使其形成一个新变量,即判别函数。
(2分)要使判别函数值能充分地区分开地理类型,就需要使各类均值之间的差别最大(即使不同类之间的差别最大),而使各类内部的离差平方和最小(即使同类间的差别最小)。
(1分)换句话说,即要求类间(或组间)均值差与类内(或组内)方差之比最大,这样就能把地理类型区分得最清楚,这就是费歇准则的基本要点。
(1分)
贝叶斯准则:
应用贝叶斯准则时,要求把已知的地理数据分成几类(或几组),然后计算出未知地理类型或区域归属于各已知类型(或组)的概率值,它归属于哪一类的概率值最大,就把它划归该类(或组);(2分)另外,还可计算出划归各已知类的错分损失,即错分哪一类的平均损失最小,就把它判定为该类。
以上就是贝叶斯准则的基本要点。
(2分)
三、统计指标与参数的计算(本题共1小题,满分10分。
)
解:
(1)计算表如下:
测点序号
平均潮差△H
至150m等深线的
最短距离(km)
(△H)2
D2
变异系数
1
3.34
780
11.1556
608400
2
2.56
510
6.5536
260100
3
0.89
172
0.7921
29584
4
1.57
232
2.4649
53824
5
0.75
138
0.5625
19044
6
1.40
210
1.96
44100
7
0.99
90
0.9801
8100
总和
11.5
2132
24.47
1023152
平均值
1.64
304.57
各统计指标值的计算公式为:
(2)平均数:
由公式计算得出;(0.5分)(0.5分)
(3)方差:
,其中
由公式计算得出
(2分)
(2分)
(4)标准差:
;(0.5分)(0.5分)
(5)变异系数:
平均潮差的变异系数为:
(2分)
至150m等深线的最短距离的变异系数为:
(2分)
四、线性回归(本题共1小题,满分20分。
)
解法一:
(1)模型的建立:
写出函数方程如下:
,其中,为待定参数,求解过程如下。
(1分)
利用最小二乘法求参数,求解参数的方程组为
(2分)
解此方程组得到:
(2分)
数据计算表如下:
(7分)
年份(x)
序号
零售额(y)
(亿元)
x2
y2
xy
2000
1
32.3
1
1043.29
32.3
2001
2
33.6
4
1128.96
67.2
2002
3
36.3
9
1317.69
108.9
2003
4
39.4
16
1552.36
157.6
2004
5
42.3
25
1789.29
211.5
2005
6
46.0
36
2116.00
276.0
总和
21
229.9
91
8947.59
853.5
平均数
3.5
38.32
将表中计算值代入参数b的求解公式,即
所得模型为(2分)
(2)计算相关系数
(1分)
(三个参数数值的得出共3分,每个参数为1分)
(3)2006年零售额预测
根据建立的模型对2006年的零售额进行预测,即把X=7代入所建立的线性回归模型,得
(亿元)(2分)
解法二:
本题也可直接以年份为X值与零售额建立线性模型,其计算步骤与解法一相同,其结果为:
)
五、完成投入产出表(本题共1小题,满分30分。
)
解:
第一步,根据直接消耗系数计算第一列
增加值
(得出x1给2分,其余数值各1分)
第二步,完成第二列
(每项0.5分)
根据平衡关系
(2分)
(2分,每个数值为0.5分)
第三步,完成第三列
(每项0.5分)
增加值(1分)
第四步,完成第四列
根据行方向的平衡关系,对第四行有
(2分)
(4分,其中x4的求解为2分,其余项每个0.5分)
(1分)
第五步,计算最终产品量
(每项2分)
中间产品
最终产品
总产品
A
B
C
D
中
间
消
耗
A
80
150
32
15
123
400
B
60
400
100
100
340
1000
C
20
80
16
50
234
400
D
32
50
28
95
295
500
增加值
208
320
224
240
总产出
400
1000
400
500
(完成表格的填充得2分)
地理学数学方法试卷2
一、填空题(本题共6小题,满分12分。
)
1、 根据其测度标准,可以将数量标志数据划分为 和 两种类型。
2、 在计量地理学中表示地理数据的方式有多种,常用的有 和 。
3、 地理数据的整理工作大致可分为三步,即 、 和 。
4、 在地理数据的分布性质中,最重要的两个性质是 和 。
5、 趋势面是一种 ,它能集中地代表地理数据在大范围内的空间变化趋势。
6、 投入产出模型,按照分析时期的不同,可分为 和 两大类。
二、问答题(本题共5小题,满分35分。
)
1、地理数据采集的来源渠道有哪些?
2、简述相关系数(rxy)的性质。
3、简述回归分析的主要内容。
4、聚类分析的基本特点是什么?
5、写出价值型投入产出表所反映的五个平衡关系。
三、统计指标计算(本题共1小题,满分8分。
)
在某地实施作物新品种试验,各试验小区的面积如表1所示,试计算其平均值,中位数、众数、极差、离差平方和。
表1某试验地玉米产量
地块编号
1
2
3
4
5
6
7
面积
(/亩)
32
80
54
63
54
70
42
四、服务点最优区位问题(本题共1小题,满分15分。
)
根据所给出的无向图写出各点到其他点的最短距离矩阵,并求出无向图的中心。
V1
V4
V2
V3
V5
V6
2
2
4
3
5
7
3
1
6
V7
8
5
3
五、投入产出分析方法(本题共1小题,满分30分。
)
设有如下投入产出表:
单位:
亿元
中间产品
最终产品
总产品
A
B
C
中间消耗
A
20
60
15
105
200
B
40
180
30
150
400
C
10
20
15
105
150
增加值
130
140
90
总产值
200
400
150
(1) 直接消耗系数矩阵A和列昂捷夫矩阵I-A;
(2) 计划年度A、B、C三个部门分别生产240,460和170亿元的社会产品,各部门应相互提供和消耗多少中间产品?
(3) 各部门生产多少社会最终产品和创造多少社会最终产值?
一、 填空题(本题共6小题,满分12分)
1、 间隔尺度数据、比例尺度数据
2、 矩阵形式、矩阵表
3、 检查资料、统计分组、绘制图表
4、 集中性、离散性
5、 光滑的数学曲面
6、 静态模型、动态模型
二、 问答题(本题共5小题,满分35分)
1、地理数据采集的来源渠道有哪些?
答:
(1)来自观测、测量部门的有关专业数据。
(1分)
(2)来自统计年鉴、统计公报中的有关自然资源及社会经济发展数据。
(1分)
(3)来自有关单位或个人的不定期的典型调查数据、抽样调查数据。
(1分)
(4)来自政府公报、政府文件中的有关数据。
(1分)
(5)来自档案、图书等文献资料中的有关数据及互联网的有关共享数据。
(1分)
(6)地图图件和遥感数据。
主要包括各种比例尺的地形图、影像地图、专题地图、各种航空遥感数据和卫星遥感数据。
(1分)
(7)其他来源的有关数据。
(1分)
2、简述相关系数(rxy)的性质。
答:
rxy为要素x与y之间的相关系数,它就是表示该两要素之间相关程度的统计指标,其值在[-1,1]区间之内。
(3分)
rxy>0,表示正相关,即两要素同向发展;(1分)rxy<0,表示负相关,即两要素异向发展;(1分)
rxy的绝对值越接近于1,表示两要素的关系越密切;(1分) 越接近于0,表示两要素的关系越不密切。
(1分)
3、简述回归分析的主要内容。
答:
从一组地理数据出发,确定这些要素(变量)间的定量数学表达式,即回归模型;(2分)根据一个或几个要素(自变量)的值来预测或控制另一个要素(因变量)的取值;(2分)从某一地理过程中的许多要素中,找出哪些要素(变量)是主要的,哪些要素是次要的,这些要素之间又有些什么关系。
(3分)
4、聚类分析的基本特点是什么?
答:
事先无需知道分类对象的分类结构,而只需要一批地理数据;(3分)然后选好分类统计量,并按一定的方法步骤进行计算;(2分)最后便能自然地、客观地得出一张完整的分类系统图。
(2分)
5、写出价值型投入产出表所反映的五个平衡关系。
答:
列平衡关系:
中间投入+增加值=总投入(2分)
行平衡关系:
中间使用+最终使用=总产出(2分)
总量平衡关系:
总投入=总产出(1分)
每个部门的总投入=每个部门的总产出(1分)
中间投入合计=中间使用合计(1分)
三、统计指标计算(本题共1小题,满分8分。
)
在某地实施作物新品种试验,各试验小区的面积如表所示,试计算其平均值,中位数、众数、极差、离差平方和。
某试验地玉米产量
地块编号
1
2
3
4
5
6
7
面积
(/亩)
32
80
54
63
54
70
42
解:
平均数:
(1分)
中位数:
将数据按从小到大的顺序排列后,找出其中位数为54(1分)
众数是出现次数最多的数据,在此为54(1分)
极差:
(2分)
离差平方和:
(3分)
四、服务点最优区位问题(本题共1小题,满分15分。
)
根据所给出的无向图写出各点到其他点的最短距离矩阵,并求出无向图的中心。
V1
V4
V2
V3
V5
V6
2
2
4
3
5
7
3
1
6
V7
8
5
3
解:
最短距离矩阵如下:
(10分)
求每一行的最大值,得
(3分)
其中,,定出v5,v6均是图的中心。
(2分)
五、投入产出分析方法(本题共1小题,满分30分。
)
设有如下投入产出表:
单位:
亿元
中间产品
最终产品
总产品
A
B
C
中间消耗
A
20
60
15
105
200
B
40
180
30
150
400
C
10
20
15
105
150
增加值
130
140
90
总产值
200
400
150
(1) 直接消耗系数矩阵A和列昂捷夫矩阵I-A;
(2) 计划年度A、B、C三个部门分别生产240,460和170亿元的社会产品,各部门应相互提供和消耗多少中间产品?
(3) 各部门生产多少社会最终产品和创造多少社会最终产值?
解:
(1)(本部分分数为11分)
根据直接消耗系数计算公式
及,(写出公式及矩阵形式各1分,共2分)
得到直接消耗系数矩阵如下:
(4.5分,每一个数字为0.5分)
列昂惕夫矩阵为:
(4.5分,每一个数字为0.5分)
(2)(本部分分数为9分,计算出每一数据为1分)
根据直接消耗系数计算公式,以及求得的直接消耗系数矩阵可得
各部门相互提供和消耗的中间产品矩阵
=
(3)(本部分分数为10分,列出矩阵形式为1分,计算出一个数值为1分)
社会最终产品与创造的社会最终产值可用矩阵形式求出,也可根据平衡关系求出,以下以矩阵形式求出:
总产出(1分),又(1分)
所以,社会最终产品为
(3分)
社会最终产值
(5分,包括写出N与X之间的关系式为1分,写观消耗系数矩阵形式给1分,计算出相应的Ni,每个给1分)
根据以上计算数值得到下面的投入产出表:
(此表可不给出)
中间产品
最终产品
总产品
A
B
C
中间消耗
A
24
69
17
130
240
B
48
207
34
171
460
C
12
23
17
118
170
增加值
156
161
102
总产值
240
460
170
地理学数学方法试卷
(三)
一、判断题:
(判断并改错每题2分,共10题。
正确的在括弧内写“正确”;错误的在括弧内写“错误”,划出错误内容,并在空白处写出正确内容。
)
1、地理学数学方法研究地理系统的一切模型的建立。
( )
2、西方计量革命的开端是1955年华盛顿大学地理系为训练学生使用数学统计方法开设的第一个研究班。
( )
3、计量地理学对未经理论化的命题其研究方法为模式化——检验——解释——结论。
( )
4、地理系统数学模拟是建立数学模型并对之求知求解过程。
( )
5、中位数在频数分布图上居中央点,在累积频率图上为最高点。
( )
6、在均值及单位相同的情况下,标准差大,表示变量分布的较集中,反之分布的较分散。
( )
7、相关指数R必大于或至少等于同一批资料相关系数的绝对值。
( )
8、趋势面是一个光滑的数学曲面,集中代表大范围的空间变化趋势。
( )
9、滑动平均法可用来研究确定型时间序列,也可用来研究随机型时间序列。
( )
10、判别分析中的判别函数可反映各要素或特征值的作用方向,分辨能力和贡献率的大小。
( )
二、我国自然灾害受灾面积的某段历史资料如下表,试用一次指数平滑法预测下一年受灾面积,(平滑系数а=0.9)(15分)
单位:
万公顷
年
1
2
3
4
5
6
7
8
9
10
11
受灾
面积
3105
4046
3649
3865
3538
4250
5202
5079
3937
4453
3979
三、某物质总销售额取决于两种主要物资x1,x2供应量,现将有关资料列表如下,试用多元线性回归模型预测下一年该物质的销售额,预测年第一种物质供应量为12万吨,第二种物质供应量为17万吨。
(35分)
年份序号
1
2
3
4
5
6
7
8
9
10
总销售额(万元)
13
15
20
16
18
13
17
15
19
21
第一种物质(万吨)
3
3
9
3
7
4
6
4
10
11
第二种物质(万吨)
3
4
12
6
10
6
9
5
12
13
四、现有我国北方6个城市的两个气候指标,最热月平均气温T1与最冷月平均气温T2,试用欧氏距离作聚类统计量进行聚类分析,一次形成聚类谱系图(30分)
城市序号
1
2
3
4
5
6
T1
20.4
22.9
26.0
27.5
16.3
15.5
T2
-25.8
-17.0
-4.7
0.2
-2.0
-2.3
地理学数学方法试卷(三)答案
一、判断题
1、错误 2、正确 3、错误4、正确 5、错误 6、正确 7、正确 8、正确 9、正确 10、正确
二、一次指数平滑公式为St=St-1+α(Xt-1-St-1) (5分)
S1=3105
S2=3105+0.9(3105-3105)=3105
S3=3105+0.9(4046-3105)=3951.9
S4=3679.29 S5=38446.43
S6=3560.85 S7=4181.05
S8=5102.61 S9=5081.39
S10=4051.44 S11=4412.84
预测值S12=4412.84+0.9×(3979-4412.84)=4022.38(万/公顷)(10分)
三、设第一种物质供应量为x1,第二种物质为x2,总销售额为y
多元线性回归模型=b0+b1x1+b2x2 (2分)
正规方程组为 (2分)