13、空间分布的类型:
点状分布类型、线状分布类型、面状分布类型(离散区域分布类型、连续区域分布类型)。
14、根据测度标准,可以将数量标志数据划分为_间隔尺度数据_和比例尺度数据。
15、地理现象的分布格局,常常用地理数据分布的集中化程度和均衡度来描述。
16、地统计学:
以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性或空间相关和依赖性的自然现象的科学。
地统计学的两个最基本函数:
协方差函数和变异函数。
主要方法之一:
克立格法
17、克里格插值的关键是计算权重系数λi,而权重系数的求取需要满足的2个条件是:
无偏性、最优性。
P142。
18、在事件的发展过程中,若每次状态的转移都只仅与前一时刻的装态有关,而与过去的发展的状态无后效性。
这样的状态转移过程就叫马尔可夫过程。
19、常用的统计指标与参数:
P29
(1)描述地理数据一般水平的指标:
平均值、中位数、众数;
(2)描述地理数据分布的离散程度的指标:
极差、离差、离差平方和、方差、标准差、标准差无偏估计、变异系数;
(3)描述地理数据分布特征的参数:
偏度系数、峰度系数。
20、时间序列的组合成份(P72)
长期趋势(T)、季节变动(S)、循环变动(C)不规则变动(I)
21、在聚类分析中,常用的聚类要素的数据处理方法(P83)有如下几种:
总和标准化标准差标准化极大值标准化极差的标准化---(及它们的特征)
22、回归分析方法,就是研究要素之间_具体数量关系__的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即__回归模型__。
23、趋势面分析是利用数学曲面模拟地理系统要素在(空间上的分布)及变化趋势的一种数学方法。
24、变异函数四个非常重要的函数:
基台值、变程(空间依赖范围)、块金值(区域不连续性值)、分维数。
25、全局空间自相关的两个指标:
moran指数【-1~1】小于0负相关,大于0正相关,等于0不相关;
Geary系数【0~2】小于1正相关,大于1负相关,等于1不相关
局部空间自相关的分析方法:
LISA,G统计量,moran散点图。
26、AHP决策法的弱点随意性,基本步骤8、AHP决策的步骤:
(明确问题)、(建立层次结构模型)、(构造判断矩阵)、(层次单排序)、(层次总排序)、(层次总排序一致性检验);
计算方法:
方根法和和积法。
计算任务:
求解判读矩阵的最大特征根及其所对应的特征向量。
27、地理数据的类型:
(空间数据和属性数据)、(本身性质——定性和定量)、(数据来源——社会、经济、自然资源)
28、时间系列4种成分:
(长期趋势)、(季节变动)、(循环变动)、(不规则变动)。
29、全局指标:
(Moran指数)、(Geary系数)。
LISA包括:
(局部Moran指数)和(局部Geary系数)。
30、投入产出模型:
可分为(实物型)和(价值型)
31、地理要素空间分布四种类型:
(点状分布类型)、(线状分布类型)、(离散区域分布类型)、(连续的区域分布)
32、最临近距离的测度,通常有(顺序法)和(区域法)
33、点状分布的测度:
(最邻近距离的测度)、(中心位置及其测度)、(离散程度的测度)
离散程度的测度:
(对于平均中心的离散程度)、(对于任何指定位置的离散程度)、(各点之间离散程度的测定)
二、名词解释
1、计量地理学——又称数量地理学或统计地理学或理论地理学,是用数学方法和计算机术研究地理现象及地理要素的科学,是应用地理学的分支,是数学与地理学相交叉的学科。
(是将数学和电子计算机技术应用于地理学的一门新兴学科,计量地理学的出现反映了地理学朝着定量化的发展趋势。
--09级的)
2、地理数据是用一定的测度方式描述和衡量地理对象的有关量化标志,是对地理问题进行定量化描述和研究的基础,是一切数学方法在地理学中应用的先决条件。
3、空间数据主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程的产生、存在和发展的地理位置、区域范围及空间联系。
4、属性数据主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征,包括数量标志数据与品质标志数据两种。
5、中位数:
将各个数据从小到大排列,居于中间位置的那个数就是中位数。
它也从一个侧面反映了地理数据的一般水平。
6、众数:
出现频率最多的那个数。
它也从一个侧面反映了地理数据的一般水平。
7、离差:
指每一个地理数据与平均值的差,它代表着有一个地理数据与平均值的离散程度
8、极差:
指所有数据中最大值和最小值之差。
9、秩相关系数又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
10、偏度系数(P33)测度地理数据分布的不对称性情况,刻画以平均值为中心的偏向情况。
11、峰度系数:
它测度了地理数据在均值附近的几种程度。
12、回归分析方法,就是研究要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即回归模型。
13、集中化指数:
是一个描述地理数据分布的集中化程度的指数)
14、聚类分析,亦称群分析或点群分析,它是研究多要素事物分类问题的数量方法。
其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。
15、洛伦兹曲线:
使用累计频率曲线研究工业化集中化程度的曲线被称之为罗伦次曲线。
16、可行解P156:
满足约束条件(即满足线性约束和非负约束)的一组变量为可行解。
17、可行域:
所有可行解组成的集合称为可行域。
18、最优解:
使目标函数最大或最小化的可行解称为最优解。
19、基本可行解:
满足非负约束条件的基本解,称为基本可行解。
20、可行基:
对应于基本可行解的基,称为可行基。
21、马尔科夫过程:
在事件的发展过程中,若每次状态的转移都只仅与前一时刻的状态有关,而与过去的状态无关,或者说状态的转移过程是无后效性的,则这样的状态转移过程就叫马尔科夫过程。
22、回路:
起始顶点和最后顶点重合的路。
23、连通性:
如无向图内任意两个顶点之间存在着一条连接它们的路,则这个无向图是连通的。
24、强连通性:
在一个有向图中,它们任意两个顶点,都存在着一条连接它们的有向路。
三、简答题
1、统计整理的基本步骤:
p27
㈠统计分组——就是根据研究目的,按照一定的分组标志将地理数据分成若干组,使资料系统化,进而研究它们的规律性和依存关系。
统计分组的标志通常有品质标志和数量标志两种类型。
㈡计算各组的频数、频率,编制统计分组表
㈢作频数分布图
2、地理数据统计整理中的统计分组的步骤如下:
p27
A、求极差R(全距):
R=Xmax-Xmin
B、确定组数n:
组数是根据地理数据所包含变数值个数(N)的多少来确定的。
C、计算组距h:
即一组两头分界点距离h=R/n
D、计算组限Yi:
即各组分界点的数值
第一组下限:
y=Xmin-1/2h
第一组上限=下限+组距
E、计算组中值m:
m=(下限+上限)/2
3、写出对地理数据进行统计处理时常用到的统计指标与参数。
并解释偏度系数和峰度系数的含义。
答:
描述地理数据一般水平的指标:
平均值、中位数、众数。
描述地理数据分布的离散程度的指标:
极差、离差、离差平方和、方差与标准差、变异系数。
描述地理数据分布特征的参数:
偏度系数、峰度系数。
偏度系数测度了地理数据分布的不对称情况,刻画了以平均值为中心的偏向情况。
峰度系数测度了地理数据在均值附近的集中程度。
4、简述主成分分析法的原理和计算步骤
原理:
把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,是一种降维技术。
设有n个地理样本中有p个地理变量,当p较大时,如果在p维空间中考察问题,是比较麻烦的。
为了克服这个困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间彼此独立的。
设所有变量为主成分,求出所有变量指标的方差,把这些方差排序,挑选前几个方差最大的主成分进行问题的分析。
这样既能减少变量的数目,又能抓住主要矛盾,简化了变量之间的关系。
计算步骤:
⑴计算相关系数矩阵
⑵计算特征值和特征向量
⑶计算主成分贡献率及累计贡献率
⑷计算主成分载荷
(5)计算各主成分的得分
5、简述AHP决策分析方法的基本过程
答:
⑴明确问题
⑵建立层次结构模型
⑶构造判断矩阵
⑷层次单排序
⑸层次总排
(6)层次总排序的一次性检验
6、趋势面分析:
把实际的地理曲面分为趋势面和剩余面两部分,前者反映地理要素的宏观分布规律,属于确定性因素作用的结果,而后者对应于微观局域,是随机因素影响的结果。
趋势面分析的一个基本要求,就是所选择的趋势面模型应该是剩余值最小,而趋势面最大。
7、地理数据的特征:
①数量化、形式化与逻辑化。
是数学的基本特征。
②不确定性。
不确定性是地理数据的基本特征之一。
原因有:
地理系统的复杂性;各种原因所导致的数据误差。
③多时空尺度。
由于地理学的研究对象具有多种时空尺度,所以描述地理现象的地理数据也具有多种时空尺度的性质。
④多维性。
对于一个地理对象,它的具体意义往往需要从空间、属性、时间三个方面进行综合描述。
8、乘法模型的预测步骤:
①将原时间序列求移动(或滑动)平均,目的是消除季节变动和不规则变动,保留长期趋势
②将原序列y除以其对应的趋势方程值(或平滑值),目的是分离出季节变动(含不规则变动),即:
季节系数=TSCI/趋势方程值(TC或平滑值)=SI。
一般用序列中若干年的季节系数之平均值作为季节系数的改进值。
③将月度(或季度)的季节指标加总,以由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。
④求预测模型。
如果欲求下一年度的预测值,可简单地延长趋势线即可;若要求各月(季)的预测值,只需以趋势值乘各月份(季度)的季节性指标即可求得未来各月(季)的预测值。
以下大家自个打字,或者直接看书,我懒得打了,请多多包涵。
10、Moran与Geary的取值范围?
P122
11、标准化统计量Z的意义?
P123
当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z值为零时,观测值呈独立随机分布。
12、空间联系的局部指标(LISA)要满足的2个条件?
P123
(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标。
(2)所有区域单元LISA总和与全局的空间联系指标成比例。
13、G统计量的意义?
(正值、负值)P125第二段
显著的正G值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负G值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。
14、Moran散点图的四个象限:
P125
第一象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第二象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第三象限代表了低观测值的区域单元被同是低值的区域所包围的空间联系形式;第四象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。
15、与局部Moran指数相比,Moran散点图的优势是什么?
P125(总共有3点)
与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值,低值和低值,高值和低值,低值和高值之中的哪种空间联系形式。
并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。
16、区域化变量的两个特征;P132-133(随机、结构性)
首先区域化变量是一个随机函数,它具有局部性,随机性,异常的性质;其次,区域化变量具有一般的或平均的结构性质,即变量在点x与偏离空间距离为h的点x+h处的数值Z(x)与Z(x+h)具有某种程度的自相关,这种自相关依赖于两点之间的距离h及变量的特征。
这就体现了其结构性。
17、终极状态概率应满足的条件:
P112
18、马尔科夫预测法的适用条件:
P113(老师笔记)
19、线性规划的共同特征,解及其性质:
p152
在线性规划的问题中,称满足约束条件(即满足线性约束和非负约束)的一组变量x=(x1,x2,x3,x4……….)T为可行解。
所有可行解组成的集合成为可行域。
使目标函数取最大值(或者最小值)的可行解称为最优解。
解的特性:
(1)线性规划问题的可行解(可行域)为凸集。
(2)可行解集S中的点X是顶点的充要条件是X为基本可行解。
(3)诺可行解有界,则线性规划问题的最优解一定可以在其顶点上达到。
20、什么是多元线性回归模型?
多元线性回归模型和一元线性回归模型相比有什么特点?
如何对多元线性回归模型进行检验?
答:
多元线性回归模型描述的是多个要素之间的线性相关关系。
多元线性回归模型的结构形式为:
式中:
为待定参数;为随机变量。
(4分)
而一元线性回归模型描述的是两个要素之间的线性相关关系。
由于地理系统是由多种要素构成的,因此多元线性回归模型比一元线性回归模型更带有普遍性意义。
(4分)
模型检验:
①回归平方和U与剩余平方和Q:
(3分)
②回归平方和U
回归平方和U
的自由度为自变量的个数k(3分)
③剩余平方和为
剩余平方和Q的自由度等于n-k-1,n为样本数。
(3分)
④F统计量为
计算出来F之后,可以查F分布表对模型进行显著性检验。