计量地理学-3.4-聚类分析PPT课件下载推荐.pptx

上传人:b****1 文档编号:14026324 上传时间:2022-10-17 格式:PPTX 页数:51 大小:1.16MB
下载 相关 举报
计量地理学-3.4-聚类分析PPT课件下载推荐.pptx_第1页
第1页 / 共51页
计量地理学-3.4-聚类分析PPT课件下载推荐.pptx_第2页
第2页 / 共51页
计量地理学-3.4-聚类分析PPT课件下载推荐.pptx_第3页
第3页 / 共51页
计量地理学-3.4-聚类分析PPT课件下载推荐.pptx_第4页
第4页 / 共51页
计量地理学-3.4-聚类分析PPT课件下载推荐.pptx_第5页
第5页 / 共51页
点击查看更多>>
下载资源
资源描述

计量地理学-3.4-聚类分析PPT课件下载推荐.pptx

《计量地理学-3.4-聚类分析PPT课件下载推荐.pptx》由会员分享,可在线阅读,更多相关《计量地理学-3.4-聚类分析PPT课件下载推荐.pptx(51页珍藏版)》请在冰豆网上搜索。

计量地理学-3.4-聚类分析PPT课件下载推荐.pptx

,聚类要素的数据处理,每个变量都有m个样本观测数值,假设有m个聚类的对象,每一个聚类对象都有n个变量/要素构成。

它们所对应的要素数据可用下表给出:

每个对象都由相同的n个变量来描述m个聚类对象,需要被聚集为若干类别每个对象都有n个变量的具体取值,某地区9个农业区的7项经济指标数据,在聚类分析中,描述聚类对象的变量是可选的(e.g.选择描述经济水平的若干指标变量),但选取的变量对于聚类分析结果有着极重要的影响作用,直接影响聚类结果的准确性和可靠性。

因此当聚类要素的变量对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。

在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。

不同要素的数据往往具有不同的单位量纲和数量级,其数值的变异可能是很大的,这就会对聚类结果产生一定影响。

数据标准化,消除不同变量的量纲差异;

统一不同变量的数量级,数据标准化,总和标准化标准差标准化,极大值标准化极差标准化总和标准化分别求出各聚类要素所对应的样本观测数据的总和,以各要素的数据除以该要素数据的总和,即,经过综合标准化方法所得到的新数据满足:

数据标准化,总和标准化标准差标准化,极大值标准化极差标准化标准差标准化将各聚类要素所对应的样本观测数据,减去其平均值求得离差值,然后再除以标准差,即:

由标准差标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有:

数据标准化,总和标准化标准差标准化,极大值标准化极差标准化极大值标准化经过极大值标准化所得的新数据,各要素的极大值为1,其余各数值小于1。

极差标准化,经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。

例题:

针对下表中给出的某地区9个农业区的7项指标,对原始变量数据进行极差标准化处理。

某地区9个农业区的7项经济指标数据,解:

依次求解个指标x1,x2,x7的最大值和最小值,以及它们的差值:

求解原始数据的极差标准化处理数据:

极差标准化处理后的数据,距离的计算,聚类分析是依据研究对象的距离计算结果,按照距离最近原则,将这些对象进行类别聚集。

距离计算方式?

绝对值距离欧氏距离明科夫斯基距离切比雪夫距离,绝对值距离,欧氏距离,绝对值距离,欧氏距离,明科夫斯基距离,切比雪夫距离当明科夫斯基距p时,有,明氏距离,(p=3),切氏距离,明科夫斯基距离,p=1,pp=2,绝对值距离,欧氏距离,切比雪夫距离,X,当描述对象的变量仅为x和y时Y,0,(x2,y2),点1(x1,y1),点2,绝对值距离欧氏距离切氏距离!

随着p值增大,明氏距离逐渐减小!

9个农业区7项经济指标极差标准化数据,计算任意两个农业区之间的绝对值距离,可得到9个农业区之间的距离矩阵:

聚类分析的数据基础,直接聚类法,原理先把m个分类对象单独视为一类,然后根据距离最小原则,依次选出一对分类对象,并成新类。

(即当前距离最小的两个对象聚为一类)如果其中一个分类对象已归于一类,则把另一个也归入该类;

如果一对分类对象正好属于已归的两类,则把这两类并为一类。

每一次归并,都在距离矩阵划去该对象所在的列与列序相同的行。

经过m-1次就可以把全部分类对象归为一类,这样就可以根据聚类归并的先后顺序作出聚类谱系图。

根据距离矩阵,用直接聚类法对某地区的9个农业区进行聚类分析,步骤如下:

(1)在距离矩阵D中,除去对角线元素以外,d=d=0.51为最小者,,4994故将第4区与第9区并为一类,划去第9行和第9列;

(2)在余下的元素中,除对角线元素以外,d75=d57=0.83为最小者,故将第5区与第7区并为一类,划掉第7行和第7列;

8228,(3)在第2步之后余下的元素之中,除对角线元素以外,d=d=0.88,为最小者,故将第2区与第8区并为一类,划去第8行和第8列;

(4)在第3步之后余下的元素中,除对角线元素以外,d43=d34=1.23为最小者,故将第3区与第4区并为一类,划去第4行和第4列,此时,第3、4、9区已归并为一类;

该,,,(5)在第4步之后余下的元素中,除对角线元素以外,d21=d12=1.52为最小者,故将第1区与第2区并为一类,划去第2行和第2列,此时,第1、2、8区已归并为一类;

(6)在第5步之后余下的元素中,除对角线元素以外,d65=d56=1.78为最小者,故将第5区与第6区并为一类,划去第6行和第6列,此时,第5、6、7区已归并为一类;

又增加了两类,分别为(1,2),(5,6),合并相同的类,,即此时有三类,分别为(3,4,9),(1,2,8),(5,6,7)。

在第6步之后余下的元素中,除对角线元素以外,d31=d13=3.10为最小者,故将第1区与第3区并为一类,划去第3行和第3列,此时,第1、2、3、4、8、9区已归并为一类;

在第7步之后余下的元素中,除去对角线元素以外,只有d51=d15=5.86,故将第1区与第5区并为一类,划去第5行和第5列,此时,第1、2、3、4、5、6、7、8、9区均归并为一类。

),又增加了两类,分别为(1,3),(1,5),同之前的三类(3,4,9),(1,2,8),(5,6,7)进行合并,此时只有一个大类(1,2,3,4,5,6,7,8,9)。

根据上述步骤,可以作出直接聚类法分析过程的聚类谱系图:

聚类过程距离阀值,某距离阀值下的聚类结果,聚为三类,

(1)在距离矩阵D中,除去对角线元素以外,d=d=0.51为最小者,,4994故将第4区与第9区并为一类,划去第9行和第9列;

直接聚类法的问题?

第4区与第9区并为一个新类,划去第9行和第9列。

也即保留第4区作为(4,9)新类的代表?

最短距离聚类法,原理最短距离聚类法,是在原来的mm距离矩阵的非对角元素中找出距离最小者,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式来计算原来各类与新类之间的距离,这样就得到一个新的(m1)阶的距离矩阵;

再从新的距离矩阵中同样选出最小者dij,把Gi和Gj归并成新类;

再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。

同样也需要(m1)次聚类过程才能将所有对象聚为一类。

从最短距离聚类法中新类与原类的距离计算可以看出,距离取值为原类与新类中各个类的距离最小值。

根据距离矩阵,用最短距离聚类法对某地区的9个农业区进行聚类分析,步骤如下:

解:

(1)在99阶距离矩阵D中,非对角元素中最小者是d94=0.51,首先将第4区与第9区并为一类,记为G10=G4,G9。

分别计算G1,G2,G3,G5,G6,G7,G8与G10=G4,G9之间的距离:

d1,10=maxd14,d19=max2.19,2.62=2.19d2,10=maxd24,d29=max1.47,1.66=1.47d3,10=maxd34,d39=max1.23,1.20=1.20,d5,10=maxd54,d59=max4.77,4.84=4.77d6,10=maxd64,d69=max2.99,3.06=2.99d7,10=maxd74,d79=max4.06,3.32=3.32d8,10=maxd84,d89=max1.29,1.40=1.29,123567810,

(2)这样就得到G,G,G,G,G,G,G,G上的一个新的88阶,距离矩阵:

(3)在上一步骤中所得到的88阶距离矩阵中,非对角元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11=G5,G7。

再分别计算G1,G2,G3,G6,G8,G10与G11之间的距离,可得到一个新的77阶距离矩阵:

(4)在第3步所得到的77阶距离矩阵中,非对角元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12=G2,G8。

再分别计算G1,G3,G6,G10,G11与G12之间的距离,可得到一个新的66阶距离矩阵:

(5)在第4步所得的66阶距离矩阵中,非对角元素中最小者为d6,11=1.07,故将G6与G11归并为一类,记为G13,即G13=G6,G11=G6,(G5,G7)。

再计算G1,G3,G10,G12与G13之间的距离,可得到一个新的55阶距离矩阵:

(6)在第5步所得的55阶距离矩阵中,非对角线元素中最小者为d3,10=1.20,故将G3与G10归并为一类,记为G14,即G14=G3,G10=G3,(G4,G9)。

再计算G1,G12,G13与G14之间的距离,可得一个新的44阶距离矩阵:

在第6步所得到的44阶距离矩阵中,非对角线元素中最小者为d12,14=1.29,故将G12与G14归并为一类,记为G15,即G15=G12,G14=(G2,G8),(G3,(G4,G9)。

再计算G1,G13与G15之间的距离,可得一个新的33阶距离矩阵:

在第6步所得的33阶距离矩阵中,非对角线元素中最小者为d1,15=1.32,故将G1与G15归并为一类,记为G16,即G16=G1,G15=(G1,(G2,G8),(G3,(G4,G9)。

再计算G13与G16之间的距离,可得一个新的22阶距离矩阵将G13与G16归并为一类。

此时,所有分类对象均被归并为一类。

综合上述聚类过程,可以作出最短距离聚类谱系图:

最远距离聚类法,原理:

最远距离聚类法与最短距离聚类法的唯一区别在于计算原来的类与新类距离时采用的公式不同。

最远距离聚类法的计算公式是:

即:

在最远距离聚类法中,新类与原类的距离取值为,原类与新类中各个类的距离最大值。

根据距离矩阵,用最远距离聚类法对某地区的9个农业区进行聚类分析,步骤如下:

d1,10=maxd14,d19=max2.19,2.62=2.62d2,10=maxd24,d29=max1.47,1.66=1.66d3,10=maxd34,d39=max1.23,1.20=1.23,d5,10=maxd54,d59=max4.77,4.84=4.84d6,10=maxd64,d69=max2.99,3.06=3.06d7,10=maxd74,d79=max4.06,3.32=4.06d8,10=maxd84,d89=max1.29,1.40=1.40,

(2)在第1步所得到的88阶距离矩阵中,非对角线元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11=G5,G7。

再计算G1,G2,G3,G6,G8,G10与G11之间的距离,得到一个新的77阶距离矩阵如下:

(3)在第2步所得到的77阶距离矩阵中,非对角线元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12=G2,G8。

再分别计算G1,G3,G6,G10,G11与G12之间的距离,得到一个新的66阶距离矩阵如下:

(4)在第3步所得的66阶距离矩阵中,非对角元素中最小者为d3,10=1.23,故将G3与G10归并为一类,记

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1