ImageVerifierCode 换一换
格式:DOCX , 页数:25 ,大小:1.17MB ,
资源ID:7612426      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7612426.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(系统聚类分析方法.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

系统聚类分析方法.docx

1、系统聚类分析方法 系统聚类分析方法 聚类分析是研究多要素事物分类问题的数量方法。基本原理是根据样本自身的属性,用数学方 法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对 样本进行聚类。 常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。 聚类要素的数据处理1. 表个要素构成。它们所对应的要素数据可用 个聚类的对象,每一个聚类对象都有 假设有 m 在聚类分析中,常用的聚类要素的数据处理方法有如下几种。 给出。(点击显示该表)3.4.1 总和标准化 标准差标准化 极大值标准化 。 1 1,其余各数值小于经过这种标准化所得的新数据,各要素的极大值为 极差的标

2、准化 之间。 与 1,其余的数值均在1经过这种标准化所得的新数据,各要素的极大值为 ,极小值为 0 0 距离的计算2. 距离是事物之间差异性的测度,差异性越大,则相似性越小,所以距离是系统聚类分析的依据 和基础。 绝对值距离 选择不同的距离,聚类结果会有所差异。在地理分区和分类研究中,往往采用几种距离进行计 算、对比,选择一种较为合适的距离进行聚类。 所示。 3.4.3 给出了某地区九个农业区的七项指标,它们经过极差标准化处理后,如表 例:表 3.4.2 中的数据,用绝对值距离公式计算可得九个农业区之间的绝对值距离矩阵: 3.4.3 对于表 直接聚类法 3. 直接聚类法是根据距离矩阵的结构一次

3、并类得到结果。 基本步骤: 把各个分类对象单独视为一类; 如果其中一个分类对象已归根据距离最小的原则,依次选出一对分类对象,并成新类; 于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一 次就可以把全 m -1类;每一次归并,都划去该对象所在的列与列序相同的行; 那么,经过 部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。 直接聚类法虽然简便,但在归并过程中是划去行和列的,因而难免有信息损失。因此,直接 聚类法并不是最好的系统聚类方法。 (点击打开新窗口,显示该内容)举例说明 例:已知九个农业区之间的绝对值距离矩阵,使用直接聚类法做聚类分析。 解

4、: 根据上面的距离矩阵,用直接聚类法聚类分析: 区并为一9 4区与第 第一步,在距离矩阵 D 中,除去对角线元素以外,d49=d94=0.51 为最小者,故将第 列;9 9 行和第 类,划去第 区并为一类,7 5 区与第 第二步,在余下的元素中,除对角线元素以外,d75= d57=0.83 为最小者,故将第 列;7 行和第 划掉第 7 区与第2 为最小者,故将第 第三步,在第二步之后余下的元素之中,除对角线元素以外,d82= d28=0.88 列; 行和第 88 区并为一类,划去第 8 4 3 区与第d43= d34=1.23 为最小者,故将第 第四步,在第三步之后余下的元素中,除对角线元素以

5、外, 区已归并为一类; 、9、 列,此时,第 34区并为一类,划去第 4 行和第 4 2 区与第d12=1.52 为最小者,故将第 1第五步,在第四步之后余下的元素中,除对角线元素以外,d21= 区已归并为一类;8 1 、2、区并为一类,划去第 2 行和第 2 列,此时,第 6区与第 为最小者,故将第 5 第六步,在第五步之后余下的元素中,除对角线元素以外,d65= d56=1.78 区已归并为一类; 6、7 6 列,此时,第5、 区并为一类,划去第6 行和第 3 区与第 d13=3.10 为最小者,故将第1第七步,在第六步之后余下的元素中,除对角线元素以外,d31= 区已归并为一类;9 、8

6、、4列,此时,第 1、2、3、行和第区并为一类,划去第 3 3 区 51d15=5.86,故将第 区与第 第八步,在第七步之后余下的元素中,除去对角线元素以外,只有 d51= 、区均归并为一类;9、 并为一类,划去第5行和第5列,此时,第12345678 (点击展开显示该图)根据上述步骤,可以做出直接聚类谱系图。 最短距离聚类法 4. 归并 Gq Gp 和 最短距离聚类法是在原来的 mm 距离矩阵的非对角元素中找出,把分类对象 ,然后按计算公式 Gr为一新类 )阶的距离矩阵;再从新的距离1计算原来各类与新类之间的距离,这样就得到一个新的(m 归并成新类;再计算各类与新类的距离,这样一直下去,直

7、 Gj,把dij Gi 和矩阵中选出最小者 至各分类对象被归为一类为止。 (点击打开新窗口,显示该例)举例说明 例:已知九个农业区之间的绝对值距离矩阵,使用最短距离聚类法做聚类分析。 解:用最短距离聚类法对某地区的九个农业区进行聚类分析: 区并为一类, 9,故首先将第 4 区与第D第一步,在 99 阶距离矩阵 中,非对角元素中最小者是 d94=0.51 之间的距离得:G10 G8 与 G3,G5,G6,G7,记为 G10,即 G10=G4G9。分别计算 G1,G2 阶距离矩阵:88 G10 上的一个新的 G8G3,G5,G6,G7,G1这样就得到 ,G2 归 与 G7d57=0.83阶距离矩阵

8、中,非对角元素中最小者为 ,故将 G5 88第二步,在上一步骤中所得到的 之间的距离, 与 G11G10G8G6G3G2G1。分别计算G7G5G11=,即 并为一类,记为G11 , , 阶距离矩阵: 77 可得到一个新的 归并为G8 与 阶距离矩阵中,非对角元素中最小者为 d28=0.88,故将 G2 第三步,在第二步所得到的77 之间的距离,可得到 与 G12G6,G10,G11 G3,即 G12=G2,G8。分别计算 G1,一类,记为 G12 阶距离矩阵: 一个新的 66 归G11 与 阶距离矩阵中,非对角元素中最小者为 d6,11=1.07,故将G666第四步,在第三步中所得的 G13

9、与G12。计算) G1,G3,G10,G6G11G13= 并为一类,记为G13,即 G6,=,(G5G7 阶距离矩阵:55 之间的距离,可得到一个新的 G10 与,10=1.20,故将 G3 第五步,在第四步中所得的 55阶距离矩阵中,非对角线元素中最小者为 d3 )式计算3.3.10)。再按照公式(G9=G3,(G4,G14归并为一类,记为 ,即 G14=G3,G10 阶距离矩阵:44 G14 之间的距离,可得一个新的 G13G1,G12, 与 与 G12 ,故将14=1.29,d12 阶距离矩阵中,非对角线元素中最小者为 44 第六步,在第五步所得到的 。再按照)(G3,G4,G9G14=

10、(G2,G8),(G14 归并为一类,记为 G15,即 G15=G12, 阶距离矩阵: 33 G15 之间的距离,可得一个新的G13公式(3.3.10)式计算 G1, 与 归 G15,故将 G1 与15=1.32第七步,在第六步所得的 33 阶距离矩阵中,非对角线元素中最小者为 d1, 。再按照)G4(,G1G16并为一类,记为 ,即 G16=G1,G15=(,(G2G8),G3,(,G9 阶距离矩阵:22 G16 之间的距离,可得一个新的 G13公式(3.3.10)式计算 与 归并为一类。此时,所有分类对象均被归并为一类。 与 G16第八步,将 G13 (点击展开显示)综合上述聚类过程,可以

11、作出最短距离聚类谱系图。 最远距离聚类法 5. 最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离采用的公式不同。 最远距离聚类法的计算公式: (点击打开新窗口,显示该例)举例说明 系统聚类法计算类之间距离的统一公式 6. 。最短距) 3.4.4 最短距离聚类法具有空间压缩性,而最远距离聚类法具有空间扩张性(图 离为,最远距离为。 =dd=dd ap2ABABa1b1 最短距离聚类法和最远距离聚类法关于类之间的距离计算可以用统一的式子表示: 时,就是最远距离聚类法计 时,就是最短距离聚类法计算类间距离的公式;当 =1/2 当 =-1/2 算类间距离的公式。 系统聚类的方法还有: 。

12、)3.3.4 表示了八种不同系统聚类方法计算类间距离的统一表达式(见表 系统聚类分析实例 7. 个省级区域第三产业综合发展水平进行31 作为系统聚类分析方法的应用实例,下面对中国大陆 类型划分及差异性程度分析。 聚类指标选择1) 项指标作为对中国第三产业综合发展水平进行聚类分析的基础指标: 选取如下7 ,反映经济社会发展的总体状况和一般水平;GDP人均 y1 人均第三产业增加值,反映人均服务产品占有量或服务密度; y2 第二产业增加值比重,反映工业化水平和产业结构现代化程度; y3 第三产业增加值比重,反映第三产业的发展程度及其对国民经济的贡献;y4 第三产业从业人员比重,反映第三产业对劳动力

13、的吸纳能力; y5 第三产业固定资产投资比重,反映第三产业的资金投入程度; y6 城市化水平,反映农村人口转化为城市人口的程度及对服务的需求量。y7 聚类计算2) 7年度的数据)为数据来源,运用上述 (1998 1999以 年国家统计局出版的中国统计年鉴 进行聚类分析计算,计 SPSS10.0 表 3.4.5)(点击显示该表),借助于统计分析软件包(项指标 算过程如下: 项指标的原始数据进行处理。 7 用标准差标准化方法对 个省(市、区)之间的样本间距离。31 采用欧氏距离测度 选用组平均法计算类间的距离,并对样本进行归类。 (点击在新窗口中显示该图) 。3.4.5 经过上述聚类计算步骤,得到

14、的聚类结果见图 一、模糊聚类分析基本原理 聚类分析是根据样本代表性指标在性质上的亲疏程度进行分类。因此, 我们可以把模糊聚类分析的步骤分解如下: 1 确定样本统计指标与数据标准化 对样本进行分类的效果如何,关键在于要把统计指标选择合理。也就 是统计指标应该有明确的实际意义,有较强的分辨力和代表性,即要有一 定的普遍意义。 数据标准化就是把各个代表统计指标的数据标准化,以便于分析和比 较,这一步也称为数据正规化。方法是: xS 式中 为原始数据的平均值,为原始数据的标准 为原始数据, 为标准化数据。差, 若要把标准化数据压缩到 0 , 1 闭区间,可用极值标准化公式: x max 原始数据组中的

15、最大者; x min 原始数据组中的最小者。 xx max 时, 1 当 ; xx min 时, 0 。 2 标定距离,建立相似关系矩阵 r ij ( i 1 距离是衡量分类对象间相似程度的统计量,用 , 2, nnnr ij ,2,1j; ; 为样本的个数)表示。利用 从 而确定相似关系矩阵 标定距离的方法有很多,下面只列举几种常用的计算方法: 欧氏距离 xikxj 表示第 个样本的第 其中, ik 表示第个指标的观察值,jk krij 个样本与第ij 个样本的第表示第个指标的观察值, 个样本之 rij 越小,则第个样本之间的性质就间的亲疏程度。 个样本与第 ij 越接近。性质接近的样本就可以划归为一类。 绝对减数法 crij 1其中应适当选取,使得 0 。 3 进行聚类 在确定了样本之间的距离后,就可以对样本进行归类,归类的方法很 n 多,其中用得最广泛的是系统聚类法。它首先把个样本每个自成一类, 然后每次将具有最小距离的两类合并成一类,合并后又再重新计算类与类 之间的距离,直至所有样品归为一类为止。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1