ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:120.06KB ,
资源ID:8955664      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8955664.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(聚类分析步骤.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

聚类分析步骤.docx

1、聚类分析步骤聚类分析步骤以教材第五章习题8的数据为例,演示并说明聚类分析的详细步骤:原始数据的输入:丈件(D 霸甸口 锻国(蜀 散惭直I 转快(D 分折(幻 圈解 密坏賤序史 Mt加内容(Q) SUM 帮肋S暗事?* S?鮒*ffl ft韶亟蔚粤箱专21 ;衣甫地区食品农看燃料住房交適和通讯娱乐朝育文化1北京190 3343779 7350.5449,019.042135 2035.4010.47U.1B36 433.943河北95.2122839.3022.4422 812.604山西1047625116.409.8916.U3 255内蒙占123.4127.638.9412.5323.99

2、2.276辽宁145,5832.B317 7927.293S.093.477吉林159.37333810.3711.8125.295.228黒挖江116.2223.5713.24137621.75阿日上海221.1133.5412.53115.6560.825.89W江苏114.9829.1211 6742.6027.3057411浙江)69,92327512.7247.1234.355.002安渤135,1123.0915.G223 5A16.206.3913福建144.9221.2B16.9619.6221756.3714U0.6421.6017.6J19.1915刃4.9J15山东115

3、.843EJ2612.2033.6033773.E516河南101;:18232G8.4620.2020.504.3011.选项操作:1.打开SPSS的“分析”-“分类”-“系统聚类”,打开“系统聚类”对话框。把“食品”、“衣着”等6变量输入待分析变 量框;把“地区”输入“标注个案”;“分群”选中“个案”;“输出”选中“统计 量”和“图”。(如下图)密 Ife鸟駝臭* I必炮区H-qI 1E曲前 输出v熨计養 y岡相关说明:(1)系统聚类法是最常用的方法,其他的方法较少使用。(2)“标注个案”里输入“地区”,在输出结果的距离方阵和聚类树状图里会 显示出“北京”、“天津”等,否则SPSS自动用“

4、 1”、“2”等代替。(3) “分群”选中“个案”,也就是对北京等16个样本进行分类,而不是对食 品等6个变量分类。(4)必须选中“输出”中的“统计量”和“图”。在该例中会输出16个地区的 欧氏距离方阵和聚类树状图。2.设置分析的统计量打开最右上角的“统计量”对话框,选中“合并进程表”和“相似性矩阵” “聚类成员”选中“无”。然后点击“继续”。打开第二个“绘制”对话框,必须选中“树状图”,其他的默认即可打开第三个对话框“方法”:聚类方法选中“最邻近元素”;“度量标准”选中“区间”的“欧氏距离”;“转换值”选中“标准化”的“ Z得分”,并且是“按照变量”。度量祈准+区町(LD:Euclidean

5、 肚屈7 T计徹D;卡方度豪二鼻細?TEuclicteeri转换佰标醸他:e洛 、n按片薇转换度晁国康苻脊on亶丽柝.度到01金曲日在已|i |祁祎粧也:|g |打开第四个对话框“保存”,“聚类成员”选默认的“无”即可 三分析结果的解读:按照SPSS俞出结果的先后顺序逐个介绍:1.欧氏距离矩阵:是16个地区两两之间欧氏距离大小的方阵, 该方阵是应用各 种聚类方法进行聚类的基础。Proximity MatrixCaseEuclidean Distance1:北京2:天津3:河北4:山西:i: 内蒙古6:辽宁7:吉林8:黑龙江9:上海10:江苏11:浙江12:安徽13:福建14:江西15:山东16

6、:河南1:北京.0003.8396.2896.2235.8314.7344.6914.7933.1314.3003.4045.2515.3395.9814.6815.8212:天津3.839.0002.9113.1082.3902.1902.8922.5814.1531.8811.4733.4003.6313.7011.2802.8883:河北6.2892.911.0001.1341.3243.4933.7892.5156.5442.3283.4202.9923.3042.9791.961.9604:山西6.2233.1081.134.0001.3184.0514.0402.6066.8032

7、.6203.6383.2763.6653.4202.482.9895:内蒙古5.8312.3901.3241.318.0003.0503.3262.5586.0922.5132.8913.1783.4323.0911.8401.6526:辽宁4.7342.1903.4934.0513.050.0001.8002.7644.7002.6771.9843.0602.9552.9021.8813.6627:吉林4.6912.8923.7894.0403.3261.800.0002.0525.2472.6192.2152.1462.0882.1102.5653.6068:黑龙江4.7932.5812.

8、5152.6062.5582.7642.052.0005.7971.2902.4701.4061.8432.0411.8871.9729:上海3.1314.1536.5446.8036.0924.7005.2475.797.0004.9363.5195.8345.8266.1914.9866.40210:江苏4.3001.8812.3282.6202.5132.6772.6191.2904.936.0001.9171.9222.3212.5671.3301.88011:浙江3.4041.4733.4203.6382.8911.9842.2152.4703.5191.917.0002.7432.

9、8263.0711.8573.22112:安徽5.2513.4002.9923.2763.1783.0602.1461.4065.8341.9222.743.000.6501.0862.6132.50813:福建5.3393.6313.3043.6653.4322.9552.0881.8435.8262.3212.826.650.0001.0252.8242.91314:江西5.9813.7012.9793.4203.0912.9022.1102.0416.1912.5673.0711.0861.025.0002.8052.79815:山东4.6811.2801.9612.4821.8401.

10、8812.5651.8874.9861.3301.8572.6132.8242.805.0002.04116:河南5.8212.888.960.9891.6523.6623.6061.9726.4021.8803.2212.5082.9132.7982.041.000This is a dissimilarity matrix2.合并进程表:主要看前四列,现在以前三个步骤为例说明合并过程:第一步,样本 12和样本13合并,此时系数为0.650;第二步,样本3和样本16合并,此时系数为 0.960;第三步,样本3 (实际上是第二步样本3和16组成的新类)和样本4合 并,此时系数为0.989;以此

11、类推。Agglomeration ScheduleStageCluster CombinedCoefficientsStage Cluster First AppearsNext StageCluster 1Cluster 2Cluster 1Cluster 211213.6500042316.96000u3334.989207412141.02510c w52151.28000868101.2900087351.31830128281.33056c w92121.406841C102111.473901211671.800001312231.8401071313261.88112111514

12、193.131001515123.404141303.冰柱:左侧是分组数目,上侧是被分组的样本,样本之间由等距的间隔分开,间隔 被填充的,说明相邻两样本合并为一组,没有被填充就不被合并。按照此规则, 首先从下往上看,当分为15类时,只有样本13和12合并了,其余的各自是一 类;当分为 10 类时,从左到右依次是(7),(6),(5),(4,16, 3),(11),(14, 13, 12),(10, 8),(15, 2),(9),(1);其他的分组数目时以此类推。(该冰柱的分组数目有2.5、7.5、 12.5等含有半组的情况,不需要掌握。)s*sn-u苫4.树状图:Dendrogram+ ;+=

13、 + + +:*=(! + * + * + + p|f + HIERARCHTCAL C L U S rD&tidiogram using Single LinkageRescaled Distance Clusher ComtuneLabel Hum. 4 安徽 12 +福律 13 -+ 十江西 14 +天津 2 4+ |L1J 东 15 T | -J +慝龙江 6 +丨 I江苏 to + i I浙江 Li 十河北 3 亠+ I |河南 16 + H + | +- b山西 4 + H 十I I内蔬古 5 + I I辽宁 6 14 |吉林 7 + |北京 1 +_ g 卜这是分类结果最后的树状

14、图,把整个分类情况一目了然地呈现出来了。 最上 面的是标尺,数字0-25是大致按照距离比例重新标定的数值,不影响对分类结 果的观察与结论。解读此图的方法是:每个样本的右侧都是虚线,虚线的端点处 是“ +”,说明该样本在此和另一个样本或者组(它也有上下相对齐的“ +”)合并为一类。女口:安徽和福建在对应标尺1附近时合并为一类,之后与江西在标尺 数值4附近合并为一类。天津、山东、黑龙江、江苏四个样本的“ +”看起来好像是统一对齐的,其实不是,实际情况是:天津和山东在 1.280 (欧氏距离)处对齐,黑龙江和江苏在1.290 (欧氏距离)处对齐。总说明:1.聚类分析从数学上讲不是很严谨,所以采用不同

15、的统计量和采取不同的聚类 方法,聚类结果可能有较大的差异。但是只要整个分析过程没有错误就是完 整正确的,聚类结果都是认可的。(本例中,原始数据首先进行标准差标准化, 再求欧氏距离方阵,聚类方法采取的是最短距离法。)2.聚类分析的最终结果自然是分类,除了 SPSS输出的树状图,最好自己再做出Word格式的分类表,具体分为几类,自己看情况而定。譬如该例子就可 以分为4类或5类。3.聚类分析只是分类,并不能进行评判(如发展水平高低等),如要评判各样本 应结合主成分分析、因子分析等方法共同进行。其分类结果也不一定按照聚 类分析的结果为准,可以结合主成分分析、因子分析的结果进行修正。最短距离法具体计算方

16、法及步骤在系统聚类法中,最短距离法应用比较广泛。计算过程一般是首先对原始数 据进行标准化处理,再计算初始欧氏距离矩阵,然后应用最短距离法聚类。假设有6个样本的初始欧氏距离矩阵如下:G1G2G3G4G5G600.3750D(o)= 0.4830.77601.7491.5961.92601.5161.3361.6620.50101.9721.7432.1540.6930.5890(系统聚类法在聚类之前把每个样本看成一组,用 G1, G2,.代替。在该矩阵 中,第i行和第i列都代表第i组,在左侧括号的外面应该自上到下依次是 G1, G2,,G6,因为word中不好输入,所以省略了。)在初始距离系数矩

17、阵的基础上,用最短距离法分类的具体步骤是:1.在初始距离系数矩阵 D中,选出距离数值最小者,即 di2=0.375,把第 一类G1和第二类G2合并为一个新类G7,记为G7=G1,G2。再利用最短距 离法计算新类G7与其他各类G3, G4, G5, G6的距离,得d73=mind i3,d23=min0.483, 0.776=0.483d74=mind i4,d24=min1.749, 1.596=1.596d75=mi nd 15,d25=mi n1.516, 1.336=1.336d76=mi nd 16,d26=mi n1.972, 1.743=1.743形成距离系数矩阵DG7G3G4G5

18、G600.4830D(1)1.5961.92601.3361.6620.50101.7432.1540.6930.58902.在矩阵D(1)中,选出距离数值最小者,即d73=0.483,这时G7和G3合并 为一个新类G8,记为G8=G7 , G3。再利用最短距离法计算新类 G8与其他各 类G4, G5, G6的距离,得D84=mi nd 34,d74=mi n1.926, 1.596=1.596D85=mi nd 35,d75=mi n1.662, 1.336=1.336D86=mi nd 36,d76=mi n2.154, 1.743=1.743形成距离系数矩阵D。G8G4G5G60 1.5

19、96D( 201.3360.50101.7430.6930.58903.在矩阵D中,选出距离数值最小者,即d45=0.501,这时G4和G5合并 为一个新类G9,记为G9=G4 , G5。再利用最短距离法计算新类 G9与其他各 类G8, G6的距离,得D98=mi nd 48,d58=mi n1.596, 1.336=1.336D96=mind 46,d56=min0.693, 0.589=0.589 形成距离系数矩阵D(3)。G8 G9 G60D 1.336 01.743 0.589 04.在矩阵D中,选出距离数值最小者,即d69=0.589,这时G6和G9合并 为一个新类G10,记为G10=G6,G9。再利用最短距离法计算新类 G10与G8 的距离,得Di0,8=mi nd 68,d98=mi n1.743, 1.336=1.336形成距离系数矩阵D。G8 G10D01.336 0由矩阵D可以看出,G8和G10在距离系数为1.336时合并成一类G11类。记 为G11=G8,G10,至此聚类完毕。最后绘出分类谱系图(草图):(左侧竖线是距离标尺,每格数值 0.2,因不好标注,所以未标出。谱系图 中的短横线自下而上依次表示 G7,G8,G9,G10,G11聚类时的数值,也应该 标出。)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1