ImageVerifierCode 换一换
格式:DOCX , 页数:16 ,大小:34.22KB ,
资源ID:2316472      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2316472.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(聚类分析及判别分析实验报告范例.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

聚类分析及判别分析实验报告范例.docx

1、聚类分析及判别分析实验报告范例上海电力学院应用多兀统计分析判别分析与聚类分析学院: 姓名: 学号: 2016年4月我国部分城市经济发展水平的聚类分析和判别分析摘要:本文基于中国统计年鉴(2012年版)统计数据,寻找评价城市经济 发展水平的指标,包括第二三产业发展水平、固定投资额、社会消费零售总额和 进出口贸易交流五个指标,利用统计软件 SPSS综合考虑各指标,对所选城市进 行K-Means聚类分析,利用Fisher线性判别待判城市类型,进一步验证所建模 型的有效性。关键字:聚类分析,判别分析,SPSS城市经济发展水平1,引言经过改革开放后三十多年的长足进展,中国城市化已步入中期阶段,步伐加 快

2、,质量显著提高。同时,中国城市化又处于期转折点上,上一期行将结束,下 一期将要开始。2011年中国城市化率首次突破50 %,意味着中国城镇人口首次 超过农村人口,中国城市化进入关键发展阶段,这必将引起深刻的社会变革。根据2011年4月公布的第六次人口普查数据,2010年中国居住城镇的人口 接近6.6亿人,城镇化率达到49.68%,全国已有近一半的人口居住在城镇,这 意味着中国将进入城镇时代。在过去 30多年中,中国的城市化发展取得了很大 成绩。然而,总体上中国的城市化道路是城市化滞后于工业化的非均衡道路; 是土地城市化快于人口城市化的非规整道路; 是以抑制农村、农业、农民的经济利益来支持城市发

3、展,导致不能兼顾效率和公平的非协调道路; 是片面追求城市发展的数量和规模,而以生态环境损失为代价的非持续道路; 是以生产要素的高投 入,而不是投入少、产值高、依靠科技拉动经济增长的非集约道路。传统的城市 化存在着诸多弊端,中国未来的城市化必须走出一条具有自身特色的新型城市化道路。具体而言,中国城市经济发展水平受限于地理、环境、资源以及政策等因素的影响,我国不同区域的城市化进程尚存在很大差异。 2012年中国城市发展报告中指出,从区域角度看,目前沿海一带城市发展起步早,与国际贸易交流往来频率咼,经济发展水平较咼,西部地区受到政策的大力扶持,r 1- f, 、r 1-|* 、 1-|* r r、

4、、/ / 、 八、 )r ,- k , 、十 、,_ “、 、 r r r i -表现出了强劲的增、 r 、宀 r rr - r、一门、ir的水平已经落到了最后。显然,通过研究不同城市的经济发展状况和经济类型,指出其发展差异所在,可以为政府在出台相关政策来平衡区域经济发展, 缩小不 同地区人民生活水平的差异提供一定的指导意见,也为我们深刻理解相关政策提 供了扎实的基础。2,相关统计基础理论2.1,聚类分析聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类 的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。 从统计学的 观点看,聚类分析是通过数据建模简化数据的一种法。传统

5、的统计聚类分析法包 括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模 糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到多著名的统 计分析软件包中,如SPSS SAS等。本文使用统计软件SPSS对所收集的数据进行快速聚类,其特点是:在确定 类别数量基础上,先给定一个粗糙的初始分类,然后按照某种原则进行反复修改, 直至分类较为合理。在选定类中心作为凝聚点的基础上进行分类和修正的法有很 多,本文使用的是K-Means算法。K-Means算法接受输入量k ;然后将n个数据对象划分为k个聚类以便使 得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相

6、似 度较小。聚类相似度是利用各聚类中对象的均值所获得一个 “中心对象”(引力 中心)来进行计算的。K-Means算法的工作过程说明如下:首先从n个数据对象任意选择 k个对 象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相 似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值) ;不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均差作为标准测度函数。一 般而言,k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可 能的分开。2.2,判别分析判别分析是市场研究的重要分析技术,也是多变

7、量分析技术。它可以就一定 数量的个体的一个分类变量和相应的其它多元变量的已知信息, 确定分类变量与其它多元变量之间的数量关系,建立判别函数,并利用判别函数构建 Biplot二元判别图(概念图)。同时,利用这一数量关系对其他已知多元变量的信息、但 未知分组的子类型的个体进行判别分组。 判别分析属于监督类分析法,例如:市 场细分研究中,常涉及判别个体所属类型的问题,也常涉及不同品牌在一组产品 属性之间的消费者偏好和认知概念,判别分析可以很好地对这种差异进行鉴别。 并在低维度空间表现这种差异。判别分析主要有距离判别、贝叶斯(Bayes)判别、费舍尔(Fisher)判别等 几种常用法。距离判别的基本原

8、理是:首先对样本到总体 G之间的距离进行合理规定,然后依照“就近”原则判定样本的归属,常用马氏距离(Mahalanobis )规定为: d2(x, G) (x u) 1(x u)式中 为p元总体G的协差阵,x是取自G的样品,则该式即为样品x到 总体G的马氏距离。贝叶斯判别既考虑了先验分布产生的影响,也考虑到误判损失产生的影响, 是衡量一个判别优劣的比较合理的准则。费舍尔判别的基本思想与主成分分析十分相似, 当总体是高维向量时,先把其综合成一个一维变量,然后在对一维变量进行距离判别,费舍尔判别实际上是 一种降维处理,降维压缩后,样品y到各个总体Gj*的距离可以用欧式距离度量, 即:m2 * *

9、2 2d (y,G j ) |y Uj II (aix a,Uj)i 1由此导出Fisher判别规则为:d (y,G j ) minkd (y,G j ),则 x Gi1 j k本文及使用Fisher判别建立线性判别函数进行距离判别。3,模型建立3.1设置变量本文综合考虑了评价城市发展指数衡量因素,选取衡量一个城市经济发展水 平的主要因素,城市化进程总是伴随着工业化发展,发达的服务业水平是衡量现 代新兴城市的主要指标,此外,综合考虑了固定资产投资总额与社会消费品零售 总额以及货物进出口总额作为类别分析的主要经济指标:X1:城市第二产业产值(亿元)X2 :城市第三产业产值(亿元)X3 :城市固定

10、资产投资总额(亿元)X4 :城市社会消费品零售总额(亿元)X5 :货物进出口总额(亿元)从区域发展角度从上面5个经济指标将城市经济发展水平划分为三大类:G1 :发达城市G2:中度发达城市G3 :欠发达城市3.2数据收集和整理本文所有数据来源于中国统计年鉴(2012),选取2011年度36个城市 主要经济发展水平做模型建立及分析。其中前 32个城市相关经济指标水平作为 初始样本用于划分类别,建立类别总体 G;最后四个城市(、)及其相关经济 发展水平用作待判样品,利用判别函数进行判别分析。所有相关数据经过量纲统 一规则化处理见表1所示。表1我国部分城市相关经济发展水平( 2011年)第二产业第三产

11、业固定资产投资社会消费品零售货物进出口总丿丁号城市(亿元)(亿元)总额(亿元)总额(亿元)额(亿元)1北 京3752.512363.25851.52016900.324623374.98842天 津5928.35219.27483.69733395.066203.46423家庄2031.91635.83026.97781662.9864850.11124太 原949.21097.11024.1444973.2937513.63065呼和浩特790.01277.81031.6781890.0478121.47366阳3026.92609.84577.0942426.8655637.2157大 连

12、3204.22550.74580.05851924.7943630.58748长 春2092.71620.22356.61891515.85371040.93229哈尔滨1647.22147.83011.9712070.4129307.054810上 海7927.911142.95064.26246814.826246.15111南 京2760.83220.43757.25172697.09973440.635812宁 波3349.52454.52385.50722018.86175891.209213合 肥2002.21426.23376.96521111.11881207.71914福 州

13、1711.21700.12720.28271947.81022083.485615厦 门1297.11217.51128.0872800.27794210.000216南 昌1579.3974.72022.3297928.3438473.022617济 南1829.02339.51934.33892114.2868624.12318青 岛3150.73158.53502.53822302.37034329.130219州2874.21974.03002.51987.1147959.735420武 汉3254.03309.54255.16213031.78851367.374821长 沙3151

14、.72224.33510.24252201.6112449.360422广 州4577.07641.93412.252436970.2623深 圳5343.36155.72136.38823520.873624845.98224海 口177.9487.7395.0408387.1804236.175625重 庆5543.03623.87579.44543487.8071753.071626成 都3143.83383.44944.01572861.28352274.379827贵 阳586.8733.71600.5898584.3292392.979628拉 萨75.2137.2220.5031102.594878.445229西 安1697.21993.93352.121965.9774754.7430兰 州656.5663.5950.5758639.7231112.765831西 宁411.3332.0528.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1