多元统计实验模板.docx-资源下载

多元统计实验模板.docx

1、多元统计实验模板学生实验报告学生实验报告学生姓名学号同组人实验项目必修选修演示性实验验证性实验操作性实验综合性实验实验地点G403实验仪器台号指导教师徐海云实验日期及节次一、实验目的及要求：1、目的本实验将综合利用所学的统计知识，搜集相关数据，然后将数据进行输入，并选用本课程所学的适当方法进行分析，写出分析结果。实验中的统计方法要采用本课程所学描述性统计、因子分析，多元回归分析等统计方法，并写出软件分析步骤及相应的结果。2、内容及要求掌握SPSS的基本概念，熟悉SPSS分析的基本程序和基本方法1、学习SPSS相关程序，熟悉相关操作2、了解SPSS的基本分析步骤，分析思路，判

2、定方法，建立模型的方法3、提交实验报告二、仪器用具：仪器名称规格/型号数量备注计算机1有网络环境多媒体会计模拟实验室系统1三、实验方法与步骤:1因子分析的目的利用因子分析的基本目的是，用少数几个因子去描述许多指标或多个因素之间的联系，即将相互之间的关系比较密切的几个变量归在同一类别之中，每一类变量就成为一个因子。因子分析以较少的几个因子反映原资料的大部分信息。 2、分析步骤1）依次单击Analyze Data Reduction Factor，打开Factor Analysis对话框。打开数据文件:数据.sav，单击Analyze Data Reduction Factor，打开Factor

3、Analysis对话框。2）将因子分析变量人身保险收入，GDP，年进口额和利率选入Variables栏内。3）单击“Descriptives”按钮，打开Descriptives对话框，选择Initial solution复选项。4）单击“Extraction”按钮打开Extraction对话框，选择Principal components复选项。5) 单击“Rotation”按钮，打开Rotation 对话框，选择Varimax复选项。6）单击“Scores”按钮，打开Factor Scores 对话框，选择Regression复选项。单击OK，进行分析。（2）判别分析1）操作步骤：Analy

4、ze-Classify-Discriminant2）打开Discriminant Analysis对话框，将对话框左侧变量列表中的Group选入Grouping Variable框，并点击Define Range钮，在弹出的Discriminant Analysis:Define Range对话框中，定义判别原始数据的类别区间，输入Min=1,Max=3，点击Continue钮返回Discriminant Analysis对话框。3）点击Statistics钮，弹出Discriminant Analysis:Statistics对话框，在Descriptive栏中选means项，要求对各组的各

5、变量做均值与标准差的描述；在Function Coefficients栏中选相应的方法，要求显示费谢尔判别法建立的非标准化系数。之后，点击continue返回。点击Save钮，弹出对话框中，选Predicted group membership 项要求将回判的结果存入原始数据库中，其他项目不变，点击OK即可完成分析。四、实验结果与数据处理：1. 在一项研究广东省部分地市的经济发展水平的课题中，选定了城镇人口比例、平均工资、固定资产投资额、通信服务居民消费、港口货物吞吐量、外商投资额、货运周转量、工业企业总资产贡献率、出口总额、第三产业产值比重、环境治理系数、每万人医务人员数、研究与试验发展经费

6、、人均GDP增长率、地区生产总值等15个指标构成指标体系。具体数据见广东省各地经济发展主要指标.xls。要求：（1）取显著性水平为0.05，假定16个地市被划分为4个区域，按顺序每4个市为一个区域，试检验不同区域间均值向量是否相等（请附上相关输出表格）。（2）对16个地区按经济发展水平进行系统聚类分析，请输出组间平均链接法及重心法的聚类分析结果（请附上凝聚顺序表、树状图）；（3）上述两种方法聚类结果相同吗？如不同，你更愿意接受哪一种结果？为什么？（比如你认为应该分几类，并对每一类的特征进行必要的描述，并附上各组成员列表）。答案：（1）首先将这16个地区按顺序分成四个组，然后进行两独立样本均

7、值检验，即可以检验不同区域间的均值是否相等，检验结果如下：多变量检验c效应值F假设 df误差 dfSig.截距Pillai 的跟踪1.000225189.098a12.0001.000.002Wilks 的 Lambda.000225189.098a12.0001.000.002Hotelling 的跟踪2702269.171225189.098a12.0001.000.002Roy 的最大根2702269.171225189.098a12.0001.000.002序列号Pillai 的跟踪2.6902.17236.0009.000.109Wilks 的 Lambda.00010.96136.

8、0003.682.020Hotelling 的跟踪.36.000.Roy 的最大根12344.1203086.030b12.0003.000.000a. 精确统计量b. 该统计量是 F 的上限，它产生了一个关于显著性级别的下限。c. 设计 : 截距 + 序列号结论：根据上述检验可以得出，不同地区均值向量存在显著差异。（2）1）组间平均链接法的聚类分析结果图1 组间平均链接法的凝聚顺序表图2 组间平均联结法的树状图2）重心法的聚类分析结果图3 重心法的凝聚顺序表图4 重心法的树状图（3）从（2）我们可以看出，利用组间平均链接法及重心法的聚类结果相同。如果不同，我更愿意选择组间平均链接法。因为重心

9、法虽然有很好的代表性，但并未充分利用各样本的信息。建议将两类之间的距离平方定义为这两类元素两两之间的平均平方距离，这就是类平均法。类平均法是聚类效果较好、应用比较广泛的一种聚类方法。从上述聚类冰状图中可以看出，如果分三类，那么可以得到如下分类结果：【1、广州、深圳】【2、惠州、江门、茂名、中山、珠海、汕头、湛江、河源、汕尾、梅州、阳江、韶关】【3、佛山和东莞】。对于以上结果，我们可以从地区经济发展水平层次上来理解所做的分类。第一类广州和深圳是经济最先发展的地区，众所周知，这两个城市在广东经济发展水平处于领先地位；而第二类城市在广东省内比较经济发展水平和城市对外的经济联系程度相对要差一下，这可能

10、是和地理位置有着关系；第三类是广东省除广州深圳以外经济比较突出的城市。佛山比较突出的是小家电，而东莞是全国有名的工厂聚集的地方，故这两个城市为一类。2. 为研究某地区育龄妇女的生育状况，指标及原始数据见育龄妇女生育状况.xls。将12个已知样品分为两类，试对待判样品进行归类。要求：（1）描述进行判别分析应满足的基本条件。（2）请写出费雪判别和贝叶斯判别的线性判别函数（请附上相关输出表格）。（3）运用费雪判别准则进行原12个样品的回判，回判的效果如何？请说明（请附上相关输出表格）。（4）请说明待判样品的归类（请附上相关输出表格）。答：（1）判别分析是用来解决被解释变量是非度量变量的情形的。

11、判别分析的基本条件如下：1）分组类型在两组以上；在第一阶段工作时每组案列的模型必须至少在一个以上；2）每一个判别变量不能是其他判别变量的线性组合；3）各组变量的协方差矩阵相等；4）各判别变量之间具有多元正态分布，即每个变量对于所有其他变量的固定值有正态分布。（2）费雪判别的线性判别函数：判别式函数系数函数1峰值年龄-1.001一胎生育率.234二胎生育率.127总和生育率2.379(常量)3.666非标准化系数Y=3.666-1.001*峰值年龄+0.234*一胎生育率+0.127*二胎生育率+2.379*总和生育率贝叶斯判别的线性判别函数：分类函数系数组别112峰值年龄77.7958

12、1.269一胎生育率5.8475.036二胎生育率10.61910.178总和生育率94.66686.410(常量)-1394.641-1407.364Fisher 的线性判别式函数Y1这一组的分类函数是：Y1=-1394.641+77.795*峰值年龄+5.847*一胎生育率 +10.619*二胎生育率 +94.666*总和生育率 Y2这一组的分类函数是：Y2=-1407.364+81.269*峰值年龄 +5.036*一胎生育率 +10.178*二胎生育率 +86.410*总和生育率（3）运用费雪判别准则进行原12个样品的回判，回判的效果：分类结果b,c组别1预测组成员合计12初始计数160

13、62066未分组的案例213%1100.0.0100.02.0100.0100.0未分组的案例66.733.3100.0交叉验证a计数16062156%1100.0.0100.0216.783.3100.0a. 仅对分析中的案例进行交叉验证。在交叉验证中，每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。b. 已对初始分组案例中的 100.0% 个进行了正确分类。c. 已对交叉验证分组案例中的 91.7% 个进行了正确分类。结论：由上表可以看出，通过判别函数预测，全部12个观测是分类正确的，y=1和y=2两组分别有6个观测，全部被判对。所以，由100%的原始观测被判对。在交叉验证

14、中，y=1组6个观测全部被判对，y=2组6个观测中有5个被判对，从而交叉验证有11/12=91.7%的原始观测被判对。故不存在误判，即回判效果很好。（4）按照案例顺序的统计量案例数目最高组第二最高组判别式得分P(Dd | G=g)实际组预测组pdfP(G=g | D=d)到质心的平方 Mahalanobis 距离组P(G=g | D=d)到质心的平方 Mahalanobis 距离函数 113未分组的1.33011.000.9502.00019.7592.71014未分组的2.7531.999.0991.00114.328-2.05015未分组的1.54411.000.3682.00016.6242.342结论：序号13和15被归为第一类，序号14被归为第二类。3. 某课题组欲对我国省会城市的发展状况进行综合

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？