ImageVerifierCode 换一换
格式:DOCX , 页数:28 ,大小:170.77KB ,
资源ID:20430851      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/20430851.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多元统计分析案例具体操作Word文件下载.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多元统计分析案例具体操作Word文件下载.docx

1、RR 方调整 R 方标准 估计的误差Durbin-Watson.689a.475.3693.846481.858a. 预测变量: (常量), FeO含量X2, 出钢量X1。b. 因变量: 效率YAnovab平方和df均方FSig.回归133.59866.7994.515.040a残差147.95414.795总计281.552系数a非标准化系数标准系数B标准 误差试用版t(常量)75.1449.4887.920.000.215.075.6852.889.016-.843.548-.365-1.538.155a. 因变量:相关性零阶偏部分-.189-.437-.352.592.675.662残差

2、统计量a极小值极大值均值标准 偏差N预测值74.841188.015683.14623.33664-5.627217.05607.000003.51134标准 预测值-2.4891.4591.000标准 残差-1.4631.834.913(3)结果分析回归方程的回归系数:b0=75.144,b1=0.215,b2=-0.843拟合回归方程:Y=0.215*X1-0.843*X2+75.1441)回归方程的显著性检验(F检验):检验假设:,不全为0,SS总=SS回+SS残,其中FF(m,n-m-1) 根据方差分析表(Anova),MS回=66.799,MS残=14.759,从而F=4.515,F

3、F0.05(2,10)(Sigt0.05/2(10),拒绝原假设,说明在给定的显著水平0.05下,X1对Y有显著的影响;对于b2,t2=-1.538,t0.05/2(10)|t2| t0.1/2(10),说明在给定的显著水平0.05下,接受原假设,X2对Y没有显著的影响。而在给定的显著水平0.1下,拒绝原假设,X2对Y有显著的影响。说明X1对方程的贡献显著,X2的贡献不显著。B、偏回归平方和检验回归方程中某一自变量Xj的偏回归平方和表示模型中含有其他m-1个自变量的条件下自变量对Y的回归贡献,相当于从回归方程中提出Xj后所引起的回归平方和的减少量,或在m-1个自变量的基础上新增加Xj引起的回归

4、平方和的增加量。表示偏回归平方和,其值愈大说明相应的自变量愈重要。一般情况下,m-1个自变量对Y的回归平方和由重新建立的新方程得到,而不是简单地把从有m个自变量的方程中剔出后算得。98.6225.930.033a182.93016.630 (常量), 出钢量X1。10.078.408.536a271.47424.679 (常量), FeO含量X2。SS回(X1)=SS回(X1,X2)-SS回(X2)=133.598-10.078=123.52SS回(X2)=SS回(X1,X2)-SS回(X1)=133.598-98.622=34.976F1=123.52/(147.954/10)=8.3485

5、,F2=34.976/(147.954/10)=2.335F1F2,同样说明X1对方程的贡献大于X24)标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。标准化回归系数无单位,用来比较各自变量对应变量的影响大小,|Bi|越大,Xi对Y的影响越大。此处,标准回归系数B10.685,B2-0.365 ,|B1|B2|,说明X1对Y的影响要比X2对Y 的影响显著。5)偏相关系数偏相关系数是在排除了其他变量的影响下计算变量间的相关系数。假设我们需要计算X和Y之间的相关性,Z代表其他所有的变量,X和Y的偏相关系数可以认为是X和Z线性回归得到的残差Rx与Y和Z线性回归得到

6、的残差Ry之间的简单相关系数,即pearson相关系数。1,2 0.6752,1-0.437(4)预测值观测值预测值-观测值(预测值-观测值)/观测值*100%82.91490.91491.11573170785.56451.56451.862581.8911.8912.3637583.1684-5.4316-6.13047404180.2388-1.2612-1.54748466387.96294.46295.34479041974.81681.81682.48876712386.416-1.584-1.884.2983-7.1017-7.76991247381.53380.53380.65

7、901234683.58375.58377.15858974486.0251-0.4749-0.54901734181.9249-1.4751-1.768705036二、 聚类分析下表是2003年我国省会城市和计划单列市的主要经济指标:人均GDPX1(元)、人均工业产值X2(元)、客运总量X3(万人)、货运总量X4(万吨)、地方财政预算内收入X5(亿元)、固定资产投资总额X6(亿元)、在岗职工占总人口比例X7(%)、在岗职工人均工资额X8(元)、城乡居民年底储蓄余额X9(亿元)。试通过统计分析软件进行系统聚类分析,并比较何种方法与人们观察到的实际情况较接近。城市X1X2X3X4X5X6X7X8

8、X9 北 京 31886331683052030671593200037.8253126441 天 津 264334373235073467920593418.8186481825 石 家 庄 15134131591184310008494169.5123061044 太 原 15752158312975152483319722.812679660 呼和浩特 1899111257350841552118214116255 沈 阳 232681544666121463655714.8149611423 大 连 2914527615110012108111140714.7175601310 长 春

9、 18630210456999108924629412.513870831 哈 尔 滨 148257561645895187642317.7124511154 上 海 4658677083721263861899227421.0273056055 南 京 2754743853167901480513679415.4221901134 杭 州 3266749823213491681515071711.8246671466 宁 波 3254347904249381379713955510.9236911060 合 肥 106211171460344641362458.313901359 福 州 2

10、228121310968082506737615053876 厦 门 5359093126444130557023838.619024397 南 昌 142219205572844543121011.013913483 济 南 234372263458101435442916027758 青 岛 2470535506146663055312054814.515335908 郑 州 16674140231070978476637312.7135381048 武 汉 2127817083118821661062317.4137301286 长 沙 887310609106316043410.016

11、987705 广 州 48220554042975128859275108925.1288053727 深 圳 19183834751910989679329187569.6310532199 南 宁 817633907016589317013171451 海 口 16442145531328433049916.514819284 重 庆 71905076582903245016211876.5124401897 成 都 17914928972793287989078811.9152741494 贵 阳 11046103501851153184023115.812181345 昆 明 1621

12、51160151261233834214255709 西 安 1314089131141393926544615.9135051211 兰 州 14459171362209558120318.013489468 西 宁 706656052788203710.114629175 银 川 11787110132146212713421.913497193 乌鲁木齐 22508171372188127544118026.116509420利用spss统计软件,其解答过程如下:根据统计所得数据,此处聚类为Q型聚类,即对样本进行聚类分析,聚类方法选择系统聚类法,其基本思想是距离相近的样品(或变量)先聚成

13、类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。在进行系统聚类之前,首先要定义类与类之间的距离,由类间距离定义的不同产生不同的聚类方法:最短距离法、最长距离法、中间距离法、重心法等。此处,主要运用最短距离法、重心法和最长距离法对样本进行聚类。 以下用dij表示样品X(i)和X(j)之间的距离,当样品间的亲疏关系采用相似系数Cij时,令 以下用D(p,q)表示类Gp和Gq之间的距离。(一) 利用Matlab做系统聚类分析,主要运行步骤:将统计数据表格导入到Matlab中,若数据集命名为data,则进行如下运算:X=ZSCORE(data); %标准化数据矩阵Y=p

14、dist(X,metric) %计算数据集X中两两元素的距离,metric表示使用特定的方法,有欧式距离euclid、马氏距离mahal、明可夫斯基距离Minkowski等。D=squareform(Y) %将距离的输出向量形式定格为矩阵形式Z=linkage(Y,method) %创建逐级聚类树,method表示用何种方法,默认值是欧式距离,有complete最长距离法;average类平均距离;centroid重心法等。H,T=dendrogram(Z) %画聚类树形图(二) 不同聚类方法结果分析(1)最短距离法聚类分析类与类间距离定义:Ds(p,q)=mindjk|jGp,kGq,等于G

15、p和Gq中最为邻近的两个样品之间的距离。利用最短距离法所得的Matlab聚类树形图如下图所示:从聚类树形图可直观的看出,当将35个样品分为两类时,深圳(24)单独作为第2类,其他城市属于第1类;当将35个样品分为三类时,深圳(24)单独为第3类,上海(10)单独为第2类,其他城市为第1类。2)重心法聚类分析若样品间采用欧式距离,设某步将Gp和Gq并为Gr,它们各有np、nq和nr样品,其重心用p、q和r表示,显然r=1/nrnpp+nqq,某类Gk的重心为k,它与新类Gr的距离为当将35个样品分为三类时,深圳(24)单独为第3类,北京(1)、上海(10)和广州(23)单独为第2类,其他城市为第

16、1类。结果同重心聚类法相似,这种聚类与人们实际观察到的情况相接近。(3)最远距离聚类法Ds(p,q)=maxdjk|jGp,kGq,等于Gp和Gq中最远的两个样品之间的距离。当将35个样品分为三类时,深圳(24)单独为第3类,北京(1)、上海(10)和广州(23)单独为第2类,其他城市为第1类;当将35个样品分为四类时,深圳(24)单独为第4类,北京(1)、上海(10)和广州(23)单独为第3类,重庆(27)和成都(28)为第2类,其他城市为第1类;这种聚类与人们实际观察到的情况相接近。三、 判别分析银行的贷款部门需要判别每个客户的信用好坏(是否履行还贷责任),以决定是否给予贷款。可以根据贷款

17、申请人的年龄(X1)、受教育程度(X2)、现在所从事工作的年数(X3)、未变更住址的年数(X4)、收入(X5)、负债收入比例(X6)、信用卡债务(X7)、其他债务(X8)等来判别其信用情况,下表是从某银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费希尔判别法建立判别函数和判别规则。(2)某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。目前信用好坏客户序列号已履行还贷任务236.60 0.341.713417598.00 1.812.91424.60 0.9439194813.10 1.934.363

18、55.00 0.40 1.30 未履行还贷任务372415.10 1.80 1.82 297.40 1.46 1.65 327523.30 7.76 9.72 286.40 0.19 1.29 262710.50 2.47 0.36 1、Fisher和Bayes方法在SPSS中的应用判别分析是先根据已知类别的事物的性质(自变量),建立函数式(自变量的线性组合,及判别函数),然后对未知类别的新鲜事物进行判断以将之归入已知类别。主要的判别方法有:距离判别,Fisher判别,贝叶斯判别等。在SPSS系统中,在判别分析使用时应注意以下几条:1、首先要对原始数据进行统计检验:在进行判别分析前,应首先检验

19、各类的均值是不是有差异(因为判别分析要求给定的样本数据必须是差异明显的),如果检验后某两个总体的差异不显著应将两个总体合并为一个总体,再由剩下的互不相同的总体重新建立判别函数。2、两种判别方法对总体的数据的分布要求不同:一般来说,Fisher判别对数据分布没有特殊的要求,Bayes判别要求数据分布是多元正态分布,但在实际操作过程中,要求并不严格。3、SPSS中的Fisher判别函数实为Bayes判别函数:在SPSS中,选中判别分析下的“统计量”中的“函数系数”中的Fisher项,在输出结果的末尾,给出的分类函数系数表下注明的Fisher 的线性判别式函数。但是,经验证实为一般教课书中的Baye

20、s线性判别函数。命名出现不一致的原因是,按判别函数值最大的一组进行归类这种思想是Fisher提出来的,因此SPSS用Fisher对Bayes方法进行了命名。并且因为Bayes判别函数只有在各个总体的样本的协方差阵相同时才是线性的,因此在得到该判别函数的系数时,对样本的协方差的估计必须是在总体协方差相等情况下的估计。此处,将已履行还贷责任的一类的信用级别设为1,未履行还贷责任的信用级别设为2,然后判断待判客户的信用级别。2、Fisher判别法费希尔判别(或称典型判别)的基本思想是投影(或降维):用p维向量x=(x1,x2,.,xp)的少数几个线性组合(称为判别式或典型变量) 来代替原始的p个变量

21、。(一)主要运行步骤(1)在SPSS窗口中选择分析分类判别,在调出的判别分析对话框中,将左边的变量列表中的“目前信用好坏(1,2)”选入分组变量中,将X1-X8变量选入自变量中,并选择“一起输入自变量”单选按钮,及使用所有自变量进行判别分析。(2)点击定义范围按钮,定义分组变量的取值范围,此处分组变量范围为1到2,所以在最小值和最大值中分别输入1和2。(3)单击统计量按钮,指定输出的描述统计量和判别函数系数。在函数系数栏中选择Fisher判别函数和非标准化,在描述性栏中选择均值(对各组的各变量作均数与标准差的描述),选中矩阵栏中所有的项。(4)单击分类按钮,定义判别分组参数和选择输出结果。在先验概率栏中选择所有组别的事前概率值均假定相等,在输出框中选择个案结果(给出每个观察值的分类结果),在使用协方差矩阵栏中选择在组内(使用组内离差矩阵将观察值分类)。(5)单击保存按钮,指定在数据文件中生成代表判别分组结果和判别得分的新变量,生成新变量的含义为,预测组成员:存放判别样品所属组别的值,保存在变量dis_1中;判别得分

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1