ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:56.73KB ,
资源ID:21210950      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/21210950.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实用多元统计分析相关习题学习资料Word文档格式.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

实用多元统计分析相关习题学习资料Word文档格式.docx

1、二、简答题1、 简述复相关系数与偏相关系数。答:复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关 系。例如,某种商品的需求量与其价格水平、职工收入水平等现象之间呈现复相关关 系。偏相关系数:又叫部分相关系数。部分相关系数反映校正其它变量后某一变量与另一 变量的相关关系。偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个 变量之间的的相关系数。偏相关系数的假设检验等同于偏回归系数的 t检验。复相关系数的假设检验等同于回 归方程的方差分析。2、 简述逐步回归分析方法的具体实施步骤。逐步回归过程如下:1) 自变量的剔除;2) 重新进行少一个自变量的多元线性回归分析;3)

2、 重新进行多一个自变量的多元线性回归分析;4) 重新进行上述步骤,直至无法再删除和再引入自变量为止。3、 提取样本主成分的原则。主成分个数提取原则为主成分对应的特征值大于 1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于 1,说明该主 成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此,一般可以用特征值大于1作为纳入标准。4、 简述系统聚类法的基本思想及主要步骤。系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。系统聚类过程是:假设总共有n个样品(或变量),第

3、一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近 的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,共聚成 n 1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n 2类;,以上 步骤一直进行下去,最后将所有的样品(或变量)全聚成一类,也简称聚集法。还有 与以上方法相反的称分解法。5、 简述快速聚类(k 均值聚类)的基本思想及主要步骤。基本思想:1.一个样品分配给最近中心(均值)的类中,将所有样品分成 k个初始类。2.通过欧式距离将每个样品划入离中心最近的类中,并对得到样品或失去样品的类 重新计算中心坐标。3.重复

4、步骤2,直到所有样品都不能再分配时为止。6判别分析的分类。判别分析是多元统计分析中用于判别样本所属类型的一种统计分析方法。判别分析按判别的组数来分,有两组判别分析和多组判别分析;按区分不同总体所用 的数学模型来分,有线性判别和非线性判别;按判别对所处理的变量方法不同,有逐 步判别、序贯判别等;按判别准则不同,有距离判别、贝叶斯判别( Bayes)、费歇(Fisher)判别等。7、简述Fisher判别规则及具体判别步骤。Fisher判别法的基本思想:从多个总体(类)抽取一定的样本,借助方差分析的思想,建立p个指标的线性判别函数,把待判样品代入线性判别函数,然后与临界值比较,就可判样品属于哪个类。

5、* 1 * Fisher判别法的具体算法步骤:由Fisher线性判别式 S Ml M2求解向量 的步骤:1把来自两类-训练样本集X分成1和2两个子集X1和X2。M i由X k, Ini xk Xi1,2,计算Mi。Xk MiXkMTi由xk Xi计算各类的类内离散度矩阵Si,i=1,2。计算类内总离散度矩阵SS1 S2。 i- 5计算S的逆矩阵S 。* 1 *6由 S M1 M 2求解。三、计算题1.现收集了 92组合金钢中的碳含量x及强度y,且求得:X 0.1255, y 45.7989 Lxx 0.3019 Lxy 26.5126 Lyy 2941.03(1)求y关于x的一元线性回归方程;

6、求y与x的相关系数;(3)列出对方程作显著性检验的方差分析表;在x=0.1时,求?的点估计。(1珠y装于莖的一线性回归方程;L 26 5126 - -網:h =亠= = 87.8191 : 口 =屮占工=45 肿幼 -S7 S151 仁记=U.7776L 0.3019 ”_夕A 4 hv - - 34.7776 + V 8191 h ;即 y -34.7776 4 87 .8191 x(2KRy与x的f目关系毎初在xNl.1时,求y的虫估计。由(1)知:尸=34 . 7776 + 57. S19L z得当xT时* y = 34. 7776+ S7.8191 x 0. 1 = 43, 55962

7、.某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程 为eda 10.36 0.094sibSj 0.131medui 0.210 fedui R2 0.214式中,edu为劳动力受教育年数,sibs为劳动力家庭中兄弟姐妹的个数,medu与fedu 分别为母亲与父亲受到教育的年数。问(1) 若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要 sibs增加多 少?(2) 请对medu的系数给予适当的解释。(3) 如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为 12年, 另一个的父母受教育的年数均为16年,则两人受教育的年数预期相差多少年首先

8、计算两人受萌的 10.3M,131x12-0.210x12=14,45110.364043lxl21M6=11816 因出两人根敎育年的差别为 1: 816-14452=1.364 操作:1岀种不同射的玉米避行产is批实鑑假韻实軀鸵紂翩目画品种、45A14?.5454殆46645.24S.544.5肛947.1A3血Ml-5-範145.SA444141.63S.S43.242.5iHWPl品种的平均声蚩是酩显苦差卑AM07A平方和df均方Flira组间66.662322.9519.L7B.001蛆内40.064162.504总教108.94619筍冋闻価拒细朝侵故环同品种的平妒毘有显著差异2下

9、面列竝不R1里下腰的长躲ii说10152030殛y(泗8.12S.955.90i(m11.80在醐坐标系下倆点图,并蜩丫矣于X的做矣親否卿;(幅馭旧対话框、就点,間单分布M析 回归、线性、绕计里中选择相应的)(2)茨出Y关于X的一元线性回归方程;根型菲标准出京褻标准窮数Sig.B标准吟试版1 (常量6.233.053117.624.000重星X.田$.0031.00066-745a ”因变皐;鯛 Y=0.1jX-6J83;(3 吋所求得审回归方程作显蓍性检验!列出方羞分析表:Anowtta棍型平珀d.fWig.回归14加14.6654454,915,000* 13息计U.679&一预测变虽:常

10、呈):,重星( *X因喪量:慣度丫C4)求出丫与犹间的棺关緊输匚砖注重Sit蚩虽叢Peairson相矣摆1.000F,显着性(叹侧),000N6氏虞H Fearson相矢性1.000*显著性(叹测)hJ*在 41水平(驳侧)上显善拒天3.下表给出一二元模型的回归结果方差来源平方和(SS)自由度(d.f.)来自回归(ESS)65965来自残差(RSS)总离差(TSS)6604214求:(1)样本容量是多少? RSS是多少? ESS和RSS的自由度各是多少?2(2)R2和 R ?(3)检验假设:解释变量总体上对 丫有无影响。你用什么假设检验?为什么?解:C1)样本容童为n=14.+ l=15KSS

11、=ISS-ESS=66O42-&5965=77ES5的自宙度知iRSS的自由度为:df =n 21-12(2)R=ESS TSS=fi5965 Sti042=0,9988=1l-0.0012*14 12-O.W86(3)应该采用方稈显著性检验即T检验,理由是只有这样才能剽断瓦1、屯一起是否对T有影响o4.在一项研究中,测量了 376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见F表:Y1Y2Y3Y4Y5Y6头长x10.350.530.76-0.05-0.040.00头宽x20.330.70-0.64肱骨x30.44-0.190.190.59尺骨x4-0.25-0.020.48-0.15-0.

12、63股骨x50.43-0.28-0.06-0.51-0.67胫骨x6-0.22-0.48-0.700.15特征值4.570.710.410.170.080.06(1)计算前三个主成分各自的贡献率和累积贡献率。对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断解:5.在一项对杨树的性状的研究中,测定了 20株杨树树叶,每个叶片测定了四个变量:叶长(x1),2/3处宽(x2) ,1/3处宽(x3) ,1/2处宽(x4)。这四个变量的相关系数矩阵的 特征根和标准正交特征向量分别为:2.920U1(0.1485, 0.5735, 0.5577, 0.5814)1.024U2(0.9544,

13、 0.0984,0.2695,0.0824)0.049U3(0.2516,0.7733, 0.5589, 0.1624)0.007U4(0.0612,0.2519,0.5513, 0.7930)写出四个主成分,计算它们的贡献率 解:各自的主成分为:Z1=0.1485Xi-0.5735X2-0.5577X3-0.5814X4Z2=0.9544X 仁0.0984X2+0.2695X3+0.0824X4Z3=0.2516Xi +0.7733X2-0.5589X3-0.1624X4Z4=-0.0612Xi +0.2519X2+0.5513X3-0.7930X4则各自的贡献率为:W1=2.920/(2.

14、920+1.024+0.049+0.007)=0.73W2=1.024/(2.920+1.024+0.049+0.007)=0.256W2=0.049/(2.920+1.024+0.049+0.007)=0.01225W2=0.007/(2.920+1.024+0.049+0.007)=0.001756.对纽约股票市场上的五种股票的周回升率 x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率, x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特 征向量为:12.857 U1 (0.46

15、4,0.457,0.470,0.421,0.421)20.809 U2 (0.240,0.509,0.260, 0.526, 0.582)(1)计算这两个主成分的方差贡献率。Z1=0.464Xi+0.457X2+0.470X3+0.421X4+0.421X5Z2=0.240Xi+0.509X2+0.260X3-0.526X4-0.582X5W仁2.587/(2.587+0.809)=0.762W2=0.809/(2.587+0.809)=0.238(2)能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。解释:由SPSS抽取的两个主成分,其特征值分别为 2.857和0.809,。根据

16、主成分分析 得知:各自的贡献率为 W仁76.2%, W2=23.8%。由此可知,第一个主成分对变量(股 票回升率)影响较大。命名:一、化学工业公司股票回升率二、石油公司股票回升率7、下面给出了八个样品的两个指标数据样 指标78X1X21312911使用按动态聚类法进行聚类,采用欧氏距离(取1、3、7号样本为聚点)四、上机操作会进行回归、聚类、因子、主成分、判别分析基本操作,上级题目随机抽取请指出下面SPSS软件操作分别代表多元统计分析中什么分析:(1)An alysisRegression Lin ear regressi on 回归分析(2)AnalysisClassifyHierachical Cluster 系统聚类分析聚类分析(3) AnalysisClassifyKmean Cluster K-均值聚类分析(4) AnalysisData ReductionFactor 因子分析(5)AnalysisData Reduction Faactor 主成分分析(6) AnalysisClassifyDiscriminant 判别分析

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1