ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:158.71KB ,
资源ID:26787649      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26787649.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(多元统计分析课程设计题目.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

多元统计分析课程设计题目.docx

1、多元统计分析课程设计题目课程设计题目1. 下表给出了1991年我国30个省、区、市城镇居民的月平均消费数据,所考察的八个指标如下(单位均为 元/人)X1 :人均粮食支出; X2 :人均副食支出; X3 :人均烟酒茶支出; X4 :人均其他副食支出; X5 :人均衣着商品支出; X6 :人均日用品支出;X7 :人均燃料支出; X8 :人均非商品支出;问题:(1)求样品相关系数矩阵R;(2)从R 出发做主成分分析,求各主成分的贡献率,及前两个主成分的累积贡献率;(3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,结果如何 表一 1991年我国30个省、区、市城镇居民的月平均消费

2、数据省市X1X2X3X4X5X6X7X81山西2内蒙古3吉林4黑龙江5河南6甘肃7青海8河北9陕西10宁夏11新疆12湖北13云南14湖南15安徽16贵州17辽宁18四川19山东20江西21福建22广西23海南24天津25江苏26浙江27北京28西藏29上海30广东2. 下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1 ,X2 ,X3表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小X4 ,X5 ,X6表示)的观测值(单位:mg/100ml).问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分其意义

3、如何解释就此而言,你认为基于S和R的分析那个结果更为合理表二 49位女性在空腹和摄入食糖后三个不同时刻的血糖含量编号空腹摄入食糖X1X2X3X4X5X616069629769982565384103781073806976669913045580908085114562756811613091674647010910110376471667710213087370641151101099686775768511910698274721331271160676113013412112707478150158100136674781501311421483707499981051568669011

4、985109167863751649813817103777716011712118776874144711531966776877828920707072114931222175657177701092291749311811515023667573170147121247582761531321152574716614310510026767064114113129277490867310611628747780116817729677169638770307875801051328031646671839413332718076818786336375731208959349010374

5、107109101356076619911198364877751131249737669397136112122387470761098810539607471729071406375661301019041668086130117144427767748392107437067100150142146447376811191201194578907712215514946736880102901224772836810469964865607011994894952707692941003. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数; X2 :居民消费价格指数

6、; X3 :城市居民消费价格指数;X4 :农村居民消费价格指数; X5 :农产品收购价格指数; X6 :农村工业品零售价格指数;观测数据见下表.问题: 按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)类平均距离法;表三 全国各年度各种价格指数年份X1X2X3X4X5X619851986198719881989199019911992199319941995199619971998199920004. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数; X2 :居民消费价格指数; X3 :城市居民消费价格指数

7、;X4 :农村居民消费价格指数; X5 :农产品收购价格指数; X6 :农村工业品零售价格指数;观测数据见下表.问题: 先将数据标准化,再按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)重心距离法. 表四 全国各年度各种价格指数年份X1X2X3X4X5X619851986198719881989199019911992199319941995199619971998199920005. 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。居民非商品支出x3(亿元)的关系。数据见表。编号货运总量y (万吨)工业

8、总产值x1(亿元)农业总产值x2(亿元)居民非商品支出x3(亿元)11607035102260754024321065402042657442305240723812622068451572757842408160663620927570443210250654230 (1)计算出y,x1,x2,x3的相关系数矩阵; (2)求y关于x1 ,x2,x3的三元线性回归方程; (3)对回归方程作显著性检验; (4)对每一个回归系数作显著性检验; (5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验; (6)当x1、 x2 、x3的值为:6

9、8, 43, 时,试对货运总量作出预测。6. 某科学基金会的管理人员欲了解从事研究工作的数学家的年工资额y与他们的研究成果(论文、著作等)的质量指标x1、从事研究工作的时间x2,以及能成功获得资助的指标x3之间的关系。为此,按一定的设计方案调查了24位此类型的数学家,得数据见下表。编号yx1x2x3192203184335316137258309510471125121113231435153916211771840193520232133222723342415 (1)计算出y,x1,x2,x3的相关系数矩阵; (2)求y关于x1 ,x2,x3的三元线性回归方程; (3)对回归方程作显著性检

10、验; (4)对每一个回归系数作显著性检验;(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;(6)假设某位数学家的关于x1、 x2 、x3的值为:, 20, ,试预测他得年工资额。7. 在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。每块岩石测定了Cu,Ag,Bi三种化学成分,数据如下:含矿编号CuAgBi1234567不含矿1234567(1)生成SAS数据集; (2)用DISCRIM程序进行判别分析(假定先验概率相等,两类样本协差阵相等);(3)在显著性水平下讨论已知类型的两组企业特征是否有显著差异;(4)写出距离判

11、别的线性判别函数;(5)现在取一块岩石标本测得Cu、Ag、Bi分别为:、和,试判别这块岩石标本是含矿还是不含矿,并统计已知类别样品的错判概率。8. 为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)、X2收益性指标(纯收入/总财产)、X3短期支付能力(流动资产/流动负债)、X4生产效率性指标(流动资产/纯销售额)。 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,调查资料下表,试对这些指标作判别分析。(1)生成SAS数据集;(2)用DISCRIM程序进行判别分析(假定先验概率相等,两类样本协差阵相等);(3)在显著性水平讨论已知类型的两组企业特征是否

12、有显著差异;(4)写出距离判别的线性判别函数;(5)利用后验概率对8个待判企业(*)进行判别归类,并统计已知类别样品的错判概率。(注:将下列图片数据转换成表格数据)9表1中的1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),通过典型相关分析来来找出邮电业和国民经济之间相互影响的内在规律,根据这个规律,给决策者提供一个当前如何发展邮电业的参考。采用如下指标来衡量我国各年份的邮电业:函件(亿件):快递(万件):移动电话年末用户(万户):固定电话年末用户(万户),采用下面的指标来衡量我国各年份的经济(单位都是万亿):第一产业:工业:建筑业:第三产业(1)生成SAS数据集;(2)数据预

13、处理;(3)在显著性水平讨论已知类型的两组特征数据是否有显著差异;(4)给出典型相关变量;(5)给出典型相关系数;(6)给决策者提供一个当前如何发展邮电业的参考。年份199519961997199819992000200120022003200420052006200710自1990年12月上海证券交易所和深圳证券交易所先后挂牌交易以来,中国证券市场走过了近十七个年头,证券市场已经成为中国经济生活的重要组成部分,是中国经济发展的重要推动力量。表1为搜集金融上市公司所公布的各年份的利润及资产负债数据。试用因子分析对金融上市公司在一定时期经营绩效的优劣程度进行系统分析。(1)生成SAS数据集;(2)数据预处理;(3)计算原始变量相关系数阵以及提取因子的特征值、特征向量、各个因子的贡献率及累计贡献率;(4)对结果进行分析:根据各因子得分以及他们的排名,来评价一下这些上市公司的经营状况,给决策者提供一个当前企业运营状况的参考。(注:将下列图片数据转换成表格数据)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1