1、1.8211.357青海10.0628.6410.5210.0516.188.391.9610.818河北9.0928.127.409.6217.2611.122.4912.659陕西9.4128.205.7710.8016.3611.561.5312.1710宁夏8.707.2110.5319.4513.301.6611.9611新疆6.9329.854.549.4916.6210.651.8813.6112湖北8.6736.057.317.7516.6711.682.3812.8813厶南9.9837.697.018.9416.1511.080.8311.6714湖南6.7738.696.
2、018.8214.7911.441.7413.2315安徽37.759.6113.151.2811.2816贵州7.6735.718.048.3115.137.761.4113.2517辽宁7.9039.7712.9419.2711.052.0413.2918四川7.1840.917.3217.6012.751.1414.8019山东33.707.5910.9818.8214.731.7810.1020江西6.2535.026.2810.037.151.9310.3921福建10.6052.417.7012.5311.702.3114.6922广西7.2752.653.8413.0315.26
3、1.9814.5723海南13.4555.855.507.459.559.522.2116.3024天津10.8544.6814.5117.1312.081.2611.5725江苏45.797.6610.3616.5612.862.2511.6926浙江7.6850.3719.2514.592.7514.8727北京7.7848.448.0020.5122.1215.731.1516.6128西藏7.9439.6520.9720.8222.5212.411.7529上海8.2864.3422.2220.0615.120.7222.8930广东12.4776.395.5211.2414.5222
4、.005.4625.502.下表是49位女性在空腹情况下三个不同时刻的血糖含量(用 X1 ,X2 ,X3表示) 和摄入等量食糖一小时后的三个时刻的血糖含量(用小 X4 ,X5 ,X6表示)的观测值(单位:mg/100ml).分别从样本协方差阵 S和样本相关系数矩阵 R出发做主成分分析,求主成分的贡献 率和各个主成分.在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言, 你认为基于S和R的分析那个结果更为合理?表二49位女性在空腹和摄入食糖后三个不同时刻的血糖含量编号空腹摄入食糖606962:979856538410378107807666991305590r 80 18511475
5、681169174647010910171771027311511067119827213312761134121150158100150 n1311428310563164138r 160 111714415389r 114 19312265118p 170 n147132143-114 亍113129861068187r 105 131943233r 120 i59343511136481243713611238883940414292431464412045122155P 14946471049649523.考察1985年至2000年全国如下各价格指数:商品零售价格指数;居民消费价格指数
6、;城市居民消费价格指数;农村居民消费价格指数;农产品收购价格指数;农村工业品零售价格指数;观测数据见下表按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为 3类的结果(a)最短距离法;(b)最长距离法;(c)类平均距离法;表三全国各年度各种价格指数年份1985128.1100.0134.2166.8111.11986135.8106.5143.6106.1177.5114.71987145.7114.3156.2112.7198.8120.21988172.7188.5132.4244.5138.51989203.4160.2219.2157.9281.2164.41990207.7
7、162.2222.0165.1273.9172.01991213.7170.8233.3168.9268.4177.21992225.7181.7253.4176.8277.5182.71993254.9208.4294.2201.0314.7204.31994310.2258.6367.8248.0440.3239.41995356.1302.8429.6291.4527.9274.61996377.8327.9467.4314.4550.1291.61997380.8337.1481.9322.3525.3294.81998370.9334.4479.0319.1483.3288.3199
8、9359.8329.7472.8314.3424.3280.52000354.4331.0476.6314.0409.0277.14.考察1985年至2000年全国如下各价格指数:X2 :X4 :X6 :农村工业品零售价格指数;先将数据标准化,再按年份用下列方法进行系统聚类分析, 画出谱系聚类图,并给出聚为3类的结果(c)重心距离法.表四 全国各年度各种价格指数5.研究货运总量y (万吨)与工业总产值 x1 (亿元)、农业总产值x2 (亿元)。居民非 商品支出x3 (亿元)的关系。数据见表。货运总量y (万吨)工业总产值x1 (亿元)农业总产值x2 (亿元)居民非商品支出x3 (亿元)1601
9、 . 02602. 42102. 02653. 02401 . 22201 . 52754. 03. 2250(1) 计算出y, x1, x2, x3的相关系数矩阵;(2) 求y关于x1 , x2, x3的三元线性回归方程;(3) 对回归方程作显著性检验;(4) 对每一个回归系数作显著性检验;(5) 如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归 方程的显著性检验和回归系数的显著性检验;(6) 当x1、 x2、x3的值为:68, 43, 2.5时,试对货运总量作出预测。6. 某科学基金会的管理人员欲了解从事研究工作的数学家的年工资额 y与他们的研究成果(论文、著作等)的
10、质量指标 x1、从事研究工作的时间 x2,以及能成功获得资助的指标x3之间的关系。为此,按一定的设计方案调查了 24位此类型的数学家,得数据见下表。yx1x2x333.23.56.140.35.36.438.75.17.446.85.86.741.44.27.537.56.05.939.06.840.75.54.030.13.152.97.28.338.24.55.031.84.943.38.07.644.15.67.042.86.633.63.74.434.26.248.038.035.940.436.84.345.24.835.13.9(1) 计算出y,x1,x2,x3的相关系数矩阵;(2
11、) 求y关于x1 ,x2,x3的三元线性回归方程;(5 )如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;(6)假设某位数学家的关于 x1、x2、x3的值为:5.1,20, 7.2,试预测他得年工资额。7. 在某地区抽取了 14块岩石标本,其中7块含矿,7块不含矿。每块岩石测定了 Cu,Ag,Bi三种化学成分,数据如下:含矿CuAgBi2.580.900.952.901.231.003.552.350.793.541.852.702.231.301.700.48不1.062.161.802.331.101.481.941.403.0
12、02.78(1) 生成SAS数据集;(2) 用DISCRIM程序进行判别分析(假定先验概率相等,两类样本协差阵相等) ;(3) 在显著性水平: = 0.1下讨论已知类型的两组企业特征是否有显著差异;(4) 写出距离判别的线性判别函数;(5) 现在取一块岩石标本测得 Cu、Ag、Bi分别为:2.95、2.15和1.54,试判别这块 岩石标本是含矿还是不含矿,并统计已知类别样品的错判概率。8. 为了研究中小企业的破产模型, 选定4个经济指标:总负债率(现金收益/总负债)、 X2收益性指标(纯收入/总财产)、X3短期支付能力(流动资产/流动负债)、X4生产效率性 指标(流动资产/纯销售额)。对17个
13、破产企业(1类)和21个正常运行企业(2类)进行了调查,调查资料下表, 试对这些指标作判别分析。 = 0.05讨论已知类型的两组企业特征是否有显著差异;(5) 利用后验概率对 8个待判企业(*)进行判别归类,并统计已知类别样品的错判概率。(注:将下列图片数据转换成表格数据)2UInn?UE0350.400.520.550河U.2h0.474.29U45I 990.30fi-4?0 J0.131.500.71137O.4D&0.440.560-3H0.4R0阳(Ml3 27一 h 0 !QO.OS0,330 P4,Z4n.630310(W4450,690.05CM20.J7OlM0.33n.56
14、0.200470 17MRawY06 U7K0.290.54o.os007.AOTJ1In fl701.090 09Q. I0.140.G40 01-0.06-00(0.34Q0A0,060* 112 50G 4fi2 6J3.01.242,92S-U6371.S49.表1中的1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),通过典型相关分析来来找出邮电业和国民经济之间相互影响的内在规律, 根据这个规律,给决策者提供一个当前如何发展邮电业的参考。采用如下指标来衡量我国各年份的邮电业:函件(亿件)快递(万件)移动电话年末用户(万户)固定电话年末用户(万户),采用下面的指标来衡量我
15、国各年份的经济(单位都是万亿)yi:第一产业y :工业y3:建筑业y4 :第三产业(2) 数据预处理;匸0.05讨论已知类型的两组特征数据是否有显著差异;(4) 给出典型相关变量;(5) 给出典型相关系数;(6) 给决策者提供一个当前如何发展邮电业的参考。y1y2y3y479.555562.7362.94070.612135.824950.63728.819978.578.687096.6685.35494.714015.429447.64387.423326.268.556878.91323.37031.014441.932921.44621.626988.165.517331.82386.38742.114817.634018.44985.830580.560.529091.34329.610871.614770.035861.55172.133873.477.7111031.48453.314482.914944.7
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1