ImageVerifierCode 换一换
格式:DOCX , 页数:46 ,大小:72.08KB ,
资源ID:619646      下载积分:12 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/619646.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据分析大作业讲解.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据分析大作业讲解.docx

1、数据分析大作业讲解第一章 数据描述分析(一)目的与要求:掌握利用统计软件求样本的数据特征、数据的分布,并理解所求各统计值的实际意义及作用,能把数据特征及数据分布用以解决实际问题。掌握正态分布、对数正态分布、威布尔分布、指数分布等几种常见分布的拟合检验方法。理解相关的本质含义,并会判断几个变量的相关性,掌握几种不同相关性的差别方法;能利用软件输出的结果判断变量的相关性。(二)重点与难点:掌握求数据的数字特征的程序结构,并能看懂程序输出的结果。区别不同的程序过程能求得一些相同的结果,但它们的功能上的区别;掌握几种描述数据分布软件处理方法、意义、实际应用;掌握平均数与中位数的区别与优劣;理解并能利用

2、程序计算结果计算上、下截断点,会利用上、下截断点判别一组数据中是否有截断点,会处理异常值。 掌握多元数据的数字特征及相关性的判断,并会应用程序结果。1.1 某小学60名11岁学生的身高(单位:cm)数据如下:(1) 计算均值、方差、标准差、变异系数、偏度、峰度; (2) 计算中位数、下和上四分位数、四分位极差、三均值;(3) 作出直方图;(4) 作出茎叶图;(5) 进行正态W检验();(6) 进行经验分布函数的检验。126 149 143 141 127 123 137 132 135 134 146 142135 141 150 137 144 137 134 139 148 144 142

3、 137147 138 140 132 149 131 139 142 138 145 147 137135 142 151 146 129 120 143 145 142 136 147 128142 132 138 139 147 128 139 146 139 131 138 1491.2 19491980年全国历年人口(单位:亿人)如下:(1) 计算均值、方差、标准差、变异系数、偏度、峰度; (2) 计算中位数、下、上四分位数、四分位极差、三均值;(3) 作出直方图;(4) 作出茎叶图;(5) 找出异常值。(6) 进行正态W检验();(7) 进行经验分布函数的检验。5.4167 5.5

4、196 5.6300 5.7482 5.8796 6.02666.1465 6.2828 6.4653 6.5994 6.7207 6.62076.5859 6.7295 6.9172 7.0499 7.2538 7.45427.6368 7.8534 8.0671 8.2992 8.5229 8.71778.9211 9.0859 9.2420 9.3717 9.4974 9.62599.7542 9.8705 10.0072 10.1541 10.2495 10.3475 10.45321.3 1978年至1999年我国居民消费数据如表1.3所示(1) 计算均值、方差、标准差、变异系数、偏

5、度、峰度; (2) 计算中位数、下、上四分位数、四分位极差、三均值;(3) 作出直方图;(4) 作出茎叶图;(5) 找出异常值。1978 184 138 4051979 207 158 4341980 236 178 4961981 262 199 5621982 284 221 5761983 311 246 6031984 354 283 6621985 437 347 8021986 485 376 9201987 550 417 10891988 693 508 14311989 762 553 15681990 803 571 16861991 896 621 19251992 10

6、70 718 23561993 1331 855 30271994 1746 1118 38911995 2336 1434 48741996 2641 1768 54301997 2834 1876 57961998 2972 1895 62171999 3180 1973 66511.4 2002年11月以及1至11月全国各省、市、区财政预算收入数据如下:(1) 计算均值、方差、标准差、变异系数、偏度、峰度; (2) 计算中位数、下、上四分位数、四分位极差;(3) 作出直方图;(4) 作出经验分布函数图;(5) X1和X2的观测值的pearson相关系数与spearman相关系数。北京 3

7、5.22 499.80天津 10.41 161.37河北 17.22 273.29山西 10.70 134.79内蒙古 10.29 90.92辽宁 18.66 348.99吉林 4.41 106.89黑龙江 6.24 196.44上海 49.72 656.95江苏 47.70 580.70浙江 36.55 518.10安徽 14.85 179.41福建 19.46 250.16江西 10.93 122.06山东 40.26 552.74河南 19.82 268.20湖北 19.49 221.43湖南 16.01 197.68广东 99.32 1080.26广西 14.77 160.60海南 3

8、.96 39.51重庆 10.49 111.76四川 21.71 250.09贵州 13.06 95.87云南 20.34 183.62西藏 0.77 6.08陜西 11.38 133.50甘肃 3.66 64.86青海 1.21 18.30宁夏 2.31 23.81新疆 3.24 103.811.5 对某民族的21人测量其血液4种成分的含量,观测数据如下:求总体均值向量及总体协方差矩阵的估计。18.8 28.1 5.1 35.117.4 25.6 4.9 33.916.0 27.4 5.0 32.219.3 29.5 1.7 29.117.4 27.4 4.5 35.615.3 25.3 3

9、.6 32.216.7 25.8 4.4 33.017.4 26.7 4.4 33.016.2 25.7 2.3 33.916.7 26.7 6.4 35.018.2 28.0 3.2 29.716.7 26.7 2.1 34.918.1 26.7 4.3 31.516.7 26.0 3.0 32.718.1 30.2 7.0 34.920.2 30.5 4.8 34.420.2 29.5 5.5 36.221.5 31.5 5.8 36.518.8 30.6 5.4 35.421.6 27.8 5.4 34.121.3 29.5 5.8 35.81.7 一组人体的胸部、腹部、手臂部分皮肤的有

10、关数据如下:(1) 计算观测数据均值向量和中位数向量; (2) 计算观测数据的pearson相关矩阵,spearman相关矩阵及各元素对应的检验值,并做相关性的显著性检验。9.0 12.0 3.08.5 15.0 3.013.0 19.0 3.010.0 7.0 4.07.0 13.0 2.515.5 28.5 5.022.5 20.0 4.55.5 8.5 3.025.0 35.0 6.515.0 19.0 4.012.5 20.0 3.017.0 19.5 5.016.0 17.5 6.020.0 20.0 7.512.0 17.0 4.022.0 20.0 6.017.0 28.0 5.

11、516.0 18.0 3.021.0 27.5 6.013.0 14.0 4.021.0 13.0 9.021.0 6.0 3.513.5 6.5 3.5 5.0 7.5 3.516.0 20.0 5.514.5 14.5 4.010.0 23.0 6.011.0 13.0 6.010.5 12.0 3.515.0 15.5 3.0 9.0 12.5 5.023.0 24.0 6.514.0 21.0 6.516.0 11.0 3.016.5 17.0 4.016.0 15.0 3.012.0 15.5 3.5 9.0 4.0 2.012.0 6.0 5.0 5.0 14.0 3.017.0

12、15.0 4.516.0 11.0 3.017.5 18.0 3.011.5 15.0 3.0 4.0 3.0 2.017.5 15.0 4.5 9.5 11.5 2.526.0 38.0 4.015.0 13.0 4.519.0 12.0 3.0第二章 线性回归分析(一)目的与要求:掌握建立多元回归方程的方法,并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制。(二)重点与难点: 会对实际数据建立有效的多元回归模型,能对回归模型作残差分析;掌握SAS输出结果中用于判别回归方程优良性的不同统计量;能对回归模型进行运用,对实际问题进行预测或控制。2.4 某公司管理人员为

13、了了解某化妆品在一个城市的月销售量Y(单位:箱)与该城市中适合使用该化妆品的人数X1(单位:千人)以及他们人均月收入X2(单位:元)之间的关系,在某个月中对15个城市作了调查,得到的观测值如下:(1) 求回归系数的最小二乘估计和误差方差的估计,写出回归方程并对回归系数作解释;(2) 求出方差分析表,解释对线性回归关系显著性检验的结果,求复相关系数的平方的值并解释其意义;(3) 分别求和的置信度为95%的置信区间;(4) 对,分别检验人数X1及收入X2对销量Y的影响是否显著,利用与回归系数有关的一般假设方法检验X1和X2的交互作用(即X1X2)对Y的影响是否显著;(5) 该公司欲在一个适宜使用该

14、化妆品的人数X01=200,人均月收入X02=2500的新的城市中销售该化妆品,求其销量的预测值及其置信度为95%的置信区间;(6) 求Y的拟合值,残差及学生化残差,根据对学生化残差,根据对学生化残差正态性的频率检验及正态QQ图检验说明模型误差项的正态性假定是否合理,有序学生化残差与相应标准正态分布的分位数的相关系数是多少?作出各种残差图,分析模型有关假定的合理性。162 274 2450 120 180 3254 223 375 3802 131 205 2838 67 86 2347 169 265 3782 81 98 3008 192 330 2450 116 195 2137 55

15、53 2560 252 430 4020 232 372 4427 144 236 2660 103 157 2088 212 370 2605 2.5 下面的数据是由特定模型产生的20组模拟数据(1) 首先拟合Y关于X的线性回归模型,结果如何?通过残差分析(尤其是残差图分析)并参考Y与X的散点图,选择你认为合理的回归函数形式,拟合你所选择的回归模型,再通过残差分析考察所设定的模型的合理性,最后,将你所拟合的回归方程与真实模型()比较,你是否给出了正确的模型形式。(2) 如果对因变量作BOX-COX变换,求变换参数的值,拟合变换后的变量关于X的简单线性回归模型,结果如何?你对BOX-COX变换有何新的认识?0.05 5.9421 0.15 5.4691 0.25 5.8724 0.35 5.1815 0.45 5.1955 0.55 5.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1