ImageVerifierCode 换一换
格式:DOCX , 页数:41 ,大小:776KB ,
资源ID:27130496      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/27130496.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(完整word版数据分析实验报告分析解析.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

完整word版数据分析实验报告分析解析.docx

1、完整word版数据分析实验报告分析解析 实验课程:数据分析 信息与计算科学 业: 专 级: 班 号:学 姓名: 中北大学理学院实验一 SAS系统的使用 【实验目的】 了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 将SCORE数据集的内容复制到一个临时数据集test。 SCORE数据集 English Math Sex Chinese Name 91 90 f 85 Alice 95 Tom m 87 84 93 90 Jenny f 83 80 85 80 Mike m 84 85 89 m Fred 97 83 f 82 Kate 92 Alex 9

2、0 m 91 75 Cook m 78 76 82 f Bennie 79 84 85 Hellen f 74 84 90 82 Wincelet f 87 77 Butt m 81 79 86 85 Geoge m 82 89 Tod m 84 84 89 Chris f 84 87 86 65 f 87 Janet math的高低拆分到3个不同的数据集:SCORE2将数据集中的记录按照math大于等于90的到good数据集,math在80到89之间的到normal数据集,math在80以下的到bad数据集。 3将3题中得到的good,normal,bad数据集合并。 【实验所使用的仪器设备

3、与软件平台】SAS 【实验方法与步骤】 1: DATA SCORE; INPUT NAME $ Sex $ Math Chinese English; CARDS; 2 91 85 Alice f 90 84 Tom m 95 87 83 f 93 90 Jenny 80 80 85 Mike m 89 85 m Fred 84 82 83 Kate f 97 91 Alex m 92 90 76 Cook m 78 75 84 82 79 f Bennie 84 74 Hellen f 85 87 82 Wincelet f 90 79 Butt m 77 81 82 m 86 85 Geo

4、ge 84 89 84 Tod m 87 84 f Chris 89 87 Janet f 86 65 ; ; RunPROC PRINT DATA=SCORE; DATA test; SET SCORE; :2 good normal bad; DATA SCORE; SET; SELECT) output good; 90when(math=) output normal; 80when(math=&math90) output bad; when(math80; end; Run=good; DATA PRINT PROC=normal; DATAPRINT PROC=bad; DATA

5、PRINTPROC :3 All; DATA good normal bad; SET=All; DATA PROC PRINT ;Run 3 【实验结果】 结果一: 结果二: 4 结果三: 5 实验二 上市公司的数据分析 【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟 悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表2是一组上市公司在2001年的每股收益(eps)、流通盘(scale)的规模以及2001年最后一个交易日的收盘价(price). 表2 某上市公司的数据表 代码 流通盘 每股收益 股票价格 13.27 000096 0.059 8500 1

6、4.2 000099 0.028 6000 7.12 12600 000150 -0.003 10.08 000151 0.026 10500 22.75 000153 0.056 2500 6.85 13000 000155 -0.009 14.95 000156 3600 0.033 12.65 000157 0.06 10000 8.38 10000 000158 0.018 12.15 7000 0.008 000159 7.31 15365 000301 0.04 13.26 000488 7700 0.101 12.33 6000 000725 0.044 22.58 0.07 0

7、00835 1338 18.29 000869 3200 0.194 12.55 000877 7800 -0.084 12.48 6000 000885 -0.073 9.12 0.031 000890 16934 7.88 12000 0.031 000892 6.91 000897 14166 0.002 8.59 000900 21423 0.058 27.95 000901 4800 0.005 10.92 6500 000902 -0.031 11.79 6000 000903 0.109 9.29 0.046 9500 000905 14.47 0.007 6650 000906

8、 8.28 0.006 8988 000908 9.99 0.002 6000 000909 8.9 0.036 000910 8000 9.01 0.067 7280 000911 8.06 0.112 15000 000912 11.86 0.062 8450 000913 14.4 4599 000915 0.001 5.15 34000 0.038 000916 16.23 11800 0.086 000917 10.12 6000 -0.045 000918 6 、对股票价格1 )计算均值、方差、标准差、变异系数、偏度、峰度;1 数,四分位极差,三均值;2)计算中位数,上、下四分位

9、3)作出直方图; )作出茎叶图;4 )进行正态性检验(正态5W检验); 相关矩阵;)计算协方差矩阵,Pearson6 Spearman)计算相关矩阵;7 8)分析各指标间的相关性。)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计12、 值及残差;,检验回归关系的显著性,检验各自变量对因变 2)给定显著性水平=0.05 量的影响的显著性;?)拟合残差关于拟合值图。分析 3QQ的残差图及残差的正态Y及XXX,X,2112 这些残差,并予以评述。SAS 【实验所使用的仪器设备与软件平台】 【实验方法与步骤】 prices; data num scale eps price; inp

10、ut; cards13.27 000096 8500 0.059 14.2 0.028 000099 6000 -0.003 7.12 000150 12600 10.08 000151 10500 0.026 22.75 000153 2500 0.056 -0.009 6.85 000155 13000 14.95 0.033 000156 3600 0.06 12.65 000157 10000 8.38 000158 10000 0.018 12.15 0.008 000159 7000 0.04 7.31 000301 15365 13.26 000488 7700 0.101 12

11、.33 000725 6000 0.044 22.58 000835 1338 0.07 18.29 0.194 000869 3200 7 -0.084 12.55 000877 7800 -0.073 12.48 000885 6000 9.12 0.031 000890 16934 7.88 000892 12000 0.031 6.91 000897 14166 0.002 8.59 000900 21423 0.058 27.95 000901 4800 0.005 -0.031 10.92 000902 6500 11.79 000903 6000 0.109 9.29 00090

12、5 9500 0.046 14.47 000906 6650 0.007 8.28 0.006 000908 8988 9.99 0.002 000909 6000 8.9 0.036 000910 8000 9.01 0.067 000911 7280 8.06 000912 15000 0.112 11.86 000913 8450 0.062 14.4 000915 4599 0.001 5.15 000916 34000 0.038 16.23 000917 11800 0.086 -0.045 10.12 000918 6000 ; run=prices; DATAPRINT PRO

13、C ; run; cvmeandata=prices var std skewness kurtosismeansproc price; var=result; outoutput; run; normalplotunivariateproc data=prices freq price; var=result2; outoutput; run; noprintdataproc capability =prices graphics ; price/normalhistogram; run; covnosimple proc corrdata=prices pearsonspearman pr

14、ice; var price; with; run =prices; datareg proc; p r=backward model price=scale eps/selectionnoint=r; rout =prices p=p output=prices; data procprint 8 run 【实验结果】 9 10 11 对于问题二结果: 12 13 14 实验三 美国50个州七种犯罪比率的数据分析 【实验目的】通过使用SAS软件对实验数据进行主成分分析和因子分析,熟 悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表3给出的是美国50个州每100 000个人中

15、七种犯罪的比率数据。这七种犯罪是:Murder(杀人罪),Rape(强奸罪),Robbery(抢劫罪),Assault(斗殴罪),Burglary(夜盗罪),Larceny(偷盗罪),Auto(汽车犯罪)。 表3 美国50个州七种犯罪的比率数据 State Murder Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia Hawaii Idaho Illinois Indiana Iowa Kansas Kentucky Louisiana Maine Maryland

16、 Massachusetts Michigan Minnesota Mississippi Missouri Montana Nebraska Nevada New Hampshire New Jersey New Mexico New York North Carolina 14.2 10.8 9.5 8.8 11.5 6.3 4.2 6.0 10.2 11.7 7.2 5.5 9.9 7.4 2.3 6.6 10.1 15.5 2.4 8.0 3.1 9.3 2.7 14.3 9.6 5.4 3.9 15.8 3.2 5.6 8.8 10.7 10.6 RapeRobberyAssault

17、BurglaryLarcenyAuto280.71881.925.296.8278.31135.5753.31331.73369.851.696.8284.0439.52346.1312.34467.434.2138.2183.4203.427.683.21862.1972.6663.549.4287.02139.4358.03499.8477.142.01935.2170.73903.2292.9593.22620.716.8131.8129.51346.0467.0194.23678.424.91682.6157.0351.41859.9187.9449.13840.539.6297.91

18、40.51351.1256.52170.231.1489.43920.4128.025.51911.564.1237.619.41050.839.62599.6172.5528.62828.521.8209.0211.31085.0377.41086.226.5153.5123.22498.7219.989.8812.510.62685.141.2244.3180.51270.422.02739.3100.7245.4872.281.1123.319.11662.1337.71165.5142.9335.530.92469.9246.938.72350.71253.113.5170.0428.

19、53177.7292.1358.934.81400.01140.1169.12311.31532.2231.620.8545.53159.0261.9274.61522.738.9343.185.92559.31134.719.585.8144.41239.965.7189.119.6915.6378.4189.01318.32424.2233.528.3309.2804.939.2156.82773.216.7249.164.7760.0112.718.12316.1559.2355.0323.12453.149.14212.6293.476.02343.91041.710.723.2511

20、.51435.8185.12774.521.0180.4259.53008.61418.739.1109.6343.4745.81728.02782.029.4472.6319.1192.12037.817.061.3318.31154.1 15 Ohio North Dakota Oklahoma Oregon Pennsylvania Rhode Island South Carolina South Dakota Tennessee Texas Utah Vermont Virginia Washington West Virginia Wisconsin Wyoming 7.8 0.9

21、 8.6 4.9 5.6 3.6 11.9 2.0 10.1 13.3 3.5 1.4 9.0 4.3 6.0 2.8 5.4 400.4181.127.3190.51216.02696.8144.7446.11843.09.013.343.8326.81288.2205.02228.129.273.8388.91636.4286.9124.139.935061333.2128.0130.3877.51624.119.0791.4201.01489.510.586.52844.1245.133.01613.6485.32342.4105.9147.513.5570.517.91704.4155

22、.7314.0145.81259.729.7203.91776.5397.62988.7152.433.8208.21603.1334.5147.33004.620.368.81171.6265.22201.0101.21348.215.930.8226.7165.792.12521.223.3986.2360.31605.6106.23386.939.6224.8163.342.2597.490.913.21341.7220.72614.252.263.7846.912.9282.02772.2173.939.7811.621.9 二者的结果有何差)分别用样本协方差矩阵和样本相关矩阵作主成分

23、分析,1、1 异?对所选取的主成分给原始数据的变化可否由三个或者更少的主成分反映,2) 出合理的解释。. )计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序 3 、从样本相关矩阵出发,做因子分析。2 【实验所使用的仪器设备与软件平台】SAS 【实验方法与步骤】 crime。excel,再通过SAS导入数据至数据集首先将上述数据复制到 样本协方差矩阵做主成分分析:; covariance data=work.crime proc princomp; run 样本相关矩阵做主成分分析:=work.crime; princompdataproc run; 对第一样本主成分排序=defen;

24、 out data=crime princompproc ; run=defen; data proc sort prin1; by ; run 16 =defen; data proc print ; run 、2 程序:; =work.crime scoredataproc factor ; run 【实验结果】 17 18 19 20 21 实验四 1991年全国各省、区、市城镇居民 月平均收入的数据分析 【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉 数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下

25、表,变量含义如下:X1-人均生活费收入(元/人);X2-人均全民所有制职工工资(元/人);X3-人均来源于全民标准工资(元/人);X4-人均集体所有制工资(元/人);X5-人均集体职工标准工资(元/人);X6-人均各种奖金及超额工资(元/人);X7-人均各种津贴(元/人);X8-职工人均从工作单位得到的其他收入(元/人);X9-个体劳动者收入(元/人)。 省(区市)类x1 x2 x3 x4 x5 x6 x7 x8 x9 型名 0.41 4.49 26.8 16.44 11.9 8.38 110.2 170.03 北京 1 59.76 1.05 21.3 12.36 9.21 9.33 82.5

26、8 141.55 天津 1 50.98 13.4 0.7 17.3 11.79 12 7.52 119.4 1 河北 83.33 53.39 11 0.16 31 11.8 15.6 194.53 1 上海 107.8 60.24 21.01 8.88 0.47 20.61 9.61 1 130.46 86.21 山东 15.9 52.3 12.14 10.5 0.51 13.87 1 119.29 湖北 85.41 16.47 53.02 13.1 8.44 8.38 4.56 1 134.46 21.49 广西 98.61 48.18 26.12 8.9 4.34 13.6 3.82 45

27、.6 6.3 11.8 1.56 29.49 18.67 1 143.79 99.97 海南1021 四川 13.9 14.5 9.62 10.18 1 74.96 128.05 50.13 16.14 0.9 5.87 21.2 19.41 1 12.6 127.41 93.54 50.57 云南 10.5 4.62 3.86 1 18.96 122.96 101.4 69.7 新疆 11.3 6.3 5.62 0.61 2 13.12 102.49 71.72 山西 7.9 47.72 9.42 6.96 6.66 0.96 46.19 9.655 9.65 内蒙古 20.1 6.27 6

28、.97 2 106.14 76.27 1.68 44.6 吉林 13.7 6.65 9.01 2 104.93 20.61 72.99 9.435 2.68 7.41 6.45 2 103.34 8.342 62.99 42.95 黑龙江 11.1 10.19 1.08 10.59 98.089 11.4 69.45 43.04 江西 7.69 7.95 16.5 2 1.11 72.23 47.31 8.3 河南 9.48 10.43 2 104.12 6.43 13.14 2.85 3.42 13.69 16.53 6.06 2 108.49 80.79 47.52 贵州8.37 1.27

29、 12.94 2 6.77 113.99 75.6 50.88 陕西 5.21 3.86 9.492 1.19 2 114.06 16.43 甘肃84.31 52.78 7.81 5.44 3.79 10.82 0.83 8.371 18.98 5.95 7.27 108.8 2 80.41 50.45 4.07 青海 0.97 22.65 8.81 2 115.96 88.21 宁夏5.63 51.85 13.95 4.75 1.41 3 128.46 辽宁68.91 22.4 43.41 15.3 9.01 13.88 12.42 1.19 13.9 9.661 23.9 15.2 135.24 3 73.18 江苏44.54 22.38 3.47 24.3 13.9 3 浙江162.53 80.11 45.99 29.54 10.9 13 22 0.63 71.07 9.698 7.02 43.64 19.4 12.5 16.68 111.77 安徽 3 3.08 79.09 44.19 16.47 18.5 7.67 10.5 福建 3 139.09 20.23 1.76 84.66 10.3 44.05 湖南 7.47 3 13.

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1