1、完整word版数据分析实验报告分析解析 实验课程:数据分析 信息与计算科学 业: 专 级: 班 号:学 姓名: 中北大学理学院实验一 SAS系统的使用 【实验目的】 了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 将SCORE数据集的内容复制到一个临时数据集test。 SCORE数据集 English Math Sex Chinese Name 91 90 f 85 Alice 95 Tom m 87 84 93 90 Jenny f 83 80 85 80 Mike m 84 85 89 m Fred 97 83 f 82 Kate 92 Alex 9
2、0 m 91 75 Cook m 78 76 82 f Bennie 79 84 85 Hellen f 74 84 90 82 Wincelet f 87 77 Butt m 81 79 86 85 Geoge m 82 89 Tod m 84 84 89 Chris f 84 87 86 65 f 87 Janet math的高低拆分到3个不同的数据集:SCORE2将数据集中的记录按照math大于等于90的到good数据集,math在80到89之间的到normal数据集,math在80以下的到bad数据集。 3将3题中得到的good,normal,bad数据集合并。 【实验所使用的仪器设备
3、与软件平台】SAS 【实验方法与步骤】 1: DATA SCORE; INPUT NAME $ Sex $ Math Chinese English; CARDS; 2 91 85 Alice f 90 84 Tom m 95 87 83 f 93 90 Jenny 80 80 85 Mike m 89 85 m Fred 84 82 83 Kate f 97 91 Alex m 92 90 76 Cook m 78 75 84 82 79 f Bennie 84 74 Hellen f 85 87 82 Wincelet f 90 79 Butt m 77 81 82 m 86 85 Geo
4、ge 84 89 84 Tod m 87 84 f Chris 89 87 Janet f 86 65 ; ; RunPROC PRINT DATA=SCORE; DATA test; SET SCORE; :2 good normal bad; DATA SCORE; SET; SELECT) output good; 90when(math=) output normal; 80when(math=&math90) output bad; when(math80; end; Run=good; DATA PRINT PROC=normal; DATAPRINT PROC=bad; DATA
5、PRINTPROC :3 All; DATA good normal bad; SET=All; DATA PROC PRINT ;Run 3 【实验结果】 结果一: 结果二: 4 结果三: 5 实验二 上市公司的数据分析 【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟 悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表2是一组上市公司在2001年的每股收益(eps)、流通盘(scale)的规模以及2001年最后一个交易日的收盘价(price). 表2 某上市公司的数据表 代码 流通盘 每股收益 股票价格 13.27 000096 0.059 8500 1
6、4.2 000099 0.028 6000 7.12 12600 000150 -0.003 10.08 000151 0.026 10500 22.75 000153 0.056 2500 6.85 13000 000155 -0.009 14.95 000156 3600 0.033 12.65 000157 0.06 10000 8.38 10000 000158 0.018 12.15 7000 0.008 000159 7.31 15365 000301 0.04 13.26 000488 7700 0.101 12.33 6000 000725 0.044 22.58 0.07 0
7、00835 1338 18.29 000869 3200 0.194 12.55 000877 7800 -0.084 12.48 6000 000885 -0.073 9.12 0.031 000890 16934 7.88 12000 0.031 000892 6.91 000897 14166 0.002 8.59 000900 21423 0.058 27.95 000901 4800 0.005 10.92 6500 000902 -0.031 11.79 6000 000903 0.109 9.29 0.046 9500 000905 14.47 0.007 6650 000906
8、 8.28 0.006 8988 000908 9.99 0.002 6000 000909 8.9 0.036 000910 8000 9.01 0.067 7280 000911 8.06 0.112 15000 000912 11.86 0.062 8450 000913 14.4 4599 000915 0.001 5.15 34000 0.038 000916 16.23 11800 0.086 000917 10.12 6000 -0.045 000918 6 、对股票价格1 )计算均值、方差、标准差、变异系数、偏度、峰度;1 数,四分位极差,三均值;2)计算中位数,上、下四分位
9、3)作出直方图; )作出茎叶图;4 )进行正态性检验(正态5W检验); 相关矩阵;)计算协方差矩阵,Pearson6 Spearman)计算相关矩阵;7 8)分析各指标间的相关性。)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计12、 值及残差;,检验回归关系的显著性,检验各自变量对因变 2)给定显著性水平=0.05 量的影响的显著性;?)拟合残差关于拟合值图。分析 3QQ的残差图及残差的正态Y及XXX,X,2112 这些残差,并予以评述。SAS 【实验所使用的仪器设备与软件平台】 【实验方法与步骤】 prices; data num scale eps price; inp
10、ut; cards13.27 000096 8500 0.059 14.2 0.028 000099 6000 -0.003 7.12 000150 12600 10.08 000151 10500 0.026 22.75 000153 2500 0.056 -0.009 6.85 000155 13000 14.95 0.033 000156 3600 0.06 12.65 000157 10000 8.38 000158 10000 0.018 12.15 0.008 000159 7000 0.04 7.31 000301 15365 13.26 000488 7700 0.101 12
11、.33 000725 6000 0.044 22.58 000835 1338 0.07 18.29 0.194 000869 3200 7 -0.084 12.55 000877 7800 -0.073 12.48 000885 6000 9.12 0.031 000890 16934 7.88 000892 12000 0.031 6.91 000897 14166 0.002 8.59 000900 21423 0.058 27.95 000901 4800 0.005 -0.031 10.92 000902 6500 11.79 000903 6000 0.109 9.29 00090
12、5 9500 0.046 14.47 000906 6650 0.007 8.28 0.006 000908 8988 9.99 0.002 000909 6000 8.9 0.036 000910 8000 9.01 0.067 000911 7280 8.06 000912 15000 0.112 11.86 000913 8450 0.062 14.4 000915 4599 0.001 5.15 000916 34000 0.038 16.23 000917 11800 0.086 -0.045 10.12 000918 6000 ; run=prices; DATAPRINT PRO
13、C ; run; cvmeandata=prices var std skewness kurtosismeansproc price; var=result; outoutput; run; normalplotunivariateproc data=prices freq price; var=result2; outoutput; run; noprintdataproc capability =prices graphics ; price/normalhistogram; run; covnosimple proc corrdata=prices pearsonspearman pr
14、ice; var price; with; run =prices; datareg proc; p r=backward model price=scale eps/selectionnoint=r; rout =prices p=p output=prices; data procprint 8 run 【实验结果】 9 10 11 对于问题二结果: 12 13 14 实验三 美国50个州七种犯罪比率的数据分析 【实验目的】通过使用SAS软件对实验数据进行主成分分析和因子分析,熟 悉数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】表3给出的是美国50个州每100 000个人中
15、七种犯罪的比率数据。这七种犯罪是:Murder(杀人罪),Rape(强奸罪),Robbery(抢劫罪),Assault(斗殴罪),Burglary(夜盗罪),Larceny(偷盗罪),Auto(汽车犯罪)。 表3 美国50个州七种犯罪的比率数据 State Murder Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia Hawaii Idaho Illinois Indiana Iowa Kansas Kentucky Louisiana Maine Maryland
16、 Massachusetts Michigan Minnesota Mississippi Missouri Montana Nebraska Nevada New Hampshire New Jersey New Mexico New York North Carolina 14.2 10.8 9.5 8.8 11.5 6.3 4.2 6.0 10.2 11.7 7.2 5.5 9.9 7.4 2.3 6.6 10.1 15.5 2.4 8.0 3.1 9.3 2.7 14.3 9.6 5.4 3.9 15.8 3.2 5.6 8.8 10.7 10.6 RapeRobberyAssault
17、BurglaryLarcenyAuto280.71881.925.296.8278.31135.5753.31331.73369.851.696.8284.0439.52346.1312.34467.434.2138.2183.4203.427.683.21862.1972.6663.549.4287.02139.4358.03499.8477.142.01935.2170.73903.2292.9593.22620.716.8131.8129.51346.0467.0194.23678.424.91682.6157.0351.41859.9187.9449.13840.539.6297.91
18、40.51351.1256.52170.231.1489.43920.4128.025.51911.564.1237.619.41050.839.62599.6172.5528.62828.521.8209.0211.31085.0377.41086.226.5153.5123.22498.7219.989.8812.510.62685.141.2244.3180.51270.422.02739.3100.7245.4872.281.1123.319.11662.1337.71165.5142.9335.530.92469.9246.938.72350.71253.113.5170.0428.
19、53177.7292.1358.934.81400.01140.1169.12311.31532.2231.620.8545.53159.0261.9274.61522.738.9343.185.92559.31134.719.585.8144.41239.965.7189.119.6915.6378.4189.01318.32424.2233.528.3309.2804.939.2156.82773.216.7249.164.7760.0112.718.12316.1559.2355.0323.12453.149.14212.6293.476.02343.91041.710.723.2511
20、.51435.8185.12774.521.0180.4259.53008.61418.739.1109.6343.4745.81728.02782.029.4472.6319.1192.12037.817.061.3318.31154.1 15 Ohio North Dakota Oklahoma Oregon Pennsylvania Rhode Island South Carolina South Dakota Tennessee Texas Utah Vermont Virginia Washington West Virginia Wisconsin Wyoming 7.8 0.9
21、 8.6 4.9 5.6 3.6 11.9 2.0 10.1 13.3 3.5 1.4 9.0 4.3 6.0 2.8 5.4 400.4181.127.3190.51216.02696.8144.7446.11843.09.013.343.8326.81288.2205.02228.129.273.8388.91636.4286.9124.139.935061333.2128.0130.3877.51624.119.0791.4201.01489.510.586.52844.1245.133.01613.6485.32342.4105.9147.513.5570.517.91704.4155
22、.7314.0145.81259.729.7203.91776.5397.62988.7152.433.8208.21603.1334.5147.33004.620.368.81171.6265.22201.0101.21348.215.930.8226.7165.792.12521.223.3986.2360.31605.6106.23386.939.6224.8163.342.2597.490.913.21341.7220.72614.252.263.7846.912.9282.02772.2173.939.7811.621.9 二者的结果有何差)分别用样本协方差矩阵和样本相关矩阵作主成分
23、分析,1、1 异?对所选取的主成分给原始数据的变化可否由三个或者更少的主成分反映,2) 出合理的解释。. )计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序 3 、从样本相关矩阵出发,做因子分析。2 【实验所使用的仪器设备与软件平台】SAS 【实验方法与步骤】 crime。excel,再通过SAS导入数据至数据集首先将上述数据复制到 样本协方差矩阵做主成分分析:; covariance data=work.crime proc princomp; run 样本相关矩阵做主成分分析:=work.crime; princompdataproc run; 对第一样本主成分排序=defen;
24、 out data=crime princompproc ; run=defen; data proc sort prin1; by ; run 16 =defen; data proc print ; run 、2 程序:; =work.crime scoredataproc factor ; run 【实验结果】 17 18 19 20 21 实验四 1991年全国各省、区、市城镇居民 月平均收入的数据分析 【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉 数据分析方法,培养学生分析处理实际数据的综合能力。【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下
25、表,变量含义如下:X1-人均生活费收入(元/人);X2-人均全民所有制职工工资(元/人);X3-人均来源于全民标准工资(元/人);X4-人均集体所有制工资(元/人);X5-人均集体职工标准工资(元/人);X6-人均各种奖金及超额工资(元/人);X7-人均各种津贴(元/人);X8-职工人均从工作单位得到的其他收入(元/人);X9-个体劳动者收入(元/人)。 省(区市)类x1 x2 x3 x4 x5 x6 x7 x8 x9 型名 0.41 4.49 26.8 16.44 11.9 8.38 110.2 170.03 北京 1 59.76 1.05 21.3 12.36 9.21 9.33 82.5
26、8 141.55 天津 1 50.98 13.4 0.7 17.3 11.79 12 7.52 119.4 1 河北 83.33 53.39 11 0.16 31 11.8 15.6 194.53 1 上海 107.8 60.24 21.01 8.88 0.47 20.61 9.61 1 130.46 86.21 山东 15.9 52.3 12.14 10.5 0.51 13.87 1 119.29 湖北 85.41 16.47 53.02 13.1 8.44 8.38 4.56 1 134.46 21.49 广西 98.61 48.18 26.12 8.9 4.34 13.6 3.82 45
27、.6 6.3 11.8 1.56 29.49 18.67 1 143.79 99.97 海南1021 四川 13.9 14.5 9.62 10.18 1 74.96 128.05 50.13 16.14 0.9 5.87 21.2 19.41 1 12.6 127.41 93.54 50.57 云南 10.5 4.62 3.86 1 18.96 122.96 101.4 69.7 新疆 11.3 6.3 5.62 0.61 2 13.12 102.49 71.72 山西 7.9 47.72 9.42 6.96 6.66 0.96 46.19 9.655 9.65 内蒙古 20.1 6.27 6
28、.97 2 106.14 76.27 1.68 44.6 吉林 13.7 6.65 9.01 2 104.93 20.61 72.99 9.435 2.68 7.41 6.45 2 103.34 8.342 62.99 42.95 黑龙江 11.1 10.19 1.08 10.59 98.089 11.4 69.45 43.04 江西 7.69 7.95 16.5 2 1.11 72.23 47.31 8.3 河南 9.48 10.43 2 104.12 6.43 13.14 2.85 3.42 13.69 16.53 6.06 2 108.49 80.79 47.52 贵州8.37 1.27
29、 12.94 2 6.77 113.99 75.6 50.88 陕西 5.21 3.86 9.492 1.19 2 114.06 16.43 甘肃84.31 52.78 7.81 5.44 3.79 10.82 0.83 8.371 18.98 5.95 7.27 108.8 2 80.41 50.45 4.07 青海 0.97 22.65 8.81 2 115.96 88.21 宁夏5.63 51.85 13.95 4.75 1.41 3 128.46 辽宁68.91 22.4 43.41 15.3 9.01 13.88 12.42 1.19 13.9 9.661 23.9 15.2 135.24 3 73.18 江苏44.54 22.38 3.47 24.3 13.9 3 浙江162.53 80.11 45.99 29.54 10.9 13 22 0.63 71.07 9.698 7.02 43.64 19.4 12.5 16.68 111.77 安徽 3 3.08 79.09 44.19 16.47 18.5 7.67 10.5 福建 3 139.09 20.23 1.76 84.66 10.3 44.05 湖南 7.47 3 13.
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1