完整word版数据分析实验报告分析解析.docx

上传人:b****3 文档编号:27130496 上传时间:2023-06-27 格式:DOCX 页数:41 大小:776KB
下载 相关 举报
完整word版数据分析实验报告分析解析.docx_第1页
第1页 / 共41页
完整word版数据分析实验报告分析解析.docx_第2页
第2页 / 共41页
完整word版数据分析实验报告分析解析.docx_第3页
第3页 / 共41页
完整word版数据分析实验报告分析解析.docx_第4页
第4页 / 共41页
完整word版数据分析实验报告分析解析.docx_第5页
第5页 / 共41页
点击查看更多>>
下载资源
资源描述

完整word版数据分析实验报告分析解析.docx

《完整word版数据分析实验报告分析解析.docx》由会员分享,可在线阅读,更多相关《完整word版数据分析实验报告分析解析.docx(41页珍藏版)》请在冰豆网上搜索。

完整word版数据分析实验报告分析解析.docx

完整word版数据分析实验报告分析解析

实验课程:

数据分析

信息与计算科学业:

级:

号:

姓名:

中北大学理学院.

实验一SAS系统的使用

【实验目的】

了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。

【实验内容】

1.将SCORE数据集的内容复制到一个临时数据集test。

SCORE数据集

EnglishMathSexChineseName

9190f85Alice

95Tomm8784

9390Jennyf83

808580Mikem

848589mFred

9783f82Kate

92Alex90m91

75Cookm7876

82fBennie7984

85Hellenf7484

9082Winceletf87

77Buttm8179

8685Geogem82

89Todm8484

89Chrisf8487

8665f

87

Janet

math的高低拆分到3个不同的数据集:

SCORE2.将数据集中的记录按照math大于等于90的到good数据集,math在80到89之间的到normal数据集,math在80以下的到bad数据集。

3.将3题中得到的good,normal,bad数据集合并。

【实验所使用的仪器设备与软件平台】SAS

【实验方法与步骤】

1:

DATASCORE;

INPUTNAME$Sex$MathChineseEnglish;

CARDS;

2

9185Alicef90

84Tomm9587

83f9390Jenny

808085Mikem

8985mFred84

8283Katef97

91Alexm9290

76Cookm7875

848279fBennie

8474Hellenf85

8782Winceletf90

79Buttm7781

82m8685Geoge

848984Todm

8784fChris89

87

Janetf8665

;

;

RunPROCPRINTDATA=SCORE;

DATAtest;

SETSCORE;

2goodnormalbad;DATASCORE;SET;

SELECT)outputgood;

90when(math>=)outputnormal;80when(math>=&math<90)outputbad;when(math<80;end;

Run=good;DATAPRINTPROC=normal;DATAPRINTPROC=bad;

DATAPRINTPROC

3All;

DATAgoodnormalbad;SET=All;DATAPROCPRINT;Run

3

【实验结果】

结果一:

结果二:

4

结果三:

5

实验二上市公司的数据分析

【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。

【实验内容】表2是一组上市公司在2001年的每股收益(eps)、流通盘(scale)的规模以及2001年最后一个交易日的收盘价(price).

表2某上市公司的数据表

代码流通盘每股收益股票价格

13.270000960.0598500

14.20000990.0286000

7.1212600000150-0.003

10.080001510.02610500

22.750001530.0562500

6.8513000000155-0.009

14.9500015636000.033

12.650001570.0610000

8.38100000001580.018

12.1570000.008000159

7.31153650003010.04

13.2600048877000.101

12.3360000007250.044

22.580.070008351338

18.2900086932000.194

12.550008777800-0.084

12.486000000885-0.073

9.120.03100089016934

7.88120000.031000892

6.91000897141660.002

8.59000900214230.058

27.9500090148000.005

10.926500000902-0.031

11.7960000009030.109

9.290.0469500000905

14.470.0076650000906

8.280.0068988000908

9.990.0026000000909

8.90.0360009108000

9.010.0677280000911

8.060.11215000000912

11.860.0628450000913

14.445990009150.001

5.15340000.038000916

16.23118000.086000917

10.12

6000

-0.045

000918

6

、对股票价格1)计算均值、方差、标准差、变异系数、偏度、峰度;1数,四分位极差,三均值;2)计算中位数,上、下四分位3)作出直方图;)作出茎叶图;4)进行正态性检验(正态5W检验);相关矩阵;)计算协方差矩阵,Pearson6Spearman)计算相关矩阵;78)分析各指标间的相关性。

)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计12、值及残差;,检验回归关系的显著性,检验各自变量对因变2)给定显著性水平α=0.05量的影响的显著性;?

)拟合残差关于拟合值图。

分析3QQ的残差图及残差的正态Y及XXX,X,2112这些残差,并予以评述。

SAS【实验所使用的仪器设备与软件平台】【实验方法与步骤】prices;

datanumscaleepsprice;input;cards13.2700009685000.059

14.2

0.0280000996000

-0.0037.1200015012600

10.08000151105000.026

22.7500015325000.056

-0.0096.8500015513000

14.95

0.0330001563600

0.0612.65

00015710000

8.38

000158100000.018

12.15

0.0080001597000

0.04

7.31

00030115365

13.2600048877000.101

12.3300072560000.044

22.58

00083513380.07

18.29

0.1940008693200

7

-0.08412.550008777800

-0.07312.48

0008856000

9.120.03100089016934

7.88000892120000.031

6.91000897141660.002

8.59000900214230.058

27.9500090148000.005

-0.03110.920009026500

11.7900090360000.109

9.2900090595000.046

14.4700090666500.007

8.280.0060009088988

9.990.0020009096000

8.90.0360009108000

9.010.0670009117280

8.06

000912150000.112

11.8600091384500.062

14.4

0009154599

0.001

5.15000916340000.038

16.23000917118000.086

-0.04510.12

0009186000

;

run=prices;DATAPRINTPROC

;

run;cvmeandata=pricesvarstdskewnesskurtosismeansproc

price;

var=result;outoutput;

run;normalplotunivariateprocdata=pricesfreq

price;

var=result2;outoutput;

run;noprintdataproccapability=pricesgraphics

;price/normalhistogram;

run;covnosimpleproccorrdata=pricespearsonspearmanprice;varprice;with;run

=prices;

dataregproc;pr=backwardmodelprice=scaleeps/selectionnoint=r;rout=pricesp=poutput=prices;

dataprocprint8

run

【实验结果】

9

10

11

对于问题二结果:

12

13

14

实验三美国50个州七种犯罪比率的数据分析

【实验目的】通过使用SAS软件对实验数据进行主成分分析和因子分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。

【实验内容】表3给出的是美国50个州每100000个人中七种犯罪的比率数据。

这七种犯罪是:

Murder(杀人罪),Rape(强奸罪),Robbery(抢劫罪),Assault(斗殴罪),Burglary(夜盗罪),Larceny(偷盗罪),Auto(汽车犯罪)。

表3美国50个州七种犯罪的比率数据

State

Murder

AlabamaAlaskaArizonaArkansasCaliforniaColoradoConnecticutDelawareFloridaGeorgiaHawaiiIdahoIllinoisIndianaIowaKansasKentuckyLouisianaMaineMarylandMassachusettsMichiganMinnesotaMississippiMissouriMontanaNebraskaNevadaNewHampshireNewJerseyNewMexicoNewYorkNorthCarolina

14.210.89.58.811.56.34.26.010.211.77.25.59.97.42.36.610.115.52.48.03.19.32.714.39.65.43.915.83.25.68.810.710.6

RapeRobberyAssaultBurglaryLarcenyAuto280.71881.925.296.8278.31135.5

753.31331.73369.851.696.8284.0

439.52346.1312.34467.434.2138.2

183.4203.427.683.21862.1972.6663.549.4287.02139.4358.03499.8477.142.01935.2170.73903.2292.9

593.22620.716.8131.8129.51346.0

467.0194.23678.424.91682.6157.0

351.41859.9187.9449.13840.539.6

297.9140.51351.1256.52170.231.1

489.43920.4128.025.51911.564.1237.619.41050.839.62599.6172.5528.62828.521.8209.0211.31085.0377.41086.226.5153.5123.22498.7219.989.8812.510.62685.141.2

244.3180.51270.422.02739.3100.7

245.4872.281.1123.319.11662.1

337.71165.5142.9335.530.92469.9

246.938.72350.71253.113.5170.0

428.53177.7292.1358.934.81400.0

1140.1169.12311.31532.2231.620.8

545.53159.0261.9274.61522.738.9

343.185.92559.31134.719.585.8

144.41239.965.7189.119.6915.6

378.4189.01318.32424.2233.528.3

309.2804.939.2156.82773.216.7

249.164.7760.0112.718.12316.1

559.2355.0323.12453.149.14212.6

293.476.02343.91041.710.723.2

511.51435.8185.12774.521.0180.4

259.53008.61418.739.1109.6343.4

745.81728.02782.029.4472.6319.1

192.1

2037.817.0

61.3

318.3

1154.1

15

OhioNorthDakotaOklahomaOregonPennsylvaniaRhodeIslandSouthCarolinaSouthDakotaTennesseeTexasUtahVermontVirginiaWashingtonWestVirginiaWisconsinWyoming

7.80.98.64.95.63.611.92.010.113.33.51.49.04.36.02.85.4

400.4181.127.3190.51216.02696.8

144.7446.11843.09.013.343.8

326.81288.2205.02228.129.273.8

388.91636.4286.9124.139.935061

333.2128.0130.3877.51624.119.0

791.4201.01489.510.586.52844.1

245.133.01613.6485.32342.4105.9

147.513.5570.517.91704.4155.7

314.0145.81259.729.7203.91776.5397.62988.7152.433.8208.21603.1334.5147.33004.620.368.81171.6

265.22201.0101.21348.215.930.8

226.7165.792.12521.223.3986.2

360.31605.6106.23386.939.6224.8

163.342.2597.490.913.21341.7

220.72614.252.263.7846.912.9

282.0

2772.2173.939.7

811.6

21.9

二者的结果有何差)分别用样本协方差矩阵和样本相关矩阵作主成分分析,1、1异?

对所选取的主成分给原始数据的变化可否由三个或者更少的主成分反映,2)

出合理的解释。

.)计算从样本相关矩阵出发计算的第一样本主成分的得分并予以排序3

、从样本相关矩阵出发,做因子分析。

2【实验所使用的仪器设备与软件平台】SAS【实验方法与步骤】crime。

excel,再通过SAS导入数据至数据集首先将上述数据复制到

样本协方差矩阵做主成分分析:

;covariancedata=work.crimeprocprincomp;

run样本相关矩阵做主成分分析:

=work.crime;

princompdataproc

run;

对第一样本主成分排序=defen;outdata=crimeprincompproc

;

run=defen;dataprocsortprin1;by

;

run

16

=defen;dataprocprint

;

run

、2程序:

;=work.crimescoredataprocfactor

;

run

【实验结果】

17

18

19

20

21

实验四1991年全国各省、区、市城镇居民

月平均收入的数据分析

【实验目的】通过使用SAS软件对实验数据进行判别分析和聚类分析,熟悉数据分析方法,培养学生分析处理实际数据的综合能力。

【实验内容】1991年全国各省、区、市城镇居民月平均收入情况见下表,变量含义如下:

X1-人均生活费收入(元/人);X2-人均全民所有制职工工资(元/人);X3-人均来源于全民标准工资(元/人);X4-人均集体所有制工资(元/人);X5-人均集体职工标准工资(元/人);X6-人均各种奖金及超额工资(元/人);X7-人均各种津贴(元/人);X8-职工人均从工作单位得到的其他收入(元/人);X9-个体劳动者收入(元/人)。

省(区\市)类x1x2x3x4x5x6x7x8x9型名

0.414.4926.816.4411.98.38110.2170.03北京159.76

1.0521.312.369.219.3382.58141.55天津150.9813.4

0.717.311.79127.52119.41河北83.3353.3911

0.163111.815.6194.531上海107.860.2421.018.88

0.4720.619.611130.4686.21山东15.952.312.1410.5

0.5113.871119.29湖北85.4116.4753.0213.18.448.38

4.561134.4621.49广西98.6148.1826.128.94.3413.6

3.8245.66.311.81.5629.4918.671143.7999.97海南1021四川13.914.59.6210.18174.96128.0550.1316.14

0.95.8721.219.41112.6127.4193.5450.57云南10.5

4.623.86118.96122.96101.469.7新疆11.36.35.62

0.61213.12102.4971.72山西7.947.729.426.966.66

0.9646.199.6559.65内蒙古20.16.276.972106.1476.27

1.6844.6吉林13.76.659.012104.9320.6172.999.435

2.687.416.452103.348.34262.9942.95黑龙江11.110.19

1.0810.5998.08911.469.4543.04江西7.697.9516.52

1.1172.2347.318.3河南9.4810.432104.126.4313.14

2.853.4213.6916.536.062108.4980.7947.52贵州8.37

1.2712.9426.77113.9975.650.88陕西5.213.869.492

1.192114.0616.43甘肃84.3152.787.815.443.7910.82

0.838.37118.985.957.27108.8280.4150.454.07青海

0.9722.658.812115.9688.21宁夏5.6351.8513.954.75

1.413128.46辽宁68.9122.443.4115.39.0113.8812.42

1.1913.99.66123.915.2135.24373.18江苏44.5422.38

3.47

24.3

13.9

3

浙江162.53

80.11

45.99

29.54

10.9

13

22

0.6371.079.6987.0243.6419.412.516.68111.77安徽3

3.0879.0944.1916.4718.57.6710.5福建3139.0920.23

1.7684.6610.344.05湖南7.47313.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 动物植物

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1