数据分析实验二.docx

上传人:b****8 文档编号:9927343 上传时间:2023-02-07 格式:DOCX 页数:16 大小:82.64KB
下载 相关 举报
数据分析实验二.docx_第1页
第1页 / 共16页
数据分析实验二.docx_第2页
第2页 / 共16页
数据分析实验二.docx_第3页
第3页 / 共16页
数据分析实验二.docx_第4页
第4页 / 共16页
数据分析实验二.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

数据分析实验二.docx

《数据分析实验二.docx》由会员分享,可在线阅读,更多相关《数据分析实验二.docx(16页珍藏版)》请在冰豆网上搜索。

数据分析实验二.docx

数据分析实验二

中北大学理学院

实验报告

实验课程:

数据分析

专业:

信息与计算科学

班级:

13080241

学号:

1308024121

姓名:

徐可

中北大学理学院

实验二上市公司的数据分析

【实验目的】通过使用SAS软件对实验数据进行描述性分析和回归分析,熟悉数

据分析方法,培养学生分析处理实际数据的综合能力。

【实验内容】

表2是

」组上市公司在

2001年的每股收益

(eps)、流通盘(scale)

的规模以及2001年最后一个交易日的收盘价(price).

表2某上市公司的数据表

代码

流通盘

每股收益

股票价格

000096

8500

0.059

13.27

000099

6000

0.028

14.2

000150

12600

-0.003

7.12

000151

10500

0.026

10.08

000153

2500

0.056

22.75

000155

13000

-0.009

6.85

000156

3600

0.033

14.95

000157

10000

0.06

12.65

000158

10000

0.018

8.38

000159

7000

0.008

12.15

000301

15365

0.04

7.31

000488

7700

0.101

13.26

000725

6000

0.044

12.33

000835

1338

0.07

22.58

000869

3200

0.194

18.29

000877

7800

-0.084

12.55

000885

6000

-0.073

12.48

000890

16934

0.031

9.12

000892

12000

0.031

7.88

000897

14166

0.002

6.91

000900

21423

0.058

8.59

000901

4800

0.005

27.95

000902

6500

-0.031

10.92

000903

6000

0.109

11.79

000905

9500

0.046

9.29

000906

6650

0.007

14.47

000908

8988

0.006

8.28

000909

6000

0.002

9.99

000910

8000

0.036

8.9

000911

7280

0.067

9.01

000912

15000

0.112

8.06

000913

8450

0.062

11.86

000915

4599

0.001

14.4

000916

34000

0.038

5.15

000917

11800

0.086

16.23

1、对股票价格

1)计算均值、方差、标准差、变异系数、偏度、峰度;

2)计算中位数,上、下四分位数,四分位极差,三均值;

3)作出直方图;

4)作出茎叶图;

5)进行正态性检验(正态W检验);

6)计算协方差矩阵,Pearson相关矩阵;

7)计算Spearman相关矩阵;

8)分析各指标间的相关性。

2、1)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计值及残差;

2)给定显著性水平a=0.05,检验回归关系的显著性,检验各自变量对因变量的影响的显著性;

3)拟合残差关于拟合值Y?

X1,X2及X^2的残差图及残差的正态QQ图。

分析这些残差,并予以评述。

【实验所使用的仪器设备与软件平台】

SAS软件计算机

【实验方法与步骤】(阐述实验的原理、方案、方法及完成实验的具体步骤等,附上自己编写的程序)

dataprices;

inputnumscaleepsprice;cards;

0000968500

0.059

13.27

0000996000

0.028

14.2

00015012600

-0.0037.12

00015110500

0.026

10.08

0001532500

0.056

22.75

00015513000

-0.0096.85

0001563600

0.033

14.95

00015710000

0.06

12.65

00015810000

0.018

8.38

0001597000

0.008

12.15

00030115365

0.04

7.31

0004887700

0.101

13.26

0007256000

0.044

12.33

0008351338

0.07

22.58

0008693200

0.194

18.29

0008777800

-0.08412.55

0008856000

-0.07312.48

00089016934

0.031

9.12

00089212000

0.031

7.88

00089714166

0.002

6.91

00090021423

0.058

8.59

0009014800

0.005

27.95

0009026500

-0.031

10.92

0009036000

0.109

11.79

0009059500

0.046

9.29

0009066650

0.007

14.47

0009088988

0.006

8.28

0009096000

0.002

9.99

0009108000

0.036

8.9

0009117280

0.067

9.01

00091215000

0.112

8.06

0009138450

0.062

11.86

0009154599

0.001

14.4

00091634000

0.038

5.15

00091711800

0.086

16.23

0009186000

-0.04510.12

run;

PROCPRINTDATAprices;

run;

procmeansdata=pricesmeanvarstdskewnesskurtosiscv;varprice;

outputout=result;

run;

procunivariatedata=pricesplotfreqnormal;

varprice;

outputout=result2;

run;

proccapabilitydata=pricesgraphicsnoprint;

histogramprice/normal;

run;

proccorrdata=pricespearsonspearmancovnosimple;

varpriceepsscale;

withpriceepsscale;

run;

procregdata=prices;

modelprice=scaleeps/selection=backwardnointpr;

outputout=pricesp=pr=r;procprintdata=prices;

run;

procgplotdata=prices;

plotscale*r=1eps*r=2price*r=3;

run;

proccapabilitydata=pricesgraphics;

qqplotr/noemal;

run;

【实验结果】

1.

1)计算均值、方差、标准差、变异系数、偏度、峰度;

SAS幼花年05月25日星期三上牛朋时甘分■抽孙

MEANSPROCEDURE

分析Sfi:

price

均值方差标淮差偏度111皐度娈异系数

11.847777823.76751494.87519381.51603022.720592940.8041891

2)计算中位数,上、下四分位数,四分位极差,三均值

3)作出直方图

price

Curve:

庇nfial®i=1L948Sigffia=48752)

4)作出茎叶图;

茎叶

2ECi旺

It

1

£4

2268

2

20

1C3

1

162

1

142450

4

122356693

7

10011989

8

819489018

8

B68199

5

G891395

421

++4+

5)进行正态性检验(正态W检验);

由上图可知W=0.872266

正态性检验(一般取0.10)

1.W检验:

p=0.006〉=0.05故拒绝原假设认为样本数据不是来自正态总体。

2.Kolmogorov-Smirnov检验:

p=0.0615〉=0.10故拒绝原假设认为样本数据

不是来自正态总体。

3.Anderson-Darling检验:

p=0.00500.10故拒绝原假设认为样本数据不

是来自正态总体。

4.Cramer-von检验:

p=0.0050=0.10故拒绝原假设认为样本数据不是来自

正态总体。

6)计算协方差矩阵,Pearson相关矩阵;

协方差矩阵:

CovarianceMatrix,DF-95

price

eps

sea1e

price

23.77

0.05

-1B186.60

eps

0,05

0,00

4,39

scale

-1A1SA.80

4.38

36215622.48

Pearson相关矩阵:

PeftrsonCorrelat

Prob>|r

ionCoefficients,

1underHO:

Rho=0

M=3S

price

scale

priice

1.00000

0.18780

0,2725

-0.82028

<,OOC1

eps

0JB790

0.2725

1.00000

0.01300

0.9859

scale

-D-62D29

0.01390

1.00000

<-00010)359

7)计算Spearman相关矩阵;

SpearmanCorrelationCoefficients,M=36

Prob>lr|

price

underHO:

Rho=0

eps

scale

price

L0OQQ0

0.208500.239S

-0.7BOEB

<.0001

eps

0.20350

0.2839

1.00000

0.03180

0.8539

seaIIe

-0.76858

C0001

0.03180

0.B599

1.00000

8)分析各指标间的相关性

通过Pearson相关矩阵,Spearman相关矩阵的结果可以看出price与eps,eps于scale不相关。

2.

1)对股票价格,拟合流通盘和每股收益的线性回归模型,求出回归参数估计值

及残差;

y二一:

0「1召「2^2「3冷」i,i=1,2,…,36,其中;i相互独立,均服从正态分布N(0,二2).

参数估计值如图;其中r列为残差

Obs

num

scale

eps

price

p

r

p2

r2

1

9S

SbOC

0.059

13.27

9.0345

4.2355

9.0345

4,2355

2

99

6000

0.028

U.20

5,4525

8,7474

5.4526

8,7474

3

150

12600

-0,008

7J2

7,2682

-0,1432

7.2692

-0,1432

4

151

10500

0.026

io.oa

7,9887

2,0963

7,8897

2.08S9

5

153

2500

0.056

22.75

5.2758

17.4742

6.2758

II7.4?

42

e

156

13000

-0.009

7.093?

-0.2437

7.093?

-0*2437

7

156

3600

0.033

14.95

4.38S!

10.EB00

1.3692

10.6009

8

157

10000

0』冊

忆飾

9.9911

2.6539

9.9S11

2.GE89

9

153

10000

0.013

7J454

L2346

7.1454

1.234G

10

159

7000

12.15

4.S901

7.4539

4*6901

7.4599

11

301

153B5

0.040

7.31

1L6152

-4.5052

1LS152

-4,5052

12

438

7700

OJU

13,2S

IL4082

1.8538

11.40B2

1.8535

13

725

eoQC

0,044

12.83

6,5367

5J933

S.53S7

5.7333

14

835

1338

0.C70

22,58

5,5357

17.0449

5,5357

17,0443

15

320C

0.194

18,29

15.0408

3.2492

16.0400

8,2492

IB

877

780C

-O.OS4

12.56

-1.08^

13.61S3

-1.0693

119.8199

17

885

帥00

-0.073

12.48

<1.3907

13.6707

■1.9907

13.8707

18

690

16934

0*031

S.12

12.1352

-3.0152

12.1852

-3.0152

19

892

12000

0.031

7.93

9.2114

-1.3314

9.2114

-1.3314

20

897

I41BB

0.002

6.91

3.5300

-1.B2Q0

E'+53〔iU

-KE2U0

21

21423

0.053

G.59

IB.6246

-3.0346

15.6246

-9.0346

22

4800

0.005

27.95

3,1832

£4.76S3

3.188:

2

24.7660

23

302

8500

-0,031

10.92

1.7514

9J68S

1.7514

9.1880

24

903

E000

0JC3

11.79

10,9408

0,8492

10.9406

25

905

9500

0.C4S

8.29

8.7463

0.6437

BJ463

0,5437

26

906

6S50

Q.007

14.47

4.4149

10.0561

4.414S

110,0551

27

90S

胡铀

0.006

6.28

6J32S

2.5474

5.7326

2.5474

28

909

EMO

3.99

3.B910

6.2990

3*6910

6.2990

29

910

6000

0,036

e.ao

7J798

L7202

7.1798

1.7202

30

911

7280

o.oe?

S.01

S.S536

0.1S64

3.S53B

0.15S4

31

912

15000

0J12

e.os

IS.4773

-9.4173

IS.4773

-8,4173

32

913

8450

0.062

11.88

9.2081

2.6&19

9.£081

2.6519

33

915

4699

0,001

14.40

2.78S0

11.eO?

Q

2.7830

11.6070

34

91S

34O0C

0,038

5.15

22,7224

-17,5724

22.7224

*117,5724

35

$17

1180C

0.086

16,28

12,8194

3.4108

i2,eia4

L410B

as

91S

GOOO

-Q.C45

10.12

0.5065

O.50S5

TheSASSystem

20IE年朋月D4日星期六下工0

2)给定显著性水平的影响的显著性;

a=0.05,检验回归关系的显著性,检验各自变量对因变量

¥&riabIe

Parameter

EstImaie

Standard

Error

TypeIISS

FValue

Pr>F

seals

0.000692G8

0.00015511

123L53619

14,60

0.0006

ep^

87.75G87

28.17249

4fi8,06?

0l

0.021S

Boundsonconditionnumber:

1.2727,5.0907

从图中可以看出

1.流通盘(scale)p=0.0005「亠0.05拒绝原假设认为股票价格(price)与流

通盘(scale)之间存在显著的显著回归关系

2.每股收益(eps)p=0.0218=0.05拒绝原假设认为股票价格(price)与每股

收益(eps)之间存在显著的显著回归关系

3)拟合残差关于拟合值Y?

X1,X2及X^2的残差图及残差的正态QC图。

分析这些残差,并予以评述。

正态QQ图:

2Q-

110一

Q—-13-切-

hlorniBI'QuantiIos

Y?

Xi的残差图

pfl-CC

30」

20-

10-

-2g

-10

Y,X2的残差图

即w

0.IB1

a14:

a.io:

Q.06:

a06i0加

Q.02:

a阿■0.02:

a04=Q亦aE

Y?

X1X2的残差图

1<1

20

Residual

4

+

Residua.I

70

 

price

30-

20-

-凶-KJ0192

Residual

 

从图中可以得出:

1.正态QQ图中散点图是弯曲的,在一条直线的下方,可认为数据不是来自正态分布总体,且样本的偏度为正。

2.残差图中数据偏离0轴的距离比较大,数据比较分散。

【实验原理】

1.preason相关系数

当口=0时,称变量X,Y的观测数据是不相关的,当0pLyp1时,称变量X,Y

的观测数据是线性正相关的,当-1pqp0时,称变量X,Y的观测数据是线

性负相关的。

当rxy=1时,称变量X,Y的观测数据是完全线性相关的。

2.为了检验丫与X!

X2,LXp-!

之间是否存在显著的线性回归关系,即检验假设

H°:

b=b2=L=bp-!

=0H1:

至少有某个bi0

我们构造了检验统计量。

通过SAS系统PROCREG±程得到检验结果,通过方差分析结果中的P值来拒绝原假设(即在显著性水平a下,认为丫与X1,X2,LXp-1之间存在显著的线性回归关系)或者接受原假设(即在显著

性水平a下,认为丫与X1,X2,LXp-1之间线性回归关系不显著)

【结果分析与讨论】

通过此次的实验,我学会了使用SAS的基本操作,对实验操作也越来越熟练,此次试验,通过线性回归分析,我们可以得出每股收益,流通盘和收盘价三者之间存在线性回归关系,但是通过正态检验和正态QQ可以知道样本数据不是来自正态总体的,数据的偏度为正,数据整体是偏向右边的,峰度为正可得出样本总体分布中极端数值分布范围较广,又通过学生化残差可知残差较大的可疑点所占的比例不大,所以通过线性回归建立的模型是可行的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1