多元统计分析实验报告.docx

上传人:b****4 文档编号:24445355 上传时间:2023-05-27 格式:DOCX 页数:16 大小:204.60KB
下载 相关 举报
多元统计分析实验报告.docx_第1页
第1页 / 共16页
多元统计分析实验报告.docx_第2页
第2页 / 共16页
多元统计分析实验报告.docx_第3页
第3页 / 共16页
多元统计分析实验报告.docx_第4页
第4页 / 共16页
多元统计分析实验报告.docx_第5页
第5页 / 共16页
点击查看更多>>
下载资源
资源描述

多元统计分析实验报告.docx

《多元统计分析实验报告.docx》由会员分享,可在线阅读,更多相关《多元统计分析实验报告.docx(16页珍藏版)》请在冰豆网上搜索。

多元统计分析实验报告.docx

多元统计分析实验报告

 

《应用多元统计分析》

课程实验报告

 

项目名称:

数据分析

学生姓名:

辛岩

学生学号:

3108010664

指导教师:

邓志民

完成日期:

2011年4月28日

 

一、引言

数据说明

1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金绩效平价规则》。

其中,竞争性工商业指标体系包括下面八大基本指标:

净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率。

所以我们借助这一指标体系对我国上市公司的运营情况进行分析,数据来自35家上市公司2000年年报数据,这35家上市公司分别来自电力、煤气及水的生产和供应业,房地产业,信息技术业。

二、数据分析

1.散点图分析

散点图可以很直观的看出两个变量之间的关系,所以为了大致了解这8个指标体系之间存在的关系,可以对35家公司的8个指标体系的数据做散点图,如图1所示。

图18个指标体系间的散点图

从图1中可以明显的看出净资产收益率与总资产收益率之间有近似的线性关系,而且也是显而易见,净资产收益率增加了则总资产收益率必然会增加。

而其他的变量之间则基本看不出来有什么关系。

2.箱线图分析

箱线图是利用数据中的五个统计量:

最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息。

还可以直观明了地识别出数据中的异常值。

对数据做箱线图,如图2所示。

 

图28个指标体系的箱线图

 

从图中我们可以看到总资产周转率和流动资产周转率两个指标的箱线图由于过小而无法看清楚,是因为这两个指标的取值过小而引起的,我们可以将这两个取值相对较小的指标单独做一次箱线图,如图3所示。

 

图3总资产周转率和流动资产周转率箱线图

 

从图2、图3我们就可以看出:

净资产收益率的数据还算比较集中,但是分布不是很均匀,还有1个温和的异常值;

总资产收益率的数据相对比较集中,有2个温和的异常值;

资产负债率的数据分布不是太集中,而且数据分布的也不均匀,可以看到中位数偏小,但没有异常值;

总资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值和1个极端异常值;

流动资产周转率的数据不是很集中,分布也不均匀,有2个温和的异常值;

已获利息倍数的数据分布不均匀,中位数偏小,有2个温和异常值;

销售增长率的数据分布相对来说比较均匀,且没有异常值;

资本积累率的数据分布很不均匀,中位数偏小,有2个温和的异常值和1个极端异常值。

 

3.正态性检验

用SPSS对这8个指标进行正态性检验,得到数据表1。

 

TestsofNormality

Kolmogorov-Smirnova

Shapiro-Wilk

Statistic

df

Sig.

Statistic

df

Sig.

净资产收益率%

.152

35

.039

.944

35

.077

总资产报酬率%

.137

35

.095

.942

35

.064

资产负债率%

.144

35

.065

.939

35

.052

总资产周转率

.235

35

.000

.683

35

.000

流动资产周转率

.159

35

.026

.850

35

.000

已获利息倍数

.172

35

.011

.880

35

.001

销售增长率%

.116

35

.200*

.982

35

.836

资本积累率%

.252

35

.000

.695

35

.000

a.LillieforsSignificanceCorrection

*.Thisisalowerboundofthetruesignificance.

表1正态性检验

我们可以看到表中给出了两种检验方法的数据,一种是KolmogorovSmirnov检验方法,另一种是Shapiro-Wilk检验方法。

SPSS规定:

当样本量

时,结果以Shapiro-Wilk检验为准,当样本量

时,结果以KolmogorovSmirnov检验为准,因为这里的样本量

,所以结果以Shapiro-Wilk检验为准。

的条件下,总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的p值(Sig值)小于

也就是我们可以以

的把握说净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布,而总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布。

我们也可以从指标数据的直方图中很直观的看出来是否服从正态分布,在这就以销售增长率、资本积累率这两个指标的直方图为例看一看,如图4、图5所示。

从图中我们可以看到销售增长率的直方图呈中间多、两头少,跟正态分布的曲线很接近,可以认为近似服从正态分布;而资本累计率的直方图我们可以看到跟正态分布的曲线完全没联系,就可以认为不服从正态分布。

图4销售增长率的直方图

 

图5资本积累率的直方图

4.描述性统计量

4.1均值向量

通过均值向量可以了解到每个指标的平均取值情况,进一步了解这些企业的平均发展状况。

在这我们了计算了信息技术行业当中的每个指标的平均值,如表2所示。

DescriptiveStatistics

N

Mean

净资产收益率%

9

13.3898

总资产报酬率%

9

8.7911

资产负债率%

9

46.8900

总资产周转率

9

.8911

流动资产周转率

9

1.1756

已获利息倍数

9

8.4744

销售增长率%

9

44.2956

资本积累率%

9

24.5311

ValidN(listwise)

9

表2信息技术行业的均值向量

我们从表中的数据可以看到,信息技术行业中一共有9家公司,其每个指标的均值分别为:

净资产收益率:

13.3898%、总资产报酬率:

8.7911%、资产负债率:

46.89%、总资产周转率:

89.11%、流动资产周转率:

117.56%、已获利息倍数:

8.4744、销售增长率:

44.2956%、资本累计率:

24.5311%;

其中流动资产周转率平均达到了117.56%,说明信息技术行业中的企业流动资产的周转速度是相当快的,而销售增长率也达到了44.2956%,说明信息技术行业中的企业的整体经营状况都很好,而且市场占有能力也很强。

4.2协差阵

协方差用于衡量两个变量的总体误差,如果说两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值,另外一个却小于自身的期望值,则这两个变量之间的协方差就是负值;若两个变量是相互独立的,则协方差就是0。

表3中就计算了8个变量,每两个变量之间的的协方差,组成一个矩阵,称为协方差阵,简称协差阵。

 

净资产收益率%

总资产报酬率%

资产负债率%

总资产周转率

流动资产周转率

已获利息倍数%

销售增长率%

资本累计率%

净资产收益率%

51.833

26.589

57.937

4.925

4.756

1.882

184.536

100.574

总资产报酬率%

26.589

15.070

2.919

2.290

2.577

3.935

89.114

40.536

资产负债率%

57.937

22.919

192.867

3.589

3.081

-42.103

178.892

-39.183

总资产周转率

4.295

2.290

3.589

0.454

0.514

-0.027

10.023

6.018

流动资产周转率

4.756

2.577

3.081

0.514

0.616

0.367

11.456

8.188

已获利息倍数%

1.882

3.935

-42.103

-0.027

0.367

21.333

59.002

72.438

销售增长率%

184.536

89.114

178.892

10.023

11.456

59.002

1223.792

771.603

销售增长率%

100.574

40.536

-39.183

6.018

8.188

72.438

771.603

868.694

表3协差阵

从表3的数据中我们可以看到,协差阵就是一个对角矩阵,因为A、B的协方差和B、A的协方差显然是相等的。

我们可以看到有3组指标之间的协方差是负的,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标之间的协方差,可以初步说明这3组指标变量之间的变化趋势是相反的。

这也复合经济意义,负债率提高了,则获得的利息、销售额必然会减少。

4.3相关系数矩阵

相关系数是衡量两个变量之间相关程度的指标,样本相关系数用

表示,其取值范围是

值越大,说明变量之间的线性相关程度越高;

值越小,说明变量之间的线性相关程度越低。

其中:

时称为正相关;

时称为完全正相关;

时称为负相关;

时称为完全负相关;

完全正相关或负相关时,此两个变量间的散点图呈一条直线。

一般来说,可以将相关程度分为以下几个等级:

时,认为高度相关;

时,认为中度相关;

时,认为低度相关;

时,认为相关程度极弱。

现将各指标之间的相关系数计算得到一个相关系数矩阵,如表4所示:

 

净资产收益率%

总资产报酬率%

资产负债率%

总资产周转率

流动资产周转率

已获利息倍数%

销售增长率%

资本累计率%

净资产收益率%

1

0.951

0.579

0.886

0.841

0.057

0.733

0.474

总资产报酬率%

0.951

1

0.425

0.876

0.845

0.219

0.656

0.354

资产负债率%

0.579

0.425

1

0.384

0.283

-0.656

0.368

-0.096

总资产周转率

0.886

0.876

0.384

1

0.973

-0.009

0.425

0.303

流动资产周转率

0.841

0.845

0.283

0.973

1

0.101

0.417

0.354

已获利息倍数%

0.057

0.219

-0.656

-0.009

0.101

1

0.365

0.532

销售增长率%

0.733

0.656

0.368

0.425

0.417

0.365

1

0.748

销售增长率%

0.474

0.354

-0.096

0.303

0.354

0.532

0.748

1

表4相关系数矩阵

从表4的数据我们可以看到,相关系数矩阵也是一个对角阵。

其中有3组指标的相关系数为负值,说明这3组指标之间成负相关性,分别是资产负债率和已获利息倍数、资产负债率和销售增长率、总资产周转率和已获利息倍数这3组指标,这与协差阵里协方差为负值的3组指标是一样的,这就再一次确认了这3组指标之间的变化趋势的相反的。

这一点可以从图1的散点图中得到证实。

为表示方便,现将净资本收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标分别表示为:

,将各个指标间的相关程度进行分类:

5.各行业的均值向量、协差阵进行比较

由于不同行业的企业规模、盈利等方面往往都不一样,现在就来看看不同行业的企业的8项指标的均值是否有差异。

用SPSS求解得到表5。

MultivariateTestsc

Effect

Value

F

Hypothesisdf

Errordf

Sig.

Intercept

Pillai’sTrace

.958

71.296a

8.000

25.000

.000

Wilks’Lambda

.042

71.296a

8.000

25.000

.000

Hotelling’sTrace

22.815

71.296a

8.000

25.000

.000

Roy’sLargestRoot

22.815

71.296a

8.000

25.000

.000

行业

Pillai’sTrace

1.110

4.054

16.000

52.000

.000

Wilks’Lambda

.191

4.034a

16.000

50.000

.000

Hotelling’sTrace

2.671

4.006

16.000

48.000

.000

Roy’sLargestRoot

1.788

5.811b

8.000

26.000

.000

a.Exactstatistic

b.ThestatisticisanupperboundonFthatyieldsalowerboundonthesignificancelevel.

c.Design:

Intercept+行业

表5各行业均值向量的检验

从表中数据,我们可以看到对不同行业均值向量的检验的HotellingsTrace的p值(Sig值)为远小于0.05,说明这3个行业中8项指标之间有显著的差异,我们可以求出这3个行业的各项指标的均值来得到证实,如表6所示:

净资产收益率%

总资产报酬率%

资产负债率%

总资产周转率

流动资产周转率

已获利息倍数%

销售增长率%

资本累计率%

电力、煤气行业

12.3200

10.1082

37.6745

0.3382

1.0818

14.1609

16.4455

20.2245

房地产行业

5.5349

4.2073

54.1760

0.2127

0.3020

3.9173

3.3540

4.6973

信息技术行业

13.3898

8.7911

46.8900

0.8911

1.1756

8.4744

44.2956

24.5311

总体

9.6872

7.2406

47.1163

0.4266

0.7717

8.3086

17.9963

14.6774

表6各行业各指标平均值

从表6的数据我们可以看到,各行业各指标的均值是有较大的差异,其中房地产行业的各项指标中除资产负债率外,其余指标均偏低。

对各行业各指标数据的协差阵是否有显著差异进行检验,得到表7:

Box'sTestofEqualityofCovarianceMatricesa

Box'sM

260.786

F

2.152

df1

72

df2

2050.869

Sig.

.000

Teststhenullhypothesisthattheobservedcovariancematricesofthedependentvariablesareequalacrossgroups.

a.Design:

Intercept+行业

表7各行业各指标协差阵的检验

从表中的数据,我们看到p值(Sig值)远小于0.05,所以说这3个行业之间的各项指标的协差阵是有显著差异的。

三、结束语

本文主要利用SPSS和多元统计的方法,对上市的35家公司,涉及电力、煤气及水的生产和供应业,房地产业,信息技术业这3个行业,的运营情况进行了分析。

主要是从净资产收益率、总资产报酬率、资产负债率、总资产周转率、流动资产周转率、已获利息倍数、销售增长率和资本累计率这8个指标进行了分析。

通过分析我们得到:

1.净资产收益率、总资产报酬率、资产报酬率、销售增长率这4个指标的数据服从正态分布;

2.总资产周转率、流动资产周转率、已获利息倍数、资本累计率这4个指标的数据不服从正态分布;

3.总资产周转率与流动资产周转率、净资产收益率与总资产报酬率之间存在着高度的线性关系;

4.3个行业在8个指标方面的均值、协差阵都有显著的差异。

其中房地产行业在除了在资产负债率这一指标均值最高外,其余7个指标在3个行业中都是最低的,而且和其他2个行业的差距较大。

存在的缺点:

没有处理异常值。

在箱线图中我们看到:

资本积累率、总资产周转率这两个指标各存在1个极端异常值,但是在后面的具体分析没有考虑到这一点,因为这两个极端异常值有可能会影响分析的结果。

没有对3个行业指标进行系统的分析,只是对数据做了简单的一些检验。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1