多元统计分析.docx

上传人:b****2 文档编号:1412351 上传时间:2022-10-22 格式:DOCX 页数:20 大小:705.25KB
下载 相关 举报
多元统计分析.docx_第1页
第1页 / 共20页
多元统计分析.docx_第2页
第2页 / 共20页
多元统计分析.docx_第3页
第3页 / 共20页
多元统计分析.docx_第4页
第4页 / 共20页
多元统计分析.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

多元统计分析.docx

《多元统计分析.docx》由会员分享,可在线阅读,更多相关《多元统计分析.docx(20页珍藏版)》请在冰豆网上搜索。

多元统计分析.docx

作业一

1.2分析2016年经济发展情况

排名

gdp

占比

累计占比

1

广东

79512.05

10.30

10.30

2

江苏

76086.2

9.86

20.17

3

山东

67008.2

8.68

28.85

4

浙江

46485

6.02

34.87

5

河南

40160.01

5.20

40.08

6

四川

32680.5

4.24

44.31

7

湖北

32297.9

4.19

48.50

8

河北

31827.9

4.12

52.62

9

湖南

31244.7

4.05

56.67

10

福建

28519.2

3.70

60.37

11

上海

27466.2

3.56

63.93

12

北京

24899.3

3.23

67.16

13

安徽

24117.9

3.13

70.28

14

辽宁

22037.88

2.86

73.14

15

陕西

19165.39

2.48

75.62

16

内蒙古

18632.6

2.41

78.04

17

江西

18364.4

2.38

80.42

18

广西

18245.07

2.36

82.78

19

天津

17885.4

2.32

85.10

20

重庆

17558.8

2.28

87.37

21

黑龙江

15386.09

1.99

89.37

22

吉林

14886.23

1.93

91.30

23

云南

14869.95

1.93

93.22

24

山西

12928.3

1.68

94.90

25

贵州

11734.43

1.52

96.42

26

新疆

9550

1.24

97.66

27

甘肃

7152.04

0.93

98.59

28

海南

4044.51

0.52

99.11

29

宁夏

3150.06

0.41

99.52

30

青海

2572.49

0.33

99.85

31

西藏

1150.07

0.15

100.00

将2016各省的GDP进行排名,可以发现,经济发达的的地区主要集中在东部地区。

西部gdp的占比较小。

作出2016各省的gdp直方图如下:

作业二多元回归分析

2.1多元线性回归

2.1.1数据来源

《福建省统计年鉴-2017》

年份

商品零售价格指数y

农业生产资料价格指数x1

工业生产价格指数x2

工业生产者购进价格指数x3

固定资产投资价格总指数x4

2000

98.9

97.4

100.5

112.4

100.2

2001

98

98.7

98.1

96.7

99.5

2002

98.3

99.9

97.6

97.6

99.7

2003

99.1

101.8

100.7

106.3

101.4

2004

102.7

112.5

102.6

113.3

103.4

2005

100.6

108.1

100.2

108.1

100.7

2006

100.5

100.9

99.2

103.9

102

2007

104.3

110.3

100.8

104.3

105.9

2008

105.7

123.6

102.7

110.2

105.9

2009

97.9

93.3

95.5

93.2

98

2010

103.4

102.4

103.2

107.7

103.3

2011

104.8

111.8

103.9

108

106.2

2012

101.8

103.3

98.7

97.7

100.3

2013

101.1

99.5

98.4

98.4

100.1

2014

101.1

99.5

98.6

98.3

100.4

2015

99.9

101.4

97

96.1

98.3

2016

100.7

100.2

99.1

98

100

2.1.2模型假设

商品的零售价格会受很多因素的影响,对于影响零售价格指数y的影响现在仅考虑农业生产资料指数x1、工业生产价格指数x2、工业生产者购进价格指数x3、固定资产投资的影响x4。

2.1.3模型建立

为了大致分析y与x1、x2、x3、x4,建立y关于x1、x2、x3、x4的散点图,可以看出y与X呈现出较为明显的线性相关关系。

由此可以建立y关于x的多元线性回归模型:

运用MatlabR2017a画y关于x的散点图如下:

2.1.4模型求解和分析

运用MatlabR2017a进行多元回归分析,使用命令为:

[b,bint,r,rint,stats]=regress(y,X,alpha)

在这里y是n*1的列向量,x是n*(m+1)的矩阵且第一列向量全是1,alpha采用默认值0.05。

将Excel的数据导入Matlab运行结果截图如下:

由计算结果可得:

参数

参数估计值

置信区间

a0

11.84

[-23.7566,47.4395]

a1

0.1304

[-0.0041,0.2648]

a2

0.5429

[-0.1834,1.2961]

a3

-0.1796

[-0.3628,0.0036]

a4

0.3945

[-0.1545,0.9432]

R2=0.8699统计量观测值F=20.0540检验值p=0.0000误差方差估计=0.9995

可知y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4

以上结果的置信度为95%,R2=0.8699,F=20.0540,p=0.0000<0.05,可知回归模型成立。

分析其杠杆残差图如下:

执行rcoplot(r,rint)

由残差图可以看出,除第二个数据外,其它数据的残差离零点都较近,且残差的置信区间均包含零点,这说明回归模型y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4能较好的符合原始数据,而第二个数据为异常点。

由模型可以看出对商量零售价格影响最大的是工业生产价格指数,工业生产价格指数每上升一个点,商品零售价格指数约上升0.5。

2.1.5逐步回归分析

运用Matlab采用逐步回归的方法对数据进行建模分析,命令为

stepwise(x,y,inmodel,alpha)

这里inmodel采取所有变量,alpha采用默认值,输如命令得到下图:

可以看出,四条线均为实线,无需对变量进行剔除,选中四条线,可以得到下图:

由图可知,模型结果同2.1.4中的模型,即:

y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4

2.2非线性回归

2.2.1数据来源

《福建省统计年鉴-2017》

年份

工业总产值

(亿元)

能源生产量

(万吨标准煤)

年份

工业总产值

(亿元)

能源生产量

(万吨标准煤)

1981

87.76

493

1999

3479.84

1634.16

1982

95.77

522

2000

3994.86

1654.17

1983

103.97

609

2001

4398.08

1850.44

1984

131.11

641

2002

5260.2

1923.4

1985

173.13

690

2003

6616.61

1816.8

1986

205.1

724

2004

8544.5

1805.75

1987

265.87

806

2005

9995.89

2488.47

1988

388.85

918

2006

11855.68

2668.15

1989

488.96

950

2007

14425.06

2625.28

1990

531.49

966.52

2008

17141.44

2989.93

1991

658.86

854.43

2009

18681.48

2939.48

1992

915.51

1013.39

2010

23805.32

3260.42

1993

1522.37

1051.43

2011

30330.59

2802.72

1994

2128.61

1169.96

2012

32379.94

2989.65

1995

2638.52

1396.24

2013

36724.66

2739.76

1996

2840.51

1406.04

2014

41579.84

2924.01

1997

3066.76

1256.3

2015

43888.84

3566.6

1998

3218.51

1177

2016

47275.84

4490.8

2.2.2模型假设

工业生产总值会收到很多因素的影响,技术的进步会使得能源的利用率得到提高,假设工业生产总值与能源的生产量存在着非线性关系,作工业生产总值关于能源生产量的散点图如下,运用Matlab作散点图,命令为:

scatter(x,y),得到的散点图如下:

由散点图可知,工业生产总值y与能源生产量之间x存在着非线性关系,设y与x存在着指数函数关系,即。

2.2.3模型建立

由于是二维,可运用Matlab的cftool拟合工具箱对数据进行拟合,结果如下图所示:

由拟合结果可知,R2为0.8016,拟合效果一般,SSE为1132000000,RMSE为5856,模型为:

作业三主成分分析与聚类分析

3.1数据来源

《福建省统计年鉴——2017》

年份

固定资产投资(亿元)

GDP(亿元)

财政总收入(亿元)

工业总产值(亿元)

第一产业(%)

第二产业(%)

第三产业(%)

GDP增长率(%)

人均GDP(元)

社会消费品零售总额(亿元)

城镇居民人均可支配收入(元)

2000

995.38

3764.54

369.67

3994.86

17.02

43.26

39.73

9.3

11194

1320.80

7432

2001

1053.84

4072.85

428.33

4398.08

15.99

44.28

39.73

8.7

11691

1442.32

8313

2002

1148.76

4467.55

476.20

5260.20

14.88

45.59

39.53

10.2

12739

1593.76

9189

2003

1411.45

4983.67

551.00

6616.61

13.90

46.97

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1