应用多元统计分析课程设计.docx

上传人:b****2 文档编号:20509165 上传时间:2023-04-25 格式:DOCX 页数:12 大小:53.09KB
下载 相关 举报
应用多元统计分析课程设计.docx_第1页
第1页 / 共12页
应用多元统计分析课程设计.docx_第2页
第2页 / 共12页
应用多元统计分析课程设计.docx_第3页
第3页 / 共12页
应用多元统计分析课程设计.docx_第4页
第4页 / 共12页
应用多元统计分析课程设计.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

应用多元统计分析课程设计.docx

《应用多元统计分析课程设计.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析课程设计.docx(12页珍藏版)》请在冰豆网上搜索。

应用多元统计分析课程设计.docx

应用多元统计分析课程设计

成绩评定表

学生姓名

郑文星

班级学号

1109030133

专业

统计学

课程设计题目

各地区农村住房问题分析

 

 

组长签字:

成绩

 

日期

20年月日

课程设计任务书

学院

理学院

专业

统计学

学生姓名

郑文星

班级学号

1109030133

课程设计题目

各地区农村住房问题分析

实践教学要求与任务:

通过该课程设计,使学生进一步理解多元统计分析的基本概念、理论和方法;初步掌握SPSS统计软件作常见的多元统计检验和多元统计分析;掌握典型的多元统计分析方法,使教材中的理论能应用到实践。

1.数据整理:

收集数据,录入数据。

2.分类模型:

判别分析中距离判别法、费希尔判别法、贝叶斯判别法的应用,以最优的性质对P维空间构造一个“划分”,给出判别函数,判断新样品的归属。

聚类分析中系统聚类法、K均值聚类法的应用,对样品或变量进行量化分类。

3.降维模型:

主成分分析在保留原数据的大部分信息的基础上,提取较少的主成分代替较多的变量,克服多变量中信息重叠,降低数据维数。

因子分析中提取因子载荷阵,得到表示原始变量基本数据结构的公共因子,简化数据。

4.各模型结果的分析解释,并应用于实际问题。

 

工作计划与进度安排:

周四5~8节:

选题,设计解决问题方法

周五5~8节:

SPSS应用,完成论文,答辩

 

指导教师:

201年月日

专业负责人:

201年月日

学院教学副院长:

201年月日

摘要

随着经济的飞速发展,居民的住房问题日益突出,就各地区农村居民的住房情况进行调查,为了更好的将我们学过的知识运用到实际中所以我们可以运用学过的应用多元统计分析和SPSS软件对各地区农村居民住房进行因子分析。

关键词:

住房问题,因子分析

1.设计问题

随着我国社会经济的发展,人口的增多,居民的住房问题逐渐凸现出来,就我国各地区的农村居民住房问题的研究来说明各地区的经济发展和农村人口数等关系?

2.设计原理

因子分析根据变量之间相关性的大小,对变量进行分组,使得组内的变量之间相关性较高,而组间变量的相关性较低。

每组变量代表一个基本结构,即公共因子。

从而将众多变量转换为少数几个公共因子。

计算样本在各个公共因子上的得分,可以挖掘出样本的问题所在。

通过计算样本的加权公共因子得分,可以对样本进行综合评价。

因子分析的一般模型如下:

(1)

一般而言,m远少于p,m的选取一般根据相关系数矩阵特征根大于1的个数来确定。

其中因子分析的出发点是相关系数矩阵,上述因子载荷系数

可以基于主成分法、主轴因子法、极大似然法、综合最小平方法或a因子法等方法进行估计。

通过回归法或Bartlett法等建立公共因子与原始变量的线性组合,从而求得各因子的得分。

3.设计分析

1.在spss中输入数据,如下图:

表_3.1各地区农村居民家庭住房情况(2011年)

地区

住房面积

住房价值

住房结构(平方米/人)

(平方米/人)

(元/平方米)

钢筋混凝土结构

砖木结构

 

 

 

 

 

全国

36.24

654.37

16.48

15.92

 

北京

38.08

2101.58

10.48

27.44

天津

30.22

1600.45

5.70

24.50

河北

34.11

684.38

9.66

22.96

山西

29.92

547.44

7.30

18.95

内蒙古

24.25

479.53

1.23

16.72

 

辽宁

28.86

813.82

6.61

21.70

吉林

24.44

585.09

0.16

22.72

黑龙江

24.82

813.15

0.82

20.38

 

上海

58.90

2372.36

21.91

36.97

江苏

49.34

833.19

26.20

23.00

浙江

61.38

1280.05

43.04

16.87

安徽

34.59

591.84

20.13

13.95

福建

49.82

791.05

36.42

10.32

江西

46.02

469.12

37.03

7.29

山东

36.31

552.19

11.19

24.45

 

河南

36.45

493.11

19.29

16.61

湖北

44.24

538.02

24.90

15.00

湖南

46.40

431.89

20.71

23.89

广东

30.73

832.44

23.75

4.75

广西

34.90

454.41

27.57

5.52

海南

24.22

842.09

11.07

13.07

 

重庆

39.73

454.11

18.54

17.06

四川

37.71

489.55

16.65

14.62

贵州

29.41

519.81

10.79

14.70

云南

30.88

573.20

8.80

7.09

西藏

28.47

314.52

0.76

14.07

 

陕西

35.76

613.65

17.83

11.04

甘肃

23.65

537.26

4.12

9.30

青海

26.81

461.27

2.48

11.48

宁夏

24.38

480.91

1.73

16.59

新疆

26.14

452.36

2.30

13.47

 

 

 

 

 

2.再打开分析菜单找出因子分析,如下图:

在spss中的分析菜单中找到因子分析,并将住房价值,住房面积,住房结构(混泥土结构,木质结构)设为变量。

3.调整各项指标如(描述,抽取,旋转,得分,选项),并进行分析。

4.设计结果

4.1得出以下结果

在SPSS中得到表4_1到4_5.

因子分析

表4_1公因子方差

初始

提取

住房面积

1.000

.950

住房价值

1.000

.798

混泥土结构

1.000

.981

木架结构

1.000

.873

提取方法:

主成份分析。

表4_1是从住房面积,住房价值,住房结构(混泥土结构,木架结构)4个变量中提取

公因子如表4_1所示。

表4_2解释的总方差

成份

初始特征值

提取平方和载入

旋转平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

合计

方差的%

累积%

1

2.130

53.255

53.255

2.130

53.255

53.255

1.877

46.923

46.923

2

1.471

36.787

90.041

1.471

36.787

90.041

1.725

43.119

90.041

3

.356

8.910

98.952

4

.042

1.048

100.000

提取方法:

主成份分析。

从表4_2可以看出,选取两个因子运算后,累计方差达到90.041%>85%,符合了一般性选取公

共因子的要求。

表4_3成份矩阵a

成份

1

2

住房面积

.922

-.315

住房价值

.724

.524

混泥土结构

.700

-.701

木质结构

.515

.779

提取方法:

主成分分析法。

a.已提取了2个成份。

根据表4_3可以写出每个原始变量的因子表达式:

从成份矩阵表4_3中可以看出,每个因子在不同的原始变量上的载荷没有明显的差

别,为了便于对因子进行命名,需要对因子载荷阵进行旋转,得到表4_4.

表4_4旋转成份矩阵a

成份

1

2

住房面积

.919

.325

住房价值

.243

.860

混泥土结构

.984

-.116

木质结构

-.079

.931

提取方法:

主成分分析法。

旋转法:

具有Kaiser标准化的正交旋转法。

a.旋转在3次迭代后收敛。

从旋转成分矩阵可以看出,旋转后的载荷系数已经明显地两级分化了。

第一个公因子

在指标

上有较大载荷,说明这两项指标有较强的相关性,可以归为一类属于住房

各地区农村人口和农村面积的指标。

第二个公因子在指标

上有较大载荷,同理可

以将这两个指标归为一类,属于各地区农村经济水平的指标。

 

表4_5成份得分系数矩阵

成份

1

2

住房面积

.472

.101

住房价值

.046

.490

混泥土结构

.553

-.170

木质结构

-.139

.566

提取方法:

主成分分析法。

旋转法:

具有Kaiser标准化的正交旋转法。

构成得分。

根据表4_5的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分

数,并可以据此对观测量进行进一步的分析。

下面得出旋转后的因子得分表达式写出:

比较直观的得出每个观测值的碎石图和成分图如图所示:

地区F1F2

全国36.24654.3716.4815.920.01288-0.22072

北京38.082101.5810.4827.441.367881.96012

天津30.221600.455.7024.500.426571.72249

河北34.11684.389.6622.96-0.008300.66390

山西29.92547.447.3018.95-0.495210.44326

内蒙古24.25479.531.2316.72-1.040570.59500

辽宁28.86813.826.6121.70-0.272850.90490

吉林24.44585.090.1622.72-0.778491.16981

黑龙江24.82813.150.8220.38-0.658971.13015

上海58.902372.3621.9136.973.121631.97093

江苏49.34833.1926.2023.001.23190-0.22920

浙江61.381280.0543.0416.872.34438-1.30945

安徽34.59591.8420.1313.95-0.06813-0.53286

福建49.82791.0536.4210.321.07417-1.65630

江西46.02469.1237.037.290.58941-2.07408

山东36.31552.1911.1924.450.086500.56675

河南36.45493.1119.2916.610.00910-0.41114

湖北44.24538.0224.9015.000.48314-0.89721

湖南46.40431.8920.7123.890.68788-0.17651

广东30.73832.4423.754.75-0.27652-1.11571

广西34.90454.4127.575.52-0.23417-1.59110

海南24.22842.0911.0713.07-0.624940.18650

重庆39.73454.1118.5417.060.11688-0.44540

四川37.71489.5516.6514.62-0.08345-0.48222

贵州29.41519.8110.7914.70-0.58507-0.03404

云南30.88573.208.807.09-0.80329-0.51933

西藏28.47314.520.7614.07-1.082060.19766

陕西35.76613.6517.8311.04-0.16791-0.66717

甘肃23.65537.264.129.30-1.19898-0.03142

青海26.81461.272.4811.48-1.088620.07710

宁夏24.38480.911.7316.59-1.024490.56218

新疆26.14452.362.3013.47-1.060310.24312

2.对以上结果进行分析

由以上表格可以得出;排第一的是上海,第二是北京……

可以看出来,农村的住房面积跟所在地区的农村人口成反比,跟所在地区的经济呈线性关系

农村的住房价格跟所在地区的经济水平呈正相关。

5.设计总结

通过这次课程设计,我知道了因子分析在解决实际问题中有很重要的意义,有些实际问

题解决起来很复杂麻烦,但通过因子以及SPSS软件的结合应用,就能很清楚的得到解决

,给我们带来了很大的方便。

我也更加熟悉了因子分析相关知识以及SPSS软件的应用,

并能很好的运用到实际中去。

通过这次的设计我更加熟悉了用计算机软件来解决数学问题,很多的数学问解决起来很

复杂,但是应用计算机软件就可以轻松的解决这些问题,用SPSS中自带的软件非常方便。

且通过本次的设计我彻底的了解了因子分析的意义以及应用,我也会学习更多的数学相关知识

,并运用到学习和生活中,相信这对我今后的学习和生活都会有很大的帮助。

 

参考文献

(1)《应用多元统计分析》<第二版>,朱建平

(2)中国统计局年鉴

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 互联网

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1