多元统计分析课程设计心得模版Word文档下载推荐.docx
《多元统计分析课程设计心得模版Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程设计心得模版Word文档下载推荐.docx(15页珍藏版)》请在冰豆网上搜索。
北京
(1)
119.29
30.98
29.92
25.97
15.48
2178
3.41
21006
296.7
天津
(2)
143.98
31.59
30.21
21.94
12.29
2852
4.29
20254
363.1
河北(3)
94.8
17.2
17.95
18.14
9.37
1167
2.03
12607
322.2
山西(4)
65.8
11.08
11.06
12.15
16.84
8.82
1.65
10166
284.7
内蒙(5)
54.79
9.24
9.54
16.86
6.27
894
1.8
7564
225.4
辽宁(6)
94.51
21.12
22.83
22.35
11.28
1416
2.36
13.386
311.7
吉林(7)
80.49
13.36
13.76
16.6
7.14
1306
2.07
9400
274.1
黑龙江(8)
75.86
15.82
16.67
20.86
10.37
1267
2.26
9830
267
上海(9)
187.79
45.9
39.77
24.44
15.09
4346
4.11
31246
418.6
江苏(10)
205.96
27.65
22.58
13.42
7.81
3202
4.69
23377
407.2
浙江(11)
207.46
33.06
25.78
15.94
9.28
3811
4.19
22054
385.5
安徽(12)
110.78
20.7
20.12
18.69
6.6
1468
2.23
12578
341.1
福建(13)
122.76
22.52
19.93
18.34
8.35
2200
2.63
12164
301.2
江西(14)
94.94
14.7
14.18
15.49
6.69
1669
2.24
10463
274.4
山东(15)
117.58
21.93
20.89
18.65
9.1
1820
2.8
17829
331.1
河南(16)
85.98
17.3
17.18
7.67
1.89
11247
276.5
湖北(17)
103.96
19.5
18.48
18.77
9.16
1829
2.75
15745
308.9
湖南(18)
104.03
21.47
21.28
20.63
8.72
1272
1.98
13161
309
广东(19)
136.44
23.64
20.83
17.33
7.85
2959
3.71
16259
334
广西(20)
100.72
22.04
20.9
21.88
9.67
1732
2.13
12441
296.4
四川(21)
84.73
14.35
14.17
16.93
7.96
1310
2.34
11703
242.5
贵州(22)
59.05
14.48
24.53
8.09
1068
1.32
9710
206.7
云南(23)
73.72
21.91
22.7
29.72
9.38
1447
1.94
12517
295.8
陕西(24)
78.02
13.13
12.57
16.83
9.19
1731
2.08
11369
220.3
甘肃(25)
59.62
14.07
16.24
23.59
11.34
926
1.13
13084
246.8
青海(26)
51.66
8.32
8.26
16.11
7.05
1055
1.31
9246
176.49
宁夏(27)
52.95
8.25
15.57
6.58
834
1.12
10406
245.4
新疆(28)
60.29
11.26
13.14
18.68
8.39
1041
2.9
10983
266
设计目的与要求:
设计环境或器材、原理与说明:
机房spss软件
设
是一个
维随机向量,有二阶矩存在,记
,
。
考虑它的线性变换:
(5.1)
易见
(5.2)
假如我们希望用
来代替原来的
个变量
,这就要求
尽可能地反映原来
个变量的信息,这里“信息”用什么来表达?
最经典的方法是用
的方差来表达。
越大,表示
包含的信息越多。
由(5.2)可以看出,对
必须有某种限制,否则可使
,常用的限制是
(5.3)
故我们希望在约束(5.3)下找
,使得
达到极大,
就称为第一主成分。
如果一个主成分不足以代表原
个变量,可再考虑采用
,为了最有效地代表原变量的信息,
已有的信息就不需要出现在
中,用数学语言来讲,就是
(5.4)
于是,求
就是在约束(5.3)和(5.4)下求
,使
达到极大,所求的
称为第二主成分。
类似地,我们可以定义第三主成分、第四主成分、…。
一般地讲,
的第
个主成分
是指:
在约束
下求
达到极大。
令
表示
的特征根,
为相应的单位特征向量。
若特征根有重根,对应于这个特征根的特征向量组成一个
的子空间,子空间的维数等于重根的次数。
在子空间中任取一组正交的坐标系,这个坐标系的单位向量就可用来作为它的特征向量。
显然,这时特征向量的取法不唯一,有无穷多种取法,在下面的讨论中,我们总假定已选定的某一种取法。
设计过程(步骤)或程序代码:
1、将原始数据标准化,标准化的数据见下表
0.423523
1.338405
1.590282
1.687556
2.239634
0.481971
0.954746
1.260371
0.048805
0.995199
1.409649
1.631453
0.667228
1.065873
1.188758
1.855394
1.133844
1.200166
-0.14352
-0.271
-0.10906
-0.29487
-0.00854
-0.57821
-0.45763
-0.15279
0.49097
-0.81499
-0.98577
-1.08721
-1.81143
2.740046
-1.79273
-0.84655
-0.56349
-0.15927
-1.06992
-1.20067
-1.303
-0.61894
-1.14919
-0.86449
-0.69303
-1.00129
-1.18752
-0.15024
0.186827
0.583737
0.771033
0.694243
-0.3171
-0.11989
-2.2717
0.308902
-0.47486
-0.71949
-0.7039
-0.68477
-0.82907
-0.43245
-0.4167
-0.69238
-0.34307
-0.58206
-0.43218
-0.29078
0.39379
0.359408
-0.47334
-0.22224
-0.62003
-0.46619
2.009583
3.080956
2.988656
1.300186
2.096133
2.755433
1.671171
2.983284
2.162524
2.430294
0.949485
0.548246
-1.48989
-0.58254
1.555783
2.26478
1.659299
1.964851
2.465025
1.581335
1.002539
-0.85187
-0.04166
2.194408
1.753048
1.4367
1.588578
0.226481
0.137774
0.199007
-0.15562
-1.02776
-0.26257
-0.25294
-0.15767
0.818691
0.503868
0.350337
0.172033
-0.24423
-0.38385
0.505041
0.156444
-0.22732
0.126834
-0.14028
-0.56298
-0.64428
-0.9658
-0.99465
-0.05179
-0.24271
-0.51352
-0.33787
0.383929
0.281429
0.308322
-0.16574
-0.10789
0.106557
0.330433
0.72583
0.645294
-0.34774
-0.25932
-0.21838
0.206435
-0.63406
-0.60092
-0.38161
-0.30146
0.068569
-0.00238
-0.03382
-0.13536
-0.08581
0.115994
0.27926
0.37519
0.260351
0.07019
0.227705
0.363689
0.335558
-0.24771
-0.4681
-0.50881
-0.05958
0.262085
0.820617
0.481145
0.299804
-0.49995
-0.56783
1.300963
1.261785
0.461673
0.695579
-0.00645
0.294277
0.309741
0.652037
0.101843
0.014276
-0.35529
-0.18072
0.043603
-0.37669
-0.60386
-0.6457
-0.60122
-0.52735
-0.42825
-0.14036
-0.30489
-0.89101
-0.97128
-0.58868
-0.62014
1.322972
-0.47952
-0.68202
-1.18429
-0.64022
-1.51177
-0.63161
0.279093
0.565282
2.636993
-0.00486
-0.28459
-0.54975
-0.16793
0.033199
-0.53205
-0.74635
-0.87284
-0.62654
-0.07477
0.013227
-0.40646
-0.36109
-1.27595
-0.95809
-0.63656
-0.35182
1.08498
0.71632
-0.83093
-1.37875
-0.07253
-0.81645
-1.14239
-1.30812
-1.48472
-0.80883
-0.86219
-0.69566
-1.19453
-0.71829
-2.03561
-1.11252
-1.3163
-1.40522
-0.94555
-1.03512
-0.92741
-1.38899
-0.52311
-0.84073
-0.94257
-0.96475
-0.79192
-0.15815
-0.36913
-0.71034
0.432779
-0.42603
-0.48353
2、将以上数据导入spss软件,依次点击分析—降维—因子分析
点击按钮,在弹出的对话框中,在中选择。
回到原对话框点击右侧的确定。
即可得到以下输出结果
TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
1
6.150
68.332
2
1.473
16.365
84.698
3
.697
7.749
92.447
4
.318
3.531
95.978
5
.190
2.112
98.090
6
.116
1.289
99.379
7
.029
.324
99.703
8
.024
.270
99.973
9
.002
.027
100.000
ExtractionMethod:
PrincipalComponentAnalysis.
由输出结果看到前面两个主成分y1,y2的方差和占全部方差的比例为84.7%。
我们就选取y1为第一主成分,y2为第二主成分。
且这两个主成分占全部方差的84.7%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新的指标,起到了降维的作用
2、spss软件得到主成分系数矩阵如下:
ComponentMatrixa
X1
.931
-.315
X2
.976
.163
X3
.322
X4
.232
.863
X5
.433
.596
X6
.923
-.200
X7
.897
-.274
X8
.871
-.064
X9
.899
-.154
Undefinederror#11401-Cannotopentextfile"
D:
\ProgramFiles\SPSSInc\Statistics17\lang\en\spss.e
a.2componentsextracted.
3、由以上结果得到前两个主成分的线性组合为
y1=0.931x1+0.976x2+0.931x30.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9
y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x9
4、对所选主成分做经济解释:
第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变量的系数相当所以第一主成分可以看成是x1,x2,x3,x6,x7,x8,x9的综合变量。
可以解释为第一主成分反映了工业生产中投入的资金、劳动力所产生的效果,他是投入和产出之比。
第一主成分所占信息总量为68.3%,在我国目前的工业企业中,经济效益首先反映在投入与产出之比上,其中固定资产所产生的经济效益更大一些。
第二主成分是把工业生产中所得产量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了产出对国家所做的贡献。
这样,在抓企业经济效益活动中,就应注重投入与产出之比和产出对国家所做的贡献,抓住了这两个方面,经济效益一定会提高
5、通常为了分析各样品在主成分所反映的经济意义方面的情况,还将标准化后的原始数据代入主成分表达式计算各样品的主成分得分
6.992.94
9.270.65
-1.21-0.12
-5.010.47
-7.38-0.89
-1.041.54
-4.00-0.98
-2.580.84
17.451.67
9.78-3.41
10.83-2.21
0.18-0.73
1.27-0.63
-2.95-1.52
2.44-0.44
-2.550.12
0.88-0.36
-0.110.47
4.51-1.60
0.340.87
-3.50-0.74
-5.571.60
-0.052.91
-4.03-0.49
-4.082.12
-8.45-0.72
-7.61-1.02
-3.83-0.35
6、由各样品的主成分得分就可在二维空间中描述出各样品的分布情况
由上图可知,分布在第一象限的是上海、北京、天津、广西4个省区,这四个省区的经济效益在全国来说比较好的,其中,上海的经济效益最好。
分布在第四象限的是江苏、浙江、安徽、福建、山东、湖北、广东7个省区。
因为第四象限的主要特征是第一主成分,第一主成分占信息总量的比重最大,所以这7个省区的经济效益也算较好。
分布在第二和第三象限的地区可属同一类,经济效益较差
设计结果与分析(可以加页):
设计体会与建议:
经过了两周的课程设计,深有感触啊,从本次课程设计的目的来看,收获也是不少的,它使我们对课本以及以前学过的知识有了一个更好的总结与理解,也让我们知道了,光分开使用是不够的,从书本上学到的知识要自己整理归纳形成自己的想法,然后进行构思设计,这很好的训练对对开发一个项目,应该有怎样的思路和准备更清晰。
来学校三年了,从最早的实验报告到现在的课程设计,每一个自己都觉得有一个进步,虽然有时有些方面我自己做不出,但可以从老师和其他同学那里学到更好更多的东西,他们从另一个方面透析了我自己的困难,这是很重要的,它让我学会了怎样学习别人的长处并把它变成自己的长处。
有这样的机会和收获,要感谢老师的辅导以及同学的帮助,是他们让我对自己有了一个更好的认识,无论是学习还是生活,生活是实在的,要踏实走路,虽然自己走出来的路要崎岖的多,但觉得踏实、放心。
最后建议软件应该更完善些,有些检验完成不了,希望我们以后能有更多的机会接触此类型的软件,帮助我们更全面的掌握跟统计有关的知识和具体操作。
设计成绩:
教师签名:
年月日