R软件中的主成分分析报告.docx
《R软件中的主成分分析报告.docx》由会员分享,可在线阅读,更多相关《R软件中的主成分分析报告.docx(11页珍藏版)》请在冰豆网上搜索。
R软件中的主成分分析报告
问题
表1为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法,用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。
表1某农业生态经济系统各区域单元的有关数据
样本序号
x1:
人口密度(人/km2)
x2:
人均耕地面积(ha)
x3:
森林覆盖率(%)
x4:
农民人均纯收入(元/人)
x5:
人均粮食产量(kg/人)
x6:
经济作物占农作物播面比例(%)
x7:
耕地占土地面积比率(%)
x8:
果园与林地面积之比(%)
x9:
灌溉田占耕地面积之比(%)
1
363.912
0.352
16.101
192.11
295.34
26.724
18.492
2.231
26.262
2
141.503
1.684
24.301
1752.35
452.26
32.314
14.464
1.455
27.066
3
100.695
1.067
65.601
1181.54
270.12
18.266
0.162
7.474
12.489
4
143.739
1.336
33.205
1436.12
354.26
17.486
11.805
1.892
17.534
5
131.412
1.623
16.607
1405.09
586.59
40.683
14.401
0.303
22.932
6
68.337
2.032
76.204
1540.29
216.39
8.128
4.065
0.011
4.861
7
95.416
0.801
71.106
926.35
291.52
8.135
4.063
0.012
4.862
8
62.901
1.652
73.307
1501.24
225.25
18.352
2.645
0.034
3.201
9
86.624
0.841
68.904
897.36
196.37
16.861
5.176
0.055
6.167
10
91.394
0.812
66.502
911.24
226.51
18.279
5.643
0.076
4.477
11
76.912
0.858
50.302
103.52
217.09
19.793
4.881
0.001
6.165
12
51.274
1.041
64.609
968.33
181.38
4.005
4.066
0.015
5.402
13
68.831
0.836
62.804
957.14
194.04
9.110
4.484
0.002
5.790
14
77.301
0.623
60.102
824.37
188.09
19.409
5.721
5.055
8.413
15
76.948
1.022
68.001
1255.42
211.55
11.102
3.133
0.010
3.425
16
99.265
0.654
60.702
1251.03
220.91
4.383
4.615
0.011
5.593
17
118.505
0.661
63.304
1246.47
242.16
10.706
6.053
0.154
8.701
18
141.473
0.737
54.206
814.21
193.46
11.419
6.442
0.012
12.945
19
137.761
0.598
55.901
1124.05
228.44
9.521
7.881
0.069
12.654
20
117.612
1.245
54.503
805.67
175.23
18.106
5.789
0.048
8.461
21
122.781
0.731
49.102
1313.11
236.29
26.724
7.162
0.092
10.078
解答:
1模型选择
x1:
人口密度(人/km2)x2:
人均耕地面积(ha)
x3:
森林覆盖率(%)x4:
农民人均纯收入(元/人)
x5:
人均粮食产量(kg/人)x6:
经济作物占农作物播面比例(%)
x7:
耕地占土地面积比率(%)x8:
果园与林地面积之比(%)
x9:
灌溉田占耕地面积之比(%)
做主成分分析,命名第一主成分为Z1,第二主成分为Z2,第三主成分为Z3,依次类推,当前m个主成分的累积贡献率达到80%及以上,我们就说脑的大小与前m主成分有关。
并求解转化后的
与
之间的相关系数。
2问题解答
在F盘保存某地区农业生态经济系统各区域单元相关指标数data.txt(见附录)。
在R软件中输入代码:
得到如下结果:
第一主成分的贡献率为51.8%,第二主成分的贡献率为23.2%,第三主成分的贡献率为11.6%。
前三个主成分的累积贡献率为86.6%,另六个主成分可舍去。
Z1=0.342X1-0.368X2-0.375X4-0.355X5+0.312X6+0.599X7+0.113X8-0.233X9
Z2=0.614X2+0.155X4-0.761X5-0.11X6
Z3=-0.446X2+0.206X6+0.467X7-0.203X8+0.692X9
从第一主成分中,可看出农业生态经济与人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比,成反比,即人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比越大,生态农业经济越差。
做碎石图:
建立模型:
目标变量:
农民人均纯收入(元/人)—y
决策变量:
x1:
人口密度(人/km2)x2:
人均耕地面积(ha)
x3:
森林覆盖率(%)x5:
人均粮食产量(kg/人)
x6:
经济作物占农作物播面比例(%)x7:
耕地占土地面积比率(%)
x8:
果园与林地面积之比(%)x9:
灌溉田占耕地面积之比(%)
进行多元线性回归分析:
y=B0+B1x+B2x2+B3x3+B5x5+B6x6+B7x7+B8x8+B9x9
在R软件中输入:
得到以下结果
y=-1340.879-2.816X1+278.234X2+25.309X3+1.719X5-6.303X6+27.989X7-18.964X8+52.593X9
此结果不合理,对其做主成分回归检验:
由结果可得前三个主成分贡献率达到94.4%,然后进行主成分分析:
在R中建立模型:
继续建模:
此结果结果符合要求。
作图得:
所以回归方程为:
y=-613.453+382.723X2+12.025X3+2.458X5