R软件中的主成分分析报告.docx
《R软件中的主成分分析报告.docx》由会员分享,可在线阅读,更多相关《R软件中的主成分分析报告.docx(16页珍藏版)》请在冰豆网上搜索。
![R软件中的主成分分析报告.docx](https://file1.bdocx.com/fileroot1/2023-1/1/e78a59c8-2e5e-4604-b6c7-de644388206a/e78a59c8-2e5e-4604-b6c7-de644388206a1.gif)
R软件中的主成分分析报告
问题
表1为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法,用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。
表1某农业生态经济系统各区域单元的有关数据
址八An…如EW农民人XS:
人均粮:
誓篦X7:
耕地占g果园与X9:
灌溉田
梓本X】:
人口密X2:
人均耕X?
:
森林復阳姉⑷一彳令各二物占农作物rWir?
n-toMz廿抽侖士甜殆滴知Q口rfr/A/I2\riTtfrt/1\士八均纯收入(元貝产量.we_ua-.土地面枳比林地面枳之占耕地面积
序号度(人/km?
)地面积(1识)盖率(%)...n,..播面比例如“八亠“八亠―
/人)(kg/人)(%)率(%)比(%)之比(%)
1
363.912
0.352
16.101
192.11
295.34
26.724
18.492
2.231
26.262
2
141.503
1.684
24.301
1752.35
452.26
32.314
14.464
1.455
27.066
3
100.695
1.067
65.601
1181.54
270.12
18.266
0.162
7.474
12.489
4
143.739
1.336
33.205
1436.12
354.26
17.486
11.805
1.892
17.534
5
131.412
1.623
16.607
1405.09
586.59
40.683
14.401
0.303
22.932
6
68.337
2.032
76.204
1540.29
216.39
8.128
4.065
0.011
4.861
7
95.416
0.801
71.106
926.35
291.52
8.135
4.063
0.012
4.862
8
62.901
1.652
73.307
1501.24
225.25
18.352
2.645
0.034
3.201
9
86.624
0.841
68.904
897.36
196.37
16.861
5.176
0.055
6.167
10
91.394
0.812
66.502
911.24
226.51
18.279
5.643
0.076
4.477
11
76.912
0.858
50.302
103.52
217.09
19.793
4.881
0.001
6.165
12
51.274
1.041
64.609
968.33
181.38
4.005
4.066
0.015
5.402
13
68.831
0.836
62.804
957.14
194.04
9.110
4.484
0.002
5.790
14
77.301
0.623
60.102
824.37
188.09
19.409
5.721
5.055
8.413
15
76.948
1.022
68.001
1255.42
211.55
11.102
3.133
0.010
3.425
16
99.265
0.654
60.702
1251.03
220.91
4.383
4.615
0.011
5.593
17
118.505
0.661
63.304
1246.47
242.16
10.706
6.053
0.154
8.701
18
141.473
0.737
54.206
814.21
193.46
11.419
6.442
0.012
12.945
19
137.761
0.598
55.901
1124.05
228.44
9.521
7.881
0.069
12.654
20
117.612
1.245
54.503
805.67
175.23
18.106
5.789
0.048
8.461
21
122.781
0.731
49.102
1313.11
236.29
26.724
7.162
0.092
10.078
1模型选择
X1:
人口密度(人/Ion2)
X3:
森林覆盖率(%)
X5:
人均粮食产量(kg/A)
Xg:
灌溉田占耕地面积之比(%)
做主成分分析,命名第一主成分为Z1,第二主成分为Z2,第三主成分为Z3,
依次类推,当前m个主成分的累积贡献率达到80%及以上,我们就说脑的大小与前m主成分有关。
并求解转化后的乙与厂之间的相关系数。
2问题解答
在F盘保存某地区农业生态经济系统各区域单元相关指标数data.txt(见附录)。
在R软件中输入代码:
>wydata<-read・cabLm(wFr/ds匸s•匸xts"]
>mydata.pi:
<-princomp(mydatarcor=TRUE)
>suirmary(mydat-a.pr;Loadings=TRUE)
得到如下结果:
JjnpoxtaDceoiGonponeats:
第一主成分的贡献率为51.8%,第二主成分的贡献率为23.2%,第三主成
分的贡献率为11.6%o前三个主成分的累积贡献率为86.6%,另六个主成分可舍去。
Zl=0.342Xl-0.368X2-0.375X4-0.355X5+0.312X6+0.599X7+0.113
X8-0.233X9
Z2=0.614X2+0.155X4-0.761X5-0.11X6
Z3=-0.446X2+0.20GX6+0.467X7-0.203X8+0.692X9
从第一主成分中,可看出农业生态经济与人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比,成反比,即人均耕地面积,农民人均纯
收入,人均粮食产量,灌溉田占耕地面积之比越大,生态农业经济越差。
做碎石图:
mydata.pr
建立模型:
目标变量:
农民人均纯收入(元/人)一y
决策变■:
X2:
人均耕地面积(h£
x5:
人均粮食产量(1毎/人)
x7:
耕地占土地面积比率(%)
X9:
灌溉田占耕地面积之比(%)
X1:
人口密度(人/km')
x3:
森林覆盖率(%)
XC:
经济作物占农作物播面比例(%)
X3:
果园与林地面积之比(%)
进行多元线性回归分析:
y=Bo+B1x+B2x2+BoX3+B5x5+B6xg+B7x7+B8xg+B9x9
在R软件中输入:
>rnydata・lrn=lm(V4-V1+V2+V3+V5+V6+V7+V8+V9:
>surmtiaxzy(roydata.lrn)
得到以下结果
Call:
lm(formula=V4-VI+U2+V3+V5+V6+V7+V8+V9)
Residuals:
MinIQ
Median
3Q
Max
-560.00-143.25
-36.29
162.19
587.24
Coefficients:
Es匚imate
Std.Error
匚value
Pr
(Intercept)
-1340.879
1259.751
-1.064
0.308
VI
-2.816
2.603
-1.082
0.300
VZ
Z78.234
231.356
1.203
0.252
U3
Z5.309
15.455
1.638
0.127
U5
1.719
1.519
1.132
0.280
U6
-6.303
13.798
-0.45?
0.656
V7
27.989
63.064
0.444
0.665
U8
-18.964
56.572
-0.335
0.743
U9
52.593
39.781
1.322
0.211
Residualstandarde匚匚ou:
319.3on12degreeso£freedom
Mui匚ipieR-squared:
0.6283^AdjustedR-squared:
0.3805
F-statis匚ic;2.535on8and12DF,p-value:
0.07109
y=-1340.879-2.816X1+278.234X2+25.309X3+1.719X5-6.303X6+27
.989X7-18.964X8+52.593X9
此结果不合理,对其做主成分回归检验:
Importanceofcomponents:
Loadings:
Coirip・1
Comp・2
Cornp・3
Comp・4
Comp・5
Comp・6
Comp・7
Comp・8
VI
0.344
-0・461
0・389
-0・324
0.584
0・121
0.221
V2
0・756
0・554
-0・323
0・114
V3
-0・447
0.524
-0・228
-0・671
V5
0・374
0.368
-0.166
Cl・647
0.514
Cl・103
V6
0・379
0.217
-0・145
-0・644
-0・582
0・122
-0・136
V7
0・433
-0・108
0.255
Cl・131
-0.223
-0・787
-0・223
V8
-0・130
-0.943
0.133
-0・227
0.101
V9
0・446
0・242
0・154
-0.229
0.508
-0・631
由结果可得前三个主成分贡献率达到94.4%,然后进行主成分分析:
>pre<-predict(inydata.br)
>mydata$zl<-pre[,1];myd&t•&$z2<-pre[/.2];mydata$z3<-pre[,3]
Call:
lw(formula=V6zl+z2rdata=wydata)
Residuals:
3QMax
3.8929.113
MinIQMedian
-7.^32-3.465-l.QOQ
Coefficients:
在R中建立模型:
>wydara・1如LmCV4"i+V2+V3+V3+V6+V7+V8+㈣
>smruriary(itiydata・lit))
Call;
lw(±orwula=V4-VI+V2+V3+V5+V6十W?
十V8十V9)
Residuals;
IlinIQMedian.3QMax
degreesoffreedom
-560・00-143・25-36・29162・19587・2址
Estimate
Std.・Error
t.value
Pr(>|t|)
(Intercept)
■1340.879
1259・75:
L
■:
L・064
0.3CI8
VI
■2・816
2・603
■:
L・032
0.30CI
V2
278.234
231.356
L.2O3
0・252
V3
25.309
15・455
:
L・638
0・127
VS
1・719
1・519
:
L・132
0・280
V6
-6.303
13・798
-0・457
0・656
V?
27.989
63・064
0・444
0・665
V8
-18.964
56・572
-0・335
0・743
V9
S2・593
39・781
1.322
0・211
Coefficients:
Residualstandarderror:
319.3on12
继续建模:
>mydata.Lm=lrti(V4-V1+V2+V3+V5+V6+V7+V9)
>suinmary(rriydata.Im)
Call:
lm(formula=V4-VI+V2+V3+V5+V6+V7+V9)
Residuals:
Min
-552・77-122
IQMedian
.93-44.06
30
1=4・9吕
Max
611.38
Coefficient-s
■
■
EstimateStd・Error
tvalue
Pr(>|t|)
(Inve匚ezp匸)
-1313.893
1213.438
-1.083
0.299
VI
-2.889
2.503
-1.154
0.269
VZ
294.636
218.267
1.350
0.200
V3
24.645
1吆・795
1・666
0・120
V5
1.771
1・458
1.215
0・246
V6
-7.659
12.733
・0・601
0・558
V7
39.609
50・854
0・779
0・450
V9
44.386
30・264
1・467
0・166
Residualstandardetrtror:
308・2on13degreesoffreedom
MultipleR-squared:
0・6248fAdjustedR-squared:
0.4228
F-statistic:
3-093on?
and13DF0・0376
>wydat^・lx产1尚
>suwtrtary(wydata・Lm)
Call:
lrn(formula=V4-VI+V2+V3+V5+U?
+U9)
Residuals:
KinIQMedian.3QMax
-562.72-125.32-59.32152.35542.44
Coefficients:
Estimate
Std.Error
匚value
PrOlcn
(Intercept)
-1583.233
1101・&址0
-:
L・437
0.1727
VI
-2・942
2・4:
44
-:
L・20^
0.2486
V2
274.517
210.7L5
:
L・303
0.2137
V3
27・990
L3・395
2・090
0.0554・
V5
1.553
1・380
1・1Z6
0.2792
V7
44.338
49・084
0・903
0.3816
V9
45.203
29・537
:
L・530
0.1482
Signif・codes:
0、*e0・001、"*0・01.0.05、・*0.1、・1standarderror:
301・1.on14degreesoffreedom
R-squared:
0・6144^AdjustedR—squerrgd:
0・4491
F-statistic:
3・717on.6and14DFZp-value:
0.02013
>rnydata・
>surcanarytmvdata,lrn)
Call:
lm(formula=V4-VI+U2+V3+V5+V9)
Residuals:
MinIQMedian3QMax
一634・7一1_38・6-62.6160.6519・9
Coefficients:
Estimate
Std.Error
tvalue
Pr(>|t|)
(Intercept)
-1062.03Q
932.903
-1.136
0.2728
VI
-1.845
2.108
-0.875
0.3952
V2
307.817
206.188
1.493
0.1562
V3
20.608
10.548
1・954
0・0696・
V5
1.717
1.359
1・263
0・2257
V9
43.556
29.299
1・487
0・1578
Signlf・codes:
0*汁汁汁「0.001卞/0・01、需'0・050・1''1
Residualstandarderror:
299.2on15degreeso±freedoin
MultipleR-squared:
0.5919xAdjustedP-squared:
0・4558
F-statistic:
4・351on5and15DF,p-value:
0.01201
>mydata・lw=lw(V4-V2+V3+V5+V9)
>3urt(raary(inydata・ln»)
Call!
lw(±orwula=V4-V2+V3+V5+V9)
Residuals:
Min10Median3QMax
-589・93-13S・27-9・73188・00535・86
Coefficients;
Estimate
Std.Error
tvalue
Pr(>|t|)
(Intercept)
-1336.280
844.920
-1.653
□.1179
V2
377.319
188.888
1.998
0.0631.
V3
22.079
10.337
2.136
0.0485*
V5
2・173
1.246
1・7址址
0・1004
V9
29・768
24.522
1・214
0・2424
5igni±・codes:
00.001n0・0:
L、畜'0・050.1*『1
Residualstandarderror:
297on.16degreesoffreedom
MultipleP-squared:
0・571,AdjustedR-squared:
0・4638
F-statistic:
5・32Son4and.16DF,p-value:
0・006384
>wydata.lm=lw(V4-V2+V3+VS)
>simiwary(mydata・lm)
Call:
lw(forwula=V4-V2+V3+V5)
Pesiduals:
MiniQHedian3QMax
0.050.1、
-749•合S-i42・49i4・362SO・S3475・5仔
Coe±±icients;
Estimate
Std.Errort.valuePr(>|匚I)
(Intercept)
-613.453
553.459
-1.108
0.2831
V2
382・723
191•址98
:
L・999
0・0618•
V3
12.025
6・271
L・918
0・0721•
V5
2・458
L・24:
1
:
L・980
0・0641•
Signi±・codes:
0、古古古"
0・001nCLOLw
此结果结果符合要求c
作图得
Fittedvalues
lm(V4〜V2十V3+V5)
NormalQ-Q
cnronp一S(D」P(DZ一Eropuss
・2・1012
TheoreticalQuantiles
lm(V4-V2+V3+V5)
Scale-Location
Fittedvalues
lm(#4~V2十V3十站5)
ResidualsvsLeverage
0.00.10.20.30.40.50.6
Leverage
lm(V4〜V2+V3+V5)
所以回归方程为:
y—613.453+382.723X2+12.025X3+2.458X5