R软件中的主成分分析报告Word格式文档下载.docx
《R软件中的主成分分析报告Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《R软件中的主成分分析报告Word格式文档下载.docx(16页珍藏版)》请在冰豆网上搜索。
1540.29
216.39
8.128
4.065
0.011
4.861
7
95.416
0.801
71.106
926.35
291.52
8.135
4.063
0.012
4.862
8
62.901
1.652
73.307
1501.24
225.25
18.352
2.645
0.034
3.201
9
86.624
0.841
68.904
897.36
196.37
16.861
5.176
0.055
6.167
10
91.394
0.812
66.502
911.24
226.51
18.279
5.643
0.076
4.477
11
76.912
0.858
50.302
103.52
217.09
19.793
4.881
0.001
6.165
12
51.274
1.041
64.609
968.33
181.38
4.005
4.066
0.015
5.402
13
68.831
0.836
62.804
957.14
194.04
9.110
4.484
0.002
5.790
14
77.301
0.623
60.102
824.37
188.09
19.409
5.721
5.055
8.413
15
76.948
1.022
68.001
1255.42
211.55
11.102
3.133
0.010
3.425
16
99.265
0.654
60.702
1251.03
220.91
4.383
4.615
5.593
17
118.505
0.661
63.304
1246.47
242.16
10.706
6.053
0.154
8.701
18
141.473
0.737
54.206
814.21
193.46
11.419
6.442
12.945
19
137.761
0.598
55.901
1124.05
228.44
9.521
7.881
0.069
12.654
20
117.612
1.245
54.503
805.67
175.23
18.106
5.789
0.048
8.461
21
122.781
0.731
49.102
1313.11
236.29
7.162
0.092
10.078
1模型选择
X1:
人口密度(人/Ion2)
X3:
森林覆盖率(%)
X5:
人均粮食产量(kg/A)
Xg:
灌溉田占耕地面积之比(%)
做主成分分析,命名第一主成分为Z1,第二主成分为Z2,第三主成分为Z3,
依次类推,当前m个主成分的累积贡献率达到80%及以上,我们就说脑的大小与前m主成分有关。
并求解转化后的乙与厂之间的相关系数。
2问题解答
在F盘保存某地区农业生态经济系统各区域单元相关指标数data.txt(见附录)。
在R软件中输入代码:
>
wydata<
-read・cabLm(wFr/ds匸s•匸xts"
]
mydata.pi:
<
-princomp(mydatarcor=TRUE)
suirmary(mydat-a.pr;
Loadings=TRUE)
得到如下结果:
JjnpoxtaDceoiGonponeats:
第一主成分的贡献率为51.8%,第二主成分的贡献率为23.2%,第三主成
分的贡献率为11.6%o前三个主成分的累积贡献率为86.6%,另六个主成分可舍去。
Zl=0.342Xl-0.368X2-0.375X4-0.355X5+0.312X6+0.599X7+0.113
X8-0.233X9
Z2=0.614X2+0.155X4-0.761X5-0.11X6
Z3=-0.446X2+0.20GX6+0.467X7-0.203X8+0.692X9
从第一主成分中,可看出农业生态经济与人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比,成反比,即人均耕地面积,农民人均纯
收入,人均粮食产量,灌溉田占耕地面积之比越大,生态农业经济越差。
做碎石图:
mydata.pr
建立模型:
目标变量:
农民人均纯收入(元/人)一y
决策变■:
X2:
人均耕地面积(h£
x5:
人均粮食产量(1毎/人)
x7:
耕地占土地面积比率(%)
X9:
人口密度(人/km'
)
x3:
XC:
经济作物占农作物播面比例(%)
X3:
果园与林地面积之比(%)
进行多元线性回归分析:
y=Bo+B1x+B2x2+BoX3+B5x5+B6xg+B7x7+B8xg+B9x9
在R软件中输入:
rnydata・lrn=lm(V4-V1+V2+V3+V5+V6+V7+V8+V9:
surmtiaxzy(roydata.lrn)
得到以下结果
Call:
lm(formula=V4-VI+U2+V3+V5+V6+V7+V8+V9)
Residuals:
MinIQ
Median
3Q
Max
-560.00-143.25
-36.29
162.19
587.24
Coefficients:
Es匚imate
Std.Error
匚value
Pr
(Intercept)
-1340.879
1259.751
-1.064
0.308
VI
-2.816
2.603
-1.082
0.300
VZ
Z78.234
231.356
1.203
0.252
U3
Z5.309
15.455
1.638
0.127
U5
1.719
1.519
1.132
0.280
U6
-6.303
13.798
-0.45?
0.656
V7
27.989
63.064
0.444
0.665
U8
-18.964
56.572
-0.335
0.743
U9
52.593
39.781
1.322
0.211
Residualstandarde匚匚ou:
319.3on12degreeso£
freedom
Mui匚ipieR-squared:
0.6283^AdjustedR-squared:
0.3805
F-statis匚ic;
2.535on8and12DF,p-value:
0.07109
y=-1340.879-2.816X1+278.234X2+25.309X3+1.719X5-6.303X6+27
.989X7-18.964X8+52.593X9
此结果不合理,对其做主成分回归检验:
Importanceofcomponents:
Loadings:
Coirip・1
Comp・2
Cornp・3
Comp・4
Comp・5
Comp・6
Comp・7
Comp・8
0.344
-0・461
0・389
-0・324
0.584
0・121
0.221
V2
0・756
0・554
-0・323
0・114
V3
-0・447
0.524
-0・228
-0・671
V5
0・374
0.368
-0.166
Cl・647
0.514
Cl・103
V6
0・379
0.217
-0・145
-0・644
-0・582
0・122
-0・136
0・433
-0・108
0.255
Cl・131
-0.223
-0・787
-0・223
V8
-0・130
-0.943
0.133
-0・227
0.101
V9
0・446
0・242
0・154
-0.229
0.508
-0・631
由结果可得前三个主成分贡献率达到94.4%,然后进行主成分分析:
pre<
-predict(inydata.br)
mydata$zl<
-pre[,1];
myd&
t•&
$z2<
-pre[/.2];
mydata$z3<
-pre[,3]
lw(formula=V6zl+z2rdata=wydata)
3QMax
3.8929.113
MinIQMedian
-7.^32-3.465-l.QOQ
在R中建立模型:
wydara・1如LmCV4"
i+V2+V3+V3+V6+V7+V8+㈣
smruriary(itiydata・lit))
Call;
lw(±
orwula=V4-VI+V2+V3+V5+V6十W?
十V8十V9)
Residuals;
IlinIQMedian.3QMax
degreesoffreedom
-560・00-143・25-36・29162・19587・2址
Estimate
Std.・Error
t.value
Pr(>
|t|)
■1340.879
1259・75:
L
■:
L・064
0.3CI8
■2・816
2・603
L・032
0.30CI
278.234
L.2O3
0・252
25.309
15・455
:
L・638
0・127
VS
1・719
1・519
L・132
0・280
13・798
-0・457
0・656
V?
63・064
0・444
0・665
56・572
-0・335
0・743
S2・593
39・781
0・211
Residualstandarderror:
319.3on12
继续建模:
mydata.Lm=lrti(V4-V1+V2+V3+V5+V6+V7+V9)
suinmary(rriydata.Im)
lm(formula=V4-VI+V2+V3+V5+V6+V7+V9)
Min
-552・77-122
IQMedian
.93-44.06
30
1=4・9吕
611.38
Coefficient-s
■
EstimateStd・Error
tvalue
(Inve匚ezp匸)
-1313.893
1213.438
-1.083
0.299
-2.889
2.503
-1.154
0.269
294.636
218.267
1.350
0.200
24.645
1吆・795
1・666
0・120
1.771
1・458
1.215
0・246
-7.659
12.733
・0・601
0・558
39.609
50・854
0・779
0・450
44.386
30・264
1・467
0・166
Residualstandardetrtror:
308・2on13degreesoffreedom
MultipleR-squared:
0・6248fAdjustedR-squared:
0.4228
F-statistic:
3-093on?
and13DF<
p-value:
0・0376
wydat^・lx产1尚
suwtrtary(wydata・Lm)
lrn(formula=V4-VI+V2+V3+V5+U?
+U9)
KinIQMedian.3QMax
-562.72-125.32-59.32152.35542.44
PrOlcn
-1583.233
1101・&
址0
-:
L・437
0.1727
-2・942
2・4:
44
L・20^
0.2486
274.517
210.7L5
L・303
0.2137
27・990
L3・395
2・090
0.0554・
1.553
1・380
1・1Z6
0.2792
44.338
49・084
0・903
0.3816
45.203
29・537
L・530
0.1482
Signif・codes:
0、*e0・001、"
*0・01.0.05、・*0.1、・1standarderror:
301・1.on14degreesoffreedom
R-squared:
0・6144^AdjustedR—squerrgd:
0・4491
F-statistic:
3・717on.6and14DFZp-value:
0.02013
rnydata・
surcanarytmvdata,lrn)
lm(formula=V4-VI+U2+V3+V5+V9)
MinIQMedian3QMax
一634・7一1_38・6-62.6160.6519・9
-1062.03Q
932.903
-1.136
0.2728
-1.845
2.108
-0.875
0.3952
307.817
206.188
1.493
0.1562
20.608
10.548
1・954
0・0696・
1.717
1.359
1・263
0・2257
43.556
29.299
1・487
0・1578
Signlf・codes:
0*汁汁汁「0.001卞/0・01、需'
0・050・1'
'
1
299.2on15degreeso±
freedoin
0.5919xAdjustedP-squared:
0・4558
4・351on5and15DF,p-value:
0.01201
mydata・lw=lw(V4-V2+V3+V5+V9)
3urt(raary(inydata・ln»
Call!
orwula=V4-V2+V3+V5+V9)
Min10Median3QMax
-589・93-13S・27-9・73188・00535・86
Coefficients;
-1336.280
844.920
-1.653
□.1179
377.319
188.888
1.998
0.0631.
22.079
10.337
2.136
0.0485*
2・173
1.246
1・7址址
0・1004
29・768
24.522
1・214
0・2424
5igni±
・codes:
00.001n0・0:
L、畜'
0・050.1*『1
297on.16degreesoffreedom
MultipleP-squared:
0・571,AdjustedR-squared:
0・4638
5・32Son4and.16DF,p-value:
0・006384
wydata.lm=lw(V4-V2+V3+VS)
simiwary(mydata・lm)
lw(forwula=V4-V2+V3+V5)
Pesiduals:
MiniQHedian3QMax
0.050.1、
-749•合S-i42・49i4・362SO・S3475・5仔
Coe±
±
icients;
Std.Errort.valuePr(>
|匚I)
-613.453
553.459
-1.108
0.2831
382・723
191•址98
L・999
0・0618•
12.025
6・271
L・918
0・0721•
2・458
L・24:
L・980
0・0641•
Signi±
0、古古古"
0・001nCLOLw
此结果结果符合要求c
作图得
Fittedvalues
lm(V4〜V2十V3+V5)
NormalQ-Q
cnronp一S(D」P(DZ一Eropuss
・2・1012
TheoreticalQuantiles
lm(V4-V2+V3+V5)
Scale-Location
lm(#4~V2十V3十站5)
ResidualsvsLeverage
0.00.10.20.30.40.50.6
Leverage
lm(V4〜V2+V3+V5)
所以回归方程为:
y—613.453+382.723X2+12.025X3+2.458X5