主成分分析实验报告.docx
《主成分分析实验报告.docx》由会员分享,可在线阅读,更多相关《主成分分析实验报告.docx(9页珍藏版)》请在冰豆网上搜索。
![主成分分析实验报告.docx](https://file1.bdocx.com/fileroot1/2023-1/12/88a6005e-5f33-4836-8dd8-6d5ec9cd1d99/88a6005e-5f33-4836-8dd8-6d5ec9cd1d991.gif)
主成分分析实验报告
项目名称实验4―主成分分析
所属课程名称多元统计分析(英)
项目类型综合性实验
实验(实训)日期2012年4月15日
一、实验(实训)概述:
【目的及要求】
主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。
这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。
利用矩阵代数的知识可求解主成分。
按具体的题目要求完成实验报告,并及时上传到给定的FTP和课程网站!
【基本原理】
利用指标之间的相关性,将多个指标转化为少数几个综合指标。
【实施环境】(使用的材料、设备、软件)
SAS、SPSS、EXCEL软件
二、实验(实训)内容:
【项目内容】
主成分分析。
【方案设计】
题目:
由原始数据求主成分。
【实验(实训)过程】(步骤、记录、数据、程序等)
附后
【结论】(结果、分析)
附后
三、指导教师评语及成绩:
评语:
成绩:
指导教师签名:
批阅日期:
实验报告4
主成分分析(综合性实验)
(Principalcomponentanalysis)
实验原理:
主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。
这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。
利用矩阵代数的知识可求解主成分。
实验题目:
下表中给出了不同国家及地区的男子径赛记录:
(t8a6)
Country
100m(s)
200m(s)
400m(s)
800m(min)
1500m(min)
5000m(min)
10,000m(min)
Marathon(mins)
Argentina
10.39
20.81
46.84
1.81
3.7
14.04
29.36
137.72
Australia
10.31
20.06
44.84
1.74
3.57
13.28
27.66
128.3
Austria
10.44
20.81
46.82
1.79
3.6
13.26
27.72
135.9
Belgium
10.34
20.68
45.04
1.73
3.6
13.22
27.45
129.95
Bermuda
10.28
20.58
45.91
1.8
3.75
14.68
30.55
146.62
Brazil
10.22
20.43
45.21
1.73
3.66
13.62
28.62
133.13
Burma
10.64
21.52
48.3
1.8
3.85
14.45
30.28
139.95
Canada
10.17
20.22
45.68
1.76
3.63
13.55
28.09
130.15
Chile
10.34
20.8
46.2
1.79
3.71
13.61
29.3
134.03
China
10.51
21.04
47.3
1.81
3.73
13.9
29.13
133.53
Columbia
10.43
21.05
46.1
1.82
3.74
13.49
27.88
131.35
CookIslands
12.18
23.2
52.94
2.02
4.24
16.7
35.38
164.7
CostaRica
10.94
21.9
48.66
1.87
3.84
14.03
28.81
136.58
Czechoslovakia
10.35
20.65
45.64
1.76
3.58
13.42
28.19
134.32
Denmark
10.56
20.52
45.89
1.78
3.61
13.5
28.11
130.78
DominicanRepublic
10.14
20.65
46.8
1.82
3.82
14.91
31.45
154.12
Finland
10.43
20.69
45.49
1.74
3.61
13.27
27.52
130.87
France
10.11
20.38
45.28
1.73
3.57
13.34
27.97
132.3
German(D.R.)
10.12
20.33
44.87
1.73
3.56
13.17
27.42
129.92
German(F.R.)
10.16
20.37
44.5
1.73
3.53
13.21
27.61
132.23
GreatBrit.&N.Ireland
10.11
20.21
44.93
1.7
3.51
13.01
27.51
129.13
Greece
10.22
20.71
46.56
1.78
3.64
14.59
28.45
134.6
Guatemala
10.98
21.82
48.4
1.89
3.8
14.16
30.11
139.33
Hungary
10.26
20.62
46.02
1.77
3.62
13.49
28.44
132.58
India
10.6
21.42
45.73
1.76
3.73
13.77
28.81
131.98
Indonesia
10.59
21.49
47.8
1.84
3.92
14.73
30.79
148.83
Ireland
10.61
20.96
46.3
1.79
3.56
13.32
27.81
132.35
Israel
10.71
21
47.8
1.77
3.72
13.66
28.93
137.55
Italy
10.01
19.72
45.26
1.73
3.6
13.23
27.52
131.08
Japan
10.34
20.81
45.86
1.79
3.64
13.41
27.72
128.63
Kenya
10.46
20.66
44.92
1.73
3.55
13.1
27.38
129.75
Korea
10.34
20.89
46.9
1.79
3.77
13.96
29.23
136.25
D.P.RKorea
10.91
21.94
47.3
1.85
3.77
14.13
29.67
130.87
Luxembourg
10.35
20.77
47.4
1.82
3.67
13.64
29.08
141.27
Malaysia
10.4
20.92
46.3
1.82
3.8
14.64
31.01
154.1
Mauritius
11.19
22.45
47.7
1.88
3.83
15.06
31.77
152.23
Mexico
10.42
21.3
46.1
1.8
3.65
13.46
27.95
129.2
Netherlands
10.52
20.95
45.1
1.74
3.62
13.36
27.61
129.02
NewZealand
10.51
20.88
46.1
1.74
3.54
13.21
27.7
128.98
Norway
10.55
21.16
46.71
1.76
3.62
13.34
27.69
131.48
PapuaNewGuinea
10.96
21.78
47.9
1.9
4.01
14.72
31.36
148.22
Philippines
10.78
21.64
46.24
1.81
3.83
14.74
30.64
145.27
Poland
10.16
20.24
45.36
1.76
3.6
13.29
27.89
131.58
Portugal
10.53
21.17
46.7
1.79
3.62
13.13
27.38
128.65
Rumania
10.41
20.98
45.87
1.76
3.64
13.25
27.67
132.5
Singapore
10.38
21.28
47.4
1.88
3.89
15.11
31.32
157.77
Spain
10.42
20.77
45.98
1.76
3.55
13.31
27.73
131.57
Sweden
10.25
20.61
45.63
1.77
3.61
13.29
27.94
130.63
Switzerland
10.37
20.46
45.78
1.78
3.55
13.22
27.91
131.2
Taipei
10.59
21.29
46.8
1.79
3.77
14.07
30.07
139.27
Thailand
10.39
21.09
47.91
1.83
3.84
15.23
32.56
149.9
Turkey
10.71
21.43
47.6
1.79
3.67
13.56
28.58
131.5
USA
9.93
19.75
43.86
1.73
3.53
13.2
27.43
128.22
USSR
10.07
20
44.6
1.75
3.59
13.2
27.53
130.55
WesternSamoa
10.82
21.86
49
2.02
4.24
16.28
34.71
161.83
(数据来源:
1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)
实验要求:
(1)试用Princomp过程求主成分;并对结果进行解释;
(2)试用方差累积贡献率和Scree图确定主成分的个数;
(3)计算各国第一主成分的得分并排名;
(4)试对结果进行解。
实验题目分析报告:
(1)试用Princomp过程求主成分;并对结果进行解释;
如上就是主成分分析截图,利用sas处理数据后我们可以知道:
有8个主成分。
(2)试用方差累积贡献率和Scree图确定主成分的个数;
从上面的主成分累计贡献率截图和碎石图我们可以分析:
选取两个主成分的贡献率就已经达到0.9375.所以我们选取2个主成分个数。
(3)计算各国第一主成分的得分并排名;
(4)试对结果进行解。
对上述的各个国家的第一主成分得分排名,排在第一的是CoookIsland,排名中也有出现第一主成分得分负数的,这主要是因为求出来的数据与对应的数据相乘的结果。
相关程序:
(1)导入数据程序
PROCIMPORTOUT=WORK.b
DATAFILE="f:
\sas\test.xls"
DBMS=EXCELREPLACE;
RANGE="Sheet1$";
GETNAMES=YES;
MIXED=NO;
SCANTEXT=YES;
USEDATE=YES;
SCANTIME=YES;
RUN;
(2)得到主成分并且画图分析程序:
title;
footnote;
***PrincipalComponentsAnalysis***;
optionspageno=1;
odsoutputEigenvalues=work._eigen;
procprincompdata=WORK.bout=WORK.SCOREoutstat=WORK.STATS;
varABCDEFGH;
run;quit;
goptionsreset=alldevice=WIN;
***ScreePlot***;
datawork._eigen;setwork._eigen;
ifeigenvalue>0;
renamenumber=Component;
dropdifferenceproportioncumulative;
run;
title;
footnote;
goptionsftext=SWISSctext=BLACKhtext=1cells;
axis1minor=nonemajor=(number=5)label=('Eigenvalue');
pattern1value=SOLIDcolor=BLUE;
procgchartdata=work._eigen;
formateigenvaluebest8.;
vbarcomponent/type=sumsumvar=eigenvaluediscrete
raxis=axis1frame
cframe=CXF7E1C2caxis=BLACKcoutline=BLACK
name='SCREE'
description='Screeplot';
run;
quit;
goptionsreset=patternftext=ctext=htext=;
goptionsreset=alldevice=WIN;