对应分析 SAS讲义12.docx
《对应分析 SAS讲义12.docx》由会员分享,可在线阅读,更多相关《对应分析 SAS讲义12.docx(11页珍藏版)》请在冰豆网上搜索。
对应分析SAS讲义12
对应分析SAS程序
2010年5月
一、对应分析的统计思想
二、对应分析的原理
三、对应分析的SAS程序与应用
四、对应分析练习题
第一节对应分析的基本理论
对应分析又称相应分析,于1970年由法国统计学家J.P.Beozecri提出的.
对应分析是将频数或计数表的各种联系用图来表示的方法。
对应分析本质是一种在低维空间中用图形方法表示联系的技术。
对应分析(CorrespondenceAnalysis):
通过分析由定性变量构成的交互汇总表来揭示变量间的联系。
对应分析可以揭示同一变量的各个类别之间的差异,不同变量各个类别之间的对应关系。
可以将两个变量的联系做在一个图里表示出来。
它是在R型和Q型因子分析基础上发展起来的多元统计分析方法,故也称为R-Q型因子分析.因子分析方法是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R型和Q型,如果研究变量间的相互关系时采用R型因子分析;如果研究样品间相互关系时采用Q型因子分析.
第二节对应分析原理
5、将因子载荷为座标作图,得到对应分析图
奇异值是惯量(特征值)的平方根。
惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。
第三节SAS对应分析程序
例:
生活自理能力
完全自理1
部分自理2
不能自理3
合计
自
评
健
康
状
况
很好A
129
14
8
151
好B
931
146
96
1173
一般C
660
116
74
850
差D
251
104
81
436
很差E
11
7
23
41
没回答F
15
13
24
52
合计
1997
400
306
2703
Dataex2;
Inputzipin$zilirenshu;
datalines;
a1129
a214
a38
b1931
b2146
b396
c1660
c2116
c374
d1251
d2104
d381
e111
e27
e323
f115
f213
f324
;
Proccorrespdata=ex2alloutc=result;
tableszipin,zili;
weightrenshu;
Run;
%plotit(data=result,datatype=corresp)
卡方分解表
TheCORRESPProcedure
InertiaandChi-SquareDecomposition
SingularPrincipalChi-Cumulative
ValueInertiaSquarePercentPercent1836547290
----+----+----+----+----+---
0.296150.08770237.06092.4592.45**************************
0.084630.0071619.3587.55100.00**
Total0.09486256.418100.00
DegreesofFreedom=10
奇异值(SingularValue)是主惯量(PrincipalInertia)特征值的平方根。
惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。
第一维度可解释总信息的92.45%
RowCoordinates
Dim1Dim2
a-0.2546-0.0768
b-0.1257-0.0267
c-0.0941-0.0018
d0.33840.1530
e1.3810-0.4086
f1.1856-0.1051
Q型因子载荷矩阵也就是样本的因子载荷阵,用来反映样本在第一公因子(Dim1)和第二公因子(Dim2)上的载荷程度
从第一因子载荷可以看出,a,b,c是一组负值,d,e,f是正值,值越大健康状况越差
ColumnCoordinates
Dim1Dim2
1-0.1590-0.0216
20.23170.1920
30.7346-0.1097
R型因子载荷矩阵也就是变量的因子载荷阵,用来反映各变量在第一公因子(Dim1)和第二
公因子(Dim2)上的载荷程度.
第一维度说明,自理能力,越小则自理能力越强。
从图形上可以综合将两个变量的关系加以说明。
SummaryStatisticsfortheColumnPoints
QualityMassInertia
11.00000.73880.2005
21.00000.14800.1412
31.00000.11320.6583
SummaryStatisticsfortheRowPoints
QualityMassInertia
a1.00000.05590.0417
b1.00000.43400.0755
c1.00000.31450.0294
d1.00000.16130.2346
e1.00000.01520.3317
f1.00000.01920.2873
边缘频率(MASS密度)如(0.0559=151/2703);
Inertia对总惯量的相对贡献,e,f,d对惯量贡献最大
TheCORRESPProcedure
SquaredCosinesfortheRowPoints
Dim1Dim2
a0.91660.0834
b0.95680.0432
c0.99960.0004
d0.83030.1697
e0.91950.0805
f0.99220.0078
从原点到这一点的向量和每一座标轴夹角余弦平方。
表示哪个座标轴起作用。
IndicesoftheCoordinatesthatContributeMosttoInertiafortheRowPoints
Dim1Dim2Best
a002
b001
c001
d222
e222
f101
指示哪个点能最好地解释每一维的惯量。
PartialContributionstoInertiafortheRowPoints
Dim1Dim2
a0.04130.0460
b0.07810.0432
c0.03170.0001
d0.21060.5273
e0.32990.3537
f0.30830.0297
例2
SAS手册例题
各年份读博士学位的专业选择特点
title"NumberofPh.D'sAwardedfrom1973to1978";
dataPhD;
inputScience$1-19y1973-y1978;
labely1973='1973'
y1974='1974'
y1975='1975'
y1976='1976'
y1977='1977'
y1978='1978';
datalines;
LifeSciences448943034402435042664361
PhysicalSciences410138003749357234103234
SocialSciences335432863344327831373008
BehavioralSciences244425872749287829603049
Engineering333831442959279126412432
Mathematics1222119611491003959959
;
proccorrespdata=PhDout=Resultsshort;
vary1973-y1978;
idScience;
run;
procprintdata=results;run;
procplotdata=results;
plotDim1*Dim2$science="*";
run;
%plotit(data=Results,datatype=corresp,plotvars=Dim1Dim2)
TheCORRESPProcedure
InertiaandChi-SquareDecomposition
SingularPrincipalChi-Cumulative
ValueInertiaSquarePercentPercent1836547290
----+----+----+----+----+---
0.041490.00172119.40091.3491.34*************************
0.010640.000117.8476.0097.34**
0.007080.000053.4782.66100.00*
Total0.00188130.726100.00
DegreesofFreedom=15
RowCoordinates
Dim1Dim2
LifeSciences-0.04000.0068
SocialSciences-0.0142-0.0131
Engineering0.0571-0.0038
Mathematics0.05150.0218
ColumnCoordinates
Dim1Dim2
19730.05130.0049
19740.04520.0035
19750.00930.0003
1976-0.0200-0.0165
1977-0.0328-0.0096
1978-0.06470.0175
练习:
1、对应分析的数据形式
ABCD是发掘地点,P0-P6是出土文物品种
A
B
C
D
P0
30
10
10
39
P1
53
4
16
2
P2
73
1
41
1
P3
20
6
1
4
P4
46
36
37
13
P5
45
6
59
10
P6
16
28
169
5
2、
父母社会经济状况高低
心理
高1
2
3
4
低5
受损
Impaired
86
60
94
78
71
轻微
MildSymp
188
105
141
97
71
中等
Moderate
112
65
77
54
54
好
Well
121
57
72
36
21
3、