对应分析 SAS讲义12.docx

上传人:b****5 文档编号:6402559 上传时间:2023-01-06 格式:DOCX 页数:11 大小:179KB
下载 相关 举报
对应分析 SAS讲义12.docx_第1页
第1页 / 共11页
对应分析 SAS讲义12.docx_第2页
第2页 / 共11页
对应分析 SAS讲义12.docx_第3页
第3页 / 共11页
对应分析 SAS讲义12.docx_第4页
第4页 / 共11页
对应分析 SAS讲义12.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

对应分析 SAS讲义12.docx

《对应分析 SAS讲义12.docx》由会员分享,可在线阅读,更多相关《对应分析 SAS讲义12.docx(11页珍藏版)》请在冰豆网上搜索。

对应分析 SAS讲义12.docx

对应分析SAS讲义12

对应分析SAS程序

2010年5月

一、对应分析的统计思想

二、对应分析的原理

三、对应分析的SAS程序与应用

四、对应分析练习题

 

第一节对应分析的基本理论

对应分析又称相应分析,于1970年由法国统计学家J.P.Beozecri提出的.

对应分析是将频数或计数表的各种联系用图来表示的方法。

对应分析本质是一种在低维空间中用图形方法表示联系的技术。

对应分析(CorrespondenceAnalysis):

通过分析由定性变量构成的交互汇总表来揭示变量间的联系。

对应分析可以揭示同一变量的各个类别之间的差异,不同变量各个类别之间的对应关系。

可以将两个变量的联系做在一个图里表示出来。

它是在R型和Q型因子分析基础上发展起来的多元统计分析方法,故也称为R-Q型因子分析.因子分析方法是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R型和Q型,如果研究变量间的相互关系时采用R型因子分析;如果研究样品间相互关系时采用Q型因子分析.

第二节对应分析原理

5、将因子载荷为座标作图,得到对应分析图

奇异值是惯量(特征值)的平方根。

惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。

 

第三节SAS对应分析程序

例:

 

 

生活自理能力

 

 

完全自理1

部分自理2

不能自理3

合计

很好A

129

14

8

151

好B

931

146

96

1173

一般C

660

116

74

850

差D

251

104

81

436

很差E

11

7

23

41

没回答F

15

13

24

52

合计

1997

400

306

2703

Dataex2;

Inputzipin$zilirenshu;

datalines;

a1129

a214

a38

b1931

b2146

b396

c1660

c2116

c374

d1251

d2104

d381

e111

e27

e323

f115

f213

f324

;

Proccorrespdata=ex2alloutc=result;

tableszipin,zili;

weightrenshu;

Run;

%plotit(data=result,datatype=corresp)

卡方分解表

TheCORRESPProcedure

InertiaandChi-SquareDecomposition

SingularPrincipalChi-Cumulative

ValueInertiaSquarePercentPercent1836547290

----+----+----+----+----+---

0.296150.08770237.06092.4592.45**************************

0.084630.0071619.3587.55100.00**

Total0.09486256.418100.00

DegreesofFreedom=10

奇异值(SingularValue)是主惯量(PrincipalInertia)特征值的平方根。

惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度。

第一维度可解释总信息的92.45%

 

RowCoordinates

Dim1Dim2

a-0.2546-0.0768

b-0.1257-0.0267

c-0.0941-0.0018

d0.33840.1530

e1.3810-0.4086

f1.1856-0.1051

Q型因子载荷矩阵也就是样本的因子载荷阵,用来反映样本在第一公因子(Dim1)和第二公因子(Dim2)上的载荷程度

从第一因子载荷可以看出,a,b,c是一组负值,d,e,f是正值,值越大健康状况越差

ColumnCoordinates

Dim1Dim2

1-0.1590-0.0216

20.23170.1920

30.7346-0.1097

R型因子载荷矩阵也就是变量的因子载荷阵,用来反映各变量在第一公因子(Dim1)和第二

公因子(Dim2)上的载荷程度.

第一维度说明,自理能力,越小则自理能力越强。

从图形上可以综合将两个变量的关系加以说明。

SummaryStatisticsfortheColumnPoints

QualityMassInertia

11.00000.73880.2005

21.00000.14800.1412

31.00000.11320.6583

SummaryStatisticsfortheRowPoints

QualityMassInertia

a1.00000.05590.0417

b1.00000.43400.0755

c1.00000.31450.0294

d1.00000.16130.2346

e1.00000.01520.3317

f1.00000.01920.2873

边缘频率(MASS密度)如(0.0559=151/2703);

Inertia对总惯量的相对贡献,e,f,d对惯量贡献最大

TheCORRESPProcedure

SquaredCosinesfortheRowPoints

Dim1Dim2

a0.91660.0834

b0.95680.0432

c0.99960.0004

d0.83030.1697

e0.91950.0805

f0.99220.0078

从原点到这一点的向量和每一座标轴夹角余弦平方。

表示哪个座标轴起作用。

IndicesoftheCoordinatesthatContributeMosttoInertiafortheRowPoints

Dim1Dim2Best

a002

b001

c001

d222

e222

f101

指示哪个点能最好地解释每一维的惯量。

PartialContributionstoInertiafortheRowPoints

Dim1Dim2

a0.04130.0460

b0.07810.0432

c0.03170.0001

d0.21060.5273

e0.32990.3537

f0.30830.0297

 

例2

SAS手册例题

各年份读博士学位的专业选择特点

title"NumberofPh.D'sAwardedfrom1973to1978";

dataPhD;

inputScience$1-19y1973-y1978;

labely1973='1973'

y1974='1974'

y1975='1975'

y1976='1976'

y1977='1977'

y1978='1978';

datalines;

LifeSciences448943034402435042664361

PhysicalSciences410138003749357234103234

SocialSciences335432863344327831373008

BehavioralSciences244425872749287829603049

Engineering333831442959279126412432

Mathematics1222119611491003959959

;

proccorrespdata=PhDout=Resultsshort;

vary1973-y1978;

idScience;

run;

procprintdata=results;run;

procplotdata=results;

plotDim1*Dim2$science="*";

run;

%plotit(data=Results,datatype=corresp,plotvars=Dim1Dim2)

TheCORRESPProcedure

InertiaandChi-SquareDecomposition

SingularPrincipalChi-Cumulative

ValueInertiaSquarePercentPercent1836547290

----+----+----+----+----+---

0.041490.00172119.40091.3491.34*************************

0.010640.000117.8476.0097.34**

0.007080.000053.4782.66100.00*

Total0.00188130.726100.00

DegreesofFreedom=15

RowCoordinates

Dim1Dim2

LifeSciences-0.04000.0068

SocialSciences-0.0142-0.0131

Engineering0.0571-0.0038

Mathematics0.05150.0218

ColumnCoordinates

Dim1Dim2

19730.05130.0049

19740.04520.0035

19750.00930.0003

1976-0.0200-0.0165

1977-0.0328-0.0096

1978-0.06470.0175

 

练习:

1、对应分析的数据形式

ABCD是发掘地点,P0-P6是出土文物品种

A

B

C

D

P0

30

10

10

39

P1

53

4

16

2

P2

73

1

41

1

P3

20

6

1

4

P4

46

36

37

13

P5

45

6

59

10

P6

16

28

169

5

2、

 

父母社会经济状况高低

心理

 

高1

2

3

4

低5

受损

Impaired

86

60

94

78

71

轻微

MildSymp

188

105

141

97

71

中等

Moderate

112

65

77

54

54

Well

121

57

72

36

21

 

3、

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1