实验九典型相关分析.docx

上传人:b****6 文档编号:6626516 上传时间:2023-01-08 格式:DOCX 页数:22 大小:139.48KB
下载 相关 举报
实验九典型相关分析.docx_第1页
第1页 / 共22页
实验九典型相关分析.docx_第2页
第2页 / 共22页
实验九典型相关分析.docx_第3页
第3页 / 共22页
实验九典型相关分析.docx_第4页
第4页 / 共22页
实验九典型相关分析.docx_第5页
第5页 / 共22页
点击查看更多>>
下载资源
资源描述

实验九典型相关分析.docx

《实验九典型相关分析.docx》由会员分享,可在线阅读,更多相关《实验九典型相关分析.docx(22页珍藏版)》请在冰豆网上搜索。

实验九典型相关分析.docx

实验九典型相关分析

课 时 授 课 计 划

课次序号:

22

一、课  题:

实验九典型相关分析

二、课  型:

上机实验

三、目的要求:

1.掌握典型相关分析的理论与方法、模型的建立与显著性检验;

2.掌握利用典型相关分析的SAS过程解决有关实际问题.

四、教学重点:

典型相关分析的SAS过程.

教学难点:

相关分析的理论与方法、模型的建立与显著性检验.

五、教学方法及手段:

传统教学与上机实验相结合.

六、参考资料:

《应用多元统计分析》,高惠璇编,北京大学出版社,2005;

《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;

《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;

《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007;

《统计建模与R软件》,薛毅编著,清华大学出版社,2007.

七、作业:

4.94.10

八、授课记录:

授课日期

班  次

九、授课效果分析:

 

实验九典型相关分析(CanonicalCorrelationAnalysis)(2学时)

一、实验目的和要求

能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量.

二、实验内容

1.典型相关分析的SAS过程—PROCCANCORR过程

基本语句:

PROCCANCORR;

VARvariables;

WITHvariables;

RUN;

说明:

此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.

(1)proccancorr语句的<选项列表>:

第三十七课OUT=SAS数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.

第三十八课OUTSTAT=SAS数据集——创建含原始变量的样本均值、样本标准差、样本相关系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集.

第三十九课CORR(或C)——打印原始变量的样本相关系数矩阵.

第四十课NCAN=m——规定要求输出的典型变量对个数,默认为两组变量个数较小者.

第四十一课EDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.

第四十二课all——所有输出项.

第四十三课noprint——不输出分析结果.

第四十四课short——只输出典型相关系数和多元分析统计数.

第四十五课simple——简单统计数.

第四十六课vname=变量名——为var语句的变量定义名称.

第四十七课vprefix=前缀名——为var语句的典型变量定义前缀.

第四十八课wname=变量名——为with语句的变量定义名称.

第四十九课wprefix=前缀名——为with语句的典型变量定义前缀.

(2)VARvariables——VAR后列出进行相关分析的第一组变量名称.

(3)WITHvariables——WITH后列出进行相关分析的第二组变量名称

var与with语句经常同proccancorr语句一起使用.其他语句类似corr过程.

2.典型相关分析步骤

两组随机变量

取值

组观测数据

标准化样本

样本相关系数矩阵

为总体

相关系数矩阵

的估计.

样本典型相关分析步骤:

(1)求

)的特征值

(2)求

对应的正交单位化特征向量

(3)第k对典型相关变量为

其中

样本典型相关系数为

(4)典型相关系数的显著性检验

统计量

检验

值为

,拒绝

依次就

进行检验,若对某个

,检验

值首次满足

,则认为只有前

对典型变量显著相关,选取前

对即可.

注意:

利用样本协方差矩阵,分析方法一样.不需要对数据标准化处理.

3.实例分析

例4.6为研究空气温度与土壤温度的关系,考虑六个变量

日最高土壤温度;

日最低土壤温度;

日土壤温度积分值;

日最高气温;

日最低气温;

日气温曲线积分值.

观测了

天,数据如表4.7.

做典型相关分析.

解:

(1)建立输入数据集,程序如下:

dataexamp4_6;

inputx1-x3y1-y3;

cards;

85591518465147

86611598465149

83641527966142

83651588167147

88691808468167

77671477466131

78691597366131

84681597567134

89711958468161

91762068672169

91762068873176

94762119074187

94752118872171

92702015872171

87681678169154

83681627968149

87661738469160

87681778470160

88701698470168

83661707767147

92671968767166

92721998969171

94722048972180

92732019372186

93722069374188

94722089475199

95732149374193

95702109374196

95712079675198

95692029576202

96691738473173

91691689171170

89701898872179

95712108972179

96732089172182

97752159274196

96691989475192

95671969675195

94752119376198

92731988874188

90741978874178

94702059172175

95712099272190

96722089273189

95712089475194

96712089676202

;

run;

(2)调用典型相关分析cancorr过程

菜单操作方法为,选择Globals/SAS/Assist/Dataanalysis/multivariate/canonicalcorrelationanalysis(典型相关分析)菜单命令.

编程方法如下:

proccancorrdata=examp4_6corr;/*调用相关分析过程,打印样本相关系数矩阵*/

varx1-x3;/*第一组变量x1-x3*/

withy1-y3;/*第二组变量y1-y3*/

run;

由SASproccancorr过程求得

样本相关系数矩阵

SAS系统10:

24Sunday,November2,200814

TheCANCORRProcedure

CorrelationsAmongtheOriginalVariables

CorrelationsAmongtheVARVariables(变量x1-x3的相关系数矩阵

x1x2x3

x11.00000.57050.8751

x20.57051.00000.7808

x30.87510.78081.0000

CorrelationsAmongtheWITHVariables(变量y1-y3的相关系数矩阵

y1y2y3

y11.00000.67050.7850

y20.67051.00000.9324

y30.78500.93241.0000

CorrelationsBetweentheVARVariablesandtheWITHVariables

变量x1-x3与y1-y3的相关系数矩阵

y1y2y3

x10.71360.84000.9143

x20.37960.68090.5907

x30.62560.81850.8695

变量间高度相关。

SAS系统10:

24Sunday,November2,200815

TheCANCORRProcedure

CanonicalCorrelationAnalysis

典型相关分析的一般结果

AdjustedApproximateSquared

CanonicalCanonicalStandardCanonical

CorrelationCorrelationErrorCorrelation

典型相关系数

校正的典型相关系数近似的标准误典型相关系数平方

1

=0.9278570.9223450.020733

=0.860919

2

=0.5621810.5398330.101958

=0.316047

3

=0.165974.0.144965

=0.027547

(3)检验各对典型变量是否显著相关

表4.8各对典型变量相关性检验结果

EigenvaluesofInv(E)*HTestofH0:

Thecanonicalcorrelationsinthe

=CanRsq/(1-CanRsq)即

currentrowandallthatfollowarezero

LikelihoodApproximate

EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>F

各对相关系相邻两特特征值占特征值占方差似然比

数特征值征值之差方差比例比例累计值

16.19015.72800.92660.92660.0925044017.98997.5<.0001

20.46210.43380.06920.99580.665111584.644820.0020

30.02830.00421.00000.972452681.191420.2816

检验假设

检验统计量

为第一、第二自由度.由检验结果可知,

.故只有前两对典型变量显著相关.取前两对进行分析即可.

另外,从对典型变量

进行分析求得特征值在方差占比例的累计值(贡献率)为0.9958也可看出,只需要前两对变量即可.

以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验

MultivariateStatisticsandFApproximations

S=3M=-0.5N=19

StatisticValueFValueNumDFDenDFPr>F

统计方法F值检验p值

Wilks'Lambda0.0925044017.98997.5<.0001

Pillai'sTrace1.204513669.399126<.0001

Hotelling-LawleyTrace6.6804708129.18959.755<.0001

Roy'sGreatestRoot6.1900536086.66342<.0001

NOTE:

FStatisticforRoy'sGreatestRootisanupperbound.

(4)求出典型变量及典型相关系数,并解释

 

典型变量的系数和典型结构

SAS系统10:

24Sunday,November2,200816

TheCANCORRProcedure

CanonicalCorrelationAnalysis

RawCanonicalCoefficientsfortheVARVariables

第一组变量x1-x3的典型变量的系数(原始变量未标准化)

第一典型变量

第二典型变量

V1V2V3

x10.12801998270.1095637597-0.406148274

x2-0.0313304930.4635275823-0.074977596

.021*******

第二组变量y1-y3的典型变量的系数(原始变量为标准化)

RawCanonicalCoefficientsfortheWITHVariables

第一典型变量

第二典型变量

W1W2W3

y1-0.0115648350.0308514741-0.222582518

y2-0.0611632560.8627405447-0.119837671

y30.0624247406-0.1379069240.0811935636

数据未标准化结果,即利用协方差矩阵分析的结果

其余略

SAS系统10:

24Sunday,November2,200817

TheCANCORRProcedure

CanonicalCorrelationAnalysis

第一组变量x1-x3的典型变量的系数(原始变量标准化后)

StandardizedCanonicalCoefficientsfortheVARVariables

第一典型变量

第二典型变量

V1V2V3

x1(即

)0.64850.5550-2.0575

x2(即

)-0.11491.6993-0.2749

x3(即

)0.4600-1.69632.3422

第二组变量y1-y3的典型变量的系数(原始变量标准化后)

StandardizedCanonicalCoefficientsfortheWITHVariables

第一典型变量

第一典型变量

W1W2W3

y1-0.08630.2302-1.6609

y2-0.20162.8436-0.3950

给出

的三个特征值

.

第一对典型变量

主要日最高、日均土壤温度加权

主要受日均气温影响

第一对典型变量主要表现日均气温与日均、最高土壤温度相关性。

气温高,则土壤温度高。

第一对典型相关系数为

第二、第三对典型变量及典型相关系数

主要日最低土壤温度和日均土壤温度差异

主要最低气温和日均气温的差异

第二对变量主要表现日均温差与土壤温差的关系。

温差大,则土壤温度差异大。

(5)以下输出原变量和典型变量间的相关系数(可不要求)

SAS系统10:

24Sunday,November2,200818

TheCANCORRProcedure

CanonicalStructure

第一组变量x1-x3和它们的典型变量

的相关系数

CorrelationsBetweentheVARVariablesandTheirCanonicalVariables

V1V2V3

x10.98560.0400-0.1646

x20.61430.69150.3802

x30.93780.11630.3270

第二组变量y1-y3和它们的典型变量

的相关系数

CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables

W1W2W3

y10.7620-0.0358-0.6466

y20.90860.41760.0107

y30.99700.0647-0.0428

第一组变量x1-x3和第二组典型变量

的相关系数

CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables

W1W2W3

x10.91450.0225-0.0273

x20.57000.38870.0631

x30.87020.06540.0543

第二组变量y1-y3和第一组典型变量

的相关系数

CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables

V1V2V3

y10.7070-0.0201-0.1073

y20.84300.23470.0018

y30.92510.0364-0.0071

原变量和第一对变量相关程度高,后两组提取的信息很少,与典型对系数一致。

练习:

评委打分问题

dataexamp1;

inputx1-x3y1-y3;

cards;

864385439371

997499789989

372210272433

51956131138

454355395458

213221343532

367848754278

693185327052

409836996486

26144082521

516838684872

638679877695

398057805568

784072427558

564954485261

398071765281

65553116741

281131122335

503268234958

699869978199

559978976090

3611515265

771861276854

673395345961

458746856780

617263636275

416374555076

65135513

285335513159

662079186755

;

run;

(2)调用典型相关分析cancorr过程

菜单操作方法为,选择Globals/SAS/Assist/Dataanalysis/multivariate/canonicalcorrelationanalysis(典型相关分析)菜单命令.

编程方法如下:

proccancorrdata=ex5corr;/*调用相关分析过程,打印样本相关系数矩阵*/

varx1-x3;/*第一组变量x1-x3*/

withy1-y3;/*第二组变量y1-y3*/

run;

SAS系统2008年08月01日星期五下午09时25分34秒1

TheCANCORRProcedure

CorrelationsAmongtheOriginalVariables

CorrelationsAmongtheVARVariables

x1x2x3

x11.00000.22660.7249

x20.22661.00000.3345

x30.72490.33451.0000

CorrelationsAmongtheWITHVariables

y1y2y3

y11.00000.52230.8898

y20.52231.00000.7144

y30.88980.71441.0000

CorrelationsBetweentheVARVariablesandtheWITHVariables

y1y2y3

x10.27810.91870.5144

x20.99040.48210.8954

x30.31860.75670.6409

SAS系统2008年08月01日星期五下午09时25分34秒2

TheCANCORRProcedure

CanonicalCorrelationAnalysis

AdjustedApproximateSquared

CanonicalCanonicalStandardCanonical

CorrelationCorrelationErrorCorrelation

10.9954400.9949330.0016900.990902

20.9528200.9510820.0171090.907865

30.637323.0.1102700.406180

TestofH0:

Thecanonicalcorrelationsin

EigenvaluesofInv(E)*Hthecurrentrowandallthatfollowarezero

=CanRsq/(1-CanRsq)

LikelihoodApproximate

EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>F

1108.911299.05750.91180.91180.00049778141.58958.56<.0001

29.85369.16960.08250.99430.0547115840.94450<.0001

30.68400.00571.00000.5938199317.781260.0003

 

MultivariateStatisticsandFApproximations

S=3M=-0.5N=11

StatisticValueFValueNumDFDenDFP

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 入党转正申请

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1