实验报告9典型相关分析Word文档下载推荐.docx
《实验报告9典型相关分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《实验报告9典型相关分析Word文档下载推荐.docx(20页珍藏版)》请在冰豆网上搜索。
2、变量y1-y2的相关系数矩阵
CorrelationsAmongtheWITHVariables
y1y2
y11.00000.4200
y20.42001.0000
3、变量x1-x2与y1-y2的相关系数矩阵
CorrelationsBetweentheVARVariablesandtheWITHVariables
x10.24000.0600
x2-0.06000.0700
变量间高度相关。
05Thursday,November18,20132
4典型相关分析的一般结果
CanonicalCorrelationAnalysis
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
CorrelationCorrelationErrorCorrelation
典型相关系数
校正的典型相关系数近似的标准误典型相关系数平方
10.3971120.3969100.0084230.157698
20.072889.0.0099470.005313
5、检验各对典型变量是否显著相关
TestofH0:
Thecanonicalcorrelationsinthe
EigenvaluesofInv(E)*Hcurrentrowandallthatfollowarezero
=CanRsq/(1-CanRsq)
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>
F
各对相关系相邻两特特征值占特征值占方差似然比
值
数特征值征值之差方差比例比例累计值
10.18720.18190.97230.97230.83782737462.33419992<
.0001
20.00530.02771.00000.9946871253.4019997<
第一对典型变量贡献率97.23%。
充分反映了两组变量的相互关系。
检验假设
检验统计量
,
为第一、第二自由度.由检验结果可知,
,.故两对典型变量显著相关.取两对进行分析即可.
另外,从对典型变量
进行分析求得特征值在方差占比例的累计值(贡献率)为0.9947也可看出,两对变量即可。
以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验
6、求出典型变量及典型相关系数,并解释
典型变量的系数和典型结构
MultivariateStatisticsandFApproximations
S=2M=-0.5N=4997
StatisticValueFValueNumDFDenDFPr>
Wilks'
Lambda0.83782737462.33419992<
Pillai'
sTrace0.16301046443.56419994<
Hotelling-LawleyTrace0.19256330481.20411994<
Roy'
sGreatestRoot0.18722205935.8329997<
NOTE:
FStatisticforRoy'
sGreatestRootisanupperbound.
NOTE:
FStatisticforWilks'
Lambdaisexact.
TheSASSystem20:
05Thursday,November18,20133
CanonicalCorrelationAnalysis
RawCanonicalCoefficientsfortheVARVariables
第一组变量x1-x3的典型变量的系数(原始变量未标准化)
第一典型变量
第二典型变量
V1V2
x11.2477984840.3179603133
x2-1.0330394770.7687192318
RawCanonicalCoefficientsfortheWITHVariables
第二组变量y1-y3的典型变量的系数(原始变量为标准化)
W1W2
y11.1018762969-0.007089979
y2-0.4563537171.0029570909
数据未标准化结果,即利用协方差矩阵分析的结果。
05Thursday,November18,20134
第一组变量x1-x2的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheVARVariables
x11.24780.3180
x2-1.03300.7687
第二组变量y1-y2的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheWITHVariables
第一典型变量
W1W2
y11.1019-0.0071
y2-0.45641.0030
给出
的三个特征值
第一对典型变量
主要阅读速度,阅读理解力的影响。
主要计算速度,计算正确程度影响。
第一对典型变量主要表现阅读和计算的相关性。
第一对典型相关系数为
第二对典型变量及典型相关系数
输出原变量和典型变量间的相关系数
05Thursday,November18,20135
TheCANCORRProcedure
CanonicalStructure
第一组变量x1-x2和典型变量
的相关系数
CorrelationsBetweentheVARVariablesandTheirCanonicalVariables
V1V2
x10.59700.8023
x2-0.24690.9690
第二组变量y1-y2和典型变量
CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables
W1W2
y10.91020.4142
y20.00641.0000
第一组变量x1-x2和第二组典型变量
CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables
x10.23710.0585
x2-0.09810.0706
第二组变量y1-y2和第一组典型变量
CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables
V1V2
y10.36150.0302
y20.00260.0729
由数据分析得:
原变量和第一对变量相关程度高,第二组提取的信息很少,与典型对系数一致。
4.8Matlab实现
(1)可以用matlab求出各样本典型相关变量和样本的典型相关系数
程序如下:
>
R11=[10.63;
0.631];
R12=[0.240.06;
-0.060.07];
R21=[0.24-0.06;
0.060.07];
R22=[10.42;
0.421];
[v1,d1]=eig(R11);
[v2,d2]=eig(R22);
p1=inv(v1*sqrt(d1)*v1'
);
p2=inv(v2*sqrt(d2)*v2'
T1=p1*R12*inv(R22)*R21*p1;
T2=p2*R21*inv(R11)*R12*p2;
结果:
有上求出的结果可以得到:
典型相关系数为:
r1=0.0729r2=0.3971
典型变量:
(2)检验各对典型变量的显著相关
p=2;
q=2;
n=140;
k=1:
2;
d1k=(p-k+1).*(q-k+1);
d=[0.07290.3971];
D=1-d.^2;
Ak=[D
(1)*D
(2),D
(2)];
Tk=-[n-0.5*(p+q+3)].*log(Ak);
pk=1-chi2cdf(Tk,d1k)
可以看出,第一、第二典型变量都是显著性相关的。
即一名学生的阅读速度和阅读理解能力越强,他的技术速度和计算正确程度就越好。
4.9SAS实现
dataexamp4_9;
inputx1-x2y1-y2;
1191155179145
2195149201152
3181148185149
4183153188149
5176144171142
6208157192152
7189150190149
8197159189152
9188152197159
10192150187151
11179158186148
12183147174147
13174150185152
14190159195157
15188151187158
16163137161130
17195155183158
18186153173148
19181145182146
20175140165137
21192154185152
22174143178147
23176139176143
24197167200158
25190163187150
proccancorrdata=examp4_9corr;
由SASproccancorr过程求得
样本相关系数矩阵
20Thursday,November18,20131
CorrelationsAmongtheVARVariables
x11.0000-0.2094
x2-0.20941.0000
CorrelationsAmongtheWITHVariables
y1y2
y11.00000.6932
y20.69321.0000
x1-0.0108-0.2318
x20.73460.7108
TheSASSystem14:
21Saturday,October30,20124
AdjustedApproximateSquared
CanonicalCanonicalStandardCanonical
10.7874780.7723830.0775430.620121
20.292947.0.1866070.085818
TestofH0:
=CanRsq/(1-CanRsq)
LikelihoodApproximate
EigenvalueDifferenceProportionCumulativeRatioFValueNumDFDenDFPr>
11.63241.53850.94560.94560.347278677.324420.0001
20.09390.05441.00000.914181972.071220.1648
第一对典型变量贡献率94.56%。
进行分析求得特征值在方差占比例的累计值(贡献率)为0.9141也可看出,只需要两对变量即可。
以下输出用wilks’Lambda等四种方法对典型相关系数为零的假设检验。
S=2M=-0.5N=9.5
Lambda0.347278677.324420.0001
Pillai'
sTrace0.705938886.004440.0006
Hotelling-LawleyTrace1.726290238.94424.1980.0001
sGreatestRoot1.6324161017.96222<
TheCANCORRProcedure
x10.00917257220.1386496154
x20.10366421780.0151230041
y10.08450520960.168128993
y20.0459765801-0.130308033
TheSASSystem20:
20Thursday,November18,20134
第一组变量x1-x3的典型变量的系数(原始变量标准化后)
x10.06751.0204
x21.01200.1476
第二组变量y1-y3的典型变量的系数(原始变量标准化后)
StandardizedCanonicalCoefficientsfortheWITHVariables
y10.62311.2396
y20.4616-1.3083
第一对典型变量
主要成年长子的头长、头宽加权
主要次子头宽影响
第一对典型变量主要表现头宽和头长的相关性。
CanonicalStructure
第一组变量x1-x3和典型变量
x1-0.14440.9895
x20.9978-0.0660
第二组变量y1-y3和典型变量
CorrelationsBetweentheWITHVariablesandTheirCanonicalVariables
y10.94300.3327
y20.8935-0.4491
第一组变量x1-x3和第二组典型变量
CorrelationsBetweentheVARVariablesandtheCanonicalVariablesoftheWITHVariables
x1-0.11370.2899
x20.7858-0.0193
第二组变量y1-y3和第一组典型变量
CorrelationsBetweentheWITHVariablesandtheCanonicalVariablesoftheVARVariables
y10.74260.0975
y20.7036-0.1316
4.9MATLAB实现
建立data.txt,并导入数据。
a=[data];
[n,m]=size(a);
b=a./(ones(n,1)*std(a));
R=cov(b);
X=b(:
1:
2);
Y=b(:
3:
4);
[A,B,r,U,V,ststs]=canoncorr(X,Y)
A=
0.0675-1.0204
1.0120-0.1476
B=
0.6231-1.2396
0.46161.3083
r=
0.78750.2929
U=
0.43731.5839
0.86111.3848
-0.58101.4579
-0.36451.2890
-1.08101.2562
2.24540.6336
0.28500.7823
1.12350.5227
0.19970.5201
0.62350.3210
-0.71500.3789
-0.29110.1798
-1.21490.1772
0.4529-0.2034
0.2547-0.3118
-2.3277-0.0724
0.9987-0.6949
0.0749-0.6975
-0.4343-0.7605
-1.0471-0.8084
0.7244-1.2042
-1.1324-1.0706
-0.9159-1.2395
1.2702-1.6957
0.5538-1.7285
V=
0.1054-1.2830
0.60982.5925
-0.21030.6757
0.35010.2260
-1.1920-0.4761