典型相关分析Word下载.docx
《典型相关分析Word下载.docx》由会员分享,可在线阅读,更多相关《典型相关分析Word下载.docx(12页珍藏版)》请在冰豆网上搜索。
withy1y2;
run;
在proccancorr语句之前是输入一个数据集,一个名称为exec102,结构为相关矩阵的数据集,数据集中各变量名称分别为x1,x2,y1,y2。
在输入相关数据集之后就要进行典型相关分析。
proccancorr是执行CANCORR过程,其可以用来执行典型相关分析、典型净相关分析、及典型冗余分析。
分析结果包括标准化的典型相关系数、所有典型变量与原始变量之间的相关系数以及典型变量值。
它可以分析的资料集既可以是原始变量的数据,也可以是一个相关系数矩阵或是协方差阵,在本题中分析的就是一个相关关系矩阵。
接下来就是定义因变量与自变量组,VAR语句用以指定第一组变量,WITH语句用以指定第二组变量。
接下来是结果分析。
可以从上表看出样本典型相关系数分别是r1=0.394506、r2=0.068848;
样本典型相关系数平方(即相应的特征值)分别为0.155635、0.004740。
上表是对样本的典型相关系数是否显著为零的检验,两对典型相关系数的P值都小于0.0001,那么可以在较大概率下拒绝H0,即认为第一对与第二对典型相关系数都是显著的。
接下来是输出结果
上图是原始数据的典型相关变量的系数,下图则是标准化后数据的典型相关变量的系数
因为原始数据的单位并不一致,所以在这里采用标准化数据的典型相关变量的系数,即
第一对典型变量为
第二对典型变量为
最后是两对典型变量与x1、x2、y1、y2的相关系数图,可以得出第一对典型变量与x1(阅读速度)和y1(数学运算速度)的相关系数较大,说明两者之间存在着一定的关系;
第二对典型变量与x1(阅读速度)、x2(阅读才能)、y1(数学运算速度)和y2(数学运算才能)之间的相关系数都比较大,较大的是x2与y2,这表示x1x2与y1y2之间存在着一定的联系。
10.3
程序这里与上题不同的是通过导入的excel数据,运用原始数据来进行典型分析。
可以从上表看出样本典型相关系数分别是r1=0.788508、r2=0.053740;
样本典型相关系数平方(即相应的特征值)分别为0.621745、0.002888。
上表是对样本的典型相关系数是否显著为零的检验,第一对典型相关系数的P值为0.0003,小于0.005,那么在较大概率下拒绝H0,但第二对的典型相关系数的P值为0.8031,那么在较大概率下接受H0,即认为第一对典型相关系数都是显著,第二对典型相关系数是不显著的。
为了减少数据的差异,在这里采用标准化数据的典型相关变量的系数,即
第二对典型变量的系数并不显著,在这里就不做列举
最后是两对典型变量与x1、x2、y1、y2的相关系数图,可以明显得出第一对典型变量与x1(长子头长)x2(长子头宽)和y1(次子头长)y2(次子头宽)的相关系数都非常大(接近于1),说明两者之间存在着一定的关系,这表示长子的头长宽与次子的头长宽之间很可能存在着一定的联系。
10.4
程序部分因与上一题相似,在这里不做重复介绍了,下面直接对结果进行分析。
可以从上表看出样本典型相关系数分别是r1=0.521594、r2=0.375256
r3=0.242181r4=0.136568;
样本典型相关系数平方(即相应的特征值)分别为0.272060、0.140817、0.058652、0.018651。
上表是对样本的典型相关系数是否显著为零的检验,四对典型相关系数的P值都小于0.0001,那么在较大概率下拒绝H0,即认为第一对到第四对典型相关系数都是显著的。
因为原始数据的单位并不一致,所以在这里采用标准化数据的典型相关变量的系数,将其以表格的形式表示,每一列代表一对典型变量
标准化
V1
V2
V3
V4
x1
-0.04295
1.089824
1.116106
-1.00923
x2
1.162204
0.698785
-1.417
0.173189
x3
-1.37533
0.208149
0.015567
1.689889
x4
0.890862
-1.65057
0.832481
-0.26301
R
0.521594
0.375256
0.242181
0.136568
W1
W2
W3
W4
y1
0.473266
-0.81405
0.494647
-0.16044
y2
-0.78058
-0.45102
0.590939
-0.71929
y3
0.256703
-0.60518
0.698133
0.624613
y4
0.691917
0.379952
-0.41897
0.43757
y5
-0.14515
-0.18399
-1.51915
-0.72527
y6
-0.07039
0.625541
-0.33425
0.875976
y7
0.312728
0.589835
0.227576
0.186125
y8
0.336425
0.486865
0.833353
-0.65573
最后是四对典型变量与x1、x2、x3、x4及y1、y2、y3、y4、y5、y6、y7、y8的相关系数图。
可以看出第一对典型变量与x2(吸烟2(第二措词))x4(吸烟4(第四措词))y1(集中力)y4(紧张)y5(警惕)y7(疲劳)的相关系数较高,那么认为x2x4与y1y4y5y7之间存在着一定的关系。
通过相关系数,依次可以观察到接下来的三对典型变量所代表的含义,但是因为第一对典型变量的相关系数最大0.521594,其它三对的相关系数较小,在此就不做细致分析。
课外习题
程序结果分析
可以从上表看出样本典型相关系数分别是r1=0.980756、r2=0.906494
r3=0.631299r4=0.570813(前两个的典型系数相对较大);
样本典型相关系数平方(即相应的特征值)分别为0.961882、0.821731、0.398539、0.325827。
上表是对样本的典型相关系数是否显著为零的检验,前两对典型相关系数的P值都小于0.0001,那么可以在较大概率下拒绝H0,即认为第一对与第二对典型相关系数都是显著的;
但第三、第四对典型相关系数分别为0.0640、0.1158,都大于0.05,可以认为接受H0,即认为第三对与第四对典型相关系数都是显著的
因为原始数据的差异较大,并且原始数据的典型相关变量系数较小,所以在这里采用标准化数据的典型相关变量的系数,即
由于第三第四对相关变量的系数并不显著,在这里就不做列举。
可以看出在第一对典型相关变量中,除了x2(家庭经营收入)、x4(财产性收入)、x9(医疗保健支出),其它变量与典型的相关变量的相关系数较大,认为劳动者报酬、转移性收入与食品支出、衣着支出、居住支出、家庭设备及服务支出、交通和通讯支出、文教娱乐用品及服务支出、其他商品及服务支出之间存在着较大的正相关关系;
在第二对典型相关变量中,转移性收入与衣着支出、医疗保健支出存在着一定的负相关关系。