1、 OUTSTAT=SAS 数据集 NCAN=mEDF=n-1;VAR variables;WITH variables;RUN;说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等(1)proc cancorr语句的: OUT=SAS 数据集创建含原始数据和典型相关变量得分(观测值)的SAS集 OUTSTAT=SAS 数据集创建含原始变量的样本均值、样本标准差、样本相关系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集 COR
2、R(或C)打印原始变量的样本相关系数矩阵 NCAN=m规定要求输出的典型变量对个数,默认为两组变量个数较小者 EDF=n-1针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1输入为原始观测数据时,省略此项 all所有输出项 noprint不输出分析结果 short只输出典型相关系数和多元分析统计数 simple简单统计数 vname=变量名为var语句的变量定义名称 vprefix=前缀名为var语句的典型变量定义前缀 wname=变量名为with语句的变量定义名称 wprefix=前缀名为with语句的典型变量定义前缀(2)VAR variablesVA
3、R后列出进行相关分析的第一组变量名称(3)WITH variablesWITH后列出进行相关分析的第二组变量名称var与with语句经常同proc cancorr语句一起使用其他语句类似corr过程2. 典型相关分析步骤两组随机变量,取值 组观测数据 , 标准化样本 样本相关系数矩阵为总体相关系数矩阵的估计样本典型相关分析步骤:(1)求()的特征值 (2)求和对应的正交单位化特征向量(3)第k对典型相关变量为其中 样本典型相关系数为(4)典型相关系数的显著性检验统计量 检验值为 若,拒绝依次就进行检验,若对某个,检验值首次满足,则认为只有前对典型变量显著相关,选取前对即可注意:利用样本协方差矩
4、阵,分析方法一样不需要对数据标准化处理3.实例分析例4.6 为研究空气温度与土壤温度的关系,考虑六个变量日最高土壤温度;日最低土壤温度;日土壤温度积分值;日最高气温;日最低气温;日气温曲线积分值观测了天,数据如表4.7,做典型相关分析解:(1)建立输入数据集,程序如下:data examp4_6;input x1-x3 y1-y3;cards;85 59 151 84 65 14786 61 159 84 65 14983 64 152 79 66 14283 65 158 81 67 14788 69 180 84 68 16777 67 147 74 66 13178 69 159 73
5、66 13184 68 159 75 67 13489 71 195 84 68 16191 76 206 86 72 16991 76 206 88 73 17694 76 211 90 74 18794 75 211 88 72 17192 70 201 58 72 17187 68 167 81 69 15483 68 162 79 68 14987 66 173 84 69 16087 68 177 84 70 16088 70 169 84 70 16883 66 170 77 67 14792 67 196 87 67 16692 72 199 89 69 17194 72 204
6、 89 72 18092 73 201 93 72 18693 72 206 93 74 18894 72 208 94 75 19995 73 214 93 74 19395 70 210 93 74 19695 71 207 96 75 19895 69 202 95 76 20296 69 173 84 73 17391 69 168 91 71 17089 70 189 88 72 17995 71 210 89 72 17996 73 208 91 72 18297 75 215 92 74 19696 69 198 94 75 19295 67 196 96 75 19594 75
7、 211 93 76 19892 73 198 88 74 18890 74 197 88 74 17894 70 205 91 72 17595 71 209 92 72 19096 72 208 92 73 18995 71 208 94 75 19496 71 208 96 76 202run;(2) 调用典型相关分析cancorr过程菜单操作方法为,选择Globals/SAS/Assist/Data analysis/multivariate/canonical correlation analysis(典型相关分析)菜单命令编程方法如下:proc cancorr data=examp
8、4_6 corr; /*调用相关分析过程,打印样本相关系数矩阵*/var x1-x3; /* 第一组变量x1-x3*/with y1-y3; /* 第二组变量y1-y3*/由SAS proc cancorr过程求得SAS 系统 10:24 Sunday, November 2, 2008 14 The CANCORR Procedure Correlations Among the Original Variables Correlations Among the VAR Variables(变量x1-x3的相关系数矩阵) x1 x2 x3 x1 1.0000 0.5705 0.8751 x2
9、 0.5705 1.0000 0.7808 x3 0.8751 0.7808 1.0000 Correlations Among the WITH Variables(变量y1-y3的相关系数矩阵 y1 y2 y3 y1 1.0000 0.6705 0.7850 y2 0.6705 1.0000 0.9324 y3 0.7850 0.9324 1.0000 Correlations Between the VAR Variables and the WITH Variables变量x1-x3与y1-y3的相关系数矩阵 x1 0.7136 0.8400 0.9143 x2 0.3796 0.68
10、09 0.5907 x3 0.6256 0.8185 0.8695变量间高度相关。 SAS 系统 10:24 Sunday, November 2, 2008 15 Canonical Correlation Analysis典型相关分析的一般结果 Adjusted Approximate Squared Canonical Canonical Standard Canonical Correlation Correlation Error Correlation 典型相关系数 校正的典型相关系数 近似的标准误 典型相关系数平方 1 =0.927857 0.922345 0.020733 =0
11、.860919 2 =0.562181 0.539833 0.101958 =0.316047 3 =0.165974 . 0.144965 =0.027547(3)检验各对典型变量是否显著相关 表4.8 各对典型变量相关性检验结果 Eigenvalues of Inv(E)*H Test of H0: The canonical correlations in the = CanRsq/(1-CanRsq) 即 current row and all that follow are zero Likelihood Approximate Eigenvalue Difference Propo
12、rtion Cumulative Ratio F Value Num DF Den DF Pr F 各对相关系 相邻两特 特征值占 特征值占方差 似然比值 数特征值 征值之差 方差比例 比例累计值 1 6.1901 5.7280 0.9266 0.9266 0.09250440 17.98 9 97.5 统计方法 F值 检验p值 Wilks Lambda 0.09250440 17.98 9 97.5 Pillais Trace 1.20451366 9.39 9 126 Hotelling-Lawley Trace 6.68047081 29.18 9 59.755 Roys Greatest Root 6.19005360 86.66 3 42 1 108.9112 99.0575 0.9118 0.9118 0.00049778 141.58 9 58.56 2 9.8536 9.1696 0.0825 0.9943 0.05471158 40.94 4 50 3 0.6840 0.0057 1.0000 0.59381993 17.78 1 26 0.0003 S=3 M=-0.5 N=11 Stat
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1