1、 OUTSTAT=SAS 数据集 NCAN=mEDF=n-1;VAR variables;WITH variables;RUN;说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等(1)proc cancorr语句的: OUT=SAS 数据集创建含原始数据和典型相关变量得分(观测值)的SAS集 OUTSTAT=SAS 数据集创建含原始变量的样本均值、样本标准差、样本相关系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集 COR
2、R(或C)打印原始变量的样本相关系数矩阵 NCAN=m规定要求输出的典型变量对个数,默认为两组变量个数较小者 EDF=n-1针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1输入为原始观测数据时,省略此项 all所有输出项 noprint不输出分析结果 short只输出典型相关系数和多元分析统计数 simple简单统计数 vname=变量名为var语句的变量定义名称 vprefix=前缀名为var语句的典型变量定义前缀 wname=变量名为with语句的变量定义名称 wprefix=前缀名为with语句的典型变量定义前缀(2)VAR variablesVA
3、R后列出进行相关分析的第一组变量名称(3)WITH variablesWITH后列出进行相关分析的第二组变量名称var与with语句经常同proc cancorr语句一起使用其他语句类似corr过程2. 典型相关分析步骤两组随机变量,取值 组观测数据 , 标准化样本 样本相关系数矩阵为总体相关系数矩阵的估计样本典型相关分析步骤:(1)求()的特征值 (2)求和对应的正交单位化特征向量(3)第k对典型相关变量为其中 样本典型相关系数为(4)典型相关系数的显著性检验统计量 检验值为 若,拒绝依次就进行检验,若对某个,检验值首次满足,则认为只有前对典型变量显著相关,选取前对即可注意:利用样本协方差矩
4、阵,分析方法一样不需要对数据标准化处理3.实例分析例 为研究空气温度与土壤温度的关系,考虑六个变量日最高土壤温度;日最低土壤温度;日土壤温度积分值;日最高气温;日最低气温;日气温曲线积分值观测了天,数据如表,做典型相关分析解:(1)建立输入数据集,程序如下:data examp4_6;input x1-x3 y1-y3;cards;85 59 151 84 65 14786 61 159 84 65 14983 64 152 79 66 14283 65 158 81 67 14788 69 180 84 68 16777 67 147 74 66 13178 69 159 73 66 131
5、84 68 159 75 67 13489 71 195 84 68 16191 76 206 86 72 16991 76 206 88 73 17694 76 211 90 74 18794 75 211 88 72 17192 70 201 58 72 17187 68 167 81 69 15483 68 162 79 68 14987 66 173 84 69 16087 68 177 84 70 16088 70 169 84 70 16883 66 170 77 67 14792 67 196 87 67 16692 72 199 89 69 17194 72 204 89 72
6、 18092 73 201 93 72 18693 72 206 93 74 18894 72 208 94 75 19995 73 214 93 74 19395 70 210 93 74 19695 71 207 96 75 19895 69 202 95 76 20296 69 173 84 73 17391 69 168 91 71 17089 70 189 88 72 17995 71 210 89 72 17996 73 208 91 72 18297 75 215 92 74 19696 69 198 94 75 19295 67 196 96 75 19594 75 211 9
7、3 76 19892 73 198 88 74 18890 74 197 88 74 17894 70 205 91 72 17595 71 209 92 72 19096 72 208 92 73 18995 71 208 94 75 19496 71 208 96 76 202run;(2) 调用典型相关分析cancorr过程菜单操作方法为,选择Globals/SAS/Assist/Data analysis/multivariate/canonical correlation analysis(典型相关分析)菜单命令编程方法如下:proc cancorr data=examp4_6 co
8、rr; /*调用相关分析过程,打印样本相关系数矩阵*/var x1-x3; /* 第一组变量x1-x3*/with y1-y3; /* 第二组变量y1-y3*/由SAS proc cancorr过程求得SAS 系统 10:24 Sunday, November 2, 2008 14 The CANCORR Procedure Correlations Among the Original Variables Correlations Among the VAR Variables(变量x1-x3的相关系数矩阵) x1 x2 x3 x1 x2 x3 Correlations Among the
9、WITH Variables(变量y1-y3的相关系数矩阵 y1 y2 y3 y1 y2 y3 Correlations Between the VAR Variables and the WITH Variables变量x1-x3与y1-y3的相关系数矩阵变量间高度相关。 SAS 系统 10:24 Sunday, November 2, 2008 15 Canonical Correlation Analysis典型相关分析的一般结果 Adjusted Approximate Squared Canonical Canonical Standard Canonical Correlation
10、 Correlation Error Correlation 典型相关系数 校正的典型相关系数 近似的标准误 典型相关系数平方 1 = = 2 = 3 = . (3)检验各对典型变量是否显著相关 表 各对典型变量相关性检验结果 Eigenvalues of Inv(E)*H Test of H0: The canonical correlations in the = CanRsq/(1-CanRsq) 即 current row and all that follow are zero Likelihood Approximate Eigenvalue Difference Proporti
11、on Cumulative Ratio F Value Num DF Den DF Pr F 各对相关系 相邻两特 特征值占 特征值占方差 似然比值 数特征值 征值之差 方差比例 比例累计值 1 9 统计方法 F值 检验p值 Wilks Lambda 9 Pillais Trace 1. 9 126 Hotelling-Lawley Trace 6. 9 Roys Greatest Root 6. 3 42 1 9 2 4 50 Wilkss Trace 2. 9 78 Hotelling-Lawley Trace 119. 9 s Greatest Root 108. 3 26 SAS 系统
12、 2008年08月01日 星期五 下午09时25分34秒 3 Raw Canonical Coefficients for the WITH Variables SAS 系统 2008年08月01日 星期五 下午09时25分34秒 4 The CANCORR Procedure 标准化数据典型相关分析 第一特征根贡献率,选一对就可以。也说明,两组变量高度相关。主要高学历、低学历加权与网络调查差异。主要艺术家、部门主管、发行部门加权。第一对典型变量主要表现高低学历打分与艺术家部门主管打分的关系。网络调查占比例小。第一组(高学历)打分高,则第二组打分也高。说明二者具有高度的一致性。特别是高学历的打分和专家打分高度一致,第一对典型相关系数为主要低学历、网络和高学历打分差异主要发行部门、部门主管和艺术家打分的差异。第二对变量主要表现低学历与发行部门打分的关系。低学历打分高,则发行部门打分高。低学历占人群比例高,发行部门打分主要看是否符合大众口味。 SAS 系统 2008年08月01日 星期五 下午09时25分34秒 5 Correlations Between the VAR Variables and th
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1