对应分析_精品文档PPT格式课件下载.ppt
《对应分析_精品文档PPT格式课件下载.ppt》由会员分享,可在线阅读,更多相关《对应分析_精品文档PPT格式课件下载.ppt(21页珍藏版)》请在冰豆网上搜索。
运用分布图分析变量类别间的关系的方法:
l分解法(分解法(Decomposi-tionalMethod),如多维标度。
),如多维标度。
l构成法(构成法(CompositionalMethod),如因子分析、判别),如因子分析、判别分析。
分析。
多元对应分析多元对应分析具体可以采取两种方法:
具体可以采取两种方法:
l合并法。
对超过二元的变量进行转换,将两个或合并法。
对超过二元的变量进行转换,将两个或多个变量合并为一个变量(如多个变量合并为一个变量(如“性别性别”和和“城乡城乡”合并为合并为“性别城乡性别城乡”,城市男性、城市女性、,城市男性、城市女性、农村男性、农村女性四个变量值),从而使各个农村男性、农村女性四个变量值),从而使各个变量的所有类别都表现在同一个多维空间里。
适变量的所有类别都表现在同一个多维空间里。
适用于变量个数较少的情况。
用于变量个数较少的情况。
l同质分析(同质分析(HomogeneityAnalysis)。
对多个)。
对多个定性变量进行主成分分析,其优势是可对多个定定性变量进行主成分分析,其优势是可对多个定性变量进行对应分析。
性变量进行对应分析。
对应分析的基本思路对应分析的基本思路基本思路:
通过对二维交互表的条件次数分析来基本思路:
通过对二维交互表的条件次数分析来确定变量及其类别之间的关系。
确定变量及其类别之间的关系。
例如:
l在分析顾客对不同品牌商品的喜好时,可将商品品牌在分析顾客对不同品牌商品的喜好时,可将商品品牌与顾客的性别、收入水平、职业等进行交叉分类,表与顾客的性别、收入水平、职业等进行交叉分类,表中的每一项数字都代表着某一类顾客喜欢某一品牌的中的每一项数字都代表着某一类顾客喜欢某一品牌的人数,这一人数就是这类顾客与这一品牌的人数,这一人数就是这类顾客与这一品牌的“对应对应”点,代表不同特点的顾客与品牌之间的联系。
点,代表不同特点的顾客与品牌之间的联系。
l通过分析,可以把品牌、顾客特点以及他们之间的联通过分析,可以把品牌、顾客特点以及他们之间的联系同时反映在一个二维或三维的分布图上,顾客认为系同时反映在一个二维或三维的分布图上,顾客认为比较相似的品牌在图上的分布便会彼此靠近在一起。
比较相似的品牌在图上的分布便会彼此靠近在一起。
l根据顾客特点与每一品牌之间距离的远近,还可以区根据顾客特点与每一品牌之间距离的远近,还可以区分顾客的哪些特点与喜好某种品牌的关系密切。
分顾客的哪些特点与喜好某种品牌的关系密切。
对应分析的基本思路对应分析的基本思路在对应分析中,每个变量的类别差异是通过在对应分析中,每个变量的类别差异是通过直观图上的分值距离表现出来的;
直观图上的分值距离表现出来的;
l这个距离是经过加权以这个距离是经过加权以Chi-square值(其分布值(其分布是由累计交互分类表中每一交互组的实际频数与是由累计交互分类表中每一交互组的实际频数与期望频数的差值得来的)的差异表现出来的距离,期望频数的差值得来的)的差异表现出来的距离,即将即将Chi-square值转变成可度量的距离。
值转变成可度量的距离。
操作前提:
l对于分析的基础是交互分类表,表中每个条件次对于分析的基础是交互分类表,表中每个条件次数都不能是数都不能是0或负数;
或负数;
l如果有为如果有为0的条件次数出现应当对变量的分类进的条件次数出现应当对变量的分类进行合并,去掉这个类别。
行合并,去掉这个类别。
对应分析的优点对应分析的优点定性变量划分的类别越多,这种方法的有时定性变量划分的类别越多,这种方法的有时越明显;
越明显;
揭示行变量类别间与列变量类别间的联系;
将类别联系直观地表现在图形中;
将定类或定序变量转变为定距变量。
对应分析的局限性对应分析的局限性不能用于相关关系的假设检验。
不能用于相关关系的假设检验。
l它只是一种描述性的条件方法,只能揭示变量它只是一种描述性的条件方法,只能揭示变量间的联系;
间的联系;
维度要由研究者决定。
l在分析过程中,研究者可以知道最大维度数是在分析过程中,研究者可以知道最大维度数是多少;
多少;
l但是,减少到几维为好必须衡量分析结果是否但是,减少到几维为好必须衡量分析结果是否可解释以及是否简约。
可解释以及是否简约。
对极端值敏感。
对应分析的假设条件对应分析的假设条件对数据类型、变量间的关系无严格限定。
要求:
对数据类型、变量间的关系无严格限定。
l调查对象必须有代表性,调查对象必须有代表性,l研究对象要有可比性;
研究对象要有可比性;
l变量的类别应当涵盖所有可能出现的情况。
变量的类别应当涵盖所有可能出现的情况。
对于所分析的调查数据,还有以下假设条件:
l被调查者回答问题时并不都从同一角度(或称维度)作被调查者回答问题时并不都从同一角度(或称维度)作出判断。
出判断。
l在意愿、态度等调查中,被调查者通常会从两个维度进行评判,在意愿、态度等调查中,被调查者通常会从两个维度进行评判,即主观维度和客观维度。
即主观维度和客观维度。
l换言之,被调查者并不都是用同样的主观或客观维度及指标来作换言之,被调查者并不都是用同样的主观或客观维度及指标来作为判断的依据。
为判断的依据。
l所有被调查者对于某一维度重要性的评价不必一样。
所有被调查者对于某一维度重要性的评价不必一样。
l被调查者的评判角度和看法可以改变。
被调查者的评判角度和看法可以改变。
第二节第二节统计软件应用统计软件应用分析结果指标的含义分析结果指标的含义;
提供的统计量和图形及其含义;
SPSS操作步骤;
操作步骤;
STATA命令及结果命令及结果分析结果指标的含义分析结果指标的含义Scores:
l分值,表示在相应维度上的坐标;
分值,表示在相应维度上的坐标;
SingleValue:
l奇异值,即特征值的平方根。
代表行与列分值的相关奇异值,即特征值的平方根。
代表行与列分值的相关关系,相当于相关分析里的相关系数关系,相当于相关分析里的相关系数r;
Inertia:
l惯量,即特征值(惯量,即特征值(Eigenvalue),表示每个维度对),表示每个维度对变量各个类别之间差异的解释量;
变量各个类别之间差异的解释量;
ProportionExplained:
l解释比例,即每一维度的特征值与特征值总和相除得解释比例,即每一维度的特征值与特征值总和相除得到的比例,以便确定用几维来表现变量类别的差异。
到的比例,以便确定用几维来表现变量类别的差异。
CumulativeProportion:
l累计解释比例。
累计解释比例。
分析结果的含义分析结果的含义rowandcolumnprofiles:
l交互分类表,为对应分析的基础数据;
交互分类表,为对应分析的基础数据;
row/columnscores:
l行、列变量在不同维度上的分值,即作图的坐标。
行、列变量在不同维度上的分值,即作图的坐标。
row/columnscoreconfidencestatistics:
l行、列变量在不同维度上分值的置信区间。
行、列变量在不同维度上分值的置信区间。
Contributionofrow/columnpointstotheinertiaofeachdimension:
l行、列变量对各维度特征值的贡献,作用是检查行、列行、列变量对各维度特征值的贡献,作用是检查行、列变量各个类别对每一维度特征值的影响。
变量各个类别对每一维度特征值的影响。
Contributionofdimensionstotheinertiaofeachrow/columnpoints:
l各维度对行、列变量特征值的贡献,作用是检查每一维各维度对行、列变量特征值的贡献,作用是检查每一维度对行、列变量各个类别特征的影响。
度对行、列变量各个类别特征的影响。
距离的测度方法及作图距离的测度方法及作图距离测度方法(距离测度方法(DistanceMeasure):
lChisquare.加权卡方距离加权卡方距离lEuclidean.欧氏距离欧氏距离row/columnpointplots:
l行、列变量各分类在不同维度上的分布图;
行、列变量各分类在不同维度上的分布图;
lbi-plots:
行和列变量各分类在不同维度上的联合分布;
:
ltransformationplots:
Producesaplotoftheoriginalrowcategoryvaluesagainsttheircorrespondingrow(column)scores。
图形的作用:
l重新分类的依据;
重新分类的依据;
l判断不同类别差异的大小。
判断不同类别差异的大小。
距离测度的标准化方法距离测度的标准化方法Rowandcolumnmeansareremoved.lBoththerowsandcolumnsarecentered.Thismethodisrequiredforstandardcorrespondenceanalysis.Rowmeansareremoved.Columnmeansareremoved.Row/Columntotalsareequalizedandmeansareremoved.lBeforecenteringtherows/column,therow/columnmarginsareequalized.根据分析重点绘图选项根据分析重点绘图选项NormalizationMethod.l决定绘图时是以行变量为主还是以列变量为主,或者是同时决定绘图时是以行变量为主还是以列变量为主,或者是同时考虑行列变量。
具体方法:
考虑行列变量。
lSymmetrical.关注行和列变量中不同类别的差异或联系。
关注行和列变量中不同类别的差异或联系。
lPrincipal.同时关注行和列变量各类别间的差异。
同时关注行和列变量各类别间的差异。
lRowprincipal.分析的重点是行变量各类别间的差异。
分析的重点是行变量各类别间的差异。
lColumnprincipal.分析的重点是列变量各类别间的差异。
分析的重点是列变量各类别间的差异。
lCustom.常规设定的方法,利于作图。
常规设