华东理工大学多元统计分析与SPSS应用实验 6.docx
《华东理工大学多元统计分析与SPSS应用实验 6.docx》由会员分享,可在线阅读,更多相关《华东理工大学多元统计分析与SPSS应用实验 6.docx(22页珍藏版)》请在冰豆网上搜索。
华东理工大学多元统计分析与SPSS应用实验6
华东理工大学2013—2014学年第二学期
《多元统计分析与SPSS应用》实验报告6
班级学号姓名
开课学院商学院任课教师任飞成绩
实验内容:
实验6判别分析方法
1.使用默认值进行判别分析
选用数据文件data14-04
将slen,swid,plen,pwid移入Independents框
将spno移入GroupingVariables框
对输出结果的认识
2.使用选择项进行判别分析
选用数据文件data14-04
将slen,swid,plen,pwid移入Independents框
将spno移入GroupingVariables框
3.逐步判别法
实验要求:
熟悉SPSS中判别分析功能
Analyze
Classify
Discriminant
2.对“Employeedata”进行数据整理
教师评语:
教师签名:
年月日
实验报告:
1、使用默认值进行判别分析
打开“data14-04.sav”文件,依次选择Analyze→Classify→Discriminant,将变量“slen,swid,plen,pwid”移入Independents框,将变量“spno”移入GroupingVariables框,单击GroupingVariables框,再在DefineRange弹出框中,Minimum输入1,Maximum输入2,如图1.1所示,单击OK输入结果如图1.2、图1.3、图1.4、图1.5所示
图1.1
图1.2
分析:
总体样本为150个,有效样本数为150个,占总数的100%,无效或者未分组的样本数为0个。
图1.3
分析:
图1.4为分组统计量列表
分析:
图1.4为Fisher判别法的两个Fisher判别函数特征值。
Function1的特征值为30.419,解释了99%的变异.典型相关系数为0.984。
Function2的判别函数的特征值为0.293,解释了1%的变异.典型相关系数为0.476。
其特征值是组间平方和与组内平方和之比。
图1.5
分析:
图1.5为Wilks'Lambda的值,0.025表示判别函数具有较高的判别力,概率P值.000,判别效果显著;0.774表示判别函数,可能存在不显著变量,应当可以考虑逐步判别法,判别函数具有较低的判别力,概率P值.000,判别效果显著。
图1.6
分析:
图1.6标准化后费希尔判别函数系数
图1.7
分析:
图为1.7为结构系数又称为判别负载,实际上是某个判别变量xi与判别值y之间的相关系数,它表达了两者之间的拟合水平:
绝对值很大(接近+1或-1),这个函数表达的信息与这个变量表达的信息几乎完全相同,接近0,两者之间几乎没什么共同之处。
图1.8
分析:
图1.8为各判别函数组重心矩阵
2、使用选择项进行判别分析
(1)打开“data14-04.sav”文件,依次选择Analyze→Classify→Discriminant,将变量“slen,swid,plen,pwid”移入Independents框,将变量“spno”移入GroupingVariables框,单击GroupingVariables框,再在DefineRange弹出框中,Minimum输入1,Maximum输入2,在主对话框中,单击Classify按纽,展开Classification,对话框,PriorProbabilities中选择Allgroupsequal,UseCovarianceMatrix中选择Withingroups,Plots中选择Combinedgroups,Separategroups,Territorialmap,Display中选择Summarytable,Casewiseresults.单击Continue.
如图2.1所示
图2.1
(2)在主对话框中,单击Statistics按纽,展开Statistics对话框,Descriptives中选择Means,FunctionCoefficients中选择Fisher’s,Unstandardized,Matrices中选择Within-groupscorrelation,Within-groupscovariance,Separate-groupscovariance,Totalcovariance。
如图2.2所示
图2.2
(3)在主对话框中,单击Save按纽,展开SaveNewVariables的对话框,选择“Predictedgroupmembership、DescriminantScores、Probabilitiesofgroupmembership”如图2.3所示
(4)单击OK,输出结果如图2.4~
分析:
总体样本为150个,有效样本数为150个,占总数的100%,无效或者未分组的样本数为0。
分析:
由上图可知各项均值,标准差,有效样本个数。
分析:
上图为组内协方差和相关系数矩阵
分析:
上图为协方差矩阵
分析:
上图为Fisher判别法下两个个Fisher判别函数的特征值。
Function1的特征值为30.419,解释了99%的变异.典型相关系数为0.984。
Function2的特征值为0.293,解释了1%的变异.典型相关系数为0.476。
分析:
上图为Wilks’Lambda的值(其值越小越好)0.025表示判别函数很好且判别效果显著;0.774表示判别函数不好但判别效果显著。
分析:
标准化后费歇尔费希尔判别函数系数
分析:
结构矩阵
分析:
费希尔判别函数矩阵
分析:
上图为各组重心坐标值。
利用Fisher判别函数计算出各观测值具体坐标后,再计算出离各重心的距离,则可得知分类情况。
分析:
贝叶斯判别函数,有效样本为150个,无缺省样本或未知样本。
TerritorialMap
CanonicalDiscriminant
Function2
-12.0-8.0-4.0.04.08.012.0
12.01223
1223
1223
1223
1223
1223
8.01223
1223
1223
1223
1223
1223
4.01223
1223
1223
1223
1223
1223*
.0*1223
12*23
1223
1223
1223
1223
-4.01223
1223
1223
1223
1223
1223
-8.01223
1223
1223
1223
1223
1223
-12.01223
-12.0-8.0-4.0.04.08.012.0
CanonicalDiscriminantFunction1
Symbolsusedinterritorialmap
SymbolGroupLabel
-------------------------------
11刚毛鸢尾花
22变色鸢尾花
33佛吉尼亚鸢尾花
*Indicatesagroupcentroid
分析:
上图显示各类正确判别率分别为100%,96%,98%
3、逐步判别法
打开“discrim.sav”,将pa,alpha_ag,alpha_at,hp移入Independents框,将group移入GroupingVariables框,在主对话框中,选择Usestepwisemethod,单击Method按纽,展开Stepwisemethod的对话框
分析:
图为变量进入及删除表,剔除显著性较弱的变量,变量“ALPHA_AT”、“PA”进入判别函数。
分析:
进入判别分析的变量表
分析:
不在判别分析中的变量表,Wilk’sLambda检验值在第0步中,ALPHA_AT为0.539最小,选入判别函数,PA在第1步中选入判别函数。
分析:
图为各步Wilks’Lambda统计量,概率P值均为.000小于显著性水平0.05.
分析:
上图为判别指数和判别函数的显著性检验
分析:
Fisher判别函数的系数
分析:
原始样本始回代判别正确率,正常人84%,肝癌AFP检测阳性只有15%,肝癌AFP检测阴性只有15%,肝硬化只有33%。
4、作业:
对案例:
Crop’Pain连锁店展开判别分析讨论
(1)先用聚类分析将变量分成n组,比如4组,如图4.1所示
(2)依次选择Analyze→Classify→Discriminant,将所有变量移入Independents框,将变量“Clu4_1”移入GroupingVariables框,单击GroupingVariables框,再在DefineRange弹出框中,Minimum输入1,Maximum输入4,得到结果
分析:
判别函数各分类样本回代正确率均为100%,判别效果较好。
思考:
在判别分析中缺少分类变量的话,怎么办?
可以考虑先用聚类分析生成分类变量