华东理工大学多元统计分析与SPSS应用实验 6.docx

资源描述

华东理工大学多元统计分析与SPSS应用实验 6.docx

《华东理工大学多元统计分析与SPSS应用实验 6.docx》由会员分享，可在线阅读，更多相关《华东理工大学多元统计分析与SPSS应用实验 6.docx（22页珍藏版）》请在冰豆网上搜索。

华东理工大学多元统计分析与SPSS应用实验 6.docx

华东理工大学多元统计分析与SPSS应用实验6

华东理工大学2013—2014学年第二学期

《多元统计分析与SPSS应用》实验报告6

班级学号姓名

开课学院商学院任课教师任飞成绩

实验内容：

实验6判别分析方法

1.使用默认值进行判别分析

选用数据文件data14-04

将slen,swid,plen,pwid移入Independents框

将spno移入GroupingVariables框

对输出结果的认识

2.使用选择项进行判别分析

选用数据文件data14-04

将slen,swid,plen,pwid移入Independents框

将spno移入GroupingVariables框

3.逐步判别法

实验要求：

熟悉SPSS中判别分析功能

Analyze

Classify

Discriminant

2.对“Employeedata”进行数据整理

教师评语：

教师签名：

年月日

实验报告：

1、使用默认值进行判别分析

打开“data14-04.sav”文件，依次选择Analyze→Classify→Discriminant，将变量“slen,swid,plen,pwid”移入Independents框，将变量“spno”移入GroupingVariables框，单击GroupingVariables框，再在DefineRange弹出框中，Minimum输入1，Maximum输入2，如图1.1所示，单击OK输入结果如图1.2、图1.3、图1.4、图1.5所示

图1.1

图1.2

分析：

总体样本为150个，有效样本数为150个，占总数的100%，无效或者未分组的样本数为0个。

图1.3

分析：

图1.4为分组统计量列表

分析：

图1.4为Fisher判别法的两个Fisher判别函数特征值。

Function1的特征值为30.419，解释了99%的变异.典型相关系数为0.984。

Function2的判别函数的特征值为0.293，解释了1%的变异.典型相关系数为0.476。

其特征值是组间平方和与组内平方和之比。

图1.5

分析：

图1.5为Wilks'Lambda的值，0.025表示判别函数具有较高的判别力，概率P值.000,判别效果显著；0.774表示判别函数，可能存在不显著变量，应当可以考虑逐步判别法，判别函数具有较低的判别力，概率P值.000，判别效果显著。

图1.6

分析：

图1.6标准化后费希尔判别函数系数

图1.7

分析：

图为1.7为结构系数又称为判别负载，实际上是某个判别变量xi与判别值y之间的相关系数，它表达了两者之间的拟合水平：

绝对值很大（接近+1或-1），这个函数表达的信息与这个变量表达的信息几乎完全相同，接近0，两者之间几乎没什么共同之处。

图1.8

分析：

图1.8为各判别函数组重心矩阵

2、使用选择项进行判别分析

（1）打开“data14-04.sav”文件，依次选择Analyze→Classify→Discriminant，将变量“slen,swid,plen,pwid”移入Independents框，将变量“spno”移入GroupingVariables框，单击GroupingVariables框，再在DefineRange弹出框中，Minimum输入1，Maximum输入2，在主对话框中，单击Classify按纽，展开Classification，对话框，PriorProbabilities中选择Allgroupsequal，UseCovarianceMatrix中选择Withingroups，Plots中选择Combinedgroups,Separategroups,Territorialmap，Display中选择Summarytable，Casewiseresults.单击Continue.

如图2.1所示

图2.1

（2）在主对话框中，单击Statistics按纽，展开Statistics对话框，Descriptives中选择Means，FunctionCoefficients中选择Fisher’s，Unstandardized，Matrices中选择Within-groupscorrelation,Within-groupscovariance,Separate-groupscovariance,Totalcovariance。

如图2.2所示

图2.2

（3）在主对话框中，单击Save按纽，展开SaveNewVariables的对话框，选择“Predictedgroupmembership、DescriminantScores、Probabilitiesofgroupmembership”如图2.3所示

（4）单击OK，输出结果如图2.4~

分析：

总体样本为150个，有效样本数为150个，占总数的100%，无效或者未分组的样本数为0。

分析：

由上图可知各项均值，标准差，有效样本个数。

分析：

上图为组内协方差和相关系数矩阵

分析：

上图为协方差矩阵

分析：

上图为Fisher判别法下两个个Fisher判别函数的特征值。

Function1的特征值为30.419，解释了99%的变异.典型相关系数为0.984。

Function2的特征值为0.293，解释了1%的变异.典型相关系数为0.476。

分析：

上图为Wilks’Lambda的值（其值越小越好）0.025表示判别函数很好且判别效果显著；0.774表示判别函数不好但判别效果显著。

分析：

标准化后费歇尔费希尔判别函数系数

分析：

结构矩阵

分析：

费希尔判别函数矩阵

分析：

上图为各组重心坐标值。

利用Fisher判别函数计算出各观测值具体坐标后，再计算出离各重心的距离，则可得知分类情况。

分析：

贝叶斯判别函数，有效样本为150个，无缺省样本或未知样本。

TerritorialMap

CanonicalDiscriminant

Function2

-12.0-8.0-4.0.04.08.012.0

12.01223

1223

8.01223

1223

4.01223

1223

1223*

.0*1223

12*23

1223

-4.01223

1223

-8.01223

1223

-12.01223

-12.0-8.0-4.0.04.08.012.0

CanonicalDiscriminantFunction1

Symbolsusedinterritorialmap

SymbolGroupLabel

-------------------------------

11刚毛鸢尾花

22变色鸢尾花

33佛吉尼亚鸢尾花

*Indicatesagroupcentroid

分析：

上图显示各类正确判别率分别为100%，96%，98%

3、逐步判别法

打开“discrim.sav”，将pa,alpha_ag,alpha_at,hp移入Independents框，将group移入GroupingVariables框，在主对话框中，选择Usestepwisemethod，单击Method按纽，展开Stepwisemethod的对话框

分析：

图为变量进入及删除表，剔除显著性较弱的变量，变量“ALPHA_AT”、“PA”进入判别函数。

分析：

进入判别分析的变量表

分析：

不在判别分析中的变量表，Wilk’sLambda检验值在第0步中，ALPHA_AT为0.539最小，选入判别函数，PA在第1步中选入判别函数。

分析：

图为各步Wilks’Lambda统计量，概率P值均为.000小于显著性水平0.05.

分析：

上图为判别指数和判别函数的显著性检验

分析：

Fisher判别函数的系数

分析：

原始样本始回代判别正确率，正常人84%，肝癌AFP检测阳性只有15%，肝癌AFP检测阴性只有15%，肝硬化只有33%。

4、作业：

对案例：

Crop’Pain连锁店展开判别分析讨论

（1）先用聚类分析将变量分成n组，比如4组，如图4.1所示

（2）依次选择Analyze→Classify→Discriminant，将所有变量移入Independents框，将变量“Clu4_1”移入GroupingVariables框，单击GroupingVariables框，再在DefineRange弹出框中，Minimum输入1，Maximum输入4，得到结果

分析：

判别函数各分类样本回代正确率均为100%，判别效果较好。

思考：

在判别分析中缺少分类变量的话，怎么办？

可以考虑先用聚类分析生成分类变量

展开阅读全文