判别分析实验报告SPSS.docx
《判别分析实验报告SPSS.docx》由会员分享,可在线阅读,更多相关《判别分析实验报告SPSS.docx(17页珍藏版)》请在冰豆网上搜索。
判别分析实验报告SPSS
一、实验目的及要求:
1、目的
用SPSS软件卖现判别分析及其应用。
2、内容及要求
用SPSS对实脍数据利用Fisher别比和贝叶斯判别出,建立判别函数并判
定君州、/•姿等13个地级市分别厲于哪个管理水平凑型。
二、仪器用具:
仪器名称
规格/型号
数量
备注
计算机
1
有网络环境
SPSS软件
1
三、实验方法与步骤:
准备工作:
把实验所用数据从Word丈档复制列Excel,并进一步导入到SPSS数据丈件中,同肘,由于只有当彼解释变量是属性变量而解粹变量是度量变量肘,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型敌为“数值(NJ”,度量标;隹改为“度量(S)n,以备接下来的分析。
4.实验结果与数据处理:
表1组均值的均等性的检验
Wilks的Lambda
F
dfl
df2
Sig.
综合效率标准指数
.582
23.022
2
64
・000
经济效率标准指数
.406
46.903
2
64
・000
结构效率标准指数
.954
1.560
2
64
・218
社会效率标准指数
.796
8.225
2
64
.001
人员效率标准指数
.342
61.645
2
64
.000
发展效率标准指数
.308
71.850
2
64
.000
环境效率标准指数
.913
3.054
2
64
.054
表1是对各级均值是否和等的检睑,由该表可以看出,A0.05的显著性水平
上我们不能拒绝结构赦率标准指数和环境效率标准指数在三组的均值和等的假设,
即认为除了结构畝率标准指数和环境效率标准指数外,其余五个标准指数在三组的均值是有显著差异的。
表2对数行列式
group
秩
对数行列式
1
6
-33.410
2
6
-33.177
3
6
-40.584
汇聚的组内
6
-32.308
打印的行列式的秩和自然对数是组协方湼矩阵的秩和自然对数。
表3检验结果
箱的M
140.196
F
近似。
2.498
dfl
42
df2
1990.001
Sig.
・000
对柑等总体协方差矩阵的零假i殳进行检验。
以上是对各组协方差矩阵是否和等的Box'M松验,表2反映协方差矩阵的狄和行列式的对数值。
由行列式的值可以看出,协方差矩阵不是病态矩阵。
哀3是对各总体协方差阵是否相等的统计检酸,由F值及其显著水平,在0.05的显著性水平下拒绝療假设,认为各总体协方差阵不和等。
1JFbhwr刈别廉:
團一
「矩阵
初组內相关迟)
□组內协方差(V)
0分组协万差㈢n总体协方差Q)
判别分析:
统计呈
「描述性
■••••・•••••••••••••••■
g单^lANOVA(A)
gBox'sM(B)
「函数系数
□Fisher(F)
3未标准化9)
国二
表4特征值
函数
特征值
方差的%
累积%
正则相矢性
1
3.76?
75.0
75.0
.889
2
1.257
25.0
100.0
.746
a.分析中使用了前2个典型判别式函数。
表5Wilks的Lambda
函数检验
Wilks的Lambda
卡方
df
Sig.
1到2
.093
146.042
12
.000
2
.443
50.053
5
.000
在4反映了判别函救的特征值、解释方差的比例和典童相关糸数。
笫一判别函数解释了75%的方差,笫二判别函数解释了25%的方差,它们两个判别函数解释了全部方差。
裹5是对两个判别函数的显著性检验,由Wilks'Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。
表6标准化的典型判别式函数系数
函数
1
2
综合效率标准指数
-.228
-.578
经济效率标准指数
.566
.404
结构效率标准指数
.097
.472
社会效率标准指数
.378
.233
人员效率标准指数
・・328
1.099
发展效率标准指数
.621
.675
表7结构矩阵
函数
1
2
发展效率标准指数
.752*
.305
经济效率标准指数
•61F
.222
综合效率标准指数
・42&
.170
社会效率标准指数
.261*
-.001
环境效率标准指数’
.141*
-.129
人员效率标准指数
-.547
・797
结构效率标准指数
.070
•・156
判别变虽和标准化典型判别式函数之间的汇聚组间相矢性按函数内相矢性的绝对大小排序的变虽。
*.每个变虽和任意判别式函数间最大的绝对相尖性
a•该变虽不在分析中使用。
表6为标准化的判别函数,表7为结构矩阵,即判别载希。
由判别权重和判别我椅可以看出发展效率标准指数、经济效率标准指数对判别函数1的责献轶大,而人员效率标准指数对判别函数2的贡执较大。
表8典型判别式函数系数
函数
1
2
综合效率标准指数
-5.216
-13.231
经济效率标准指数
5.168
3.688
结构效率标准指数
.999
4.848
社会效率标准指数
4.877
3.011
人员效率标准指数
•3.319
11.138
发展效率标准指数
7.145
7.774
(常量)
-1.363
-6.424
非标准化系数
组质心处的函数
1
2
1
-.210
-.730
2
3.964
1.263
3
-2.725
1.905
在组均值处评估的非标准化典型判别式函数
表8为非标准化的判别函数.我们可以根据这个判别函教计算每个观测的判别Z得分。
在9反映判别函数症各组的重心。
根据结果,判别函数淮.group"这一纽的重心为C-0.210,-0.730),淮_group=2这一组的重心为f3.964J.263J,Agroup=3这一组的重心为(-2.725,1.905丿。
这样,我们就可以根据每个观测的判别Z得分将观测进行分类。
表10组的先验槪率
group
先验
用于分析的案例
未加权的
已加权的
1
.333
46
46.000
2
.333
10
10.000
3
.333
11
11.000
合计
1.000
67
67.000
表11分类结果^
group
预测组成员
合计
1
2
3
初始
计数
1
46
0
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
%
1
100.0
・0
・0
100.0
2
・0
100.0
・0
100.0
3
18.2
・0
81.8
100.0
未分组的案例
50.0
25.0
25.0
100.0
交叉验证'
计数
1
45
0
1
46
2
I
9
0
10
3
2
0
9
11
1
97.8
・0
2.2
100.0
2
10.0
90.0
.0
100.0
3
18.2
・0
81.8
100.0
a.仅对分析中的案例逬行交叉验证。
在交叉验证中,每个寨例都是按照从该案例以外的所有其他寨例派生的函数来分类的。
b.已对初始分组案例中的97.0%个逬行了正确分类。
c.已对交叉验证分组案例中的94.0%个逬行了正确分类。
裹10为各俎的先验規率,准.分类选项中选择的是所有组的先脸規率和等。
在11%分类矩阵表,这里交又殓证是采用“超一个在外”的原则,即每个城市是通过除了这个城市以外的其他城市推孚出来的判别函数来分类的。
由该表可以看出,通过判别函数预测,有65个城市是分类正确的,其中,group=bn46个城市全部菠判对,group=2组的10个城市也,全部彼判对,group=3组11个城市中有9个彼判对,即有97%的原始城市菠判对。
在交又验证中,三组.中分别有45、9、9个城市■菠判对,交又脍证有94%的城市後判对。
典则判别幣数
group
△2
未分组的案供■组炳心
图三
图三为分类结果图,从图中可以看列笫2组与笫3组可以很请晰地分开,与笫1组也能分开,而笫3纽和弟1纽存在重合区城,即存在祺判。
同肘,根据对待判城市的判别可以看岀:
在13个待判城市中,宿州、广安、河地彼判列了第3纽,佛丄、苏州、东營拔判到了笫2纽,咸阳、盘綁、汉中、保定、宝呜、衡阳彼判列了第1纽,而以钝由于只有环境效率标准指救的值,其他变量值确实,糸统未对其进行判别。
2)臾叶斯刘别出:
图B
贝叶斯判别法输出的结果与Fisher判别法很大程度上是一致的’这里不再列出。
表12组的先验概率
group
先验
用于分析的案例
未加权的
已加权的
1
.687
46
46.000
2
.149
10
10.000
3
.164
11
11.000
合计
1.000
67
67.000
group
1
2
3
综合效率标准指数
・89.225
-137.370
-110.980
经济效率标准指数
18.318
47.236
15.041
结构效率标准指数
112.414
126.246
122.679
社会效率标准指数
61.509
87.864
57.179
人员效率标准指数
77.419
85.768
115.125
发展效率标准指数
57.663
102.980
60.184
(常量)
-46.457
-74.840
-66.632
Fisher的线性判别式函数
表12%各族的先验概率,淮.分组选项中选择的是“根据组大小计算”。
裹13展示了每纽的分类函数,也称枣欧线性判别函数,由表中的结果可以说朗:
group=1这一组的分类函数为:
£=46.457-89.225综合效率标准指数+18.318经济数率标准指救
+112.414结构数率标准指救+61.509祝会效率标;隹指数
+77.419人员效率标准指数+57.663发展效率标准指数
其他两组的分类函数同样可以写出,我们可以根据毎个城市淮.各组的分类函救值然后将城市分类列较大的分类函数值中。
在14为贝叶斯判别的分类结果,其交又殓证有95.5%的城市彼判对,这一觇率比Fisher判别要需。
分类结果^
1
2
3
初始
计数
1
46
0
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
1
100.0
・0
・0
100.0
2
・0
100.0
・0
100.0
3
18.2
・0
81.8
100.0
未分组的案例
50.0
25.0
25.0
100.0
交叉验证'
计数
1
46
0
0
46
2
I
9
0
10
3
2
0
9
11
1
100.0
・0
.0
100.0
2
10.0
90.0
・0
100.0
3
18.2
・0
81.8
100.0
a.仅对分析中的案例逬行交叉验证。
在交叉验证中,每个寨例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.已对初始分组寨例中的97.0%个逬行了正确分类。
c.已对交叉验证分组案例中的95.5%个逬行了正确分类。
五、讨论与结论
(\)由前面的分析我们知道,协方差矩阵并不相等,考虑采用分纽协方差矩阵。
在分类中使用协方差矩阵“分组其他逸择同上,得列分类结果表如下。
分类结果’
group
预测组成员
合计
I
2
3
初始
计数
1
44
0
2
46
2
0
10
0
10
3
0
0
11
11
未分组的案例
6
3
3
12
1
95.7
.0
4.3
100.0
2
・0
100.0
・0
100.0
3
.0
.0
100.0
100.0
未分组的案例
50.0
25.0
25.0
100.0
a.已对初始分组案例中的97.0%个逬行了正确分类。
典则判别函数
group
1
△2
03
末分组的宅例
口织质心
IIIII
・6・3036
歯数4
可以看出这个结果与采用组内协方差矩阵的预测效果没有朗显的差别,而且分类结果图与图三也没有很大的差异,因此,可以采用组内协方差矩阵来进行判别。
(2)之箭的分析是采用“一超输入勺变量”的方法,由表1可知,A0.05的
显著性水平上不能拒绝结构效率标准指数和环境数率标准指数>4三组的均值和等
的假设,考虑“使用步进式方法”,最终确岌进入分析的变量有3个:
经济效率标
准指数、人员败率标准指救、发展效率标准指救,上表给出了最终的分类结果,可
以看出,征療有数据的所有城市中,有95.5%的城市披判对,在交又殓证中有92.5%
的城市彼判对。
没有“一起输入勺变量"肘的效果好,但是柱最终对待判城市的分
组问題上,两种方法所得列的结果是一致的,症这里两种方出的选择对我们所需要
的结果影响不是很大!
分类结果^
group
预测组成员
合计
1
2
3
初始
计数
1
45
1
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
%
1
97.8
2.2
・0
100.0
2
・0
100.0
・0
100.0
3
18.2
・0
81.8
100.0
未分组的寨例
50.0
25.0
25.0
100.0
交叉验证'
计数
1
44
2
0
46
2
I
9
0
10
3
2
0
9
11
%
1
95.7
4.3
・0
100.0
2
10.0
90.0
・0
100.0
3
18.2
・0
81.8
100.0
a.仅对分析中的案例逬行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.已对初始分组案例中的95.5%个进行了正确分类。
C.已对交叉验证分组寨例中的92.5%个进行了正确分类。