SPSS操作方法判别分析例题.docx
《SPSS操作方法判别分析例题.docx》由会员分享,可在线阅读,更多相关《SPSS操作方法判别分析例题.docx(32页珍藏版)》请在冰豆网上搜索。
SPSS操作方法判别分析例题
实验指导之二
判别分析的SPSS软件的基本操作
[实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。
试建立判别函数,判定、分别属于哪个收入类型。
判别指标及原始数据见表9-4。
1991年30个省、市、自治区城镇居民月平均收人数据表
单位:
元/人
x1:
人均生活费收入x6:
人均各种奖金、超额工资(国有+集体)
x2:
人均国有经济单位职工工资x7:
人均各种津贴(国有+集体)
x3:
人均来源于国有经济单位标准工资x8:
人均从工作单位得到的其他收入
x4:
人均集体所有制工资收入x9:
个体劳动者收入
x5:
人均集体所有制职工标准工资
样品序号
地区
x1
x2
x3
x4
x5
x6
x7
x8
x9
类
序号
G1
1
北京
170.03
110.2
59.76
8.38
4.49
26.80
16.44
11.9
0.41
2
天津
141.55
82.58
50.98
13.4
9.33
21.30
12.36
9.21
1.05
3
河北
119.40
83.33
53.39
11.0
7.52
17.30
11.79
12.0
0.70
4
上海
194.53
107.8
60.24
15.6
8.88
31.00
21.01
11.8
0.16
5
山东
130.46
86.21
52.30
15.9
10.5
20.6l
12.14
9.61
0.47
6
湖北
119.29
85.41
53.02
13.1
8.44
13.87
16.47
8.38
0.51
7
广西
134.46
98.61
48.18
8.90
4.34
21.49
26.12
13.6
4.56
8
海南
143.79
99.97
45.60
6.30
1.56
18.67
29.49
11.8
3.82
9
四川
128.05
74.96
50.13
13.9
9.62
16.14
10.18
14.5
1.21
10
云南
127.41
93.54
50.57
10.5
5.87
19.41
21.20
12.6
0.90
11
新疆
122.96
101.4
69.70
6.30
3.86
11.30
18.96
5.62
4.62
G2
1
山西
102.49
71.72
47.72
9.42
6.96
13.12
7.9
6.66
0.61
2
106.14
76.27
46.19
9.65
6.27
9.655
20.1O
6.97
0.96
3
吉林
104.93
72.99
44.60
13.7
9.01
9.435
20.61
6.65
1.68
4
103.34
62.99
42.95
11.1
7.4l
8.342
10.19
6.45
2.68
5
江西
98.089
69.45
43.04
11.4
7.95
10.59
16.50
7.69
1.08
6
河南
104.12
72.23
47.31
9.48
6.43
13.14
10.43
8.30
1.11
7
贵州
108.49
80.79
47.52
6.06
3.42
13.69
16.53
8.37
2.85
8
陕西
113.99
75.6
50.88
5.21
3.86
12.94
9.492
6.77
1.27
9
甘肃
114.06
84.31
52.78
7.81
5.44
10.82
16.43
3.79
1.19
10
青海
108.80
80.41
50.45
7.27
4.07
8.371
18.98
5.95
0.83
11
宁夏
115.96
88.2l
51.85
8.81
5.63
13.95
22.65
4.75
0.97
G3
1
辽宁
128.46
68.91
43.4l
22.4
15.3
13.88
12.42
9.01
1.41
2
江
135.24
73.18
44.54
23.9
15.2
22.38
9.661
13.9
1.19
3
浙江
162.53
80.11
45.99
24.3
13.9
29.54
10.90
13.0
3.47
4
安徽
111.77
71.07
43.64
19.4
12.5
16.68
9.698
7.02
0.63
5
福建
139.09
79.09
44.19
18.5
10.5
20.23
16.47
7.67
3.08
6
湖南
124.00
84.66
44.05
13.5
7.47
19.11
20.49
10.3
1.76
待判
1
广东
211.30
114.0
41.44
33.2
11.2
48.72
30.77
14.9
11.1
2
西藏
175.93
163.8
57.89
4.22
3.37
17.81
82.32
15.7
0.00
贝叶斯判别的SPSS操作方法:
1.建立数据文件
2.单击Analyze→Classify→Discriminant,打开DiscriminantAnalysis判别分析对话框如图1所示:
图1DiscriminantAnalysis判别分析对话框
3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents框,作为判别分析的基础数据变量。
从对话框左侧的变量列表中选分组变量Group进入GroupingVariable框,并点击DefineRange...钮,在打开的DiscriminantAnalysis:
DefineRange对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。
。
选择后点击Continue按钮返回DiscriminantAnalysis主对话框。
图2DefineRange对话框
4、选择分析方法
✧Enterindependenttogether所有变量全部参与判别分析(系统默认)。
本例选择此项。
✧Usestepwisemethod采用逐步判别法自动筛选变量。
单击该项时Method按钮激活,打开StepwiseMethod对话框如图3所示,从中可进一步选择判别分析方法。
图3StepwiseMethod对话框
✧Method栏,选择变量的统计量方法
Wilks’lambda(默认)按统计量Wilksλ最小值选择变量;
Unexplainedvariance:
按照所有组方差之和最小值选择变量;
Mahalanobis’distance:
按照相邻两组的最大马氏距离选择变量;
SmallestFratio:
按组间最小F值比的最大值选择变量;
Rao’sV按照统计量RaoV最大值选择变量。
✧Criteria选择逐步回归的标准(略)选择系统默认项。
5.单击Statistics按钮,打开Statistics对话框如图4所示,从中指定输出的统计量。
✧Descriptives描述统计量栏
Means-各类中各自变量的均值,标准差stdDev和各自变量总样本的均值和标准差(本例选择)。
UnivariateANOV----对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果(本例选择)。
Box’sM--对各类的协方差矩阵相等的假设进行检验(本例选择)。
图4Statistics对话框
✧Functioncoefficients选择输出判别函数系数
Fisherh’s给出贝叶斯判别函数系数(本例选择)
Unstandardized给出未标准化的典型判别(也称典则判别)系数(费舍尔判别函数)。
✧Matrices栏选择给出的自变量系数矩阵
Within-groupscorrelation合并类相关系数矩阵(本例选择)
Within-groupscovariance合并类协方差矩阵(本例选择)
Separate-groupscovariance各类协方差矩阵(本例选择)
Totalcovariance总协方差矩阵(本例选择)
6.单击Classify按钮,打开Classify对话框如图5所示:
图5Classify对话框
✧PriorProbabilities栏,选择先验概率。
Allgroupsequal各类先验概率相等(系统默认);
Computefromgroupssizes各类的先验概率与其样本量成正比.(本例选择)
✧UseCovarianceMatrix栏,选择使用的协方差矩阵
Within-groups--使用合并类协方差矩阵进行分类(系统默认)(本例选择)
Separate-groups--使用各类协方差矩阵进行分类
✧Display栏,选择生成到输出窗口中的分类结果
Casewiseresults输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等。
Summarytable输出分类的小结给出正确分类观测量数(原始类和根据判别函数计算的预测类相同)和错分观测量数和错分率(本例选择)。
Leave-one-outclassification输出交互验证结果。
✧Plots栏,要求输出的统计图
Combined-groups生成一包括各类的散点图(本例选择);
Separate-groups每类生成一个散点图;
Territorialmap根据生成的函数值把各观测值分到各组的区域图。
(本例选择)
6.单击Save按钮,打开Save对话框,见图6.
图6Save对话框
✧Predictedgroupmembership建立一个新变量,系统根据判别分数,把观测量按后验概率最大指派所属的类;(本例选择)
✧Discriminantscore建立表明判别得分的新变量,该得分是由未标准化的典则判别函数计算。
(本例选择)
✧Probabilitiesofgroupmembership建立新变量表明观测量属于某一类的概率。
有m类,对一个观测量就会给出m个概率值,因此建立m个新变量。
(本例选择)
全部选择完成后,点击OK,得到输出结果如下:
AnalysisCaseProcessingSummary分类样本综述
UnweightedCases
N
Percent
Valid
28
93.3
Excluded
Missingorout-of-rangegroupcodes
2
6.7
Atleastonemissingdiscriminatingvariable
0
.0
Bothmissingorout-of-rangegroupcodesandatleastonemissingdiscriminatingvariable
0
.0
Total
2
6.7
Total
30
100.0
GroupStatistics各类统计分析
分类
Mean
均值
Std.Deviation
标准差
ValidN(listwise)
有效样本数
Unweighted
Weighted
1
人均生活费收入(元/人)
139.2664
23.35125
11
11.000
人均国有经济单位职工工资
93.0918
11.38829
11
11.000
人均来源于国有经济单位标准工资
53.9882
6.80530
11
11.000
人均集体所有制工资收入
11.2073
3.44937
11
11.000
人均集体所有制职工标准工资
6.7645
2.89685
11
11.000
人均各种奖金、超额工资(国有+集体)
19.8082
5.55600
11
11.000
人均各种津贴(国有+集体)
17.8327
6.23305
11
11.000
均从工作单位得到的其他收入
11.0018
2.56135
11
11.000
个体劳动者收入
1.6736
1.74528
11
11.000
2
人均生活费收入(元/人)
107.3099
5.56641
11
11.000
人均国有经济单位职工工资
75.9064
7.17233
11
11.000
人均来源于国有经济单位标准工资
47.7536
3.42090
11
11.000
人均集体所有制工资收入
9.0827
2.45900
11
11.000
人均集体所有制职工标准工资
6.0409
1.77266
11
11.000
人均各种奖金、超额工资(国有+集体)
11.2775
2.15323
11
11.000
人均各种津贴(国有+集体)
15.4375
5.11023
11
11.000
均从工作单位得到的其他收入
6.5773
1.38350
11
11.000
个体劳动者收入
1.3845
.73428
11
11.000
3
人均生活费收入(元/人)
133.5150
17.11642
6
6.000
人均国有经济单位职工工资
76.1700
6.06280
6
6.000
人均来源于国有经济单位标准工资
44.3033
.91825
6
6.000
人均集体所有制工资收入
20.3333
4.09031
6
6.000
人均集体所有制职工标准工资
12.4783
3.04592
6
6.000
人均各种奖金、超额工资(国有+集体)
20.3033
5.39344
6
6.000
人均各种津贴(国有+集体)
13.2732
4.34722
6
6.000
均从工作单位得到的其他收入
10.1500
2.80907
6
6.000
个体劳动者收入
1.9233
1.11631
6
6.000
Total
人均生活费收入(元/人)
125.4796
22.22549
28
28.000
人均国有经济单位职工工资
82.7143
12.09003
28
28.000
人均来源于国有经济单位标准工资
49.4636
6.09033
28
28.000
人均集体所有制工资收入
12.3282
5.36546
28
28.000
人均集体所有制职工标准工资
7.7046
3.54143
28
28.000
人均各种奖金、超额工资(国有+集体)
16.5630
6.10883
28
28.000
人均各种津贴(国有+集体)
15.9147
5.54104
28
28.000
均从工作单位得到的其他收入
9.0811
2.98513
28
28.000
个体劳动者收入
1.6136
1.26601
28
28.000
TestsofEqualityofGroupMeans每个变量各类均值相等的检验
Wilks'Lambda
F
df1
df2
Sig.
人均生活费收入(元/人)
.542
10.567
2
25
.000
人均国有经济单位职工工资
.506
12.226
2
25
.000
人均来源于国有经济单位标准工资
.583
8.923
2
25
.001
人均集体所有制工资收入
.338
24.429
2
25
.000
人均集体所有制职工标准工资
.478
13.672
2
25
.000
人均各种奖金、超额工资(国有+集体)
.497
12.664
2
25
.000
人均各种津贴(国有+集体)
.898
1.425
2
25
.259
均从工作单位得到的其他收入
.516
11.715
2
25
.000
个体劳动者收入
.972
.354
2
25
.705
PooledWithin-GroupsMatrices(a)合并类协方差阵和相关矩阵
人均生活费收入(元/人)
人均国有经济单位职工工资
人均来源于国有经济单位标准工资
人均集体所有制工资收入
人均集体所有制职工标准工资
人均各种奖金、超额工资(国有+集体)
人均各种津贴(国有+集体)
人均从工作单位得到的其他收入
个体劳动者收入
Covariance
人均生活费收入(元/人)
289.101
92.215
24.694
9.270
-.438
64.106
15.828
9.298
-1.158
人均国有经济单位职工工资
92.215
79.806
23.013
-13.984
-14.104
18.999
31.151
-2.229
2.386
人均来源于国有经济单位标准工资
24.694
23.013
23.374
-3.496
-2.063
1.925
-1.878
-5.027
-.052
人均集体所有制工资收入
9.270
-13.984
-3.496
10.524
7.877
3.113
-7.158
1.660
-1.670
人均集体所有制职工标准工资
-.438
-14.104
-2.063
7.877
6.469
.484
-7.895
.665
-1.611
人均各种奖金、超额工资(国有+集体)
64.106
18.999
1.925
3.113
.484
20.020
.398
4.724
-.782
人均各种津贴(国有+集体)
15.828
31.151
-1.878
-7.158
-7.895
.398
29.766
-.704
2.849
均从工作单位得到的其他收入
9.298
-2.229
-5.027
1.660
.665
4.724
-.704
4.968
-.020
个体劳动者收入
-1.158
2.386
-.052
-1.670
-1.611
-.782
2.849
-.020
1.683
Correlation
人均生活费收入(元/人)
1.000
.607
.300
.168
-.010
.843
.171
.245
-.053
人均国有经济单位职工工资
.607
1.000
.533
-.483
-.621
.475
.639
-.112
.206
人均来源于国有经济单位标准工资
.300
.533
1.000
-.223
-.168
.089
-.071
-.466
-.008
人均集体所有制工资收入
.168
-.483
-.223
1.000
.955
.214
-.404
.230
-.397
人均集体所有制职工标准工资
-.010
-.621
-.168
.955
1.000
.043
-.569
.117
-.488
人均各种奖金、超额工资(国有+集体)
.843
.475
.089
.214
.043
1.000
.016
.474
-.135
人均各种津贴(国有+集体)
.171
.639
-.071
-.404
-.569
.016
1.000
-.058
.402
均从工作单位得到的其他收入
.245
-.112
-.466
.230
.117
.474
-.058
1.000
-.007
个体劳动者收入
-.053
.206
-.008
-.397
-.488
-.135
.402
-.007
1.000
aThecovariancematrixhas25degreesoffreedom.
CovarianceMatrices(a)类协方差矩阵和总协方差阵
分类
人均生活费收入(元/人)
人均国有经济单位职工工资
人均来源于国有经济单位标准工资
人均集体所有制工资收入
人均集体所有制职工标准工资
人均各种奖金、超额工资(国有+集体)
人均各种津贴(国有+集体)
均从工作单位得到的其他收入
个体劳动者收入
1
人均生活费收入(元/人)
545.281
179.030
37.985
13.286
-1.453
116.976
35.808
13.315
-10.859
人均国有经济单位职工工资
179.030
129.693
35.643
-18.802
-20.620
33.023
46.461
-2.168
5.263
人均来源于国有经济单位标准工资
37.985
35.643
46.312
-3.559
-1.186
-.665
-6.736
-10.545
.482
人均集体所有制工资收入
13.286
-18.802
-3.559
11.898
9.560
5.957
-12.699
1.012
-4.445
人均集体所有制职工标准工资
-1.453
-20.620
-1.186
9.560
8.392
1.919
-14.117
-.005
-3.647
人均各种奖金、超额工资(国有+集体)
116.976
33.023
-.665
5.957
1.919
30.869
5.415
6.027
-3.897
人均各种津贴(国有+集体)
35.808
46.461
-6.736
-12.699
-14.117
5.415
38.851
1.994
6.7