多元统计分析实验报告判别分析.docx
《多元统计分析实验报告判别分析.docx》由会员分享,可在线阅读,更多相关《多元统计分析实验报告判别分析.docx(22页珍藏版)》请在冰豆网上搜索。
![多元统计分析实验报告判别分析.docx](https://file1.bdocx.com/fileroot1/2023-1/4/425b7d38-700c-4108-b507-bda181a0c2a3/425b7d38-700c-4108-b507-bda181a0c2a31.gif)
多元统计分析实验报告判别分析
2015——2016学年第一学期
实验报告
课程名称:
多元统计分析
实验项目:
判别分析
实验类别:
综合性
设计性□验证性□
专业班级:
姓名:
学号:
实验地点:
统计与金融创新实验室(新60801)
实验时间:
指导教师:
曹老师成绩:
数学与统计学院实验中心制
一、实验目的
让学生掌握判别分析的基本步骤和分析方法;学习《spss统计分析从入门到精通》P307-P320的内容,掌握一般判别分析与逐步判别分析方法。
二、实验内容
1、应用《胃病患者的测量数据》和《表征企业类型的数据.sav》,掌握一般判别分析与逐步判别分析方法。
数据来源于《spss统计分析从入门到精通数据文件》第12章的数据。
2、参考教材例4-2的数据进行分析,数据见文件《何晓群多元统计分析(数据)》中的例4-2new。
三、实验方案(程序设计说明)
四、程序运行结果
1.
(1)
分析案例处理摘要
未加权案例
N
百分比
有效
14
93.3
排除的
缺失或越界组代码
1
6.7
至少一个缺失判别变量
0
.0
缺失或越界组代码还有至少一个缺失判别变量
0
.0
合计
1
6.7
合计
15
100.0
组统计量
类别
均值
标准差
有效的N(列表状态)
未加权的
已加权的
胃癌患者
铜蓝蛋白
188.60
57.138
5
5.000
蓝色反应
150.40
16.502
5
5.000
尿吲哚乙酸
13.80
5.933
5
5.000
中性琉化物
20.00
13.323
5
5.000
萎缩性胃炎
铜蓝蛋白
156.25
47.500
4
4.000
蓝色反应
118.75
14.104
4
4.000
尿吲哚乙酸
7.50
1.732
4
4.000
中性琉化物
14.50
8.386
4
4.000
其他胃病
铜蓝蛋白
151.00
33.801
5
5.000
蓝色反应
121.40
13.012
5
5.000
尿吲哚乙酸
5.00
1.871
5
5.000
中性琉化物
8.00
7.314
5
5.000
合计
铜蓝蛋白
165.93
46.787
14
14.000
蓝色反应
131.00
20.203
14
14.000
尿吲哚乙酸
8.86
5.318
14
14.000
中性琉化物
14.14
10.726
14
14.000
汇聚的组内矩阵a
铜蓝蛋白
蓝色反应
尿吲哚乙酸
中性琉化物
协方差
铜蓝蛋白
2217.995
-168.268
-48.264
158.682
蓝色反应
-168.268
214.832
12.082
-13.773
尿吲哚乙酸
-48.264
12.082
14.891
-8.273
中性琉化物
158.682
-13.773
-8.273
103.182
a.协方差矩阵的自由度为11。
协方差矩阵
类别
铜蓝蛋白
蓝色反应
尿吲哚乙酸
中性琉化物
胃癌患者
铜蓝蛋白
3264.800
-711.300
-103.350
402.000
蓝色反应
-711.300
272.300
9.100
-39.750
尿吲哚乙酸
-103.350
9.100
35.200
-25.000
中性琉化物
402.000
-39.750
-25.000
177.500
萎缩性胃炎
铜蓝蛋白
2256.250
138.750
-27.500
-110.833
蓝色反应
138.750
198.917
20.500
74.167
尿吲哚乙酸
-27.500
20.500
3.000
12.333
中性琉化物
-110.833
74.167
12.333
70.333
其他胃病
铜蓝蛋白
1142.500
144.500
-8.750
117.500
蓝色反应
144.500
169.300
8.750
-53.750
尿吲哚乙酸
-8.750
8.750
3.500
-7.000
中性琉化物
117.500
-53.750
-7.000
53.500
对数行列式
类别
秩
对数行列式
胃癌患者
4
20.943
萎缩性胃炎
.a
.b
其他胃病
4
15.315
汇聚的组内
4
20.116
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
a.秩<4
b.案例太少无法形成非奇异矩阵
检验结果a
箱的M
26.091
F
近似。
1.121
df1
10
df2
305.976
Sig.
.345
对相等总体协方差矩阵的零假设进行检验。
a.有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。
将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。
其行列式的对数为21.390。
特征值
函数
特征值
方差的%
累积%
正则相关性
1
3.167a
95.2
95.2
.872
2
.159a
4.8
100.0
.370
a.分析中使用了前2个典型判别式函数。
Wilks的Lambda
函数检验
Wilks的Lambda
卡方
df
Sig.
1到2
.207
14.958
8
.060
2
.863
1.398
3
.706
标准化的典型判别式函数系数
函数
1
2
铜蓝蛋白
.443
-.295
蓝色反应
.605
-.753
尿吲哚乙酸
.685
.532
中性琉化物
.347
.668
结构矩阵
函数
1
2
尿吲哚乙酸
.623*
.309
铜蓝蛋白
.229*
-.031
蓝色反应
.611
-.630*
中性琉化物
.294
.527*
判别变量和标准化典型判别式函数之间的汇聚组间相关性
按函数内相关性的绝对大小排序的变量。
*.每个变量和任意判别式函数间最大的绝对相关性
典型判别式函数系数
函数
1
2
铜蓝蛋白
.009
-.006
蓝色反应
.041
-.051
尿吲哚乙酸
.177
.138
中性琉化物
.034
.066
(常量)
-9.023
5.622
非标准化系数
组质心处的函数
类别
函数
1
2
胃癌患者
2.092
-.072
萎缩性胃炎
-.825
.527
其他胃病
-1.431
-.349
在组均值处评估的非标准化典型判别式函数
组的先验概率
类别
先验
用于分析的案例
未加权的
已加权的
胃癌患者
.357
5
5.000
萎缩性胃炎
.286
4
4.000
其他胃病
.357
5
5.000
合计
1.000
14
14.000
分类函数系数
类别
胃癌患者
萎缩性胃炎
其他胃病
铜蓝蛋白
.154
.122
.122
蓝色反应
.780
.629
.649
尿吲哚乙酸
.865
.429
.201
中性琉化物
.131
.071
-.008
(常量)
-81.468
-50.292
-50.128
Fisher的线性判别式函数
区域图
典则判别
函数2
-8.0-6.0-4.0-2.0.02.04.06.08.0
+---------+---------+---------+---------+---------+---------+---------+---------+
8.0+21+
I21I
I21I
I21I
I21I
I21I
6.0+++++21+++
I21I
I221I
I32221I
I332221I
I3322221I
4.0+33322++++21++++
I3322221I
I3332221I
I332221I
I3322221I
I3332221I
2.0++33222++21++++
I3332221I
I332221I
I3322221I
I33322*21I
I3322221I
.0++++33322+21*+++
I*332221I
I33221I
I331I
I31I
I31I
-2.0+++++31++++
I31I
I31I
I31I
I31I
I31I
-4.0+++++31++++
I31I
I31I
I31I
I31I
I31I
-6.0+++++31++++
I31I
I31I
I31I
I31I
I31I
-8.0+31+
+---------+---------+---------+---------+---------+---------+---------+---------+
-8.0-6.0-4.0-2.0.02.04.06.08.0
典则判别函数1
区域图中使用的符号
符号组标签
----------------------------
11胃癌患者
22萎缩性胃炎
33其他胃病
*表示一个组质心
分类结果a
类别
预测组成员
合计
胃癌患者
萎缩性胃炎
其他胃病
初始
计数
胃癌患者
4
0
1
5
萎缩性胃炎
0
3
1
4
其他胃病
0
1
4
5
未分组的案例
0
0
1
1
%
胃癌患者
80.0
.0
20.0
100.0
萎缩性胃炎
.0
75.0
25.0
100.0
其他胃病
.0
20.0
80.0
100.0
未分组的案例
.0
.0
100.0
100.0
a.已对初始分组案例中的78.6%个进行了正确分类。
2.
分析案例处理摘要
未加权案例
N
百分比
有效
29
93.5
排除的
缺失或越界组代码
2
6.5
至少一个缺失判别变量
0
.0
缺失或越界组代码还有至少一个缺失判别变量
0
.0
合计
2
6.5
合计
31
100.0
组统计量
Group
均值
标准差
有效的N(列表状态)
未加权的
已加权的
1
x1
3640.78267471224400
732.344675348464200
5
5.000
x2
666.63951808359490
229.859408466203180
5
5.000
x3
1709.21054749795870
423.831137448486970
5
5.000
x4
586.68108103915930
145.747543294018800
5
5.000
x5
1334.93918986871840
353.261121197578600
5
5.000
x6
931.56103219718310
287.292833824583100
5
5.000
x7
814.19115093353990
269.651305651237300
5
5.000
x8
260.86584182100313
42.303649559856130
5
5.000
2
x1
1674.38215879309040
524.988766483780200
13
13.000
x2
335.32628108172827
157.791341245207500
13
13.000
x3
917.158********270
320.239807432860200
13
13.000
x4
316.39963134995446
90.364061532010410
13
13.000
x5
541.52807039114790
210.965261966270600
13
13.000
x6
353.44607864726055
166.862761183509120
13
13.000
x7
444.16926592129334
173.205494866747240
13
13.000
x8
122.83209782823597
43.883878258504275
13
13.000
3
x1
1621.79674326287110
278.771472503797100
11
11.000
x2
449.20546612978720
67.846485790118630
11
11.000
x3
983.38521778053560
212.787586838133250
11
11.000
x4
275.98939754389720
47.325755156442490
11
11.000
x5
639.43072743491230
117.404576993389040
11
11.000
x6
421.89527214930980
119.130********3900
11
11.000
x7
551.12526332392500
128.834528404794640
11
11.000
x8
151.14600667763634
30.617164953852978
11
11.000
合计
x1
1993.47053840561970
899.229366421852000
29
29.000
x2
435.64480592786555
184.758066784714150
29
29.000
x3
1078.83974648757100
415.281890726575300
29
29.000
x4
347.67186157683010
141.448775178609850
29
29.000
x5
715.45858159353630
355.905561478251700
29
29.000
x6
479.08455782905900
271.966732998301840
29
29.000
x7
548.53565890371340
216.413198176433800
29
29.000
x8
157.37077773538218
62.430639373791210
29
29.000
组均值的均等性的检验
Wilks的Lambda
F
df1
df2
Sig.
x1
.275
34.246
2
26
.000
x2
.582
9.342
2
26
.001
x3
.497
13.135
2
26
.000
x4
.367
22.465
2
26
.000
x5
.330
26.371
2
26
.000
x6
.389
20.396
2
26
.000
x7
.623
7.871
2
26
.002
x8
.363
22.788
2
26
.000
对数行列式
Group
秩
对数行列式
1
.a
.b
2
8
68.643
3
8
66.156
汇聚的组内
8
74.054
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
a.秩<5
b.案例太少无法形成非奇异矩阵
检验结果a
箱的M
173.333
F
近似。
2.845
df1
36
df2
1524.161
Sig.
.000
对相等总体协方差矩阵的零假设进行检验。
a.有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。
将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。
其行列式的对数为75.391。
特征值
函数
特征值
方差的%
累积%
正则相关性
1
8.936a
89.8
89.8
.948
2
1.020a
10.2
100.0
.711
a.分析中使用了前2个典型判别式函数。
Wilks的Lambda
函数检验
Wilks的Lambda
卡方
df
Sig.
1到2
.050
67.479
16
.000
2
.495
15.816
7
.027
标准化的典型判别式函数系数
函数
1
2
x1
.698
-.918
x2
-1.219
.226
x3
-.406
.130
x4
1.192
-.890
x5
.817
1.001
x6
.740
-.354
x7
-1.677
.411
x8
.539
1.045
结构矩阵
函数
1
2
x1
.529*
.365
x4
.438*
.123
x8
.383
.659*
x5
.436
.571*
x2
.214
.551*
x6
.384
.494*
x7
.209
.461*
x3
.314
.355*
判别变量和标准化典型判别式函数之间的汇聚组间相关性
按函数内相关性的绝对大小排序的变量。
*.每个变量和任意判别式函数间最大的绝对相关性
典型判别式函数系数
函数
1
2
x1
.001
-.002
x2
-.008
.002
x3
-.001
.000
x4
.013
-.010
x5
.004
.005
x6
.004
-.002
x7
-.009
.002
x8
.014
.027
(常量)
-4.187
-1.808
非标准化系数
组质心处的函数
Group
函数
1
2
1
5.991
.540
2
-.510
-1.047
3
-2.121
.991
在组均值处评估的非标准化典型判别式函数
分类处理摘要
已处理的
31
已排除的
缺失或越界组代码
0
至少一个缺失判别变量
0
用于输出中
31
组的先验概率
Group
先验
用于分析的案例
未加权的
已加权的
1
.333
5
5.000
2
.333
13
13.000
3
.333
11
11.000
合计
1.000
29
29.000
分类函数系数
Group
1
2
3
x1
.011
.005
-.001
x2
-.071
-.019
-.002
x3
-.009
-.001
.002
x4
.127
.056
.014
x5
.041
.008
.012
x6
.021
-.003
-.014
x7
-.079
-.021
-.001
x8
.203
.071
.103
(常量)
-59.564
-12.059
-11.061
Fisher的线性判别式函数
分类结果a,c
Group
预测组成员
合计
1
2
3
初始
计数
1
5
0
0
5
2
0
12
1
13
3
0
2
9
11
未分组的案例
1
0
1
2
%
1
100.0
.0
.0
100.0
2
.0
92.3
7.7
100.0
3
.0
18.2
81.8
100.0
未分组的案例
50.0
.0
50.0
100.0
交叉验证b
计数
1
5
0
0
5
2
1
10
2
13
3
0
3
8
11
%
1
100.0
.0
.0
100.0
2
7.7
76.9
15.4
100.0
3
.0
27.3
72.7
100.0
a.已对初始分组案例中的89.7%个进行了正确分类。
b.仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
c.已对交叉验证分组案例中的79.3%个进行了正确分类。
五、实验总结
学生签名:
年月日
六、教师评语及成绩
教师签名:
年月日