多元统计分析实验报告判别分析.docx

资源描述

多元统计分析实验报告判别分析.docx

《多元统计分析实验报告判别分析.docx》由会员分享，可在线阅读，更多相关《多元统计分析实验报告判别分析.docx（22页珍藏版）》请在冰豆网上搜索。

多元统计分析实验报告判别分析.docx

多元统计分析实验报告判别分析

2015——2016学年第一学期

实验报告

课程名称：

多元统计分析

实验项目：

判别分析

实验类别：

综合性

设计性□验证性□

专业班级：

姓名：

学号：

实验地点：

统计与金融创新实验室（新60801）

实验时间：

指导教师：

曹老师成绩：

数学与统计学院实验中心制

一、实验目的

让学生掌握判别分析的基本步骤和分析方法；学习《spss统计分析从入门到精通》P307-P320的内容，掌握一般判别分析与逐步判别分析方法。

二、实验内容

1、应用《胃病患者的测量数据》和《表征企业类型的数据.sav》，掌握一般判别分析与逐步判别分析方法。

数据来源于《spss统计分析从入门到精通数据文件》第12章的数据。

2、参考教材例4-2的数据进行分析，数据见文件《何晓群多元统计分析（数据）》中的例4-2new。

三、实验方案（程序设计说明）

四、程序运行结果

（1）

分析案例处理摘要

未加权案例

百分比

有效

93.3

排除的

缺失或越界组代码

6.7

至少一个缺失判别变量

缺失或越界组代码还有至少一个缺失判别变量

合计

6.7

合计

100.0

组统计量

类别

均值

标准差

有效的N（列表状态）

未加权的

已加权的

胃癌患者

铜蓝蛋白

188.60

57.138

5.000

蓝色反应

150.40

16.502

5.000

尿吲哚乙酸

13.80

5.933

5.000

中性琉化物

20.00

13.323

5.000

萎缩性胃炎

铜蓝蛋白

156.25

47.500

4.000

蓝色反应

118.75

14.104

4.000

尿吲哚乙酸

7.50

1.732

4.000

中性琉化物

14.50

8.386

4.000

其他胃病

铜蓝蛋白

151.00

33.801

5.000

蓝色反应

121.40

13.012

5.000

尿吲哚乙酸

5.00

1.871

5.000

中性琉化物

8.00

7.314

5.000

合计

铜蓝蛋白

165.93

46.787

14.000

蓝色反应

131.00

20.203

14.000

尿吲哚乙酸

8.86

5.318

14.000

中性琉化物

14.14

10.726

14.000

汇聚的组内矩阵a

铜蓝蛋白

蓝色反应

尿吲哚乙酸

中性琉化物

协方差

铜蓝蛋白

2217.995

-168.268

-48.264

158.682

蓝色反应

-168.268

214.832

12.082

-13.773

尿吲哚乙酸

-48.264

12.082

14.891

-8.273

中性琉化物

158.682

-13.773

-8.273

103.182

a.协方差矩阵的自由度为11。

协方差矩阵

类别

铜蓝蛋白

蓝色反应

尿吲哚乙酸

中性琉化物

胃癌患者

铜蓝蛋白

3264.800

-711.300

-103.350

402.000

蓝色反应

-711.300

272.300

9.100

-39.750

尿吲哚乙酸

-103.350

9.100

35.200

-25.000

中性琉化物

402.000

-39.750

-25.000

177.500

萎缩性胃炎

铜蓝蛋白

2256.250

138.750

-27.500

-110.833

蓝色反应

138.750

198.917

20.500

74.167

尿吲哚乙酸

-27.500

20.500

3.000

12.333

中性琉化物

-110.833

74.167

12.333

70.333

其他胃病

铜蓝蛋白

1142.500

144.500

-8.750

117.500

蓝色反应

144.500

169.300

8.750

-53.750

尿吲哚乙酸

-8.750

8.750

3.500

-7.000

中性琉化物

117.500

-53.750

-7.000

53.500

对数行列式

类别

秩

对数行列式

胃癌患者

20.943

萎缩性胃炎

其他胃病

15.315

汇聚的组内

20.116

打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。

a.秩<4

b.案例太少无法形成非奇异矩阵

检验结果a

箱的M

26.091

近似。

1.121

df1

df2

305.976

Sig.

.345

对相等总体协方差矩阵的零假设进行检验。

a.有些协方差矩阵是奇异矩阵，因此一般程序不会起作用。

将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。

其行列式的对数为21.390。

特征值

函数

特征值

方差的%

累积%

正则相关性

3.167a

95.2

.872

.159a

4.8

100.0

.370

a.分析中使用了前2个典型判别式函数。

Wilks的Lambda

函数检验

Wilks的Lambda

卡方

Sig.

1到2

.207

14.958

.060

.863

1.398

.706

标准化的典型判别式函数系数

函数

铜蓝蛋白

.443

-.295

蓝色反应

.605

-.753

尿吲哚乙酸

.685

.532

中性琉化物

.347

.668

结构矩阵

函数

尿吲哚乙酸

.623*

.309

铜蓝蛋白

.229*

-.031

蓝色反应

.611

-.630*

中性琉化物

.294

.527*

判别变量和标准化典型判别式函数之间的汇聚组间相关性

按函数内相关性的绝对大小排序的变量。

*.每个变量和任意判别式函数间最大的绝对相关性

典型判别式函数系数

函数

铜蓝蛋白

.009

-.006

蓝色反应

.041

-.051

尿吲哚乙酸

.177

.138

中性琉化物

.034

.066

（常量）

-9.023

5.622

非标准化系数

组质心处的函数

类别

函数

胃癌患者

2.092

-.072

萎缩性胃炎

-.825

.527

其他胃病

-1.431

-.349

在组均值处评估的非标准化典型判别式函数

组的先验概率

类别

先验

用于分析的案例

未加权的

已加权的

胃癌患者

.357

5.000

萎缩性胃炎

.286

4.000

其他胃病

.357

5.000

合计

1.000

14.000

分类函数系数

类别

胃癌患者

萎缩性胃炎

其他胃病

铜蓝蛋白

.154

.122

蓝色反应

.780

.629

.649

尿吲哚乙酸

.865

.429

.201

中性琉化物

.131

.071

-.008

（常量）

-81.468

-50.292

-50.128

Fisher的线性判别式函数

区域图

典则判别

函数2

-8.0-6.0-4.0-2.0.02.04.06.08.0

+---------+---------+---------+---------+---------+---------+---------+---------+

8.0+21+

I21I

6.0+++++21+++

I21I

I221I

I32221I

I332221I

I3322221I

4.0+33322++++21++++

I3322221I

I3332221I

I332221I

I3322221I

I3332221I

2.0++33222++21++++

I3332221I

I332221I

I3322221I

I33322*21I

I3322221I

.0++++33322+21*+++

I*332221I

I33221I

I331I

I31I

-2.0+++++31++++

I31I

-4.0+++++31++++

I31I

-6.0+++++31++++

I31I

-8.0+31+

+---------+---------+---------+---------+---------+---------+---------+---------+

-8.0-6.0-4.0-2.0.02.04.06.08.0

典则判别函数1

区域图中使用的符号

符号组标签

----------------------------

11胃癌患者

22萎缩性胃炎

33其他胃病

*表示一个组质心

分类结果a

类别

预测组成员

合计

胃癌患者

萎缩性胃炎

其他胃病

初始

计数

胃癌患者

萎缩性胃炎

其他胃病

未分组的案例

胃癌患者

80.0

20.0

100.0

萎缩性胃炎

75.0

25.0

100.0

其他胃病

20.0

80.0

100.0

未分组的案例

100.0

a.已对初始分组案例中的78.6%个进行了正确分类。

分析案例处理摘要

未加权案例

百分比

有效

93.5

排除的

缺失或越界组代码

6.5

至少一个缺失判别变量

缺失或越界组代码还有至少一个缺失判别变量

合计

6.5

合计

100.0

组统计量

Group

均值

标准差

有效的N（列表状态）

未加权的

已加权的

3640.78267471224400

732.344675348464200

5.000

666.63951808359490

229.859408466203180

5.000

1709.21054749795870

423.831137448486970

5.000

586.68108103915930

145.747543294018800

5.000

1334.93918986871840

353.261121197578600

5.000

931.56103219718310

287.292833824583100

5.000

814.19115093353990

269.651305651237300

5.000

260.86584182100313

42.303649559856130

5.000

1674.38215879309040

524.988766483780200

13.000

335.32628108172827

157.791341245207500

13.000

917.158********270

320.239807432860200

13.000

316.39963134995446

90.364061532010410

13.000

541.52807039114790

210.965261966270600

13.000

353.44607864726055

166.862761183509120

13.000

444.16926592129334

173.205494866747240

13.000

122.83209782823597

43.883878258504275

13.000

1621.79674326287110

278.771472503797100

11.000

449.20546612978720

67.846485790118630

11.000

983.38521778053560

212.787586838133250

11.000

275.98939754389720

47.325755156442490

11.000

639.43072743491230

117.404576993389040

11.000

421.89527214930980

119.130********3900

11.000

551.12526332392500

128.834528404794640

11.000

151.14600667763634

30.617164953852978

11.000

合计

1993.47053840561970

899.229366421852000

29.000

435.64480592786555

184.758066784714150

29.000

1078.83974648757100

415.281890726575300

29.000

347.67186157683010

141.448775178609850

29.000

715.45858159353630

355.905561478251700

29.000

479.08455782905900

271.966732998301840

29.000

548.53565890371340

216.413198176433800

29.000

157.37077773538218

62.430639373791210

29.000

组均值的均等性的检验

Wilks的Lambda

df1

df2

Sig.

.275

34.246

.000

.582

9.342

.001

.497

13.135

.000

.367

22.465

.000

.330

26.371

.000

.389

20.396

.000

.623

7.871

.002

.363

22.788

.000

对数行列式

Group

秩

对数行列式

68.643

66.156

汇聚的组内

74.054

打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。

a.秩<5

b.案例太少无法形成非奇异矩阵

检验结果a

箱的M

173.333

近似。

2.845

df1

df2

1524.161

Sig.

.000

对相等总体协方差矩阵的零假设进行检验。

a.有些协方差矩阵是奇异矩阵，因此一般程序不会起作用。

将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。

其行列式的对数为75.391。

特征值

函数

特征值

方差的%

累积%

正则相关性

8.936a

89.8

.948

1.020a

10.2

100.0

.711

a.分析中使用了前2个典型判别式函数。

Wilks的Lambda

函数检验

Wilks的Lambda

卡方

Sig.

1到2

.050

67.479

.000

.495

15.816

.027

标准化的典型判别式函数系数

函数

.698

-.918

-1.219

.226

-.406

.130

1.192

-.890

.817

1.001

.740

-.354

-1.677

.411

.539

1.045

结构矩阵

函数

.529*

.365

.438*

.123

.383

.659*

.436

.571*

.214

.551*

.384

.494*

.209

.461*

.314

.355*

判别变量和标准化典型判别式函数之间的汇聚组间相关性

按函数内相关性的绝对大小排序的变量。

*.每个变量和任意判别式函数间最大的绝对相关性

典型判别式函数系数

函数

.001

-.002

-.008

.002

-.001

.000

.013

-.010

.004

.005

.004

-.002

-.009

.002

.014

.027

（常量）

-4.187

-1.808

非标准化系数

组质心处的函数

Group

函数

5.991

.540

-.510

-1.047

-2.121

.991

在组均值处评估的非标准化典型判别式函数

分类处理摘要

已处理的

已排除的

缺失或越界组代码

至少一个缺失判别变量

用于输出中

组的先验概率

Group

先验

用于分析的案例

未加权的

已加权的

.333

5.000

.333

13.000

.333

11.000

合计

1.000

29.000

分类函数系数

Group

.011

.005

-.001

-.071

-.019

-.002

-.009

-.001

.002

.127

.056

.014

.041

.008

.012

.021

-.003

-.014

-.079

-.021

-.001

.203

.071

.103

（常量）

-59.564

-12.059

-11.061

Fisher的线性判别式函数

分类结果a,c

Group

预测组成员

合计

初始

计数

未分组的案例

100.0

92.3

7.7

100.0

18.2

81.8

100.0

未分组的案例

50.0

100.0

交叉验证b

计数

100.0

7.7

76.9

15.4

100.0

27.3

72.7

100.0

a.已对初始分组案例中的89.7%个进行了正确分类。

b.仅对分析中的案例进行交叉验证。

在交叉验证中，每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。

c.已对交叉验证分组案例中的79.3%个进行了正确分类。

五、实验总结

学生签名：

年月日

六、教师评语及成绩

教师签名：

年月日

展开阅读全文