判别分析作业.docx
《判别分析作业.docx》由会员分享,可在线阅读,更多相关《判别分析作业.docx(9页珍藏版)》请在冰豆网上搜索。
判别分析作业
判别分析
1、说明各判别方法的原理。
答:
(1)距离判别法:
样品和哪个总体的距离最近,就判断它属于哪个总体。
而距离使用的是马氏距离,即
设总体G为m元总体,均值向量为
,协方差阵为
则样品
与总体的马氏距离定义为
当m=1时,
(2)贝叶斯判别法:
就是给出空间的一个划分,使得当通过划分来判别归类时,所带来的平均损失达到最小。
(3)Fisher判别:
基本思想是投影。
将k组m元数据投影到某一个方向,使得投影后组与组之间尽可能分开。
以上判别方法的使用,均建立在各类别方差具有显著性差异的基础上。
2、下面是85个学生的GPA和GMAT数据表,经聚类分析,分为三类:
接收、不接收、边缘。
(1)已知的分类情况是否可以进行判别分析?
由上表可知,各组均值具有显著性差异,可以进行判别分析.
(2)计算各类的样本均值及Si。
计算B及A,求出A-1B特征根。
由上表可知,各类的样本均值分别为:
(3.4023,561.2258)、(2.4825,447.0714)、(2.9927,446.2308).
(3)给出三类的领域图,并给出各类的中心值。
TerritorialMap
CanonicalDiscriminant
Function2
-6.0 -4.0 -2.0 .0 2.0 4.0 6.0
6.0 21
21
21
21
21
21
4.0 21
21
2331
2331
23 31
23 31
2.0 23 31
23 31
23 31
23 31
23 31
* 23 31 *
.0 23 31
23 31
23 * 31
23 31
23 31
23 31
-2.0 23 31
23 31
23 31
23 31
23 31
23 31
-4.0 23 31
23 31
23 31
23 31
23 31
23 31
-6.0 23 31
-6.0 -4.0 -2.0 .0 2.0 4.0 6.0
CanonicalDiscriminantFunction1
Symbolsusedinterritorialmap
Symbol Group Label
------ ----- --------------------
1 1
2 2
3 3
(4)如果分类情况可以进行判别分析,则用距离法和贝叶斯法,写出判别函数,对新样本x=[3.21,497]进行判别其属于哪一个类别。
距离法:
则新样本
=495.116
=497.041
=497.029
由于
<
<
因而新样本应该属于第一类,即接受类。
贝叶斯法:
可以得到判别函数如下:
新样本在各类的得分计算如下:
因而判定新样本属于第三类,即边缘类。
接收
不接收
边缘
报名号
GPA(x1)
GMAT(x2)
报名号
GPA(x1)
GMAT(x2)
报名号
GPA(x1)
GMAT(x2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
2.91
3.14
3.22
3.29
3.69
3.46
3.03
3.19
3.63
3.59
3.30
3.40
3.50
3.78
3.44
3.48
3.47
3.35
3.39
3.28
3.21
3.58
3.33
3.40
3.38
3.26
3.60
3.37
3.80
3.76
3.24
596
473
482
527
505
693
626
663
447
588
563
553
572
591
692
528
552
520
543
523
530
564
565
431
605
664
609
559
521
646
467
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
2.54
2.43
2.20
2.36
2.57
2.35
2.51
2.51
2.36
2.36
2.66
2.68
2.48
2.46
2.63
2.44
2.13
2.41
2.55
2.31
2.41
2.19
2.35
2.60
2.55
2.72
2.85
2.90
446
425
474
531
542
406
412
458
399
482
420
414
533
509
504
336
408
469
538
505
489
411
321
394
528
399
381
384
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
2.86
2.85
3.14
3.28
2.89
3.15
3.50
2.89
2.80
3.13
3.01
2.79
2.89
2.91
2.75
2.73
3.12
3.08
3.03
3.00
3.03
3.05
2.85
3.01
3.03
3.04
494
496
419
371
447
313
402
485
444
416
471
490
431
446
546
467
463
440
419
509
438
399
483
453
414
446