Iris数据判别分析文档格式.docx
《Iris数据判别分析文档格式.docx》由会员分享,可在线阅读,更多相关《Iris数据判别分析文档格式.docx(41页珍藏版)》请在冰豆网上搜索。
13
52
20
25
39
55
58
19
17
68
57
54
21
77
38
47
76
66
49
26
35
70
29
40
50
53
37
79
44
41
42
43
72
71
73
74
75
78
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
(1)进行Bayes判别,并用回代法与交叉确认法判别结果;
(2)计算每个样品属于每一类的后验概率;
(3)进行逐步判别,并用回代法与交叉确认法验证判别结果。
二、判别分析
用距离判别法,
总体G1,G2,G3的协方差矩阵
计算各个总体之间的马氏平方距离
形成的矩阵,其中
线性判别函数是
2.1Bayes判别
先验概率按比例分配,即
求得的线性判别函数
中关于变量
的系数以及常数项均与上面结果相同。
广义平方距离函数
,
后验概率
以下是SPSS软件判别分析结果。
分析觀察值處理摘要
未加權的觀察值
N
百分比
有效
100.0
已排除
遺漏或超出範圍群組代碼
.0
至少一個遺漏區別變數
遺漏或超出範圍群組代碼及至少一個遺漏區別變數
總計
群組統計資料
平均數
標準偏差
有效的N(listwise)
未加權
加權
50.26
3.795
50.000
34.10
4.339
14.62
1.737
2.46
1.054
59.36
5.162
27.50
3.364
42.60
4.699
13.26
1.978
65.88
6.359
29.74
3.225
55.52
5.519
20.46
2.936
58.50
8.253
150.000
30.45
4.571
37.58
17.653
12.06
7.718
群組平均值的等式檢定
Wilks'
Lambda(λ)
F
df1
df2
顯著性
.393
113.314
.000
.638
41.676
.059
1180.161
.075
902.504
聯合組內矩陣a
共變異
27.159
9.783
16.709
4.225
13.514
5.610
3.464
18.519
4.547
相關
1.000
.511
.745
.380
.355
.442
.498
a.共變異數矩陣具有147自由度。
共變異數矩陣a
14.400
10.973
1.509
.939
18.827
1.304
.994
3.016
.607
1.111
26.643
9.000
18.290
5.578
11.316
8.388
4.173
22.082
7.310
3.911
40.434
9.376
30.329
6.158
10.400
7.138
5.224
30.459
5.797
8.621
68.104
-3.050
125.849
51.862
20.893
-31.831
-11.530
311.628
131.066
59.574
a.共變異數矩陣總計具有149自由度。
變數已輸入/已移除a,b,c,d
步驟
已輸入
統計資料
df3
確切F
147.000
.039
297.900
292.000
.027
243.502
290.000
.025
191.133
288.000
在每一個步驟中,輸入最小化整體Wilks'
Lambda的變數。
a.步驟的數目上限為8。
b.要輸入的局部F下限為3.84。
c.要移除的局部F上限為2.71。
d.F層次、容差或VIN不足,無法進行進一步計算。
分析中的變數
允差
要移除的F
.874
1129.588
37.484
.729
41.949
.043
.781
44.975
.044
.671
29.889
.379
44.010
.040
.648
17.172
.031
.660
22.391
.033
.369
6.615
不在分析中的變數
最低允差
要輸入的F
.445
32.824
.752
23.296
.375
12.776
變數數目
Lambda(λ)
分類處理摘要
已處理
至少一個遺漏識別變數
已在輸出中使用
群組的事前機率
在前
分析中使用的觀察值
.333
Bayes判别(用回代法)的结果见下表。
分類結果a
預測的群組成員資格
原始
計數
%
a.100.0%個原始分組觀察值已正確地分類。
下表是Bayes判别(交叉确认法)的结果。
分類函數係數
2.364
1.510
1.167
1.834
.558
.320
-1.524
.665
1.417
-1.521
.419
1.747
(常數)
-78.767
-70.541
-101.501
費雪(Fisher)線性區別函數
96.0
4.0
2.0
98.0
a.98.0%個原始分組觀察值已正確地分類。
2.2逐步判别
逐步判别的主要计算步骤如下:
第一步:
输入原始数据矩阵
第二步:
计算变量的总均值、组均值、总离差、组内离差。
第三步:
给定挑选变量F—检验门坎值(临界值)
。
第四步:
逐步挑选变量。
逐步挑选变量的思想与逐步回归中一样,现假设迭代已进行了S步,引进了r个变量,这r个变量号构成的集合为
,剩下的m-r个变量号构成的集合为
第五步:
求判别函数。
设迭代h步后,挑选变量结束,共选入r个变量进入判别式。
其中,qk为第k个总体的先验概率。
判别系数的计算为
其中,
表示为k个总体的第i个变量的均值。
第六步:
判别归类。
将已知样本进行回判,并算出错判概率,然后将待判样本进行归类。
得到结果如下表:
逐觀察值統計資料
個案編號
實際群組
最高群組
第二高群組
區別評分
預測的群組
P(D>
d|G=g)
P(G=g|D=d)
重心的馬氏(Mahalanobis)距離平方
群組
函數1
函數2
p
df
.583
1.078
102.251
-8.352
.071
.680
.771
24.204
6.471
.577
.782
.996
.491
.004
11.369
2.354
-.416
.345
2.129
27.387
6.320
1.779
2**
.141
.730
3.922
.270
5.911
3.691
-.998
.912
.184
76.125
-6.926
.377
.209
.999
3.127
.001
16.839
4.737
2.059
.287
.977
2.500
.023
9.963
3.132
-1.460
3**
.131
.760
4.063
.240
6.371
3.625
.935
.478
1.474
103.912
-8.335
.891
.832
.997
.003
12.111
2.237
-.399
.162
3.638
.168
6.841
4.337
-.921
.655
.995
.846
.005
11.315
4.722
.802
.544
1.219
25.639
.960
.645
.992
.877
.008
10.544
4.921
-.137
.812
.998
.416
.002
12.959
5.261
-.039
.449
1.599
27.548
6.550
1.342
.443
1.627
62.661
-6.086
.528
.779
.499
12.702
2.375
-1.015
.243
2.833
24.430
5.714
2.192
.421
1.728