关于肾炎判别的研究论文Word下载.docx
《关于肾炎判别的研究论文Word下载.docx》由会员分享,可在线阅读,更多相关《关于肾炎判别的研究论文Word下载.docx(38页珍藏版)》请在冰豆网上搜索。
在对B.1样本容量进行初步分析后,选取50组数据用于表达式的计算,剩下的10组数据用于对所得到的表达式进行检验。
由于B.1中数据具有随机性,根据分层取样原理,直接选取每组编号最后的五组数据用于检验。
5.2模型建立
5.2.1模型简介
0—1拟合:
首先令0为患病,1为健康进行0—1拟合使用表B.1中用于求取表达式的50组数据,得出判别表达式。
然后将用于检验的10组数据代入表达式,将得到的结果和0、1比较,若结果接近于0,则表示患有肾炎病;
若结果接近于1,则表示健康。
(结果若小于0.5界定为患有肾炎病,结果大于0.5界定为健康,若结果为0.5则无法做出判断)
Fisher判别法:
从两个总体中抽取具有P个指标的样品观测数据,借助于方差分析的思想构造一个线性判别函数。
数据使用同0—1拟合,对得到的结果与阈值进行比较,当结果小于阈值时界定为患有肾炎病,结果大于阈值界定为健康,若结果等于阈值则无法做出判断。
5.2.2模型建立与求解
0-1拟合
以就诊人员体内各元素的含量
为自变量;
就诊人员是否患病
为因变量。
设0-1拟合模型的一般形式为:
(5-1)
其中:
因变量,
为7个对
有显著影响的自变量,
是8个待估参数,
是随机误差项。
将用于求取表达式的50组样本数据代入(5-1)式,通过Mathematica软件得到表达式如下
(5-2)
将用于检验的10组数据代入表达式,检测结果如下表(函数值小于0.5界定为0为患者,函数值大于0.5界定为1为健康人):
表5.10-1拟合判断结果
序号
26
27
28
29
30
函数值
0.0348946
-0.0160506
0.184069
0.0898412
判断结果
56
57
58
59
60
1.07228
1.27081
0.861239
0.693862
0.448216
1
Fisher判别分析
为自变量,
为函数值,设判别式如下式:
系数
确定的原则是使两组间的组间离差最大,而每个组的组内离差最小,即
最小。
当建立了判别式以后,对一个新的样品值,将其p个指标值代入判别式中求出y值,然后与某个临界值(阈值)比较,就可以将该样品归某类。
用SPSS软件对用于求取表达式的50组样本数据进行fisher判别分析得到结果如下表5.2:
标准化的典型判别式函数系数
函数
Zn
.061
Cu
-1.205
Fe
.372
Ca
1.165
Mg
.524
K
.052
Na
-.350
表5.2
由上表可得表达式如下:
(5-3)
分类结果a
类别
预测组成员
合计
.00
1.00
初始
计数
4
%
100.0
.0
13.3
86.7
a.已对初始分组案例中的93.3%个进行了正确分类。
表5.3
如表中所述:
已对初始分组案例中的93.3%个进行了正确分类。
将患病与健康两组各种元素的均值(见下表)代入以上(5—3)式可得出判断临界值(阈值)
(5-4)
、
分别表示患者样本、健康人样本因变量均值,
分别表示患者样本、健康人样本容量。
采用Excel进行相应数据处理,得到临界值为1267.055。
组统计量
均值
标准差
有效的N(列表状态)
未加权的
已加权的
143.1033
53.68043
30.000
12.3343
5.05265
23.0667
13.74954
698.1667
270.19560
113.3933
46.84606
201.1333
259.78260
526.8333
300.58369
186.6000
29.68292
21.9237
23.75492
62.0117
75.77848
2511.1333
1271.60449
295.1367
177.56885
90.3700
51.31813
367.2100
244.24297
164.8517
48.27476
60.000
17.1290
17.70008
42.5392
57.45478
1604.6500
1290.85603
204.2650
158.03303
145.7517
193.86889
447.0217
283.21234
表5.4
得到的结果如下表5.5:
病例号
判别函数值
113
15.8
47.3
626
53.6
168
627
552.112
患病
50.5
11.6
6.3
608
58.9
139
685.0425
78.6
14.6
9.7
421
70.8
133
464
362.8902
90
3.27
8.17
622
52.3
770
852
498.46409
178
28.8
32.4
992
112
70.2
169
1147.0752
182
17.3
24.8
3073
246
50.7
109
3672.9165
健康
211
24
17
3836
428
73.5
351
4564.459
21.5
93.2
2112
354
71.7
195
2605.2233
164
16.1
38
2135
152
64.3
240
2491.0061
179
21
35
1560
226
47.9
330
1821.4488
表5.5Fisher判别分析结果
根据表5.5判别函数值列与临界值比较可知:
剩余用于检验的病例26、27、28、29、30为患病组。
56、57、58、59、60为正常组,准确度为100%。
5.3结果分析
两种方法的拟合度虽然很高,从一定程度上说明本文所给判别方法可行。
然而,有些输出结果很接近临界值,表达式参数并不是很精确,样本数据并不是真实可信。
机体内所有元素都存在直接或者间接的联系,彼此相互影响,处于平衡状态,但通过观察数据波动图(如下),有些检测者的部分元素含量偏离均值很大,故认为检验者在化验过程中可能出现异常。
我们需要采用相应方法对异常数据进行剔除。
5.4模型改进
5.4.1剔除数据
在数据的处理过程中我们发现同一种元素在人体内的波动性很大,为了结果的更优,我们觉得有必要对异常数据进行剔除处理。
选择每一种元素中偏离所有样本均值最大的个体进行剔除,由于异常数据的集中最终剔除11、24、40三组数据。
5.4.2模型改进
在剔除11、24、40号数据,得到0-1拟合修正后的判别表达式如下:
判定结果如下表5.6:
0.130943
0.471094
0.201087
-0.118573
0.386861
1.07953
1.33733
1.06991
0.715012
0.642139
表5.60-1拟合修正后判断结果
准确率由90%升至100%,说明剔除工作使模型更加优化。
在剔除异常数据后采用fisher模型分析得到Fisher判别分析修正后的判别表达式如下:
(5-5)
得出临界值为852.8785
判别值
73.7005
341.2865
35.7791
-55.179
589.222
2049.557
2507.201
1469.224
1318.211
936.4989
表5.7Fisher判别分析修正结果
由结果分析表可知模型已对初始分组案例中的正确分类由93.3%上升至96.5%,对检验数据的判定准确率保持在100%,剔除也使得模型更加优化。
问题二
5.5对待检测者结果分析
5.5.1纵向比较
将就诊人员的数据代入(5-4)式,得出结果如下表5.8所示:
表5.8提出异常数据后0—1拟合对待测者的判断
61
62
63
64
65
66
67
68
69
70
0.385587
0.47852
0.341774
0.004476
0.28208
0.582538
1.17937
0.345506
0.236335
0.795217
71
72
73
74
75
76
77
78
79
80
-0.22831
0.131577
0.233901
0.667165
0.556359
0.334511
0.645824
0.578856
0.55153
0.878191
81
82
83
84
85
86
87
88
89
0.925747
0.96837
0.016518
1.07503
0.055728
0.624076
0.312061
1.02869
1.54074
0.509404
就诊人员30人,其中15人患肾炎,15人健康,患病率为50%。
将就诊人员的数据代入(5-5)式,得出结果如下表5.9所示:
表5.9提出异常数据后Fisher判别分析对待测者的判断
58.2
5.42
29.7
323
138
513
4.26344
106
1.87
40.5
542
177
184
427
216.8724
0.8
12.5
1332
176
128
646
572.5341
85.5
1.7
3.99
503
62.3
238
762.6
-90.5435
144
0.7
15.1
547
79.7
218.5
255.4092
85.7
1.09
4.2
790
170
45.8
257.9
453.4837
0.3
9.11
417
552
49.5
141.5
517.6793
4.16
9.32
943
260
155
680.8
350.3903
0.57
27.3
318
99.4
318.8
83.53809
192
7.06
32.9
1969
343
103
553
1145.364
188
8.28
22.6
1208
231
1314
1372
136.288
153
5.87
34.8
328
163
264
672.5
-84.7112
143
2.84
15.7
265
123
347.5
26.22508
213
19.1
36.2
2220
249
465.8
1291.702
20.1
23.8
1606
156
40
1007.404
171
10.5
30.5
672
145
47
330.5
312.2575
162
13.2
19.8
1521
166
984.83
203
13
90.8
1544
98.9
394.5
872.3928
28.9
1062
161
134.5
688.0232
167
13.1
14.1
2278
212
36.5
96.5
1520.272
12.9
18.6
2993
197
65.5
237.8
1892.896
15
2056
44.8
1428.701
158
14.4
37
1025
101
180
899.5
188.1843
22.8
31.3
1633
401
228
289
1133.68
8
30.8
1068
99.1
53
817
254.6099
247
8.65
2554
241
77.5
373.5
1535.934
185
3.9
1211
190
134
649.8
503.2802
209
6.43
86.9
2157
288
219.8
1448.286
6.49
61.7
3870
432
367.5
2555.077
235
15.6
23.4
1806
68.9
1123.425
就诊人员30人,其中16人患肾炎,14人健康,患病率为53.33%。
5.5.2横向比较
两种方法均检验出61、62、63、64、65、68、69、71、72、73、83、85、87号为患者,74、75、77、78、80、81、82、84、86、88、89、90号为健康人;
而66、67、70、76、79得出判断结果不同。
对两种方法进行横向比较结果如下表5.10所示:
表5.10剔除异常数据后0—1拟合与Fisher判别判断结果比较
0--1拟合
患病
Fisher判别
健康
六、模型二建立与求解
问题三
6.1模型建立
6.1.1多元逐步回归向后筛选策略
考虑全部自变量中按其对因变量作用大小,显著程度大小或者说贡献大小,由大到小地逐个剔除回归方程,而对那些对因