关于肾炎判别的研究论文Word下载.docx

资源描述

关于肾炎判别的研究论文Word下载.docx

《关于肾炎判别的研究论文Word下载.docx》由会员分享，可在线阅读，更多相关《关于肾炎判别的研究论文Word下载.docx（38页珍藏版）》请在冰豆网上搜索。

关于肾炎判别的研究论文Word下载.docx

在对B.1样本容量进行初步分析后，选取50组数据用于表达式的计算，剩下的10组数据用于对所得到的表达式进行检验。

由于B.1中数据具有随机性，根据分层取样原理，直接选取每组编号最后的五组数据用于检验。

5.2模型建立

5.2.1模型简介

0—1拟合：

首先令0为患病，1为健康进行0—1拟合使用表B.1中用于求取表达式的50组数据，得出判别表达式。

然后将用于检验的10组数据代入表达式，将得到的结果和0、1比较，若结果接近于0，则表示患有肾炎病；

若结果接近于1，则表示健康。

（结果若小于0.5界定为患有肾炎病，结果大于0.5界定为健康，若结果为0.5则无法做出判断）

Fisher判别法：

从两个总体中抽取具有P个指标的样品观测数据，借助于方差分析的思想构造一个线性判别函数。

数据使用同0—1拟合，对得到的结果与阈值进行比较，当结果小于阈值时界定为患有肾炎病，结果大于阈值界定为健康，若结果等于阈值则无法做出判断。

5.2.2模型建立与求解

0-1拟合

以就诊人员体内各元素的含量

为自变量；

就诊人员是否患病

为因变量。

设0-1拟合模型的一般形式为：

（5-1）

其中：

因变量，

为7个对

有显著影响的自变量，

是8个待估参数，

是随机误差项。

将用于求取表达式的50组样本数据代入（5-1）式，通过Mathematica软件得到表达式如下

（5-2）

将用于检验的10组数据代入表达式，检测结果如下表（函数值小于0.5界定为0为患者，函数值大于0.5界定为1为健康人）：

表5.10-1拟合判断结果

序号

函数值

0.0348946

-0.0160506

0.184069

0.0898412

判断结果

1.07228

1.27081

0.861239

0.693862

0.448216

Fisher判别分析

为自变量，

为函数值，设判别式如下式：

系数

确定的原则是使两组间的组间离差最大，而每个组的组内离差最小，即

最小。

当建立了判别式以后，对一个新的样品值，将其p个指标值代入判别式中求出y值，然后与某个临界值（阈值）比较，就可以将该样品归某类。

用SPSS软件对用于求取表达式的50组样本数据进行fisher判别分析得到结果如下表5.2：

标准化的典型判别式函数系数

函数

.061

-1.205

.372

1.165

.524

.052

-.350

表5.2

由上表可得表达式如下：

（5-3）

分类结果a

类别

预测组成员

合计

.00

1.00

初始

计数

100.0

13.3

86.7

a.已对初始分组案例中的93.3%个进行了正确分类。

表5.3

如表中所述：

已对初始分组案例中的93.3%个进行了正确分类。

将患病与健康两组各种元素的均值（见下表）代入以上（5—3）式可得出判断临界值（阈值）

（5-4）

、

分别表示患者样本、健康人样本因变量均值，

分别表示患者样本、健康人样本容量。

采用Excel进行相应数据处理，得到临界值为1267.055。

组统计量

均值

标准差

有效的N（列表状态）

未加权的

已加权的

143.1033

53.68043

30.000

12.3343

5.05265

23.0667

13.74954

698.1667

270.19560

113.3933

46.84606

201.1333

259.78260

526.8333

300.58369

186.6000

29.68292

21.9237

23.75492

62.0117

75.77848

2511.1333

1271.60449

295.1367

177.56885

90.3700

51.31813

367.2100

244.24297

164.8517

48.27476

60.000

17.1290

17.70008

42.5392

57.45478

1604.6500

1290.85603

204.2650

158.03303

145.7517

193.86889

447.0217

283.21234

表5.4

得到的结果如下表5.5：

病例号

判别函数值

113

15.8

47.3

626

53.6

168

627

552.112

患病

50.5

11.6

6.3

608

58.9

139

685.0425

78.6

14.6

9.7

421

70.8

133

464

362.8902

3.27

8.17

622

52.3

770

852

498.46409

178

28.8

32.4

992

112

70.2

169

1147.0752

182

17.3

24.8

3073

246

50.7

109

3672.9165

健康

211

3836

428

73.5

351

4564.459

21.5

93.2

2112

354

71.7

195

2605.2233

164

16.1

2135

152

64.3

240

2491.0061

179

1560

226

47.9

330

1821.4488

表5.5Fisher判别分析结果

根据表5.5判别函数值列与临界值比较可知：

剩余用于检验的病例26、27、28、29、30为患病组。

56、57、58、59、60为正常组，准确度为100%。

5.3结果分析

两种方法的拟合度虽然很高，从一定程度上说明本文所给判别方法可行。

然而，有些输出结果很接近临界值，表达式参数并不是很精确，样本数据并不是真实可信。

机体内所有元素都存在直接或者间接的联系，彼此相互影响，处于平衡状态，但通过观察数据波动图（如下），有些检测者的部分元素含量偏离均值很大，故认为检验者在化验过程中可能出现异常。

我们需要采用相应方法对异常数据进行剔除。

5.4模型改进

5.4.1剔除数据

在数据的处理过程中我们发现同一种元素在人体内的波动性很大，为了结果的更优，我们觉得有必要对异常数据进行剔除处理。

选择每一种元素中偏离所有样本均值最大的个体进行剔除，由于异常数据的集中最终剔除11、24、40三组数据。

5.4.2模型改进

在剔除11、24、40号数据，得到0-1拟合修正后的判别表达式如下：

判定结果如下表5.6：

0.130943

0.471094

0.201087

-0.118573

0.386861

1.07953

1.33733

1.06991

0.715012

0.642139

表5.60-1拟合修正后判断结果

准确率由90%升至100%，说明剔除工作使模型更加优化。

在剔除异常数据后采用fisher模型分析得到Fisher判别分析修正后的判别表达式如下：

（5-5）

得出临界值为852.8785

判别值

73.7005

341.2865

35.7791

-55.179

589.222

2049.557

2507.201

1469.224

1318.211

936.4989

表5.7Fisher判别分析修正结果

由结果分析表可知模型已对初始分组案例中的正确分类由93.3%上升至96.5%，对检验数据的判定准确率保持在100%，剔除也使得模型更加优化。

问题二

5.5对待检测者结果分析

5.5.1纵向比较

将就诊人员的数据代入（5-4）式，得出结果如下表5.8所示：

表5.8提出异常数据后0—1拟合对待测者的判断

0.385587

0.47852

0.341774

0.004476

0.28208

0.582538

1.17937

0.345506

0.236335

0.795217

-0.22831

0.131577

0.233901

0.667165

0.556359

0.334511

0.645824

0.578856

0.55153

0.878191

0.925747

0.96837

0.016518

1.07503

0.055728

0.624076

0.312061

1.02869

1.54074

0.509404

就诊人员30人，其中15人患肾炎，15人健康，患病率为50%。

将就诊人员的数据代入（5-5）式，得出结果如下表5.9所示：

表5.9提出异常数据后Fisher判别分析对待测者的判断

58.2

5.42

29.7

323

138

513

4.26344

106

1.87

40.5

542

177

184

427

216.8724

0.8

12.5

1332

176

128

646

572.5341

85.5

1.7

3.99

503

62.3

238

762.6

-90.5435

144

0.7

15.1

547

79.7

218.5

255.4092

85.7

1.09

4.2

790

170

45.8

257.9

453.4837

0.3

9.11

417

552

49.5

141.5

517.6793

4.16

9.32

943

260

155

680.8

350.3903

0.57

27.3

318

99.4

318.8

83.53809

192

7.06

32.9

1969

343

103

553

1145.364

188

8.28

22.6

1208

231

1314

1372

136.288

153

5.87

34.8

328

163

264

672.5

-84.7112

143

2.84

15.7

265

123

347.5

26.22508

213

19.1

36.2

2220

249

465.8

1291.702

20.1

23.8

1606

156

1007.404

171

10.5

30.5

672

145

330.5

312.2575

162

13.2

19.8

1521

166

984.83

203

90.8

1544

98.9

394.5

872.3928

28.9

1062

161

134.5

688.0232

167

13.1

14.1

2278

212

36.5

96.5

1520.272

12.9

18.6

2993

197

65.5

237.8

1892.896

2056

44.8

1428.701

158

14.4

1025

101

180

899.5

188.1843

22.8

31.3

1633

401

228

289

1133.68

30.8

1068

99.1

817

254.6099

247

8.65

2554

241

77.5

373.5

1535.934

185

3.9

1211

190

134

649.8

503.2802

209

6.43

86.9

2157

288

219.8

1448.286

6.49

61.7

3870

432

367.5

2555.077

235

15.6

23.4

1806

68.9

1123.425

就诊人员30人，其中16人患肾炎，14人健康，患病率为53.33%。

5.5.2横向比较

两种方法均检验出61、62、63、64、65、68、69、71、72、73、83、85、87号为患者，74、75、77、78、80、81、82、84、86、88、89、90号为健康人；

而66、67、70、76、79得出判断结果不同。

对两种方法进行横向比较结果如下表5.10所示：

表5.10剔除异常数据后0—1拟合与Fisher判别判断结果比较

0--1拟合

患病

Fisher判别

健康

六、模型二建立与求解

问题三

6.1模型建立

6.1.1多元逐步回归向后筛选策略

考虑全部自变量中按其对因变量作用大小,显著程度大小或者说贡献大小,由大到小地逐个剔除回归方程,而对那些对因

展开阅读全文