化验结果诊断模型参考答案.docx

上传人:b****5 文档编号:7213770 上传时间:2023-01-21 格式:DOCX 页数:23 大小:68.07KB
下载 相关 举报
化验结果诊断模型参考答案.docx_第1页
第1页 / 共23页
化验结果诊断模型参考答案.docx_第2页
第2页 / 共23页
化验结果诊断模型参考答案.docx_第3页
第3页 / 共23页
化验结果诊断模型参考答案.docx_第4页
第4页 / 共23页
化验结果诊断模型参考答案.docx_第5页
第5页 / 共23页
点击查看更多>>
下载资源
资源描述

化验结果诊断模型参考答案.docx

《化验结果诊断模型参考答案.docx》由会员分享,可在线阅读,更多相关《化验结果诊断模型参考答案.docx(23页珍藏版)》请在冰豆网上搜索。

化验结果诊断模型参考答案.docx

化验结果诊断模型参考答案

化验结果诊断模型

问题重述与分析

人们到医院就诊时,通常要化验一些指标来协助医生的诊断。

本题给出了人们是否患某种疾病时通常要化验的几种指标以及其检验值。

表1是确诊病例的化验结果,其中1-30号病例是已经确诊为患该种疾病的化验结果;31-60号病例是已经确诊为健康人的结果。

表2是某些就诊人员的化验结果,但未确诊其是否患有该种疾病。

根据已知数据,需要解答如下问题:

1)问题:

根据表1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。

分析:

根据表1当中60个化验结果,将Zn、Cu、Fe、Ca、Mg、K、Na看成是七个指标,则前30个为该疾病患者的指标值,后30个为健康人的指标值,可以将这些数据进行标准化处理,再采用主成分分析方法,将多个指标转化为几个综合指标,当给定一个患者的各指标值时,可以算出各综合指标的得分,当这些得分满足一定条件时,如根据正负值可以判定为健康或疾病。

2)问题:

按照

(1)提出的方法,对表2中的15名就诊人员的化验结果进行判别,判定他们是患该种疾病的病人还是健康人。

分析:

(1)中已有的综合指标,根据给定的15名就诊人员的指标值计算出综合指标的得分,以此判断他们的健康状况。

3)问题:

能否根据表1的数据特征,确定哪些指标是影响人们患该疾病的关键或主要因素,以便减少化验的指标。

并根据你给出的结果,重复2的工作。

分析:

为了确定哪些指标是影响该疾病的主要因素,则需要确定出哪些因素在判别中起的权重最大,可以考虑采取回归模型,通过去除一些变量,然后比较各组的显著性与正确率,正确率最高的那组中的变量即为影响该疾病的主要因素。

一、模型假设

1)假设医院化验设备先进,化验过程科学可靠,化验结果真实可信,确诊情况(有病/健康人)符合实际。

2)在解决本题过程中,所有的化验结果只是针对该类疾病检验,并不考虑其他疾病的影响。

3)本文所建模型的检验结果只是作为医生为病人诊断的一个参考,医生为问诊人员作出最终判定还需考虑其他因素,但与本题求解无关。

二、符号说明

三、模型建立与求解

(一)问题一的求解:

模型一:

1、数据“标准化”

题目已给出了60为确诊病例的化验结果以及诊断结果,但是60个病例中各元素的含量的呈无规律性。

所以我们需要对原始数据进行处理,首先对其进行标准化分析:

用向量

=

表示每个就诊人员的化验结果,则

=

表示第α病人的化验结果。

将每个指标“标准化”,即做如下变换:

其中

标准化的数据见附录一。

2、主成分分析

对标准化的数据运用SPSS软件进行主成分分析,结果如表1、表2:

表1

解释的总方差

成份

初始特征值

提取平方和载入

合计

方差的%

累积%

合计

方差的%

累积%

1

3.129

44.702

44.702

3.129

44.702

44.702

2

1.973

28.192

72.894

1.973

28.192

72.894

3

.723

10.327

83.221

4

.570

8.147

91.368

5

.284

4.052

95.420

6

.204

2.912

98.332

7

.117

1.668

100.000

由表1可以看出,前两个主成分

的方差和占全部方差的比例为72.894%,我们就选取

为第一主成分,

为第二主成分,基本上保留了原来7个指标的信息,这样得到了2个新指标。

SPSS软件得到的这成分系数矩阵如表2:

表2:

成份矩阵a

成份

1

2

x1

.453

-.538

x2

.852

.293

x3

.682

.195

x4

.898

-.051

x5

.941

.094

x6

-.206

.856

x7

-.005

.904

由表2得到前2个主成分

的线性组合为:

=

=

(4.1)

3、模型验证

将60个就诊人员的化验结果带入(4.1)式得到结果如表3,我们的判别标准为:

第一主成分为正值表示健康,为负值表示患病。

表3:

病例号

第一主成分

第二主成分

正误判标志(正=0;误=1)

1

-1.49142

0.23997

0

2

-1.14428

-0.18983

0

3

-1.28134

0.07538

0

4

-1.49664

1.27685

0

5

-0.5735

-1.82009

0

6

-1.58142

-1.32159

0

7

-1.22966

-1.94616

0

8

-1.76188

0.86386

0

9

-2.16782

-0.99101

0

10

-1.70022

0.09606

0

11

-3.45313

8.3533

0

12

-1.79041

0.81834

0

13

-0.42078

-0.98245

0

14

-1.80823

-0.49929

0

15

-2.03276

0.68222

0

16

-1.44607

-0.50165

0

17

-2.01446

0.70872

0

18

-0.85694

-0.3205

0

19

-1.06155

2.25198

0

20

-3.60188

3.81686

0

21

-3.6008

4.08631

0

22

-1.47019

1.01608

0

23

-0.89605

-1.51287

0

24

-4.29535

0.05951

0

25

-1.54492

-1.80111

0

26

-2.1294

1.19

0

27

-3.17737

-0.35639

0

28

-2.92407

0.77313

0

29

-4.09657

4.48592

0

30

-0.27663

-1.23729

0

31

1.32902

-1.89114

0

32

-0.22283

-0.92755

1

33

-0.59422

-1.62104

1

34

0.49476

-0.72864

0

35

0.16255

-1.64628

0

36

0.60017

-1.80156

0

37

0.49891

-1.12276

0

38

-1.10205

-1.66468

1

39

0.90498

2.12586

0

40

17.60042

4.83598

0

41

1.86782

-0.25856

0

42

1.34229

-1.57748

0

43

-0.18802

0.54153

1

44

1.42776

-1.5363

0

45

2.81954

-0.5207

0

46

0.40085

-2.06658

0

47

1.1396

-0.99288

0

48

1.62295

1.90336

0

49

6.18269

1.17307

0

50

3.73368

-0.48252

0

51

4.01664

0.79222

0

52

2.24093

-0.42976

0

53

1.01309

0.4541

0

54

-0.23626

-1.03562

1

55

1.9522

-2.26504

0

56

1.389

-1.7801

0

57

3.45006

-1.06684

0

58

2.94115

-1.71942

0

59

0.06593

-1.09379

0

60

0.45845

-0.90086

0

由表3可以看出,前30个就诊人员的第一主成分均为负值,判定为患病,后30个就诊人员的第一主成分大致上为正值,判定为健康,正确率为91.6667%。

(二)问题二的求解

由模型一得到前两个主成分的线性组合为:

=

=

将15名待诊人员的化验结果带入上式得:

表4:

病例号

第一主成分

第二主成分

61

62

63

64

-1.17181594

65

66

-0.01013698

67

0.8829813

68

-0.4575774

69

0.7083415

-1.07835557

70

3.5182755

71

72

2.04054597

73

74

-1.04334549

75

用第一主成分来判定化验结果,由表4可知,15名待诊人员中有8名患有该疾病,7名健康。

(三)模型一的改进:

模型二:

Logistic回归模型

问题一的模型的正确率为91.6667%,因此考虑正确率更高的其他模型,且模型一中忽略了第二主成分的作用,故解释时有较大误差。

以Y=0表示健康,Y=1表示不健康,考虑的因变量为一个二元变量,且只取0与1两个值,因变量取1的概率

为要研究的对象,且

的线性函数,故考虑采用Logistic线性回归模型。

对附录一中的数据运用SPSS进行Logistic回归分析得表5:

表5:

方程中的变量

B

S.E,

Wals

df

Sig.

Exp(B)

步骤1a

x1

.489

48.943

.000

1

.992

1.630

x2

.347

276.987

.000

1

.999

1.415

x3

-1.479

160.310

.000

1

.993

.228

x4

-.088

7.972

.000

1

.991

.916

x5

.021

62.318

.000

1

1.000

1.021

x6

.234

109.431

.000

1

.998

1.264

x7

.015

32.972

.000

1

1.000

1.016

常量

33.470

7350.783

.000

1

.996

3.435E14

由表5可以看出

这7个变量都是显著的,因而最终的回归方程为:

根据以上公式,我们可以将这个模型计算出来的

应用于实际病例的判别。

只要给出某一个受检者的化验结果,就能应用此计算公式算出其患病几率,我们以0.5为参照,当

>0.5时表示该受检者患病,当

<0.5时表示该受检者健康。

具体数据如下:

病号

x1

x2

x3

x4

x5

x6

x7

是否健康

判别结果

1

166

15.8

24.5

700

112

179

513

1

1

2

185

15.7

31.5

701

125

184

427

1

1

3

193

9.8

25.9

541

163

128

642

1

1

4

159

14.2

39.7

896

99.2

239

726

1

1

5

226

16.2

23.8

606

152

70.3

218

1

1

6

171

9.29

9.29

307

187

45.5

257

1

1

7

201

13.3

26.6

551

101

49.4

141

1

1

8

147

14.5

30

659

102

154

680

1

1

9

172

8.85

7.86

551

75.7

98.4

318

1

1

10

156

11.5

32.5

639

107

103

552

1

1

11

132

15.9

17.7

578

92.4

1314

1372

1

1

12

182

11.3

11.3

767

111

264

672

1

1

13

186

9.26

37.1

958

233

73

347

1

14

162

8.23

27.1

625

108

62.4

465

1

1

15

150

6.63

21

627

140

179

639

1

1

16

159

10.7

11.7

612

190

98.5

390

1

1

17

117

16.1

7.04

988

95.5

136

572

1

1

18

181

10.1

4.04

1437

184

101

542

1

1

19

146

20.7

23.8

1232

128

150

1092

1

1

20

42.3

10.3

9.7

629

93.7

439

888

1

1

21

28.2

12.4

53.1

370

44.1

454

852

1

1

22

154

13.8

53.3

621

105

160

723

1

1

23

179

12.2

17.9

1139

150

45.2

218

1

24

13.5

3.36

16.8

135

32.6

51.6

182

1

25

175

5.84

24.9

807

123

55.6

126

1

1

26

113

15.8

47.3

626

53.6

168

627

1

27

50.5

11.6

6.3

608

58.9

58.9

139

1

28

78.6

14.6

9.7

421

70.8

133

464

1

1

29

90

3.27

8.17

622

52.3

770

852

1

1

30

178

28.8

32.4

992

112

70.2

169

1

31

213

19.1

36.2

2220

249

40

168

0

0

32

170

13.9

29.8

1285

226

47.9

330

0

0

33

162

13.2

19.8

1521

166

36.2

133

0

0

34

203

13

90.8

1544

162

98.9

394

0

0

35

167

13.1

14.1

2278

212

46.3

134

0

0

36

164

12.9

18.6

2993

197

36.3

94.5

0

0

37

167

15

27

2056

260

64.6

237

0

0

38

158

14.4

37

1025

101

44.6

72.5

0

0

39

133

22.8

31

1633

401

180

899

0

0

40

156

135

322

6747

1090

228

810

0

0

41

169

8

308

1068

99.1

53

289

0

0

42

247

17.3

8.65

2554

241

77.9

373

0

0

43

166

8.1

62.8

1233

252

134

649

0

0

44

209

6.43

86.9

2157

288

74

219

0

0

45

182

6.49

61.7

3870

432

143

367

0

0

46

235

15.6

23.4

1806

166

68.8

188

0

0

47

173

19.1

17

2497

295

65.8

287

0

0

48

151

19.7

64.2

2031

403

182

874

0

0

49

191

65.4

35

5361

392

137

688

0

0

50

223

24.4

86

3603

353

97.7

479

0

0

51

221

20.1

155

3172

368

150

739

0

0

52

217

25

28.2

2343

373

110

494

0

0

53

164

22.2

35.5

2212

281

153

549

0

0

54

173

8.99

36

1624

216

103

257

0

0

55

202

18.6

17.7

3785

225

31

67.3

0

0

56

182

17.3

24.8

3073

246

50.7

109

0

0

57

211

24

17

3836

428

73.5

351

0

0

58

246

21.5

93.2

2112

354

71.7

195

0

0

59

164

16.1

38

2135

152

64.3

240

0

0

60

179

21

35

1560

226

47.9

330

0

0

61

85.5

1.7

3.99

503

62.3

238

762.6

1

62

144

0.7

15.1

547

79.7

71

218.5

1

63

85.7

1.09

4.2

790

170

45.8

257.9

64

176

0.57

27.3

318

133

99.4

318.8

1

65

192

7.06

32.9

1969

343

103

553

0

66

188

8.28

22.6

1208

231

1314

1372

1

67

153

5.87

34.8

328

163

264

672.5

1

68

171

10.5

30.5

672

145

47

330.5

1

69

162

13.2

19.8

1521

166

36.2

133

0

70

203

13

90.8

1544

162

98.9

394.5

0

71

164

20.1

28.9

1062

161

47.3

134.5

72

167

13.1

14.1

2278

212

36.5

96.5

0

73

164

12.9

18.6

2993

197

65.5

237.8

0

74

167

15

27

2056

260

44.8

72

0

75

158

14.4

37

1025

101

180

899.5

1

由上表可以看出,改进后的模型正确率非常高。

且15名就诊人员中有9人患病,6人健康。

(四)问题三的模型建立与求解

由模型二中的表5知,

的各显著性水平分别为:

X1

X2

X3

X4

X5

X6

X7

0.992

0.999

0.993

0.991

1.000

0.998

0.996

因此我们将各种元素进行组合排除,将

分别去掉,比较去掉后该回归的各个参量的值,以标准误差和正确率作为评判假设是否合理的依据。

再将

去除,重新建立回归模型,以相同标准进行评判。

同理,分别从

去除2—3个量作为一组,进行评判。

最后依照相同的方法每两个、每三个进行分组,均依上述标准评判,具体分组不再赘述。

下面仅就回归后正确率比较大的两组组给出分析结果。

1、去除

三个变量,由SPSS软件得到的结果见附录二

回归方程为:

病号

x1

x2

x3

x4

x5

x6

x7

是否健康

判别结果

1

166

15.8

24.5

700

112

179

513

1

1.00

2

185

15.7

31.5

701

125

184

427

1

1.00

3

193

9.8

25.9

541

163

128

642

1

1.00

4

159

14.2

39.7

896

99.2

239

726

1

1.00

5

226

16.2

23.8

606

152

70.3

218

1

0.71

6

171

9.29

9.29

307

187

45.5

257

1

0.87

7

201

13.3

26.6

551

101

49.4

141

1

0.95

8

147

14.5

30

659

102

154

680

1

1.00

9

172

8.85

7.86

551

75.7

98.4

318

1

1.00

10

156

11.5

32.5

639

107

103

552

1

1.00

11

132

15.9

17.7

578

92.4

1314

1372

1

1.00

12

182

11.3

11.3

767

111

264

672

1

1.00

13

186

9.26

37.1

958

233

73

347

1

0.04

14

162

8.23

27.1

625

108

62.4

465

1

1.00

15

150

6.63

21

627

140

179

639

1

1.00

16

159

10.7

11.7

612

190

98.5

390

1

0.98

17

117

16.1

7.04

988

95.5

136

572

1

1.00

18

181

10.1

4.04

1437

184

101

542

1

1.00

19

146

20.7

23.8

1232

128

150

1092

1

1.00

20

42.3

10.3

9.7

629

93.7

439

888

1

1.00

21

28.2

12.4

53.1

370

44.1

454

852

1

1.00

22

154

13.8

53.3

621

105

160

723

1

1.00

23

179

12.2

17.9

1139

150

45.2

218

1

0.91

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 研究生入学考试

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1