新EpiInfo软件在流行病学中的使用.docx

上传人:b****4 文档编号:4639134 上传时间:2022-12-07 格式:DOCX 页数:14 大小:29.62KB
下载 相关 举报
新EpiInfo软件在流行病学中的使用.docx_第1页
第1页 / 共14页
新EpiInfo软件在流行病学中的使用.docx_第2页
第2页 / 共14页
新EpiInfo软件在流行病学中的使用.docx_第3页
第3页 / 共14页
新EpiInfo软件在流行病学中的使用.docx_第4页
第4页 / 共14页
新EpiInfo软件在流行病学中的使用.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

新EpiInfo软件在流行病学中的使用.docx

《新EpiInfo软件在流行病学中的使用.docx》由会员分享,可在线阅读,更多相关《新EpiInfo软件在流行病学中的使用.docx(14页珍藏版)》请在冰豆网上搜索。

新EpiInfo软件在流行病学中的使用.docx

新EpiInfo软件在流行病学中的使用

EpiInfo软件在流行病学中的应用

1990年美国乔治亚州亚特兰大疾病控制中心(CDC)流行病学软件研究室和瑞士日内瓦世界卫生组织(WHO)艾滋病全球控制小组合作,共同研制成功5.00版本的EpiInfo疾病数据管理软件;1992年卫生部卫生统计信息中心委托上海医科大学卫生统计学教研室并合作译制成功EpiInfo5.01a汉化版;1996年美国CDC与WHO又成功推出6.04版;该版在功能上有了较大的增加和提高。

用户可从http:

//www.cdc.gov/免费下载。

EpiInfo软件深受各国医学科研工作者的欢迎,该软件充分考虑了疾病调查数据的特点,能很方便地对数据进行存储、核对、连接、与其他16种数据文件相互转换以及进行流行病学研究中各种常用的统计分析。

问题1目前流行病学研究中还有哪些较流行的统计软件?

你使用过吗?

问题2你知道EpiInfo软件有哪些常用的可执行程序吗?

课题一

EpiInfo软件中常用的可执行程序有以下几种。

EPI.EXE(EPI6.EXE)

主菜单程序

EPED.EXE

文本编辑

ENTER.EXE

数据输入

CHECK.EXE

数据核对

ANALYSIS.EXE

数据分析

STATCALC.EXE

统计计算器

EXPORT.EXE

数据文件输出

IMPORT.EXE

数据文件输入

MERGE.EXE

数据文件连接

VALIDATE.EXE

文件比较

与EpiInfo5.0版相比,EpiInfo6.04增加了CSAMPLE.EXE、EPITABLE.EXE、EPINUT.EXE三个应用程序。

问题3你能说出以上可执行程序各自的主要用途吗?

[课题二]

在将流行病学调查数据录入微机之前,首先应编写调查表文件,EpiInfo软件将根据建立好的调查表文件格式自动生成数据文件结构。

一旦数据文件结构产生之后,便可开始输入数据。

有了数据,就可利用EpiInfo进行常用的统计分析。

标准的数据文件由原始数据和文件结构两部分组成。

而文件结构又由字段名(变量名)、类型和长度组成。

EpiInfo不同于其他数据库软件的特别之处在于用户可按原始调查表样式建立数据文件结构。

这对调查项目较多的流行病学调查表,有利于录入界面和调查表一致,可减少录入错误,提高效率。

问题4根据所学统计学知识,你知道流行病学资料中的数据常见类型有哪几种?

试各举一例予以说明。

编写调查表文件时,使用者主要考虑如何依据原始调查表的数据设置字段名(变量名)、类型和长度。

所谓字段(Field)是指原始调查表中的调查项目(数据分析时又可称为变量,Variable)。

EpiInfo软件可自动地从调查表建立变量或字段名,当遇到下划线或其他特殊字符时,就在本行查找文字,这些文字成为变量名的基础,其前10个非标点字符为变量名。

此变量名在数据录入(ENTER)和分析程序(ANALYSIS)中用来输入该字段数据和分析该变量。

例如“Theyliketoeatvegetables_____”,则该字段的变量名为“Vegetables”,句子其他部分因空格和标点符号而被自动删除。

如果想给变量名标上序号,则可以这样:

“Disease7____”,不要写成“7Disease___”,因为程序要求变量名要以字母开头,若以数字开头,EpiInfo将在数字前加“N”字符。

当然,数据文件建立之后,也可在CHECK模块中完成变量名的修改。

问题5如果你的原始调查表中调查项目多达数百项,则在设计变量名时要注意哪些问题?

EPI软件对字段的类型、长度规定如下:

表1EpiInfo软件的字段类型及示例

字段类型

编辑样式

举例

字符型

_____(下划线)

Cough,139666

数字型

##

139,139.666

大写字符型

HAO,H

逻辑字段型

Y,N

日期型

11/28/98

11/28

11/28/1996

28/11/96

28/11

28/11/1996

修改日期型

月、日

月、日、2位年份

月、日、4位年份

记录号字段

139666

问题6对于类似“13966696”的数据,你认为该属上述字符型变量值,还是数字型变量值?

为什么?

文本编辑模块(EPED)是用于建立EpiInfo调查表及一般文本编辑的文字处理器,其主要功能是用于编写调查表文件,但也可编写分析程序、信函及疾病报告等。

调查表文件编好后,其扩展名必须为QES,可保存于硬盘或软盘上。

另外,也可用其他字处理软件如WORD或WPS、写字本等编写,应注意用ASCⅡ文件形式(即DOS文本文件形式)存储。

进入EPED程序可有两种方式:

EPI主菜单或直接在MS-DOS环境下键入EPED,回车运行。

进入EPED模块后,用户可以象用WORD等文字处理软件一样,按原始调查表样式建立新的EPED文件或修改已经存在的调查表文件。

建立或修改完毕后,按键将调查表文件保存在软盘或硬盘上。

EPED文本编辑模块的窗口如图1所示

F1-帮助F2-文件F3-EpiaidF4-文本F5-打印F6-设置F7-查找F8-块F9-贮存F10-结束

1未命名窗口423911Pg1EPEDLn1Col1InsInd

图1EPDE文本编辑的窗口

在屏幕顶部,显示了主要操作的十个功能键的命令提示,每一命令即可直接执行命令,也可在屏幕中央引出一选择菜单。

问题7请你针对下面研究生微机知识的原始调查表建立一个名为AQ·QES的调查表文件。

研究生微机知识调查表

调查表编号________

一、基本情况

.姓名____(可不填写)

6.专业___①大内科②大外科③基础④预防⑤管理

2.性别____

7.出生日期____年____月____日

3.年龄____

8.最后学历_____①中专②大专③本科

4.入学前所在单位城市____

9.入学前月收入_____(人民币,元)

5.入学形式_____①统招②课程班

10.上月生活费_____(人民币,元)

11.Epi对你是____①必修课②选修课

二、微机知识

12.入学前是否用过微机____

13.如用过微机,微机操作系统是___

①用过②未用过

①DOS②WINDOWS③DOS+WINDOWS④其他

14.是否用统计软件处理过科研数据___

15.如用过,统计软件名称为____

①是②否

①Epi②SPSS③SAS④BMDP⑤其它

16.填表时间_______

17.核对者______

[课题三]

在进行流行病学资料分析时,有时并非都要用原始调查表的数据,可能是一些中间数据,如病例对照研究分层分析的四格表资料等。

对这种中间数据的处理可利用EpiInfo的STATCALC程序。

同样可以EPI主菜单方式或从DOS状态下直接键入STATCALC,回车后进入STATCALC程序进行分析。

EpiInfoVersion6

Statcalc

November1993

Tables(2x2,2xn)

T表(2x2,2xn)

Samplesize&power

C样本大小与把握度

Chisquarefortrend

S趋势卡方

F1-Help

F6-OpenFile

F10-Done

图2STATCALC程序窗口屏幕

运行后屏幕出现可供选择的菜单(图2),移动光标控制键并按回车或直按增强显示的字母键例如T等,可进行选择。

按<F1>键显示有关统计方法信息的求助屏幕。

四格表资料分析选择Tables时,屏幕将显示2×2表格。

若进行单个四格表的分析,只需键入四个数字,然后再按键,屏幕将会显示具有可信限范围的比值比、相对危险度、三种卡方检验值等统计结果。

数字录入时注意列是疾病结局有无,第一列为有此疾病(+),第二列为无此疾病(-);行是暴露因素有无,(+)表示暴露,(-)表示无暴露。

如果表中数字过小,则显示Fisher精确概率计算值;另外,也可进一步计算精确法可信限范围。

问题8分析一般2×2表资料,通常有3种2值可供选择,请你谈谈每种2值的各自适用条件。

为了解铅中毒病人是否有尿棕色素增加现象,分别对病例组和对照组的尿液作尿棕色素定性检查,结果见表2,问铅中毒病人与对照人群的尿棕色素阳性率有无差别?

表2两组人群尿棕色素阳性率比较

组别

阳性数

阴性数

铅中毒病人

29

7

对照组

9

28

(倪宗瓒,卫生统计学,第四版,2000)

问题9对表2资料进行分析,并对结果做出合理的解释。

分层分析如果在输入第一层次四个数字后,接下去按F2键则可继续输入另一层次四个数字。

这样当输完所有层次的数字后,按键,得到第一层的分析结果;按键将显示总的分层分析结果。

问题10何谓资料分层分析?

为什么要进行分层分析?

对表3的资料,因考虑到年龄与口服避孕药(OC)有关,也与心肌梗死(MI)有关,可能是个混杂因素。

故按年龄分层,分为年龄<40岁和≥40岁两层;如表4

表3某病例对照资料结果

组别

服OC

未服OC

病例

39

114

对照

24

154

(李立明,流行病学,第四版,1999)

表4表3资料按年龄分层的结果

组别

<40岁

≥40岁

服OC

未服OC

服OC

未服OC

病例

21

26

18

88

对照

17

59

7

95

(李立明,流行病学,第四版,1999)

问题11请对表4的资料进行分析,并对结果予以解释。

2×n的列联表分析在表格中连续输入数字,即每输入一个数字后按一次回车,用户可进行2×n的列联表卡方检验,但n的最大值为10。

某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表5,问其血型构成有无差别?

表5鼻咽癌患者与眼科病人血型构成比较

组别

A型

B型

O型

AB型

鼻咽癌患者

55

45

57

19

眼科病人

44

23

36

9

(倪宗瓒,卫生统计学,第四版,2000)

问题12分析2×n列联表时,若程序运行后显示有理论频数小于5,这种情况应如何处理?

有无补救方法?

样本大小计算当选择Samplesize进行样本大小计算时,屏幕将出现另一个选择菜单

Populationsurvey

P群体调查

Cohortorcross-sectional

C队列或横断面研究

Unmatchedcase-control

U非配比病例对照研究

用户可进行抽样调查、队列或横断面研究以及非配对病例对照研究样本大小的计算。

计算样本大小时,应按提示输入可信限水平和用户本人所期望的实际比例、相对危险度或比值比相接近的估计假定值。

例如在队列研究或横断面研究时,假定选择非暴露人群对某一问题具有阳性回答的比例是10%,可以输入20%作为能用以区别暴露人群的比例。

这意味着任何大于20%的比例都会使最终研究结果产生统计学检验显著性,例如,P<0.05。

这里应用20%的比例与应用2的相对危险度及0.5的比值比都是相同的;即它们都能通过计算获得同样的样本估计值。

在输入有关参数值后,按键进行样本大小的计算。

问题13现拟进行一项病例对照研究,研究吸烟与肺癌关系。

预期吸烟者的相对危险度为2.0,人群吸烟率约为20%,设=0.05(双侧),=0.10,试估计非配对设计病例数与对照数相等时的样本含量n。

问题14现拟用队列研究观察放射暴露与白血病的关系,已知一般人群中白血病的发病率P0=0.0001,有放射线暴露的人群白血病发病率P1=0.001。

如果将定为0.05(双侧检验),β=0.1,请计算病例数与对照数相等时的样本含量。

问题15通过上述病例对照研究和队列研究样本含量的计算,你能总结一下有关影响样本含量大小的主要因素有哪些?

趋势卡方检验在流行病学研究中(如病例对照研究),常将暴露史的资料分级计算。

不同水平的暴露各级分别与参考水平(一般用无暴露史或最低暴露水平的水平)作比较;并分别计算其比值比或标准化率比(SRR)。

分级暴露资料能分析剂量反应关系,加强病因关联的判断依据。

STATCALC程序中的趋势卡方检验经常被用于剂量反应关系,以及年龄、时间或任何其它有序变量趋势与疾病关系的分析。

而且该方法在分析时可对混杂变量的作用进行控制。

扩展的Mantel-Haenszel卡方检验值反应了线性趋势对水平线的离散。

无效假设为线性趋势等于水平线,如果P值小于0.05,则否定无效假设,表明有95%的把握认为线性趋势是存在的。

在进行趋势分析时,原始数据应按数字大小(暴露等级)顺序先进行分层,例如“0、1、2、3”等。

但也可将各组的中间值进行分层,例如“0”表示不喝牛奶;“2”表示喝1~3杯;“4”表示喝4~5杯牛奶等。

用于趋势卡方检验的原始数据格式如表6所示。

表6每日吸烟的支数与肺癌的关系

组别

每日吸烟数

0

1~

5~

15~

(0)

(1)

(2)

(3)

病例

21(c)

40(a1)

269(a2)

379(a3)

对照

59(d)

67(b1)

303(b2)

280(b3)

问题16根据上述原始数据格式,输入各暴露等级的数据,按键计算最终结果,并判断有无线性趋势?

表6数据是男、女性在一起的数据,即研究数据中可能存在性别混杂变量,如何处理这类资料?

问题17试对表7的数据进行趋势性卡方检验

   表7吸烟与肺癌关系按性别与吸烟数归纳表

层别

组别

每日吸烟数

0

1~

5~

15~

男性

病例

2(c)

33(a1)

250(a2)

364(a3)

对照

27(d)

55(b1)

293(b2)

274(b3)

女性

病例

19

7

19

15

对照

32

12

10

6

STATCALC程序结果处理有两种方式,其一,将结果送至某一个文件。

键后可将结果存到某一个文件。

记住该文件的文件名,它可以随时显示或打印出来(DOS状态下,TYPE命令);也可用文本处理软件对其进行编辑;其二,将结果送至打印机。

键可将当前屏幕计算结果送至打印机,但这时要确保打印机是在联机状态。

将表7的计算结果分别存入C:

\mydocuments\目录中。

注意屏幕底部“F6-OpenFile”与“F6-CloseFile”的含义。

问题18对已经保存的结果文件你知道有几种方法可以继续对其进行编辑?

[课题四]

在流行病学研究中,并非每次都是对原始数据进行统计分析,有时往往需要对一些中间结果进行分析。

EpiInfo6.0较好的考虑到了用户的上述要求。

EPITABLE程序是6.0版所增加的一个应用统计分析程序,其主要功能是对流行病学表格形式的数据进行统计分析。

其使用说明包含在程序的帮助文件里,光标停留在主菜单上的EPITABLEcalculator上,按键,即可获得帮助信息。

用户通过EPI6主菜单或从DOS状态下都可运行EPITABLE。

运行后屏幕出现EPITABLE主菜单,屏幕顶部依次为Describe、Compare、Study、Sample、Probability、Setup六个主菜单,每个主菜单拥有各自不同的子菜单,分别对应不同的统计分析功能。

EPITABLE窗口如图3所示。

Describe  Compare   Study  Sample  Probability  Setup

EPITABLES

F1-HelpF3-MoveF4-ZoomF5-PrintF6-NextF9- F10-QuitMem:

211720

图3 EPITABLE程序窗口

现择其要者简要介绍如下

Describe功能用光标或鼠标选择Describe菜单,屏幕将出现下列主菜单

Proportion  →

Simplerandomsampling

单纯随机样本

构成比

Clustersampling

整群样本

Designeffect

设计效率

Mean

均数

Median

中位数

该功能主要计算构成比、均数和中位数的95%可信区间。

“→”所指为下一级子目录。

Compare功能主要用于计数、计量资料的显著性检验。

选择Compare菜单,屏幕出现如下菜单。

Proportion  →

Percentages

两个百分比比较的2检验

构成比

rxcdatatable

R×C表2检验

Trend-Quantitativedata

计量资料的趋势性检验

Trend-Ordereddata(Ridit)

等级资料的趋势性检验

Goodnessoffit

拟合优度的检验

Rateragreement(Kappa)

(Rater-致性检验)

Completenessofreporting

捕获-再捕获-致性检验

Means

均数比较

Variances

方差比较

为研究肥胖与脂质代谢的关系,在某地小学中随机抽取了30名肥胖儿童(肥胖组)和30名正常儿童(对照组),用改良八木国夫法测定两组儿童血中脂质过氧化物(LPO)得表8结果。

问题19试对表8进行统计分析,并说明两样本t检验的前提条件是什么?

表8两组儿童血液中LPO含量(μmol/L)

组别

n

肥胖组

30

9.36

0.83

对照组

30

7.58

0.64

(倪宗瓒,卫生统计学,第四版,2000)

问题20某医院用A、B两种配方治疗慢性阑尾炎,治疗结果如表9所示,试分析两配方治疗慢性阑尾炎的疗效有无差别。

表9两种配方治疗慢性阑尾炎疗效比较

组别

无效

好转

显效

治愈

A配方

8

23

28

33

B配方

12

26

16

24

(倪宗瓒,卫生统计学,第四版,2000)

Study功能选择Study,具有如下菜单所示功能,可对相关研究的表格数据进行统计分析。

Cohort/cross-sectional →

Cumulativeincidence

累计发病率

队列或横断面研究资料的分析

Incidencedensity

发病密度

Stratified,cumulative

累计发病率的分层分析

Stratified,density

发病密度的分层分析

Case-control     →

Unmatched

不配比

病例对照研究资料的分析

Matched1:

1

1:

1配对

Matched1:

2

1:

2匹配

Stratified

分层分析

Vaccineefficacy   →

ControlMethod

设立对照组

疫苗效果评价

Cohortstudy

队列研究

Case-controlstudy

病例对照研究

MatchedCase-controlstudy1:

1

1:

1配对

MatchedCase-controlstudy1:

2

1:

2匹配

Screening 

筛检试验评价

有人在研究食管癌与饮酒关系的病例对照研究中,收集了表10资料,按年龄分为三层。

问题21表10可进行哪些假设检验和流行病学指标的分析?

表10三个年龄组的食管癌发病与饮酒的关系

暴露

<35岁

35岁

45岁

合计

病例

对照

病例

对照

病例

对照

病例

对照

饮酒

8

13

6

40

37

43

51

96

不饮

8

146

8

243

30

201

46

590

(倪宗瓒,医学统计学,第二版,2000)

问题22用某种新方法进行糖尿病的筛检试验,选取70例确诊的糖尿病患者作为病例组;选取510例非糖尿病病人作为对照组,结果如表11,试对该筛检试验的真实性进行评价。

表11糖尿病的筛检试验

筛检试验(血糖测定)

糖尿病患者

非糖尿病患者

+(≥110mg/100ml)

65

263

-(<110mg/100ml)

5

247

(李立明,流行病学,第四版,1999)

Sample功能用户可以根据需要计算各种流行病学研究所需样本量,Sample主要包括以下功能菜单。

Samplesize     →

Singleproportion

单个构成比样本

样本量

Twoproportions

两个构成比样本

Cohortstudy

队列研究

Case-controlstudy

病例对照研究

Powercalculation  →

Cohortstudy

队列研究

把握度计算

Case-controlstudy

病例对照研究

Randomnumbertable

随机数字表

Randomnumberlist

随机数字列表

Probability功能用户可利用Probability计算下列各种形式样本统计量的概率

KnownChi2 value

已知2值

KnownStudent'stvalue

已知t值

Binomial:

Proportionvs.Std.

二项分布

Poisson:

RareEventvs.Std.

泊松分布

RangeinNormaldistribution

正态分布

Fisher'sexacttest

Fisher精确概率

Combinations/Permutations

排列组合

问题23通过本课题实习,你认为利用统计软件处理流行病学资料有何优缺点?

需要注意哪些方面?

(郝加虎)

 

参考文献

1.倪宗瓒主编。

卫生统计学。

北京:

人民卫生出版社。

第四版,2000

2.李立明主编。

流行病学。

北京:

人民卫生出版社。

第四版,1999

3.倪宗瓒主编。

医学统计学。

北京:

人民卫生出版社。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1