第三章 描述性研究Word文档格式.docx

上传人:b****4 文档编号:16638515 上传时间:2022-11-25 格式:DOCX 页数:17 大小:56.83KB
下载 相关 举报
第三章 描述性研究Word文档格式.docx_第1页
第1页 / 共17页
第三章 描述性研究Word文档格式.docx_第2页
第2页 / 共17页
第三章 描述性研究Word文档格式.docx_第3页
第3页 / 共17页
第三章 描述性研究Word文档格式.docx_第4页
第4页 / 共17页
第三章 描述性研究Word文档格式.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

第三章 描述性研究Word文档格式.docx

《第三章 描述性研究Word文档格式.docx》由会员分享,可在线阅读,更多相关《第三章 描述性研究Word文档格式.docx(17页珍藏版)》请在冰豆网上搜索。

第三章 描述性研究Word文档格式.docx

应用现况调查中抽样调查的设计特征,通过对疾病监测系统中监测对象、预防接种群体等的随机样本的复核检测以评价该疾病监测系统或预防接种的资料完整性、可靠性和正确程度。

三、现况研究的特点与种类

(一)现况研究的特点

现况研究具有不同于其他研究的显著特点。

设计良好的现况研究可以解答许多暴露和疾病的现象。

1、现况研究开始时一般不设有对照组病例对照研究在起始时就有病例组和对照组;

队列研究在起始时则有暴露组和非暴露组;

临床试验或社区试验在研究起始时即设置有试验(干预)组和对照组等。

而现况研究与此不同,在其开始时,根据研究的目的来确定研究的对象,然后查明该研究对象中每个人在某一特定时点上的暴露(特征)和疾病的状态,最后在资料处理与分析时,则根据暴露(特征)的状态或是否患病的状态来分组比较。

2、现况研究的特定时点或时期现况研究关心的是某一特定时点上或时期内某一群体中暴露和疾病的状况或联系。

对于特定时点来讲,并不强调必须是某年某月的某一特定时间,对于该群体中的每一个个体,时点所指的具体时间可能不同。

例如,在一个人群中调查高血压的患病情况,则对每个个体来说,特定时点是指测量血压、诊断是否为高血压的时间。

同样地,特定时点也可以是患者入院的时间,出生的时间等等,这些时间在日历年月日上都不是在同一个具体的时点上。

然而,这些不同的具体时间持续得太久,将会对调查结果产生影响;

或者所调查的疾病是急性的,且随着时间的变化其发病率也有不同,则结果就很难解释。

理论上,这个不同的具体调查的时点应该越集中越好,如人口普查的时点定在11月1日零点。

一般地,时点患病率较时期患病率要精确。

3、现况研究在确定因果联系时受到限制一般而言,现况研究所揭示的暴露与疾病之间的统计学联系,仅为建立因果联系提供线索,是分析性研究(病例对照研究和队列研究)的基础,而不能以此作因果推论。

其理由有二:

在现况研究中,某一疾病的持续时间(病程)短的病人(如迅速痊愈或很快死亡),将很难包括在一个时点或一个短时期的研究中,所包括的是大量存活期长的病人。

而存活期长与存活期短的病人,在许多特点上可能会很不一样,这种情况下,就很可能将影响存活的因素当作影响发病的因素。

现况研究一般揭示的是某一时点或时期暴露(特征)与疾病的关系,而不能决定暴露(特征)与疾病的时间顺序关系。

例如,一个现况研究发现,大肠癌病人比非病人的血清胆固醇水平要低,且有统计学上的显著意义,但仍很难解释是低血清胆固醇水平增加了患大肠癌的风险,还是大肠癌导致了低血清胆固醇水平。

4、对不会发生改变的暴露因素,可以作因果推论对于诸如性别、种族、血型等这类不会因是否患病而发生改变的因素与疾病的关系,现况研究可以提供相对真实的暴露(特征)与疾病的时间先后顺序的联系。

5、现况研究用现在的暴露(特征)来替代或估计过去情况的条件在现况研究的结果解释时,常常会以研究对象的目前的暴露状态或特征来替代或估计其过去的暴露状况,以便对研究结果作出专业上更有意义的推论。

若要如此,则应符合如下的前提条件方可:

现在的暴露或暴露水平与过去的情况存在着良好的相关关系,或已证明变化不大。

如某些环境性或职业性的暴露因素在近若干年来或更长时间内稳定不变,则可用此来估计其与研究群体中是否患病的联系强度。

又如,可通过测定头发中的汞含量来估计过去暴露于汞污染和所研究的某个疾病之间的联系等。

已知研究因素的暴露水平的变化趋势或规律,以此趋势或规定来估计过去的暴露水平。

回忆过去的暴露或暴露水平极不可靠,而现在的暴露资料可以用来估计过去的暴露情况。

例如,营养调查中常采用24小时或一周食物的摄入量来估计过去的摄入情况,因为饮食回忆常不可靠。

6、现况研究定期重复进行可以获得发病率资料两次现况研究的现患率之差,除以两次现况研究之间的时间长度,即是这时期的发病率。

采用这种计算方法的要求是两次现况研究之间的时间间隔不能太长,在该时间范围内发病率的变化不大,且疾病的病程稳定。

这种计算方法,避免了需要长期随访监测研究对象来获得发病率资料的弱点。

(二)现况研究的种类

根据研究对象的范围可分为普查和抽样调查。

1、普查普查(census)是指在特定时点或时期、特定范围内的全部人群(总体)均为研究对象的调查。

这个特定时点应该较短。

特定范围是指某个地区或某种特征的人群,如儿童(≤14岁)的体格普查。

普查的目的主要是为了疾病的早期发现和诊断,如女性职工的宫颈癌普查;

和寻找某病的全部病例,如甲型肝炎流行时,找出人群中该病的全部病例,以隔离传染源。

普查的优点除了早发现、早诊断病人,并能寻找出全部病例外,尚可以普及医学卫生知识;

另外,普查的资料虽然往往比较粗糙,但由于没有抽样误差,而能较全面地描述疾病的分布与特征,为病因分析研究提供线索。

但是,普查在实际工作中的应用存在着诸多局限性,其主要缺点在于:

普查由于工作量大而不易细致,诊断可能不够准确;

如果仪器等设备及人力等不足会影响检查的速度与精确性;

不适用于患病率低、无简便易行诊断手段的疾病;

普查的费用往往较大。

2、抽样调查抽样调查(samplingsurvey)则相对于普查的一种比较常用的现况研究方法,指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本的调查,以样本的统计量来估计总体参数所在范围,即通过对样本中的研究对象的调查研究,来推论其所在总体的情况。

抽样调查的目的主要是描述疾病在时间、空间和人群特征上的分布及其影响分布的因素;

衡量群体的卫生水平;

检查与衡量资料的质量,等等。

例如,在病例对照研究中,通过随机抽取一部分研究对象进行重复调查,用此资料与原调查的资料进行对比分析,以评价该病例对照研究所收集的资料质量,即抽样调查常可作为其他调查研究方法中的质量控制的方法。

与普查(全面调查)相比,抽样调查具有省时间、省人力、省物力和由于调查范围小使工作易于做得细致的优点。

但是抽样调查的设计、实施与资料分析均比普查要复杂;

重复或遗漏不易被发现;

对于变异过大的材料和需要普查普治的情况则不适合用抽样调查;

患病率太低的疾病也不适合抽样调查,因为抽样比大于75%,则不如进行普查。

抽样调查的基本要求是能从样本获得的结果推论到整个人群(总体)。

为此,抽样必须随机化,样本含量要足够,且调查材料的分布要均匀。

第二节现况研究的设计与实施

由于现况研究的规模一般都较大,涉及的工作人员和调查对象也很多,因此,有一个良好的方案设计是保证该研究成功实施的前提,也是该研究项目获得成功的保证。

在现况研究设计中要特别引起重视的是所选择的研究对象的代表性,这是将研究结果向总体推论时的首要前提。

此外,有足够的样本含量和避免各类偏倚的介入,也是保证研究对象(样本)具有代表性的重要条件。

一、明确调查目的和类型

这是设计的重要步骤,应根据研究所提出的问题,明确该次调查所要达到的目的,如是为了了解某疾病的人群分布情况还是开展群体健康检查,然后根据具体的研究目的来确定采用普查还是抽样调查。

二、确定研究对象

应根据研究目的和实际情况来选择研究对象。

如果是普查,在设计时可以将研究对象规定为某个区域内的全部居民,或其中的一部分,如儿童,即≤14岁者;

也可以为某一时点上的流动人员所组成,如某年、月、日某企业的全体职工,或某几个工厂中工龄满10年或以上者;

也可以采用某些特殊群体来作为研究对象,如采用化学工作者来研究皮肤癌等。

如果是抽样调查,则首先要明确该抽样研究的总体是什么,其次要确定采用何种抽样方法及其抽取多大的样本等。

抽样调查选择研究对象的基本原则是保证每一个研究对象是以等同的机率从其总体中选出的,即研究样本要有代表性。

因此,随机化原则中抽样过程的随机化应在这类研究中得到良好的体现。

三、样本含量和抽样方法

(一)样本含量

由于抽样调查较之全面调查(普查)在多数情况下具有优越性,现况研究常采用抽样的办法。

当然,有时也可以采用抽样与普查相结合的方法。

例如,1989年全国进行了以县(区)为抽样单位的1/10人口的居民全死因调查。

此项研究中,采用整群抽样技术,被抽到的县(区)则进行居民全死因的普查,而所有被抽取的县(区)则构成了一个全国居民的代表性样本。

该抽样调查的抽样比为1/10。

决定现况研究的样本大小的因素来自多个方面,但其主要是

预期的现患率(P),如现患率越靠近50%,样本含量就越小;

反之,则要大些。

对调查结果精确性的要求,即允许误差(d)越大,所需样本就越小。

一般地,在作某病的现患率调查时,其样本含量可用下式估计。

(式3-1)

则:

(式3-2)

令:

,则有

(式3-3)

设:

d为P的一个分数。

一般采用d=0.1×

P,并且当α=0.05时,t=1.96≈2

则(式3-3)可写成:

(式3-4)

(P为估计现患率;

Q=1-P,t为显著性检验的统计量,α=0.05时t=1.96,α=0.01时t=2.58,N为样本含量)

注意:

(式3-3)和(式3-4)仅适用于N·

P>

5的情况;

如果N·

P≤5则宜用Poisson分布的办法来求取估算的样本含量。

(二)抽样方法

抽样可分为非随机抽样和随机抽样。

前者如典型调查。

随机抽样的样本的抽取须遵循随机化原则,即保证总体中每一个对象都有同等机会被选入作为研究对象,以保证样本的代表性。

若样本含量足够大、调查数据可靠、分析正确,则可以把调查结果推论到总体。

常见的随机抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。

1、单纯随机抽样单纯随机抽样也称简单随机抽样,是最简单、最基本的抽样方法。

从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本。

它的重要原则是总体中每个对象被抽到的概率相等(均为n/N)。

单纯随机抽样的标准误按资料性质根据(式3-5)和(式3-6)计算。

均数的标准误:

(式3-5)

率的标准误:

(式3-6)

式中:

S为样本标准差;

p为样本率;

N为总体含量;

n为样本含量;

n/N为抽样比,若小于5%可以忽略不计。

在实际工作中,简单随机抽样往往由于总体数量大,编号、抽样麻烦以及抽到个体分散而导致资料收集困难等原因而用的不多;

但它是其他各种抽样方法的基础。

2、系统抽样(systemicsampling)系统抽样又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。

具体抽样方法如下:

设总体单位数为N,需要调查的样本数为n,则抽样比为n/N,抽样间隔为K=N/n。

将每K个单位为一组,然后用随机方法确定每一组的单位号(1,2,3,·

·

,K),最后每隔K个单位抽取一个作为研究对象。

例如,某镇有10000户,拟抽1000户,则抽样比为1000/10000=1/10;

K=10000/1000=10。

以随机数字方法确定第一组被抽到的户号,假如为6,以后则每隔10户抽取一户,组成的样本为6,16,26,·

等序号的居民户。

系统抽样的优点有:

事先不需要知道总体内的单位数。

例如想抽取一年中所有新生儿的一个样本,不必准确了解一年中新生儿数量,但可以根据估计而确定抽样间隔(K);

在人群现场易进行。

例如可按户或按门牌号,调查员可以间隔K户调查一户,这比单纯随机抽样要容易;

样本是从分布在总体内部的各部分的单元中抽取的,分布比较均匀,代表性较好。

系统抽样的缺点主要是:

假如总体各单位的分布有周期性趋势,而抽取的间隔恰好是其周期或其倍数,则可能使样本产生偏性。

例如疾病的时间分布、季节性调查因素的周期性变化等,如果不能注意到这种规律,就会使结果产生偏倚。

系统抽样标准误的计算可用单纯随机抽样公式代替。

3、分层抽样(stratifiedsampling)先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。

分层可以提高总体指标估计值的精确度,它可以将一个内部变异很大的总体分成一些内部变异较小的层(次总体)。

每一层内个体变异越小越好,层间变异则越大越好。

分层抽样比单纯随机抽样所得到的结果准确性更高,组织管理更方便,而且它能保证总体中每一层都有个体被抽到。

这样除了能估计总体的参数值,还可以分别估计各个层内的情况,因此分层抽样技术常被采用。

4、整群抽样(clustersampling)将总体分成若干群组,抽取其中部分群组作为观察单位组成样本,这种抽样方法称为整群抽样。

若被抽到的群组中的全部个体均作为调查对象,称为单纯整群抽样(simpleclustersampling);

若调查部分个体,称为二阶段抽样(twostagessampling)。

整群抽样的特点有:

易于组织、实施方便,可以节省人力、物力;

如群间差异越小,抽取的群越多,则精密度越好;

抽样误差较大,故样本量比其他方法要增加1/2。

5、多级抽样(multistagesampling)在大型流行病学调查中,常常结合使用上面几种抽样方法。

常把抽样过程分为不同阶段,即先从总体中抽取范围较大的单元,称为一级抽样单位(如省、自治区、直辖市),再从每个抽得的一级单元中抽取范围较小的二级单元(县、乡、镇、街道),依次类推,最后抽取其中范围更小的单元(如村、居委会)作为调查单位。

每个阶段的抽样可以采用单纯随机抽样、系统抽样或其他抽样方法。

多级抽样可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。

多级抽样的缺点是在抽样之前要掌握各级调查单位的人口资料及特点。

我国进行的慢性病大规模调查就是采用此方法。

例如,要调查某城市初中生的吸烟情况,将全市中学按质量分成好、中、差三层,每层抽出若干学校,再在抽出的学校中,按年级分成三层,每个年级按整群抽样抽取若干班进行全部调查。

在这个抽样设计中采用了单纯、分层、整群抽样技术。

四、确定收集资料的方法

在现况研究中,收集科研资料的方法一经确定,就不应变更,在整个科研过程中必须先后一致,以避免研究资料的不同质性。

具体而言,一般有两种方法:

一是通过测定或检查的方法,如测定HBsAg是否阳性,血压是否正常等。

另一是通过直接用调查表询问研究对象,让其回答或回忆暴露或疾病的情况。

这种方法用得较为普遍,如吸烟、饮酒等等情况的调查常用此法。

资料收集过程中要注意,暴露(特征)的规定(定义)和疾病的标准均要明确和统一。

五、现况研究中常见的偏倚与质量控制

(一)现况研究中常见的偏倚

调查或研究结果与真实情况不符,或者说,样本的统计量不能代表总体参数所在的范围,则称之为偏倚。

抽样调查结果出现偏倚,其最有可能发生在抽样过程中。

偏倚产生的原因主要为①主观选择研究对象,即选择研究对象具有随意性;

将随机抽样当作随意抽样。

②任意变换抽样方法,如根据出院号来随机选择(抽样)时,就不能改用入院号等其他方法来抽样。

③调查对象不合作或因种种原因不能或不愿意参加调查从而降低了应答率,此种现象称为无应答偏倚。

若应答率低于10%就较难以以调查结果来估计整个研究对象的状况。

④在现况研究中,所调查到的对象均为幸存者,无法调查死亡的人,因此不能全面反映实际情况,有一定的局限性和片面性,此种现象又称之为幸存者偏倚。

由以上原因导致的偏倚主要是选择偏倚,其最终导致研究样本缺乏代表性而使研究结果不能外推。

⑤询问调查对象有关问题时,由于种种原因回答不准确从而引起偏倚(报告偏倚)或调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象由于没有疾病的经历,而容易将过去的暴露等情况遗忘,而导致回忆偏倚。

⑥调查员有意识地深入调查某些人的某些特征,而不重视或马虎对待其他一些人的这些特征而导致的偏倚,则称为调查偏倚。

⑦在资料收集、病患等情况的测量中由于测量工具、检验方法不正确,化验技术操作不规范等导致的系统误差则会介入测量偏倚。

此外,在数据分析中,则要注意有无混杂因素的存在及其影响程度。

(二)质量控制

现况研究或其他类型的研究中均需要调查资料的质量控制,其目的是尽量减少偏倚的产生,能正确地、真实地描述事物、事件的真实情况。

有效的质量控制的前提是研究设计时要反复论证,尽量严密,并应考虑到调查中或调查结束时对资料进行质量评价的方法和指标。

如调查结束时,随机抽取一定数量的调查表进行重复调查,比较两次调查资料的一致性,或在调查过程中,对调查表中若干问题进行电话回访复查,均是非常有效的评价调查资料质量好坏的方法。

在现况研究中,针对各种偏倚可能的来源,做好预防与控制,也是一个调查成功与否的重要环节。

具体而言,现况研究中应着重强调以下几个方面:

1.严格遵照抽样方法的要求,确保抽样过程的随机化原则的完全实施;

2.提高研究对象的依从性和受检率;

3.正确选择测量工具和检测方法,包括调查表的编制等;

4.组织好研究工作,调查员一定要经过培训,统一标准和认识;

5.做好资料的复查、复核等工作;

6.选择正确的统计分析方法,注意辨析混杂因素及其影响。

六、调查表与调查员

(一)调查表编制方法

普查和抽样调查等描述性研究以及分析性研究等,常常会采用问卷的方法来采集科研资料。

问卷又称为调查表(questionnaire)。

调查表是收集科研所需资料的工具,是研究者根据设计的研究目的,将内容具体化到一系列问题形式的一种表格。

调查表中所列的问题包含调查(研究)的整个内容,调查表举例如表3-1。

表3-1流行病学调查表(部分)

Ⅷ家族史

下面问一些有关您家里人的健康情况:

1.首先,想问一下您父母的健康情况:

a.您母亲今年多大年岁?

□□岁(18-19)

[若去世,就问]您母亲去世时是多少岁?

□□岁(20-21)

b.您母亲是否曾被医生诊断有过胃肠病?

1=是2=否9=不知道[属于那种用○在数字上圈出](22)

[如果是,就问]是什么胃肠病?

[如实记录]□(23)

c.您母亲是否曾被医生诊断有过癌症?

1=是2=否9=不知道[属于那种用○在数字上圈出](24)

[如果是,就问]是什么癌症?

[如实记录]□(25)

d.您父亲今年多大年岁□□岁(26-27)

[若去世,就问]您父亲去世时是多少岁□□岁(28-29)

e.您父亲是否曾被医生诊断有过胃肠病?

1=是2=否9=不知道[属于那种用○在数字上圈出](30)

[如实记录]□(31)

f.您父亲是否曾被医生诊断有过癌症?

1=是2=否9=不知道[属于那种用○在数字上圈出](32)

[如实记录]□(33)

编制调查表的一般步骤为:

首先,将根据研究目的确定的调查内容归纳为几大项,再将大项分别分为若干个小项,然后将各小项变为具体的问句。

在调查表的编制过程中,应注意以下问题:

1、调查表上问题的排列除了考虑各项问题相互之间的逻辑性外,还应考虑到被调查者的心理活动。

应将调查者易于接受的问题安排在前面,难于接受的问题(如涉及隐私的问题)安排在后面,此可提高被调查者对调查的依从性或应答率。

2、调查表上问句的措词要明确,易懂。

应尽量避免使用专业术语和使人难堪或反感的词句。

问句不能带有导向性,即暗示被调查者选择某一答案。

对调查表上的所有词句都要经过仔细推敲和修改,甚至连调查表的题目也应给予以同样的重视。

如将“大肠癌病例对照调查表”改为“生活与健康调查表”,此不但可使被调查者更愿意接受调查,而且也有助于贴近盲法的原则,即掩盖研究的假设。

有时,用词不当,会使被调查者发生疑虑,而使其回答闪烁其词,影响调查的真实性。

3、表式根据要求回答的形式,分为“闭关式”和“开放式”的两种。

根据是否采用计算机来作资料处理分为编码调查表和非编码调查表。

“闭关式”调查表如表7-1所示,每个小题(a-d)后有3个备选择的答案,要求被调查者只能选定其中的一个答案。

因此答案的范围就相当于测量的尺度,而这个尺度应包含对这个问题可能出现的所有答案,并且各个备选答案应互斥。

“开放式”调查表则适合于那些难以限定答案尺度的问题,如年龄、出生日期等等。

如表7-1中,“如实记录”后的横线上用于记录病名,因为可能的答案很多,不便一一例举,且可避免导向性的提问。

编码调查表(表7-1)是将计算机编码表与调查表有机地合二为一,即在每个问题的右边留出适当位置(方格),注出标号,供编码用。

其优点是:

能提高正确性,在以后数据整理过程中也便于复核。

4、应有核实被调查者回答问题的正确性项目如询问有关年龄资料时,可以同时设置“您今年多大年纪(实足岁)?

”和“您是哪年哪月哪日出生的?

”这是通过设计形式上的不同,但所问的是同一内容的问题,来核实被调查者对这一内容的回答是否正确,进而也可借以评估整个调查内容是否正确。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1