重复测量资料的统计分析方法.docx

上传人:b****6 文档编号:3359895 上传时间:2022-11-22 格式:DOCX 页数:27 大小:24.72KB
下载 相关 举报
重复测量资料的统计分析方法.docx_第1页
第1页 / 共27页
重复测量资料的统计分析方法.docx_第2页
第2页 / 共27页
重复测量资料的统计分析方法.docx_第3页
第3页 / 共27页
重复测量资料的统计分析方法.docx_第4页
第4页 / 共27页
重复测量资料的统计分析方法.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

重复测量资料的统计分析方法.docx

《重复测量资料的统计分析方法.docx》由会员分享,可在线阅读,更多相关《重复测量资料的统计分析方法.docx(27页珍藏版)》请在冰豆网上搜索。

重复测量资料的统计分析方法.docx

重复测量资料的统计分析方法

 

重复测量资料的统计分析方法

 

在临床医学研究中,一些干预研究和纵向研究都经常会涉及到同

 

一研究对象的多次观察,而同一个对象的多次观察的记录资料称为重

 

复测量的资料。

由于同一对象不同时间点的观察往往存在相关的问

 

题,也就是存在不独立性的问题,而大多数的医学统计方法都要求资

 

料是独立,所以这些资料的统计分析需要比较特殊的统计方法进行分

 

析。

本节将先举例介绍常见的重复测量资料,并介绍相应的重复测量

 

资料的统计分析方法。

 

一、单个样本的重复测量资料

 

例1为了考察某药物减肥的作用,现考察5个身高为160cm、服用该药的女性肥胖者,疗程为3个月,这5名女性肥胖者在服用该药前后的体重测量值(kg)如下:

 

肥胖者编号

1

2

3

4

5

服药前体重

50

52

49

55

46

Y0i

服药后体重

48

51

49

52

45

Y1i

 

这是一组观察对象的资料,每个观察对象有两个时间点的测量资料,因此这是最简单的重复观察测量资料(也可以认为配对设计的资

 

料)。

 

由于各个观察对象在服药前的体重不全相同,所以其体重含有服

 

药前的体重个体变异成分,而在服药后,各个观察对象的体重下降幅

 

度也不全相同,故存在体重下降幅度的个体变异成分,因此观察对象在服药后的体重中不仅含有体重下降幅度的个体变异成分,而且还含有服药前的体重个体变异成分,故服药前后的体重资料不独立。

对于

 

这种不独立资料的统计分析一般采用变异成分的分解或消除某一个

体变异成分的方法进行统计处理的。

如配对

t检验和符号秩检验就是

采用服药前后资料相减作为统计分析数据,

因而消除了服药前体重的

个体变异,使进入统计分析的资料仅含有体重下降幅度的个体变异,

但这种消除某种不独立的变异成分的统计方法无法对比较复杂的重

复测量资料进行统计分析。

因而本节将借助统计软件

Stata,介绍应

用混合模型(MixedModel)对重复测量资料进行统计分析。

设观察对象体重的总体均数为

0,服药后体重总体均数为

1,

即服药前后的体重改变量的总体均数为

1-

0。

若=0说明

服药前后的体重平均变化为0,即无疗效;若

<0,说明服药后的人

群平均体重低于服药前的平均体重,即该药物减肥是有效的;若

>0,

说明服药后的平均体重高于服药前的平均体重,

即该药对减肥有不利

 

的作用。

针对本例服药前后的体重总体均数的变化关系,引入自变量t,建立下列服药前后的体重总体均数表达式(即混合模型的确定性部分表达式)。

 

0

 

t

 

(12-1)

t=0

时,

为服药前的体重总体均数

0;t=1

时,

为服药后的

体重总体均数1。

应用混合模型可以对本例资料进行统计分析,其

 

中和0的参数估计一般采用限制的最大似然法,然而计算相当复

 

杂,故我们将借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下。

 

tyno

 

0501

 

0522

 

0493

 

0554

 

0465

 

1481

 

1512

 

1493

 

1524

 

1455

 

其中y为体重测量值,t为服药时间的自变量,no为观察对象的编号,相应的Stata操作命令如下:

Random-effectsGLSregressionNumberofobs

=10

Groupvariable(i):

no

Numberof

groups

=

5

R-sq:

within

=0.6533

Obsper

group:

min=

2

between

=

.

avg=

2.0

overall

=

0.0612

max=

2

 

Randomeffectsu_i~GaussianWaldchi2

(1)

=7.54

corr(u_i,X)=0(assumed)Prob>chi2

=0.0060

-----------------------------------------------------------

-------------------

y|Coef.Std.Err.

[95%Conf.Interval]

-------------+---------------------------------------------

-------------------

t|-1.4.509902

-2.399389-.4006105

_cons|50.41.371131

47.7126353.08737

-------------+---------------------------------------------

-------------------

sigma_u|2.9580399

sigma_e|.80622577

rho|.93085106(fractionof

-----------------------------------------------------------

-------------------

zP>|z|

 

-2.750.006

 

36.760.000

 

varianceduetou_i)

估计值为-

1.4,

0估计值为

50.4,而

1的估计值=

50.4-

1.4=49。

 

H0:

 

=0

 

即无减肥疗效

H1:

0即服药前后的人群平均体重不同

=0.05

 

相应的P值=0.006,因此服药前后平均体重的差异有统计学意

 

义,故可以认为该药物有减肥疗效。

 

例2为了考察某药物在疗程为6个月中的持续减肥作用,现考

 

察5个服用该药的女性肥胖者并且身高为162cm的,这5名女性肥

 

胖者在服用该药前、服药3个月和服药6个月的体重测量值(kg)如下:

 

肥胖者编号

服药

3个月

6个月

1

48

46

42

2

53

51

47

3

52

52

48

4

52

51

48

5

53

52

49

 

这是一组观察对象的多个测量时间点的重复观察测量资料,因此

 

同一对象的不同观察时间点的观察资料是相关的。

(也可以视为配伍

 

区组设计的观察资料,用随机区组设计的方差分析或Friedman秩检

 

验的统计方法检验该药物的减肥作用),因此可用混合模型进行统计

 

分析。

 

设观察对象在服药前的体重总体均数为

 

0、服药

 

3个月时的体

重总体均数

0+

1,服药

6个月时的体重总体均数为

0+

2,即:

1为服药

3个月时的体重平均改变量,

2为服药

6个月时的体重

平均改变量。

针对本例服药前后的体重总体均数的变化关系,引入自

 

变量t1和t2,建立下列服药前后的体重总体均数表达式

 

01t1

2t2

(12-2)

若t1=t2=0时,

为服药前的体重总体均数

0;t1=1,t2=0时,

为服药3个月时的体重总体均数

0+1。

1<0,说明服药3

 

个月时的服药人群平均体重低于服药前的平均体重,即该减肥药有

 

效,反之无疗效;t1=0,t2=1时,为服药6个月时的体重总体均数

 

0+2,而2<0和2>0同样反映该减肥药有效或无效。

若2<1,

 

说明服药6个月时的服药人群平均体重低于3个月时的服药人群平均体重到期间。

我们同样借助Stata软件对上述资料用混合模型进行统计分析,相应的Stata软件的数据格式如下。

 

no

y

t1

t2

1

48

0

0

2

53

0

0

3

52

0

0

4

52

0

0

5

53

0

0

1

46

1

0

2

51

1

0

3

52

1

0

4

51

1

0

5

52

1

0

1

42

0

1

2

47

0

1

3

48

0

1

4

48

0

1

5

49

0

1

其中t1和t2为服药时间的自变量,其他与例

12-1相同,相应的

 

Stata操作命令如下:

 

Stata命令为xtregyt1t2,i(no)

 

相应输出结果如下:

Random-effectsGLSregressionNumberofobs

=15

Groupvariable(i):

noNumberof

groups=5

R-sq:

within=0.9551Obsper

group:

min=3

between=.

avg=3.0

overall=0.4602

max=3

Randomeffectsu_i~GaussianWaldchi2

(2)

=170.18

corr(u_i,X)=0(assumed)Prob>chi2

=0.0000

-----------------------------------------------------------

-------------------

y

|

Coef.

Std.

Err.

z

P>|z|

[95%Conf.Interval]

-------------+

---------------------------------------------

-------------------

t1

|

-1.2

.3829708

-3.13

0.002

-1.950609

-.4493909

t2

|

-4.8

.3829708

-12.53

0.000

-5.550609

-4.049391

_cons

|

51.6

1.104536

46.72

0.000

49.43515

53.76485

-------------+

---------------------------------------------

-------------------

sigma_u|2.394438

sigma_e|.60553007

rho

|

.93989071(fraction

of

variancedueto

u_i)

-----------------------------------------------------------

-------------------

 

3个月时的体重与6个月时的体重比较的Stata命令和输出结果

 

如下:

 

testt1=t2(H0:

2=1)

(1)t1-t2=0.0

chi2

(1)=88.36

Prob>chi2=0.0000

1估计值为-1.2(kg),2估计值为-4.8(kg),服药前体重总

 

体均数0的估计值为51.6(kg);服药3个月时的体重总体均数0

 

+1的估计值为51.6-1.2=50.4(kg);服药6个月时的体重总体均

 

数0+2的估计值为51.6-4.8=46.8(kg)。

 

H0:

1=0

即服药3个月时减肥无效

H1:

0

即服药3个月时与服药前的人群平均体重不同

=0.05

 

相应的P值=0.002,因此差异有统计学意义,故可以认为该药

 

物在服药3个月时有减肥疗效。

 

H0:

2=0

即服药6个月时减肥无效

H1:

20

即服药6个月时与服药前的人群平均体重不同

=0.05

 

相应的P值<0.001,因此差异有统计学意义,故可以认为该药物在服

 

药6个月时有减肥疗效。

 

H0:

2=1

 

H1:

21

不同

 

即从服药3个月至6个月时,没有继续减肥

 

即服药6个月时与服药3个月的人群平均体重

 

=0.05

 

相应的P值<0.001,因此差异有统计学意义,故可以认为服药3个月至6个月期间,继续有减肥疗效。

 

多个样本多个时间点重复观察资料

 

例12-3为了比较A药和B药在疗程为6个月中的持续减肥的疗效,现有10个身高为160cm的女性肥胖者志愿参加这项研究。

随机分成2组,每组各5人。

分别考察这2组肥胖者在服药前、3个月

 

和服药6个月的体重变化。

2组肥胖者在服用该药前、服药

3个

月和的体重测量值(kg)如下:

组别和肥胖者编号

服药前

3个月

6个月

A药组1号

52

49

42

A药组2号

51

50

46

A药组3号

50

49

41

A药组4号

51

49

44

A药组5号

49

47

40

B药组1号

51

54

53

B药组2号

49

47

46

B药组3号

50

47

44

B药组4号

49

48

41

B药组5号

52

50

48

 

这是两组观察对象的多个测量时间点的重复观察测量资料,同样

 

对于同一对象的不同观察时间点的观察资料是相关的,但由于需要比

 

较两个药的减肥疗效,所以两因素方差分析,随机区组设计的方差分

 

析或Friedman秩检验的统计方法都不适用于本例的数据统计分析,

 

但仍可用混合模型对本例资料进行统计分析。

 

由于这是两组观察对象的多个测量时间点的重复观察测量资料,

 

所以仍可以借用上例的总体均数表达式(12-2)分别描述每一组体重

 

变化规律,因此可以得到下列总体均数表达式:

 

A组

 

B组

 

01t12t2

1011t112t2

 

(12-3)

 

(12-4)

由于应用混合模型进行统计分析需要建立两组统一的总体均数

 

表达式,因此引入统一参数

3=

10-

0,

4=11-

1,5

=12-

2,代入(12-4)式,得到B组总体均数表达式

B组

0

3

(1

4)t1

(2

5)t2

(12-5)

0

1t1

2t2

3

4t1

5t2

引入分组变量g=0表示A

组,g=1表示B组,因此两组的总体均数

 

表达式均可表示为

 

0

1t1

2t2

3g4t1g

5t2g

(12-6)

用g=0,1;t1

1

2

1

代入(

)式,得到相应两组各个

=0

t=0

12-6

时间点的总体均数:

组别

服药前(t1=0,

服药3个月(t1=1,服药6个月(t1=0,

t2=0)

t2=0)

t2=1)

A组(g

0

0+

1

0+

2

=0)

B组(g

0+3

0+

1+

3+

0+

2+

3+

=1)

4

5

 

两组差异

3

3+4

3+5

若4和5不全为0,则称两种药物与服药时间对疗效有交互

 

作用。

两组在3个时间点的总体均数差异分别为

3,

3+4和

3+

5,因此只需检验H0:

3=0、H0:

3+

4=0和H0:

3+

5=0就可以推断两组总体均数差异。

反之若

4和

5全为0,

 

则称两种药物与服药时间对疗效无交互作用,并且两组各个时间点的

 

总体均数差异均为3,因此只需检验H0:

3=0就可以推断两组

 

的总体均数差异。

我们同样借助Stata软件对上述资料用混合模型进

 

行统计分析,相应的Stata软件的数据格式如下。

y

g

no

t1

t2

续左侧底部数据

52

0

1

0

0

51

1

6

0

0

49

0

1

1

0

54

1

6

1

0

42

0

1

0

1

53

1

6

0

1

51

0

2

0

0

49

1

7

0

0

50

0

2

1

0

47

1

7

1

0

46

0

2

0

1

46

1

7

0

1

50

0

3

0

0

50

1

8

0

0

49

0

3

1

0

47

1

8

1

0

41

0

3

0

1

44

1

8

0

1

51

0

4

0

0

49

1

9

0

0

49

0

4

1

0

48

1

9

1

0

44

0

4

0

1

41

1

9

0

1

49

0

5

0

0

52

1

10

0

0

47

0

5

1

0

50

1

10

1

0

40

0

5

0

1

48

1

10

0

1

Stata操作命令如下:

gengt1=g*t1

产生交互作用项变量g

t1

gengt2=g*t2

产生交互作用项变量g

t2

 

xtregyt1t2ggt1gt2,i(no)

 

Random-effectsGLSregressionNumber

 

=30

 

Groupvariable(i):

noNumberof

 

groups=10

 

R-sq:

within=0.8288Obsper

 

group:

min=3

 

between=0.0973

 

avg=3.0

 

overall=0.5927

 

max=3

 

Randomeffectsu_i~GaussianWaldchi2(5)

 

ofobs

=78.32

 

corr(u_i,X)=0(assumed)Prob>chi2

 

=0.0000

 

-----------------------------------------------------------

 

-------------------

 

y|Coef.Std.Err.zP>|z|

 

[95%Conf.Interval]

 

-------------+---------------------------------------------

 

-------------------

 

t1|-1.81.053565-1.710.088

 

-3.86495

.2649502

t2|

-8

1.053565

-7.59

0.000

-10.06495

-5.93505

g|

-.4

1.612452

-0.25

0.804

-3.560347

2.760347

gt1|

.8

1.489966

0.54

0.591

-2.120281

3.720281

gt2|

4.2

1.489966

2.82

0.005

1.279719

7.120281

_cons|

50.6

1.140175

44.38

0.000

48.3653

52.8347

-------------+

---------------------------------------------

-------------------

sigma_u|1.9300259

sigma_e|1.6658331

rho

|

.57307692

(fraction

of

varianceduetou_i)

-----------------------------------------------------------

-------------------

由此得到(12-6)式中的

0估计值为50.6,

1的估计值为-1.8,

2的估计值为-8,

3的估计值为-0.4

4的估计值为0.8和4.2。

 

两组各个时间的总体均数估计如下

 

A组(g=0)B组(g=1)B组-A组两组差异检验

 

总体

总体

总体

均数

总体

均数

均数

P值

估计

均数

估计

估计

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 家庭教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1