随机分组原理与方法案例word.docx

上传人:b****4 文档编号:5205278 上传时间:2022-12-13 格式:DOCX 页数:12 大小:37.65KB
下载 相关 举报
随机分组原理与方法案例word.docx_第1页
第1页 / 共12页
随机分组原理与方法案例word.docx_第2页
第2页 / 共12页
随机分组原理与方法案例word.docx_第3页
第3页 / 共12页
随机分组原理与方法案例word.docx_第4页
第4页 / 共12页
随机分组原理与方法案例word.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

随机分组原理与方法案例word.docx

《随机分组原理与方法案例word.docx》由会员分享,可在线阅读,更多相关《随机分组原理与方法案例word.docx(12页珍藏版)》请在冰豆网上搜索。

随机分组原理与方法案例word.docx

随机分组原理与方法案例word

简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:

每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

适用于总体量大、差异程度较大的情况。

先将总体单位按其差异程度或某一特征分类、分层,然后在各类或每层中再随机抽取样本单位。

分层抽样实际上是科学分组、或分类与随机原则的结合。

分层抽样有等比抽样和不等比抽样之分,当总数各类差别过大时,可采用不等比抽样。

除了分层或分类外,其组织方式与简单随机抽样和等距抽样相同。

随机抽样设计

一、纯随机抽样:

对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。

纯随机抽样的常用抽样方法

1)抽签法:

将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为止。

缺点:

总体容量很多时,编制号签的工作量很大,且很难掺和均匀。

2)随机数字法:

用字母顺序或号等任何方便的方法对总体容量编者按号,利用随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号里的数字需跳过。

二、等距抽样:

先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位。

根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:

K=N/n,然后按此间隔依次抽取必要的样本单位。

等距抽样的一个例子

某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。

抽取方法:

按与研究目的无直接关系的笔划对总体进行排列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60,110,160,210,…直到4960为止,总共抽取50同名职工组成一个抽样总体。

等距抽样的优点:

(1)能保证被抽取到的样本单位在全及总体中均匀分布;

(2)简化抽样过程。

等距抽样应注意:

要避免抽样间隔或样本距离和现象本身的节奏性或循环周期相重合。

三、类型抽样

类型抽样:

将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。

适用围:

主要适用于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形,分层使层各单位之间的差异减小,层间差异扩大。

(一)类型比例抽样

按照总体单位数在各组之间的比例,分配各组的抽样单位数。

即:

各类型中抽取的样本单位数ni占该类型所有单位数Ni的比例是相等的,等同于样本单位总数n占总体单位数N的比例,即:

各类型组应抽取的样本单位数为:

样本比率抽样样本容量:

按前面指定的比例(n/N)从每组的Ni单位中抽取ni个单位即构成一个抽样总体,其样本容量为:

n=n1+n2+n3+…+nk=

(二)类型适宜抽样

在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()大的类型组要多抽样本单位数,变动程度()小的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和中的比例相等,等同于是或。

此外,还可将各类型组单位数和变动程度结合考虑,使得在所有类型组之和中所占比例等于或,即:

四、整群抽样

在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查。

五、多阶段抽样

将多个抽样程序分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。

适用围:

总体包括的单位很多,而且分布很广,通过一次抽样抽选出样本是很困难的,这时使用多阶段抽样。

多阶段抽样的一个例子

例:

对我国的农产量进行抽样调查。

抽样方法是:

先由省抽县,由抽中的县再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。

怎么样随机分组

一.拟将12只大鼠随机分入甲、乙两组,每组6名。

1.应先把受试者按体重由小到大编号,

2.然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。

分配给每只大鼠

3.并将随机数由小到大编秩(秩次R),

4.

令R为1~6者分入甲组,R为7~12者分入乙组。

动物编号123456789101112

随机数字699206341359717417322755

秩次R912162810113547此为随机数字

分组结果乙乙甲甲甲乙乙乙甲甲甲乙

二.试验动物随机分6组,每组10只。

完全随机化分组:

1,编号,将60个动物编号,可按体重大小编号

2,取随机数字:

从随机数字表中任一行任一列开始,抄取60个随机数字,如遇相同数字,抄取下一个随机数.可以不按章法,横着抄,竖着抄,斜着抄数字都可以.

3,对随机数字按从小到大排序.

4,分组:

从排序后的数字中规定前10个为第一组.依次类推.

区组随机化分组:

1,将动物的体重从轻到重编号,体重相近的6只配成一个区组

2,从随机数字表中任一行任一列开始,抄取60个随机数字

3,在每个区组将随机数字按大小排序

4,将各组序号为1的分为一组,序号为2的分为一组.依次类推.

怎么样随机抽样

1、随机的原则

1)随机的意义

所谓随机,就是每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。

实验设计中必须贯彻随机化原则,因为在实验过程中许多非处理因素在设计时研究者并不完全知道,必须采用随机化的办法抵消这些干扰因素的影响。

2)随机化的实施

实验设计中所指的总体不是泛指的无限总体,而是根据研究假设的要求规定的纳入标准,如动物的体重、年龄、病人的病情、经济条件、父母的文化程度等所选择的受试对象(即本次实验的有限总体),再把这些受试对象随机分入实验组和对照组中,以增强可比性,称为随机分配(randomizedallocation)。

随机化的实施就是如何进行随机分配。

随机化的方法有多种,最简单的如抽签。

但在实验设计中广泛应用随机数字表和随机排列表。

(1)随机数字表和随机排列表

随机数字表表数字相互独立,全部数字无论从横行、纵行或斜向等各种顺序均呈随机状态。

因此,使用时可从任何一个数字开始,按任意一个顺序录用。

例如拟将12只大鼠随机分入甲、乙两组,每组6名。

1.应先把受试者按体重由小到大编号,

2.然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。

分配给每只大鼠

3.并将随机数由小到大编秩(秩次R),

4.

令R为1~6者分入甲组,R为7~12者分入乙组。

动物编号123456789101112

随机数字699206341359717417322755

秩次R912162810113547此为随机数字

分组结果乙乙甲甲甲乙乙乙甲甲甲乙

随机排列表随机排列表比随机数字表更有实用性。

它可以简便地将受试对象随机分配到实验所要求的各组中去,也可以对处理因素进行随机排列,但不适用于随机抽样研究。

本表共有n分别为10、20、30、40、50、100等不同自然数排列而成的六种随机排列表,本教材引用n为20的随机排列表。

是每行或每列数字与顺序的等级相关系数,越小表示数字排列随机化程度越好。

例如,将10只小鼠随机分入甲、乙两组。

先将小鼠按体重由小到大编号,然后任意取n为20随机排列表中的任意一行或一列随机数,遇到大于或等于10的随机数则舍去。

本例取随机排列表中第6行,令单号分入甲组,双号分入乙组。

动物编号:

随机数字:

2814309675

分组结果:

乙乙甲乙甲乙甲乙甲甲

所以,第3、5、7、9、10只小鼠被分入甲组,第1、2、4、6、8只小鼠被分入乙组。

(2)几种常用随机分组方法

大样本完全随机分组适用于每组例数大于100时的情况。

方法是每个受试者给一个3位数的随机数,规定随机数区间:

分两组(等概率)000~499500~999

分三组(等概率)000~332333~665666~998

分四组(等概率)000~249250~499500~749750~999

分五组(等概率)000~199200~399400~599600~799800~999

余类推,多余的随机数可忽略,如分三组时取000~998,分六组时取000~995之间的随机数。

在有些特殊情况下需进行不等概率分组时,可按比例调整随机区间。

如按1:

2分组,A组的随机数区间为000~333,B组为334~999;按1:

3分组,A组为000~249,B组为250~999。

在临床试验中,不等概率分组的比例不能超过1:

3。

表13.1是1:

2完全随机分组举例。

表13.1300例受试者1:

2完全随机分组举例

受试者编号

1

2

3

4

5

6

7

8

9

10

11

300

随机数

849

140

539

006

860

347

323

387

563

678

253

961

处理

B

A

B

A

B

B

A

B

B

B

A

B

表13.2等概率随机分组例数分布的抽样试验

随机数区间

总例数

100

200

300

400

600

800

1000

1500

2000

000~099

11

23

30

36

58

77

93

144

191

100~199

6

17

29

38

54

68

90

137

180

200~299

14

25

35

47

70

92

113

172

226

300~399

9

20

30

42

59

87

106

157

216

400~499

10

23

39

50

72

92

118

165

218

500~599

12

23

34

43

69

90

112

146

193

600~699

10

18

28

34

52

79

95

149

203

700~799

9

17

28

39

62

79

99

147

189

800~899

6

12

17

31

45

66

83

138

193

900~999

13

22

30

40

59

70

91

145

191

最小例数

分2组

50

92

137

187

287

384

480

725

969

(50)

(100)

(150)

(200)

(300)

(400)

(500)

(750)

(1000)

分5组

17

34

47

71

104

136

174

281

371

(20)

(40)

(60)

(80)

(120)

(160)

(200)

(300)

(400)

备注:

括号为每组理想例数。

对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。

表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。

万一出现比例严重失衡的情况,如200例等概率分组时,出现85:

115或更不平衡的情况(出现概率小于0.05),需重新分组。

表13.3n个区组随机排列结果

区组

(入院时间)

随机数

随机数序号

随机排列结果

患者1

患者2

患者3

患者1

患者2

患者3

患者1

患者2

患者3

1

69

01

75

2

1

3

B

A

C

2

18

65

81

1

2

3

A

B

C

3

85

22

50

3

1

2

C

A

B

4

88

50

76

3

1

2

C

A

B

5

05

87

24

1

3

2

A

C

B

6

90

64

16

3

2

1

C

B

A

方法2当处理数k较小时(如k<5),由方法1得到的区组处理的排序顺序可能出现重复,如表13.3中的区组3和4。

此时,可用表13.4中全排列顺序确定各区组的排列方式。

表13.4k=3,4时区组处理的全排列

K=3

1ABC

2ACB

3BAC

4BCA

5CAB

6CBA

K=4

1ABCD

2ABDC

3ACBD

4ACDB

5ADBC

6ADCB

7BACD

8BADC

9BCAD

10BCDA

11BDAC

12BDCA

13CABD

14CADB

15CBAD

16CBDA

17CDAB

18CDBA

19DABC

20DACB

21DBAC

22DBCA

23DCAB

24DCBA

例如,当k=3时,对5个区组A,B,C三种处理进行随机排列。

取6个随机数:

498,739,853,994,563,479,排序结果位2,4,5,6,3,1,查表13.4对应的序号,第一个区组的对应的序号是2,排列方式为ACB,第二个区组的对应的序号是4,排列方式为BCA,第三个区组的对应的序号是5,排列方式为CAB,第四个区组的对应的序号是6,排列方式为CBA,第五个区组的对应的序号是3,排列方式为BAC。

当k=2时(配对设计),因排列方法只有2种,即AB和BA,可用每个对子随机数的奇偶决定,但为了保证所有对子中这两种顺序出现机会均等,还可采用分段随机数分组的方法。

分段随机分组分段随机分组的基本思想是利用随机数生成若干数目相同的随机排列序列,再根据序列号进行分组,其目的是使分组结果达到预想的例数分配,既适用于小样本又适用于大样本。

基本步骤是:

①将分组过程分多个阶段进行,每个阶段只对m个试验材料随机分组。

m必须是处理数的倍数,为了保证随机效果,m最好是处理数的5倍以上;②取m个3位随机数从小到大排序,得序号R;③规定R所对应的处理,如20个动物等分为两组,则R:

1~10为A组,R:

11~20为B组。

15名患者按1:

2分为两组,则R:

1~5为A组,R:

6~15为B组。

18名患者等分三组,R:

1~6为A组,R:

7~12为B组,R:

13~18为C组。

余类推。

④将m个观察对象分配完毕以后,再按以上方法对下一批m个观察对象分组,直至分组结束。

例如,将200名受试者随机等分为两组。

令m=10,需分20段完成全部分组。

规定每段随机排列序号R对应处理,R:

1~5为A组,R:

6~10为B组,第1和第2阶段的分组结果见表13.5。

表13.5分段随机分组举例

受试者序号

第1阶段分组结果

1

2

3

4

5

6

7

8

9

10

随机数

421

333

459

418

384

400

213

391

754

318

R

8

3

9

7

4

6

1

5

10

2

处理

B

A

B

B

A

B

A

A

B

A

受试者序号

第2阶段分组结果

1

2

3

4

5

6

7

8

9

10

随机数

391

910

351

024

425

293

361

660

081

911

R

6

9

4

1

7

3

5

8

2

10

处理

B

B

A

A

B

A

A

B

A

B

由表13.5第2阶段分组结果可看出,若采用随机数的奇偶数决定组别,则有7个奇数,3个偶数,不能达到每组例数相等的分组结果,但用随机数排列序号R分组,可保证各组例数相等。

配对设计时亦可采用此方法,如20个对子,预先规定R:

1~10时处理排列顺序为AB,R:

11~20时为BA。

同理,当单位组个数n大于表5中的排列方式数时,亦可采用分段随机分组的方法,并规定m=k!

,以最大限度地减少相同排列的重复次数。

怎么样随机抽样

简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:

每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

适用于总体量大、差异程度较大的情况。

先将总体单位按其差异程度或某一特征分类、分层,然后在各类或每层中再随机抽取样本单位。

分层抽样实际上是科学分组、或分类与随机原则的结合。

分层抽样有等比抽样和不等比抽样之分,当总数各类差别过大时,可采用不等比抽样。

除了分层或分类外,其组织方式与简单随机抽样和等距抽样相同。

随机抽样设计

一、纯随机抽样:

对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。

纯随机抽样的常用抽样方法

1)抽签法:

将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为止。

缺点:

总体容量很多时,编制号签的工作量很大,且很难掺和均匀。

2)随机数字法:

用字母顺序或号等任何方便的方法对总体容量编者按号,利用随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号里的数字需跳过。

二、等距抽样:

先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位。

根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:

K=N/n,然后按此间隔依次抽取必要的样本单位。

等距抽样的一个例子

某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。

抽取方法:

按与研究目的无直接关系的笔划对总体进行排列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60,110,160,210,…直到4960为止,总共抽取50同名职工组成一个抽样总体。

等距抽样的优点:

(1)能保证被抽取到的样本单位在全及总体中均匀分布;

(2)简化抽样过程。

等距抽样应注意:

要避免抽样间隔或样本距离和现象本身的节奏性或循环周期相重合。

三、类型抽样

类型抽样:

将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。

适用围:

主要适用于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形,分层使层各单位之间的差异减小,层间差异扩大。

(一)类型比例抽样

按照总体单位数在各组之间的比例,分配各组的抽样单位数。

即:

各类型中抽取的样本单位数ni占该类型所有单位数Ni的比例是相等的,等同于样本单位总数n占总体单位数N的比例,即:

各类型组应抽取的样本单位数为:

样本比率抽样样本容量:

按前面指定的比例(n/N)从每组的Ni单位中抽取ni个单位即构成一个抽样总体,其样本容量为:

n=n1+n2+n3+…+nk=

(二)类型适宜抽样

在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()大的类型组要多抽样本单位数,变动程度()小的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和中的比例相等,等同于是或。

此外,还可将各类型组单位数和变动程度结合考虑,使得在所有类型组之和中所占比例等于或,即:

四、整群抽样

在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查。

五、多阶段抽样

将多个抽样程序分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。

适用围:

总体包括的单位很多,而且分布很广,通过一次抽样抽选出样本是很困难的,这时使用多阶段抽样。

多阶段抽样的一个例子

例:

对我国的农产量进行抽样调查。

抽样方法是:

先由省抽县,由抽中的县再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 金融投资

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1