医学统计学基础Word格式文档下载.docx

上传人:b****6 文档编号:20914199 上传时间:2023-01-26 格式:DOCX 页数:56 大小:879.67KB
下载 相关 举报
医学统计学基础Word格式文档下载.docx_第1页
第1页 / 共56页
医学统计学基础Word格式文档下载.docx_第2页
第2页 / 共56页
医学统计学基础Word格式文档下载.docx_第3页
第3页 / 共56页
医学统计学基础Word格式文档下载.docx_第4页
第4页 / 共56页
医学统计学基础Word格式文档下载.docx_第5页
第5页 / 共56页
点击查看更多>>
下载资源
资源描述

医学统计学基础Word格式文档下载.docx

《医学统计学基础Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《医学统计学基础Word格式文档下载.docx(56页珍藏版)》请在冰豆网上搜索。

医学统计学基础Word格式文档下载.docx

研究者根据目的(研究假设),主动加以干预措施,并观察总结其结果,回答研究假设所提出的问题。

如:

研究脂健乳是否有降脂作用,首先假设脂健乳可以降低血脂,再将条件相似的20只大鼠先用高脂饲料喂养做成高脂血症的模型,然后将动物随机分为实验组和对照组,实验组服用脂健乳和豆奶,对照组单纯服用豆奶,喂养一个月后观察比较两组之间各项血脂指标的差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作用的结论。

实验设计主要有各种实验设计模型、分组方法、样本量估计等。

由于统计设计的质量直接影响着试验结果的准确性、可靠性、严密性和代表性,一旦出现设计上的失误或缺陷,可能导致整个研究的失败。

因此,专业设计是研究者对专业知识的把握能力,直接影响着实验的深度和水平,而统计设计是研究者对医学统计知识的正确运用,以保证统计描述和推断正确的基础。

调查设计与实验研究设计

专业设计

统计设计

要求

运用专业知识进行设计

运用统计学知识进行设计

内容

选题、调查(实验)、方法、材料

确定设计方案、收集整理资料、确定统计指标、分析和推断方法

方向

探讨实验、观察结果的适用性和创造性

探讨实验、观察结果的可重复性、高效性

目的

回答和解决科研课题,验证假说,保证科研结果的先进性

减少和控制误差。

保证样本的代表性和可靠性,保证实验结果的精确性和可重复性

2、收集资料(collectionofdata)

方式:

1、统计报表2、经常性工作记录3、专题调查或实验

3、整理资料(sortingdata)

将原始数据进行核对、整理,使其系统化、条理化,对数据进行逻辑检查,纠正错误,提供整理和描述数据资料的科学方法,确定数据的数量特征。

4、分析资料(analysisofdata)

根据不同的资料类型,选择不同的统计处理方法,计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。

统计分析包括:

1统计描述(descriptivestatistics):

用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述。

2统计推断(inferentialstatistics):

包括如何抽样,以及如何在随机变量的样本值基础上推断概率分布和总体值。

统计推断中涉及的各种统计分析方法是本次授课的重点内容。

四、医学统计学在科研中的作用:

1、系统积累和表达经验

临床经验的积累在于大量的临床实践。

实际上这些经验都可以整理和表达为统计信息,掌握了一定的统计学知识,就可以将积累的经验,通过对资料的收集、整理和分析,转变为正规和系统的统计信息,用以报告或发表,使人类医学知识宝库不断充实和发展。

2、完成科研工作

生物学是一门实验科学,不管你从事的是生物学的哪一个分支,都不可能完全脱离实验,只进行逻辑推理.而实验所得到的结果几乎无例外地都带有或多或少的不确定性,即实验误差.在这种情况下,不用统计学要想得到正确的结论是不可能的,可以毫不夸张地说,作为一个实验科学工作者,离开了统计学就寸步难行,希望通过这门课程的学习,能够掌握常用的统计方法,尤其是它们的条件,适用范围、优缺点等,从而能够应用它们去解决实践中遇到的问题。

否则,他将无法知道其研究结果是否具有科学意义上的可重复性。

要一一回答这些问题,要求研究者必须在整个研究过程中贯穿和运用统计学的理论和方法。

3、撰写研究报告和阅读书刊

医学研究中往往要涉及大量的数据,但在撰写研究报告和论文时,只能使用经过整理和归纳的统计指标,并且用规范的统计表和统计图表达。

此外,在阅读国外期刊时,如果不具备统计学的基础知识,则不能判断别人研究结果的可信性和局限性,更谈不上吸收和借鉴。

五、《医学统计学》中几个重要的基本概念:

(1)总体(population)、样本(sample)、个体(observedunit)

a.总体:

根据研究目的所确定的性质相同的所有个体的某种变量值的集合。

调查某地1999年正常成年男子的红细胞数,则

观察对象:

该地1999年正常成年男子。

观察单位:

统计研究中的最基本单位,如:

一个人、一个家庭、一个地区等。

观察值(变量值):

每个人测得的红细胞数。

该地1999年正常成年男子的红细胞数就构成一个总体。

同质基础:

同一地区、同一年份、同为正常成人、同为男性

有限总体(finitepopulation):

有确定的时间、空间和有限个观察单位,如上例。

无限总体(infinitepopulation):

没有确定的时间和空间限制,观察单位数为无限。

如研究用某药治疗缺铁性贫血的疗效,此时,总体的同质基础是贫血患者,同时用某药治疗,该总体应包括用该药治疗的所有贫血患者的治疗结果。

b.样本:

从总体中随机抽取部分个体所组成的集合。

(随机化原则:

总体中每一个观察单位均有同等机会被抽取)

(2)参数(parameter)、统计量(statistics)

统计学中把总体的指标称为参数,把所得样本的平均数称为统计量。

(3)误差(error):

抽样误差(samplingerror)由于总体中的个体间往往存在着变异,随机抽取的样本仅是总体中的一部分个体,因而样本测得的指标(统计量)往往与总体指标(参数)存在着差异,这种由于随机抽样而造成的样本的统计量与总体参数之间的差异,称为抽样误差,它既不定量,也不定性。

系统误差:

由于设计不严,测量仪器不准确,测量者水平的偏差而造成的,这种误差是定量的,可控的。

(4)统计资料

对每个观察单位的某项特征进行测量和观察,其特征称为变量,对变量的测值称为变量值,亦称为资料。

计量资料(quantitativedata)

统计资料类型计数资料(qualitativedata)

等级资料(rankeddat)

①、定量资料(quantitativedata)又称为计量资料:

用专业仪器测量,具有计量单位的测量数据,表现为数值的大小,如身高(cm)、体重(kg)、血压(kPa)等。

特点:

每个观察单位的观察值间有量的区别

②、定性资料(qualitativedata):

其观察值是定性的,表现为互不相容的类别或属性(即将观察单位按某种属性或类别分组,所得各组的观察单位数)。

每个观察单位的观察值间有质的区别

分两种情况:

1、无序分类(unorderedcategories)又称为计数资料

a.二项分类检验结果可以是阳性或阴性、治疗结果可以是治愈或未愈、性别属性等,表现为两类间互相对立。

b.多项分类某种观察结果为互不相容的多个类别,如血型、职业等。

2、有序分类(ordinalcategories)又称为等级资料

介于定量测量和定性观察之间的半定量观察结果,如测定某人群血清反应,以人为观察单位,结果分为—、±

、+、++四级,又如观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结果分为治愈、显效、好转、无效四级,通常有两个以上等级。

等级资料与计数资料的区别在于,等级资料虽然是多分类资料,但各个类别存在着大小和程度上的差别。

各类之间有程度的差别

资料的转化和分析:

根据分析问题的需要,各类变量可以互相转化。

观察某人群成年男子的血红蛋白量(g/L),属数值变量;

若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计量资料进行处理。

序号

正常人组

病人组

1

2

3

4

5

6

7

8

9

若按血红蛋白正常与偏低分为两类,可按二项分类资料处理;

正常

偏低

合计

若按贫血的诊断标准将血红蛋白含量分为五个等级:

重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。

重度贫血

中度贫血

轻度贫血

血红蛋白增高

(5)频率(frequency)、概率(probability)

医学研究的大多数现象是随机现象,例如用同一种治疗方法治疗某病的一群患者,可以知道治疗的结果有四种,但对于一个病人其治疗后的结果是不确定的,此时的每一种可能发生的结果都是一个随机事件(偶然事件、事件)。

定义:

在n次随机试验中,随机事件A发生了k次,记

则称

为随机事件A在n次试验中出现的频率。

实践证明,大量的试验中随机事件会呈现出频率稳定性。

描述随机事件A发生可能性大小的数值,称为A的概率,记作P(A),简记为P。

假如临床观察中治疗200病人的样本,求得治愈率为75%,这只是一个频率。

实际应用中,当概率不易求得时,常用n→∞时的频率作为概率的估计值。

但当n较少时,频率的波动性是很大的,用于估计概率是不可靠的。

随机事件概率的大小在0与1之间。

P值越接近1,表示某事件发生的可能性越大;

P值越接近0,表示某事件发生的可能性越小。

严格说,P=1表示事件必然发生,P=0表示事件不可能发生,他们是确定性的,不是随机事件,但可把他们看成随机事件的特例。

统计分析中的很多结论都是带有概率性的。

习惯上将P≤0.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。

《医学统计学》的学习重点是:

1、掌握其基本知识、基本技能、基本概念、基本方法。

建立逻辑思维方法和提高分析问题的能力。

2、掌握调查设计和试验设计的基本原则。

培养收集、整理、分析统计资料的系统工作能力。

3、掌握一套统计软件的使用方法(SAS、SPSS、STATA等)。

能够达到在完成《医学统计学》课程后,独立完成科研论文和正确应用统计方法。

 

第二讲集中趋势

举例

设有A、B两名新战士,他们的射击技术可用下面的分布来表示:

战士A战士B

击中环数8910击中环数8910

对应概率0.30.10.6对应概率0.20.50.3

问哪一个战士射击技术较好?

1、频数分布表

1)、频数表的编制

相同观察结果出现的次数称为频数。

将所有观察结果的频数按一定顺序排列在一起便是频数表(frequencytable)。

步骤:

①找出最大和最小值,计算极差R=Xmax―Xmin

②根据斯梯阶公式确定组距

③扫描样本值,划记后获得频数

2)、频数表的用途

①大样本数据(不限于计量资料)常用的表达方式。

②便于观察数据的分布类型。

③便于发现资料中远离群体的某些特大或特小的可疑值,必要时经检验后舍去。

④当样本含量足够大时,各组段的分布频率作为分布概率的估计值。

例7.我国某地农村1995年已婚育龄妇女现有子女数的分布

子女数

(1)

妇女数f

(2)

频率(%)

(3)

累计频数

(4)

累计频率(%)

(5)

≥10

13751

25191

30426

28560

21719

13695

7255

3268

151

373

156

145525

9.45

17.30

20.91

19.62

14.92

9.41

4.98

2.25

0.10

0.26

0.11

100.00

1.

38922

69348

97908

119627

133322

140577

143845

144996

145369

——

9.45

26.75

47.65

67.28

82.20

91.61

96.60

98.85

99.64

99.89

2、集中位置的描述

平均数(average)是统计中最广泛、最重要的一个指标体系。

用来描述一组变量的集中趋势、中心位置或平均水平,常作为一组资料的代表值,使资料产生简明概括的印象,又便于组间的比较。

常用平均数有均数、几何均数和中位数。

(一)、均数(mean)的计算

①直接法

例1、10名7岁男童体重(kg)分别为17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5.求平均体重。

=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)

②频数表法:

例2:

某地随机检查了140名成年男性红细胞数(1012/L)

4.765.265.615.954.464.574.315.184.924.274.774.88

5.004.734.475.344.704.814.935.044.405.274.635.50

5.244.974.714.444.945.054.784.524.635.515.244.98

4.334.834.565.444.794.914.264.384.874.995.604.46

4.955.074.805.304.654.774.505.375.495.224.585.07

4.814.543.824.014.894.625.124.854.595.084.824.93

5.054.404.145.014.375.244.604.714.824.945.054.79

4.524.644.374.874.604.724.835.334.684.804.154.65

4.764.884.613.974.084.584.314.054.165.045.154.50

4.624.734.474.584.704.814.554.284.784.514.634.36

4.484.595.095.205.325.054.414.524.644.754.494.22

4.715.214.944.685.174.915.024.76

红细胞数(1012/L)

频数f

(2)

组中值X

(3)

Fx

(4)=

(2)*(3)

3.80~

4.00~

4.20~

4.40~

4.60~

4.80~

5.00~

5.20~

5.40~

5.60~

5.80~

11

25

32

27

17

13

4

2

1

3.90

4.10

4.30

4.50

4.70

4.90

5.10

5.30

5.50

5.70

5.90

7.8

24.6

47.3

112.5

150.4

132.3

86.7

68.9

22.0

11.4

5.9

140(∑f)

669.8(∑fX)

=4.78(1012/L)

均数的两个重要特征:

①各离均差的总和等于零

证明:

②各离均差的平方和小于各观察值X与任何数a之差的平方

均数的应用:

1.用来描述一组变量值的平均水平,具有代表性,因此变量值必须是同质的。

2.适用于呈正态分布(对称分布)的资料。

(2)几何均数(geometricmean)的计算

1)直接法

例3:

5人的血清滴度为:

1:

2,1:

4,1:

8,1:

16,1:

32,求平均滴度。

LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903

G=lg-10.903=8故平均滴度为1:

8。

2)频数表法

例4:

40名麻疹疫苗接种麻疹疫苗后一个月,血凝抑制抗体滴度见下表,求平均滴度。

抗体滴度

人数f

滴度倒数X

LgX

(4)

f*lgX

(5)=

(2)*(4)

16

64

128

256

512

1

10

0.6021

0.9031

1.2041

1.5051

1.8062

2.1072

2.4082

2.7093

4.5155

7.2246

3.0102

12.6434

21.0720

9.6328

13.5465

40

72.2471

LgG=(flgX/f)=72.2471/40=1.8062G=lg-11.8062=64

血凝抑制抗体滴度的平均滴度为1:

几何均数的应用:

用于等比级数资料和对数正态分布资料,

如:

某些传染病的潜伏期、抗体滴度、细菌计数等。

(3)、中位数和百分位数的计算

中位数(median,M)是将一组观察值从小到大按顺序排列,位次居中的数值对应的观察值就是中位数。

因而全部观察值中,大于和小于中位数的观察值的个数相等。

1)直接法:

将原始观察值按大小顺序排列:

n为奇数时,

n为偶数时,

例5.测得5个人的低密度脂蛋白中载体B蛋白的含量(mg/dl)分别为0.84,2.58,5.46,8.58,9.60,求其中位数.

=X3=5.46mg/dl

例6.8名新生儿的身长(cm)依此为50,51,52,53,54,54,55,58,求其中位数。

2)频数表法

例7.对某地630名50岁~60岁的正常女性检查了血清甘油三脂含量,并制成如下频数表,试求中位数及第25、75、90百分位数。

甘油三脂mg/dl

频数,f

10~

40~

70~

100~

130~

160~

190~

220~

250~

280~

310~

27

169

167

94

81

42

28

14

3

630

27

196

363

457

538

580

608

622

626

629

----

4.3

31.1

57.6

72.5

85.4

92.1

96.5

98.7

99.4

99.8

100.0

例8.某日大气中SO2的日平均浓度(ug/m3)见下表,分别求第25、75、95百分位数及中位数。

浓度(ug/m3)

天数,f

5~

50~

75~

125~

150~

175~

200~

225~

275~

300~

325~

39

67

64

63

45

30

17

6

361

39

106

170

233

278

308

325

334

341

347

352

355

10.8

29.4

47.1

64.5

77.0

85.3

90.0

92.5

94.5

96.1

97.5

98.3

中位数和百分位数的应用:

1.用于描述偏态分布资料的集中位置。

反映位次居中的观察值的水平。

2.百分位数是用于描述样本或总体观察值序列在某百分位置水平,最常用的百分位数是中位数。

3.百分位数常用来确定医学参考值范围。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 文学研究

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1