医学统计学复习.docx

资源描述

医学统计学复习.docx

《医学统计学复习.docx》由会员分享，可在线阅读，更多相关《医学统计学复习.docx（19页珍藏版）》请在冰豆网上搜索。

医学统计学复习.docx

医学统计学复习

第一章

医学统计学（statistics）:

是用统计学原理和方法研究生物医学问题的一门学科。

他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。

医学统计工作的内容：

1.实验设计2.收集资料3.整理资料4.分析资料

资料的类型：

（1）计量资料（measurement data）：

对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料。

计量资料亦称定量资料、测量资料。

.其变量值是定量的，表现为数值大小，一般有度量衡单位。

（2）计数资料（count data）：

将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料。

计数资料亦称定性资料或分类资料。

其观察值是定性的，表现为互不相容的类别或属性。

（3）等级资料（ordinal data）：

将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料。

变异（variance）：

在自然状态下，个体间测量结果的差异称为变异。

变异是生物医学研究领域普遍存在的现象。

严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。

总体（population）:

是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体，反之为无限总体。

样本（sample）：

从总体中随机抽取部分观察单位，其测量结果的集合称为样本。

样本应具有代表性。

所谓有代表性的样本，是指用随机抽样方法获得的样本。

随机抽样（random sampling）：

随机抽样是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

抽样所遵循的原则：

1.代表性（representation）要求能够充分反映总体的特征

2.随机性（radomization）即需要保证总体的每个个体都有同样的几率被抽做样本。

可用机械抽样，分层抽样，随机数字抽样

3.可靠性（reliability）即实验结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。

误差（error）：

泛指观测值与真实值之差，以及样本统计量与总体参数之差。

主要有一下三类：

1.系统误差（systematic error）在收集资料的过程中，由于仪器初始状态未调整到零，标准试剂未经过校正，医生掌握疗效标准偏高或者偏低等原因，可造成观察结果倾向性的偏大或偏小，叫做~。

必须克服。

2.随机测量误差（randommeasurementerror）站在收集原始资料的过程中，即使仪器初始状态及标准试剂已经矫正，但是由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

这种误差没有固定的倾向，有时高有时低，叫做~。

这种误差应采取措施尽最大可能来控制，至少应控制在一定的允许范围内。

3.抽样误差（samplingerror）由抽样不同引起的样本均数与总体均数之间的差异。

不可避免。

产生的原因是①个体之间存在变异，②抽样时只能抽取总体中的一部分作为样本。

概率（probability）是指某事件在一定时间、地点、条件下发生的可能性大小的度量（叫概率）

第二章

频数表（frequencytable）用途：

1.作为陈述资料的形式，可以代替原始资料，便于进一步分析2.便于观察数据的分布类型。

便于发现资料中某些远离群体的特大或特小的数值4.当样本含量比较大时，可用各组段的频率作为频率的估计值。

平均数（average）是描述一组观察值集中位置或平均水平的统计指标，它常作为一组数据的代表值用于分析和进行组间的比较。

包括：

1.算术均数（mean），用于说明一组数据观察值的平均水平或集中趋势，是描呈正态分布的计量资料的一种最常用的方法。

（多用于呈正态分布的资料）

2.几何均数（geometricmean）用以描述对数正态分布或数据呈倍数变化资料的水平。

记为G。

3.中位数和百分位数

中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。

反映一批观察值在位次上的平均水平。

应用：

在频数分布呈明显偏态、或频数分布的两端无确定数值时，使用中位数描述集中位置或平均水平较为合理。

百分位数（percentile）是将n个观察值从小到大依次排列，再把它们的位次依次转化为百分位。

百分位数的另一个重要用途是确定医学参考值范围。

应用：

可用于任何频数分布的资料，但靠近两端的百分位数仅在样本例数比较大时才比较稳定。

（如n>100）

第三章

衡量变异程度的指标：

极差（range）：

观测值中最大值和最小值之差，用R表示。

四分位数间距（quartile）：

百分位数P75和P25之间的差。

Q=P75–P25

平均偏差（meandifference）各观察值偏离平均数的平均差距。

平均偏差=

离均差平方和（sumofsquare，SS）

方差（meanofsquare，MS）离均差平方和再取平均，其结果为方差。

标准差（standarddeviation，SD）方差的平方根称为标准差。

标准差的量纲与原变量一致。

标准差可以直接用于代数运算。

标准差与均数结合能够完整地概括一个正态分布。

标准差越大意味着个体差异越大。

变异系数（coefficientofvariation，CV）

不同量纲的变量间变异程度的比较。

均数差别较大的变量间变异程度的比较。

正态分布（normaldistribution）的特征

正态分布以均数μ为中心，左右对称。

正态分布曲线下面积集中在以均数μ为中心的中心部分，越远离中心曲线下面积越小。

正态分布曲线下面积分布有一定的规律。

标准正态分布（StandardNormalDistribution）

对任何参数的正态分布，都可以通过一个简单的变量变换化成μ=0和s=1的标准正态分布。

通常，可以利用标准正态分布表求出与原始变量X有关的概率值。

正态分布的应用

利用正态分布可以很容易确定资料中任意数值出现的概率，医学参考值范围的估计。

准确地进行误差分析和质量控制。

正态分布是以后学习各种统计推断方法的理论基础。

医学参考值范围的概念：

正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

医学参考值范围的制定方法

1.选择足够数量的正常人作为参照样本。

2.对选定的正常人进行准确的测定。

3.决定取单侧范围还是双侧范围值。

4.选择适当的百分范围。

第四章抽样误差与假设检验

样本均数的标准差称为标准误（standarderror,SE）。

标准误是抽样分布的重要特征之一，可用于衡量抽样误差的大小，更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。

可信区间的概念

参数估计（parameterestimation）用样本的统计量估计总体的参数。

有两种方法：

1点估计（pointestimation）用样本的统计量直接作为总体的参数值。

该法没有考虑抽样误差，无法评价其可信度。

2区间估计（intervalestimation）按预先给定的概率估计总体参数的可能范围，即总体参数的置信区间（confidenceinterval，CI）。

可信区间的两个要素：

1.准确度（accuracy）：

反映可信度（1-α）的大小，即可信区间包容μ的概率大小，愈接近1愈好。

2.精确度（precision）：

反映在区间的长度，区间长度愈小精确度愈高。

总体均数可信区间的计算

1.σ已知或未知，样本含量n≥50，按正态分布原理，可信区间为：

2.σ未知，样本含量n<50，服从t分布，可信区间为：

t分布特征

1.曲线以0为中心，两边对称。

2.曲线的变化与自由度ν有关。

ν趋于∞时，t分布趋向标准正态分布。

可信区间的含义：

1.以95%的可信区间为例，意味着在同一总体中作100次重复抽样，可得100个可信区间，平均有95个可信区间包含总体均数（估计正确），只有5个可信区间不包含总体均数（估计不正确），

2.对于某一个区间而言，它包含总体均数的可能性为95%，而不包含总体均数的可能性仅为5%。

总体均数可信区间与参考值范围的区别

区别点

参考值范围

总体均数可信区间

含义

“正常人”的解剖、生理、生化某项指标的波动范围。

个体值的波动范围

以95%的可信区间为例，意味着在同一总体中作100次重复抽样，可得100个可信区间，平均有95个可信区间包含总体均数，只有5个可信区间不包含总体均数。

总体均数的可能范围

计算

公式

正态分布：

n≥50：

n<50:

用途

绝大多数（如95%）观察对象某项指标的分布范围。

总体均数的区间估计

假设检验的意义和步骤

　　对所估计的总体首先提出一个假设，然后通过样本数据去推断是否拒绝这一假设，称为假设检验（hypothesistesting），这也是其基本思想。

假设检验是利用小概率反证法思想

假设检验的基本步骤

1.建立假设和确定检验水准

2.选择检验方法和统计推断分析

3.确定P值和作出统计推断

第五章t检验

一．单个样本的t检验

样本均数与已知某总体均数μ比较的t检验。

二．配对样本t检验

配对的三种情况：

1.两种同质受试对象分别接受两种处理。

2.同一受试对象或同一样本的两个部分，分别接受两种不同的处理。

3.自身对比，同一对象处理前后的结果比较。

三．两独立样本t检验

适用于完全随机设计的两样本的均数比较。

分别接受不同的处理的两研究总体中随机抽取样本，然后比较两组的平均效应。

需要注意的两个问题

1两样本所代表的总体均数服从正态分布。

2两样本所代表的总体方差是否具有齐性。

四．

两总体方差的齐性检验，即F检验。

ν1=n1–1,ν2=n2–1

一般取α=0.05水准做判断，

若F≥F0.05（ν1，ν2），P≤0.05，可认为两总体方差不具齐性。

若F0.05，可认为两总体方差具齐性。

五．u检验

根据数理统计的中心极限定理,不论变量X的分布是否服从正态分布,当随机抽样的样本例数足够大，样本均数服从正态分布

六．t检验中的注意事项

1.要有严密的抽样设计，假设检验结论要正确

2.选用的检验方法必须符合其适用条件

3.单侧检验和双侧检验的选择

4.正确的理解P值与差别有无统计意义

5.假设检验和可信区间的关系

假设检验中的两类错误

◆Ⅰ型错误（typeⅠerror）

Ⅰ型错误是指拒绝了实际上成立的H0，即“弃真”的错误。

Ⅰ型错误的概率用α表示。

α的意义是：

如果原假设H0成立，对研究总体抽样100次，检验结论中平均有100α次拒绝H0（犯了Ⅰ型错误）。

◆Ⅱ型错误（typeⅡerror）

Ⅱ型错误是指接受了实际上不成立的H0，即“存伪”的错误。

Ⅱ型错误的概率用β表示。

1–β称为检验功效（poweroftest）

β的意义是：

如果原假设H0不成立，对研究总体抽样100次，检验结论中平均有100β次不拒绝H0（犯了Ⅱ型错误）。

1-β的意义是：

当两总体确实存在差异时，按规定的检验水准发现该差异的能力。

注意：

拒绝H0时，只可能犯Ⅰ类错误；“接受”H0时，只可能Ⅱ类犯错误。

第六章方差分析

一．完全随机设计的方差分析

组内变异（SSe）

组内各个观测值与本组内均值之差的平方和。

反映了组内（同一水平下）样本的随机波动。

组间变异（SSTR）

组内均值　与总均值　之差的平方和，反映了处理因素各个水平组间的差异，同时也包含了随机误差。

总变异（SST）

全部测量值大小不同，这种变异称为总变异，以各测量值Xij与总均数间的差异度量。

总变异、组间变异、组内变异的关系

对应自由度的关系

均方（meansquare）

•离均差平方和大小，与变异程度大小有关，与其自由度大小有关。

•将各部分离均差平方和除以相应自由度，其比值称为均方差，简称均方（MS）。

组间均方与组内均方的比值称为F统计量，服从F分布，即

方差分析的思想逻辑：

将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异，构造出反映各部分变异作用的统计量，在此基础上，构建假设检验统计量，以实现对总体参数的推断。

将结果整理成方差分析表

方差分析步骤

⒈提出检验假设，确定检验水准。

H0:

三个组GSH值的总体均数相同；

H1:

三个组GSH值的总体均数不全相同；

⒉根据公式计算SS、MS及F值，列于方差分析表内（计算过程省略）

⒊确定P值，作出判断

分子自由度=k-1，分母自由度=n-k，查F界值表（方差分析用）可得结论：

可认为三种处理方式大鼠的GSH值不全相同。

二．随机区组设计资料的方差分析

随机区组设计（randomizedblockdesign）又称为配伍组设计。

将受试对象按性质相同或相近者组成m个组，称为区组或配伍组，每个区组中有k个受试对象，将k个受试对象随机地分到处理因素的k个水平组的一种设计方法。

随机区组设计资料数据结构

变异分解

总变异SST可分解为：

•处理因素的变异SSA

SSA反映了各个水平组间的差异（包含随机误差）

•区组因素的变异SSB

SSB反映了各个区组间的差异（包含随机误差）

•随机误差SSe

SSe反映了样本的随机波动

三者的关系如下：

方差分析表

第七章相对数及其应用（RelativeNumberandIt’sApplication）

相对数（relativenumber）

在比较两法的疗效，使计数资料具有可比性，将原始的两个资料（绝对数）之比所得指标。

相对数种类

率（rate）

概念：

率是表示某种现象发生的频率和强度，常以百分率（%）、千分率（‰）、万分率（/万）、十万分率（／10万）等表示

计算公式：

注意：

比例基数通常依据习惯而定，治愈率、感染率用百分率，出生率、死亡率用千分率，某些疾病的死亡率用十万分率。

各率相互独立，其之和不为1（如是则属巧合）

构成比（constituentratio）

概念：

又称构成指标，表示事物内部各个组成部分所占整体的比重，通常以100％为比例基数，以百分比表示

计算公式：

注意：

各组成部分的构成比之和为100%，某一部分比重增大，则其它部分相应减少。

构成比有两个特点

（1）说明同一事物的k个构成比的总和应等于100%，即各个分子的总和等于分母。

（2）各构成部分之间是相互影响的，某一部分比重的变化受到两方面因素的影响。

其一是这个部分自身数值的变化，其二是受其它部分数值变化的影响。

相对比（relativeratio）

概念：

相对比是两个有关联指标之比，用以描述两者的对比水平，常用R表示。

计算公式：

注意：

A大于B用倍数表示，A小于B时用百分数表示

相对数使用应注意的问题

1.不要把构成比与率相混淆

2.使用相对数时，分母不宜过小

3.要注意资料的可比性

（1）观察对象是否同质

（2）观察对象内部结构是否相同

4.比较两个样本率或构成比时，应考虑存在抽样误差，对于样本间的差异应作统计学检验

率的标准化（standardization）是为了在比较两个不同人群的患病率、发病率、死亡率等资料时，消除其内部构成（如年龄、性别、工龄、病程长短等）的影响。

如年龄会影响死亡率，年龄越大，死亡率可能越大；病情越重，越难治愈，治愈率就越低。

医学中常用的相对数指标

•一.死亡统计指标

•1.死亡率（Deathrate）表示某地某年1000人中的死亡人数。

•2.年龄别死亡率（Age-specificdeathrate）表示某地某年龄组每1000人中的死亡人数。

•3.死因别死亡率（Causespecificdeathrate）表示某年每10万人中由于患有某种疾病死亡的人数。

•4.死因构成（Proportionofdyingofaspecificcause）也称相对死亡比，是某种死因引起的死亡人数占总死亡人数的百分比。

•二.疾病统计指标

•1.发病率（Incidencerate）表示在某一时期内特定人群中某病新病例的频率。

•2.患病率（Prevalencerate）也称现患率，表示某一时点某人群中患某病的频率。

•3.病死率（Causefatality）表示某期间内，某病患者中因某病死亡的频率。

•4.治愈率（Curerate）表示接受治疗的病人中治愈的频率。

由于抽样引起的样本率之间及样本率与总体率之间的误差，称为率的抽样误差。

这个误差的大小我们用率的标准误来描述，用σp表示。

式中π为总体率，n为样本例数。

第八章卡方检验（ChiSquareTest）

一、基本公式和基本思想

如果检验的样本来自具有相同率的总体，那么用合计的率估计出来的各个组的理论频数应该和实际频数十分接近，相应计算出来的卡方值也就越小；反之，如果相应计算出来的卡方值越大，根据卡方分布，在计算出来的卡方值大到一定程度的时候，就需要拒绝H0。

四格表资料的基本形式

A：

实际频数（actualfrequency）

T：

理论频数（theoreticalfrequency）

TRC：

第R行C列的理论频数

nR：

相应的行合计，nC：

相应的列合计

检验统计量χ2值反映了实际频数与理论频数的吻合程度。

若检验假设H0:

π1=π2成立，四个格子的实际频数A与理论频数T相差不应该很大，即统计量χ2不应该很大。

如果χ2值很大，即相对应的P值很小，若P≤α，则反过来推断A与T相差太大，超出了抽样误差允许的范围，从而怀疑H0的正确性，继而拒绝H0，接受其对立假设H1，即π1≠π2。

自由度ν愈大，χ2值也会愈大；所以只有考虑了自由度ν的影响，χ2值才能正确地反映实际频数A和理论频数T的吻合程度。

检验的自由度取决于可以自由取值的格子数目，而不是样本含量n。

四格表资料只有两行两列,ν=1，即在周边合计数固定的情况下，4个基本数据当中只有一个可以自由取值。

假设检验步骤

（1）建立检验假设，确定检验水平。

H0:

π1=π2即试验组与对照组的总体有效率相等

H1:

π1≠π2即试验组与对照组的总体有效率不等

α=0.05。

（2）求检验统计量值

（3）确定P值，作出推断结论

二、四格表资料检验的专用公式

三、四格表资料检验的校正公式

χ2分布是一连续型分布，而四格表资料属离散型分布，由此计算得的χ2统计量的抽样分布亦呈离散性质。

为改善χ2统计量分布的连续性，则需行连续性校正（correctionforcontinuity）。

Χ2连续性校正仅用于ν=1的四格表资料，当ν≥2时，一般不作校正。

四格表资料χ2检验公式的选择：

，专用公式；

，校正公式；或改用表格资料的Fisher确切概率法。

，直接计算概率。

四、四格表资料的Fisher确切概率法

条件：

v理论依据：

超几何分布。

第二节配对四格表资料的χ2检验

　　与计量资料推断两总体均数是否有差别有成组设计和配对设计一样，计数资料推断两个总体率（构成比）是否有差别也有成组设计和配对设计，即四格表资料和配对四格表资料。

　本法一般用于样本含量不太大的资料。

因为它仅考虑了两法结果不一致的两种情况（b,c），而未考虑样本含量n和两法结果一致的两种情况（a,d）。

所以，当n很大且a与d的数值很大（即两法的一致率较高），b与c的数值相对较小时，即便是检验结果有统计学意义，其实际意义往往也不大。

第三节行×列表资料的χ2检验

行×列表资料

① 多个样本率比较时，

有R行2列，称为R×2表；

② 两个样本的构成比比较时，

有2行C列，称2×C表；

③ 多个样本的构成比比较，

有R行C列，称为R×C表。

检验统计量

三、行×列表资料χ2检验的

注意事项

1．理论频数：

行列表中的各格T≥1，并且1≤T＜5的格子数不宜超过1/5格子总数，否则可能产生偏性。

处理方法有三种：

Ø增大样本含量以达到增大理论频数的目的，属首选方法，只是有些研究无法增大样本含量，如同一批号试剂已用完等。

Ø根据专业知识，删去理论频数太小的行或列，或将理论频数太小的行或列与性质相近的邻行或邻列合并。

例如：

不同年龄组可以合并，但不同血型就不能合并。

Ø改用双向无序R×C表的Fisher确切概率法（可用SAS软件实现）。

2．多个样本率比较：

若所得统计推断为拒绝H0，接受H1时，只能认为各总体率之间总的来说有差别，但不能说明任两个总体率之间均有差别。

要进一步推断哪两两总体率之间有差别，需进一步做多个样本率的多重比较。

3.实际应用中：

对于行列表资料要根据其分类类型和研究目的选用恰当的检验方法。

第九章非参数检验

非参数统计的定义

在实际工作中，有时对总体的分布类型不易判定，或已知总体分布与检验所要求的条件不符，也不能通过数据转换使其符合参数统计的资料，这就需要一种对总体分布不作严格规定，不依赖总体分布类型，也不对总体参数进行估计或检验的统计方法来分析此类资料，称为非参数统计。

非参数统计的适用资料类型

1.分布呈非正态而又无恰当的数据转换方法使其转化为正态分布的资料（包含开口资料）

2.方差不齐的资料

3.总体分布不易确定的资料

4.不能或未加精确测量的资料，如等级资料

秩和检验

秩和检验（ranksumtest）：

一类常用的非参数统计分析方法；基于数据的秩次与秩次之和。

使用灵活，易于对各种设计类型的资料进行假设检验；在原假设下统计量与分布无关，有完备的大样本理论；秩和检验与参数检验方法如t检验相比，其检验效率不差，有时更好。

编秩原则

　1.差值为0的差值不参与编秩。

2.依差值的绝对值大小从小到大编秩。

3.绝对值相同的差值取平均值。

4.分别求正负秩和，T+和T-。

5.检验编秩是否正确，T++T-＝n（n+1）/2。

6.双侧检验使，以T+和T-中绝对值较小的T值记为统计量T。

单侧检验时，任取正差值

　　的秩和或负差值的秩和为统计量T。

第十章线性相关与回归

相关系数（correlationcoefficient），又称积差相关系数（coefficientofproduct–momentcorrelation），或Pearson相关系数（软件中常用此名称）说明相关的密切程度和方

展开阅读全文