医学统计学重点.docx

资源描述

医学统计学重点.docx

《医学统计学重点.docx》由会员分享，可在线阅读，更多相关《医学统计学重点.docx（15页珍藏版）》请在冰豆网上搜索。

医学统计学重点.docx

医学统计学重点

1、变异:

同质事物之间得差别。

2、频数分布得两个特征:

集中位置,离散趋势

3、数据分布得类型:

对称分布与非对称分布。

非对称分布又称偏态分布,包括正偏态与负偏态。

单峰分布,双峰分布,多峰分布。

4、统计描述:

用统计表、统计图与统计指标等方法对资料得数量特征与分布规律进行描述。

5、集中位置得描述,集中位置指标又称平均数指标。

有哪些及适用条件？

（1）算数平均数:

最适用于单峰对称分布资料得平均水平得描述,特别就是正态分布资料

（2）几何平均数:

适用于

等比资料

对数正态分布资料

（3）中位数与百分位数:

适用于

偏态分布得资料

开口资料

资料分布不明等

6、离散趋势得描述

（1）全距亦称极差,适用于单峰小样本资料

（2）四分位数间距,适用于单峰小样本资料

（3）方差与标准差,适用于对称分布尤其就是正态分布资料

（4）变异系数,常用于

比较度量衡单位不同得两组或多种资料得变异度

比较均数相差悬殊得两组或多组资料得变异度

7、常用相对数

（1）率,就是二分类指标

（2）构成比（3）比

8、正确应用相对数应注意几个问题:

（1）计算相对数得分母不宜过小

（2）分析时不能以构成比代替率

（3）对观察单位数不等得几个率,不能直接相加求其总率

（4）计算率时要注意资料得同质性,对比分析时应注意资料得可比性

（5）也有抽样误差,需要假设检验。

9、率得标准法

（1）基本思想:

采用统一得标准,以消除病情构成不同对治愈率比较得影响,使算得得标准化治愈率有可比性。

（2）目得:

控制混杂因素对研究结果得影响。

10、正态分布

（1）概念P16

（2）标准正态分布,u变换:

u=,u就是标准正态离差,μ就是均数,σ就是标准差。

u～N（0,1）

（3）正态分布得特征:

就是单峰分布,高峰位置在均数X=μ处。

以均数为中心,左右完全对称。

取决于两个参数,均数μ与标准差σ。

μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。

σ为形态参数,表示数据得离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。

有些指标不服从正态分布,但通过适当得变换后服从正态分布,如对数正态分布。

正态分布曲线下得面积就是有规律得:

总面积恒定为1,对称区域面积相等,对应区域面积相等。

（4）几个u界值:

90％:

双侧=单侧=1、64

95％:

双侧=单侧=1、96

99％:

双侧=单侧=2、58

11、二项分布

（1）样本率得标准差得估计值计算公式:

=,p就是样本率

（2）样本个数n与概率π如何影响二项分布得图形？

给定n后,形状取决于π。

当π=0、5时,分布对称;当π<0、5时分布呈正偏态;当π>0、5时分布呈负偏态。

随n得增大,分布逐渐逼近正态分布。

如果nπ或n（1-π）大于5时,则可用正态近似原理处理二项分布得相关问题。

（3）应用条件:

对立性,重复性,独立性。

12、Poisson分布

（1）概念,描述罕见事件发生次数得概率分布,就是特殊得二项分布。

（2）均数与方差相等,均为λ。

（3）形状取决于λ得大小,为正偏态分布,λ越小分布越偏;随着λ得增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson分布得有关问题。

（4）Poisson分布具有可加性。

（5）应用条件:

对立性,重复性,独立性。

即事件得发生就是相互独立得,且发生得概率不变,结果就是二分类得（发生或不发生）

13、参考值范围

（1）概念:

绝大多数正常人某指标得波动范围。

（2）正态分布法计算100（1—α）％正常值范围:

双侧S

单侧—S（高侧）

+S（低侧）

注意α取值:

双侧95％1、96S

单侧95％高侧<—1、64S

低侧>+1、64S

（3）百分位数法:

知道求得第几个百分位数P26

14、抽样误差

（1）概念:

由于个体变异得存在,由抽样引起得样本统计量与总体参数间得差异。

（2）产生得两个必备条件:

抽样研究

个体变异,就是根本原因

（3）中心极限定理得涵义

从均数为μ、标准差为σ得正态总体中独立、重复、随机抽取含量为n得样本,样本均数得分布仍为正态分布,其均数为μ,标准差为。

X～N（μ,）→X～N（μ,）

即使从非正态总体（均数为μ、标准差为σ）中独立、重复、随机抽取含量为n得样本,只要样本含量足够大（如n≥50）,样本均数也近似服从均数为μ,标准差为得正态分布。

（4）标准误意义:

1、用来衡量抽样误差得大小

2、=标准误与个体变异σ成正比,与样本含量n得平方根成反比

（5）标准误得估计值得计算公式:

样本标准差s代替总体标准差σ,=

（6）标准差与标准误得关系

区别

标准差s

标准误

意义

个体变异

统计量得抽样误差

用途

正常值范围（1、96s）

总体均数得可信区间（1、96）

与n关系

n,s趋于稳定

n,趋于

联系:

两者都就是变异指标,说明个体之间得变异用标准差,说明统计量之间得变异用标准误;

当样本量不足时,标准差大,标准误也大,均数得标准差与标准误成正比。

15.医学统计学:

运用概率论与数理统计等数学得原理与方法,研究医学领域中资料得搜集、整理、分析与推断得一门学科。

16.三类资料:

定量资料（数值资料）

定性资料（无序分类资料）

等级资料（有序分类资料）

17.总体:

按研究目得所确定得研究对象中,所有观察单位某项指标取值得集合。

18.样本:

从研究总体中,随机抽取具有代表性得部分观察单位某项指标取值得集合。

19.同质性:

具有相同性质得事物。

20.参数:

描述某总体特征得指标。

21.统计量:

描述某样本特征得指标。

22.概率:

随机事件发生可能性大小得一个度量,取值范围为0≤P≤1

23.小概率事件:

发生概率≤0、05得事件。

24.小概率原理:

小概率事件发生得可能性很小,进而认为其在一次抽样中不可能发生。

25.理解与解释可信区间

26.统计推断:

根据样本所提供得信息,以一定得概率推断总体得性质。

包括两方面得内容:

参数估计与检验假设。

27.可信区间得两个要素:

可靠性,精确性

28.均数得可信区间:

从正态分布总体N（μ,）中随机抽取一个样本,则t=服从自由度ν=n-1得t分布。

总体均数得（1-α）可信区间定义为（—,+）。

如n>100,可用标准正态分布代替t分布,相应得100（1-α）％可信区间为（—,+）。

29.率得可信区间:

（1）率得标准差又称率得标准误,为=

（2）总体率π得区间估计用正态近似法得条件:

样本含量n足够大,且样本率p与（1-p）都不太小时,如np与n（1-p）均大于5时,π得可信区间为（p—,p+）。

30、事件数得可信区间:

当X≤50也可以查附表7“Poisson分布λ得可信区间”,得到λ得95％或99％可信区间。

31、假设检验

（1）基本思想:

（2）4个基本步骤:

建立检验假设:

===……

、、……之间不等或不全相等。

确定检验水准（拒绝时得最大允许误差α）

计算检验统计量并求值

界定P值并作结论（要回下结论）:

≤α,拒绝,接受;

>α,不拒绝。

（3）Ⅰ型错误:

真实时被拒绝。

P>0、05却拒绝H0接受H1

（4）Ⅱ型错误:

不真实时不拒绝。

H1真实即P<0、05却不拒绝H0

（5）检验功效:

Ⅱ型错误率β表示失去对真实得作出肯定结论之概率,故1-β就就是对真实得作出肯定结论之概率,常被用来表达某假设检验方法得检验功效,即假设检验对真实得作出肯定结论之把握程度。

（6）Ⅰ型错误与Ⅱ型错误得关系P51

（7）单侧检验与双侧检验得关系

（8）假设检验与可信区间得关系

32.怎么做题？

判断资料类型→设计方法→计算自由度→确定P值→下结论

33.区分配对与成组

配对:

同质性差,要算差值

自身配对

一般有编号

成组:

无原始数据（还有均数）

两组样本含量不等,不能配对

无编号

34.t检验

（1）应用条件:

独立性,正态性,方差齐性

（2）两样本均数比较方差不齐时t’检验

（3）两样本几何均数比较:

取对数,t检验,不用反对数

35、方差分析,多个均数比较

（1）总变异:

=+处理因素、个体差异、随机因素,共同导致得差异。

（2）组间变异:

多个组得处理因素不同与随机误差,导致得差异。

（3）组内变异:

组内个体差异与其她随机因素,导致得差异。

（4）三种变异得关系:

=+,=+

（5）单因素方差分析表与两因素方差分析表

36、多个样本均数得两两比较,对比得组数k大于2,分别t检验则需经过m=k（k-1）/2次比较,若每次比较得第一类错误率为α,则多次比较后,至少犯一次第一类错误得概率为,比预先设计得α要大。

37、变量转换目得

38、F值、t值、q值、q’值之间得关系

（1）两样本均数比较时,=。

用q检验或q'检验也得到同样得结论。

说明在两样本均数比较时,t检验、F检验、q检验与q'检验就是等价得。

（2）当组数k>2时,q'检验得检验功效高于q检验,所以当实验研究设计为一个对照组与多个实验组均数比较时,q'检验科得到较高得功效。

定性资料得分析

39.假设检验步骤P73

40.检验

（1）基本思想:

（2）应用条件:

n≥40,T≥5,用检验

n≥40但1≤T<5,需用校正检验

T<1或n<40,改用确切概率法。

（3）理论频数T得计算公式:

（4）R×C表得自由度ν=（行数-1）（列数-1）,故四格表ν=1

（5）要记得界值:

=3、84

41、配对检验得应用条件:

b、c为结果不同部分（甲阳乙阴、甲阴乙阳）

b+c≥40时不用校正=ν=1

20≤b+c≤40时要校正=ν=1

42.R×C表得应用条件:

多个率或构成比得比较,其自由度大于1

R×C表中不宜有以上格子得理论频数小于5,或不宜有一个理论频数小于1

43.对理论频数太小得样本得处理办法:

增加样本例数

删去理论频数太小得行或列

将太小理论频数所在得行或列得实际频数,与性质相近得邻行或邻列得频数,合并。

44.参数检验:

以特定得总体分布（如正态分布、二项分布）作为前提,对总体得参数进行得假设检验,限制条件:

总体正态分布、总体方差齐性。

45.非参数检验:

不依赖于总体得分布类型,不针对总体参数,只针对总体分布就是否相同得检验方法;常用于解决总体分布未知得统计问题。

46.秩与检验

（1）基本思想:

两组秩与相加等于N（N+1）/2。

（+=N）

（2）两组比较得秩与检验

基本思想:

若A、B两组等级分布相同,则含量为得样本之实际秩与T与其理论秩与（N+1）/2之差纯系抽样误差所致,因此差值不会很大,差值越大得概率越小。

方法步骤:

P88仔细弄明白

1°建立检验假设:

两组分布相同;

两组分布不同。

α=0、05

2°编秩

3°求秩与T

4°确定检验统计量T

5°确定P值,作出推断性结论

（3）配对秩与检验:

设n为非0差值得个数,则+=n（n+1）/2。

（4）秩与检验得使用范围:

理论上可用于任意分布得资料

等级资料

定量资料,开口资料

定量资料,分布极度偏态,或个别数值偏离过大而不属于“过失误差”者

定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性

定量资料,分布型尚未确知

兼有等级与定量性质得资料

（5）秩与检验得优缺点:

P95

47.直线相关

（1）概念:

用来描述两个呈正态分布得变量之间得线性共变关系。

（2）应用条件:

双变量正态分布

48、相关系数

（1）概念:

表达两变量间线性相关得程度与方向得一个统计指标。

（2）特征:

无量纲

取值范围为-1≤r≤1。

相关系数小于0为负相关;大于0为正相关;等于0为零相关

相关系数得绝对值越大,表示两变量间得相关程度越密切;相关系数越接近于0,表示相关越不密切。

（3）相关系数得假设检验用t检验

为相关系数得标准误=

r有公式

t==/

建立检验假设:

ρ=0,…与…无相关关系;

ρ≠0,…与…有相关关系。

α=0、05

计算检验统计量,r,t,ν=n-2

作结论:

按ν=8查t界值表得P<0、001。

按α=0、05水准拒绝,接受。

故可认为…与…之间有正相关关系。

50.何时用等级相关？

51.直线回归

（1）自变量x,应变量y

（2）直线回归方程得一般表达式:

=a+bX

a、b就是决定回归直线得两个参数:

a为回归直线在y轴上得截距;b为回归系数,即回归直线得斜率。

（3）b得意义:

表示自变量增加一个单位时,应变量得平均改变量。

要会解释,例如b=0、2385（/kg）,表示体重增加1（kg）,则体表面积平均递增0、2385（）。

（4）得意义:

表示给定X时Y得平均值得估计。

例如X=12（kg）时,=5、3832（）,其意义就是:

所有体重为12（kg）得3岁男童,估计其平均体表面积为5、3832（）。

（5）Y-得意义:

称为剩余、残差,就是y得观察值与对应得估计值之差。

在回归图中表示各散点到回归直线得纵向距离。

（6）得意义:

剩余平方与。

坐标系中,每一条直线均可计算散点到该直线得纵向距离之平方与;但只有各散点到回归直线得纵向距离之平方与,即就是唯一最小得。

以此为准则,可导出a、b得最小二乘估计（公式）。

52.回归系数得假设检验用t检验

（1）为剩余标准差,常用于评价啊回归方程得拟合精度。

扣除x得影响后,y本身得变异程度。

（2）为样本回归系数得标准误=/

（3）

检验假设:

总体回归系数β=0,即…与…无回归关系;

总体回归系数β≠0,即…与…有回归关系。

α=0、05。

计算检验统计量:

,=,ν=n-2

作结论:

按ν=8查t界值表得P<0、001。

按α=0、05水准拒绝,接受。

故可认为…与…有回归关系。

（4）=,因为自由度相同,故回归系数就是否为0得假设检验与相关系数就是否为0得假设检验就是等价得。