医学统计学重点.docx

上传人:b****7 文档编号:25578676 上传时间:2023-06-09 格式:DOCX 页数:15 大小:29.46KB
下载 相关 举报
医学统计学重点.docx_第1页
第1页 / 共15页
医学统计学重点.docx_第2页
第2页 / 共15页
医学统计学重点.docx_第3页
第3页 / 共15页
医学统计学重点.docx_第4页
第4页 / 共15页
医学统计学重点.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

医学统计学重点.docx

《医学统计学重点.docx》由会员分享,可在线阅读,更多相关《医学统计学重点.docx(15页珍藏版)》请在冰豆网上搜索。

医学统计学重点.docx

医学统计学重点

1、变异:

同质事物之间得差别。

2、频数分布得两个特征:

集中位置,离散趋势

3、数据分布得类型:

对称分布与非对称分布。

非对称分布又称偏态分布,包括正偏态与负偏态。

单峰分布,双峰分布,多峰分布。

4、统计描述:

用统计表、统计图与统计指标等方法对资料得数量特征与分布规律进行描述。

5、集中位置得描述,集中位置指标又称平均数指标。

有哪些及适用条件?

(1)算数平均数:

最适用于单峰对称分布资料得平均水平得描述,特别就是正态分布资料

(2)几何平均数:

适用于

等比资料

对数正态分布资料

(3)中位数与百分位数:

适用于

偏态分布得资料

开口资料

资料分布不明等

6、离散趋势得描述

(1)全距亦称极差,适用于单峰小样本资料

(2)四分位数间距,适用于单峰小样本资料

(3)方差与标准差,适用于对称分布尤其就是正态分布资料

(4)变异系数,常用于

比较度量衡单位不同得两组或多种资料得变异度

比较均数相差悬殊得两组或多组资料得变异度

7、常用相对数

(1)率,就是二分类指标

(2)构成比(3)比

8、正确应用相对数应注意几个问题:

(1)计算相对数得分母不宜过小

(2)分析时不能以构成比代替率

(3)对观察单位数不等得几个率,不能直接相加求其总率

(4)计算率时要注意资料得同质性,对比分析时应注意资料得可比性

(5)也有抽样误差,需要假设检验。

9、率得标准法

(1)基本思想:

采用统一得标准,以消除病情构成不同对治愈率比较得影响,使算得得标准化治愈率有可比性。

(2)目得:

控制混杂因素对研究结果得影响。

10、正态分布

(1)概念P16

(2)标准正态分布,u变换:

u=,u就是标准正态离差,μ就是均数,σ就是标准差。

u~N(0,1)

(3)正态分布得特征:

就是单峰分布,高峰位置在均数X=μ处。

以均数为中心,左右完全对称。

取决于两个参数,均数μ与标准差σ。

μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。

σ为形态参数,表示数据得离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。

有些指标不服从正态分布,但通过适当得变换后服从正态分布,如对数正态分布。

正态分布曲线下得面积就是有规律得:

总面积恒定为1,对称区域面积相等,对应区域面积相等。

(4)几个u界值:

90%:

双侧=单侧=1、64

95%:

双侧=单侧=1、96

99%:

双侧=单侧=2、58

11、二项分布

(1)样本率得标准差得估计值计算公式:

=,p就是样本率

(2)样本个数n与概率π如何影响二项分布得图形?

给定n后,形状取决于π。

当π=0、5时,分布对称;当π<0、5时分布呈正偏态;当π>0、5时分布呈负偏态。

随n得增大,分布逐渐逼近正态分布。

如果nπ或n(1-π)大于5时,则可用正态近似原理处理二项分布得相关问题。

(3)应用条件:

对立性,重复性,独立性。

12、Poisson分布

(1)概念,描述罕见事件发生次数得概率分布,就是特殊得二项分布。

(2)均数与方差相等,均为λ。

(3)形状取决于λ得大小,为正偏态分布,λ越小分布越偏;随着λ得增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson分布得有关问题。

(4)Poisson分布具有可加性。

(5)应用条件:

对立性,重复性,独立性。

即事件得发生就是相互独立得,且发生得概率不变,结果就是二分类得(发生或不发生)

13、参考值范围

(1)概念:

绝大多数正常人某指标得波动范围。

(2)正态分布法计算100(1—α)%正常值范围:

双侧S

单侧—S(高侧)

+S(低侧)

注意α取值:

双侧95%1、96S

单侧95%高侧<—1、64S

低侧>+1、64S

(3)百分位数法:

知道求得第几个百分位数P26

14、抽样误差

(1)概念:

由于个体变异得存在,由抽样引起得样本统计量与总体参数间得差异。

(2)产生得两个必备条件:

抽样研究

个体变异,就是根本原因

(3)中心极限定理得涵义

从均数为μ、标准差为σ得正态总体中独立、重复、随机抽取含量为n得样本,样本均数得分布仍为正态分布,其均数为μ,标准差为。

X~N(μ,)→X~N(μ,)

即使从非正态总体(均数为μ、标准差为σ)中独立、重复、随机抽取含量为n得样本,只要样本含量足够大(如n≥50),样本均数也近似服从均数为μ,标准差为得正态分布。

(4)标准误意义:

1、用来衡量抽样误差得大小

2、=标准误与个体变异σ成正比,与样本含量n得平方根成反比

(5)标准误得估计值得计算公式:

样本标准差s代替总体标准差σ,=

(6)标准差与标准误得关系

区别

标准差s

标准误

意义

个体变异

统计量得抽样误差

用途

正常值范围(1、96s)

总体均数得可信区间(1、96)

与n关系

n,s趋于稳定

n,趋于

联系:

两者都就是变异指标,说明个体之间得变异用标准差,说明统计量之间得变异用标准误;

当样本量不足时,标准差大,标准误也大,均数得标准差与标准误成正比。

=

15.医学统计学:

运用概率论与数理统计等数学得原理与方法,研究医学领域中资料得搜集、整理、分析与推断得一门学科。

16.三类资料:

定量资料(数值资料)

定性资料(无序分类资料)

等级资料(有序分类资料)

17.总体:

按研究目得所确定得研究对象中,所有观察单位某项指标取值得集合。

18.样本:

从研究总体中,随机抽取具有代表性得部分观察单位某项指标取值得集合。

19.同质性:

具有相同性质得事物。

20.参数:

描述某总体特征得指标。

21.统计量:

描述某样本特征得指标。

22.概率:

随机事件发生可能性大小得一个度量,取值范围为0≤P≤1

23.小概率事件:

发生概率≤0、05得事件。

24.小概率原理:

小概率事件发生得可能性很小,进而认为其在一次抽样中不可能发生。

25.理解与解释可信区间

26.统计推断:

根据样本所提供得信息,以一定得概率推断总体得性质。

包括两方面得内容:

参数估计与检验假设。

27.可信区间得两个要素:

可靠性,精确性

28.均数得可信区间:

从正态分布总体N(μ,)中随机抽取一个样本,则t=服从自由度ν=n-1得t分布。

总体均数得(1-α)可信区间定义为(—,+)。

如n>100,可用标准正态分布代替t分布,相应得100(1-α)%可信区间为(—,+)。

29.率得可信区间:

(1)率得标准差又称率得标准误,为=

(2)总体率π得区间估计用正态近似法得条件:

样本含量n足够大,且样本率p与(1-p)都不太小时,如np与n(1-p)均大于5时,π得可信区间为(p—,p+)。

30、事件数得可信区间:

当X≤50也可以查附表7“Poisson分布λ得可信区间”,得到λ得95%或99%可信区间。

31、假设检验

(1)基本思想:

(2)4个基本步骤:

建立检验假设:

:

===……

:

、、……之间不等或不全相等。

确定检验水准(拒绝时得最大允许误差α)

计算检验统计量并求值

界定P值并作结论(要回下结论):

≤α,拒绝,接受;

>α,不拒绝。

(3)Ⅰ型错误:

真实时被拒绝。

P>0、05却拒绝H0接受H1

(4)Ⅱ型错误:

不真实时不拒绝。

H1真实即P<0、05却不拒绝H0

(5)检验功效:

Ⅱ型错误率β表示失去对真实得作出肯定结论之概率,故1-β就就是对真实得作出肯定结论之概率,常被用来表达某假设检验方法得检验功效,即假设检验对真实得作出肯定结论之把握程度。

(6)Ⅰ型错误与Ⅱ型错误得关系P51

(7)单侧检验与双侧检验得关系

(8)假设检验与可信区间得关系

32.怎么做题?

判断资料类型→设计方法→计算自由度→确定P值→下结论

33.区分配对与成组

配对:

同质性差,要算差值

自身配对

一般有编号

成组:

无原始数据(还有均数)

两组样本含量不等,不能配对

无编号

34.t检验

(1)应用条件:

独立性,正态性,方差齐性

(2)两样本均数比较方差不齐时t’检验

(3)两样本几何均数比较:

取对数,t检验,不用反对数

35、方差分析,多个均数比较

(1)总变异:

=+处理因素、个体差异、随机因素,共同导致得差异。

(2)组间变异:

多个组得处理因素不同与随机误差,导致得差异。

(3)组内变异:

组内个体差异与其她随机因素,导致得差异。

(4)三种变异得关系:

=+,=+

/

(5)单因素方差分析表与两因素方差分析表

36、多个样本均数得两两比较,对比得组数k大于2,分别t检验则需经过m=k(k-1)/2次比较,若每次比较得第一类错误率为α,则多次比较后,至少犯一次第一类错误得概率为,比预先设计得α要大。

37、变量转换目得

38、F值、t值、q值、q’值之间得关系

(1)两样本均数比较时,=。

用q检验或q'检验也得到同样得结论。

说明在两样本均数比较时,t检验、F检验、q检验与q'检验就是等价得。

(2)当组数k>2时,q'检验得检验功效高于q检验,所以当实验研究设计为一个对照组与多个实验组均数比较时,q'检验科得到较高得功效。

定性资料得分析

39.假设检验步骤P73

40.检验

(1)基本思想:

(2)应用条件:

n≥40,T≥5,用检验

n≥40但1≤T<5,需用校正检验

T<1或n<40,改用确切概率法。

(3)理论频数T得计算公式:

=

(4)R×C表得自由度ν=(行数-1)(列数-1),故四格表ν=1

(5)要记得界值:

=3、84

41、配对检验得应用条件:

b、c为结果不同部分(甲阳乙阴、甲阴乙阳)

b+c≥40时不用校正=ν=1

20≤b+c≤40时要校正=ν=1

42.R×C表得应用条件:

多个率或构成比得比较,其自由度大于1

R×C表中不宜有以上格子得理论频数小于5,或不宜有一个理论频数小于1

43.对理论频数太小得样本得处理办法:

增加样本例数

删去理论频数太小得行或列

将太小理论频数所在得行或列得实际频数,与性质相近得邻行或邻列得频数,合并。

44.参数检验:

以特定得总体分布(如正态分布、二项分布)作为前提,对总体得参数进行得假设检验,限制条件:

总体正态分布、总体方差齐性。

45.非参数检验:

不依赖于总体得分布类型,不针对总体参数,只针对总体分布就是否相同得检验方法;常用于解决总体分布未知得统计问题。

46.秩与检验

(1)基本思想:

两组秩与相加等于N(N+1)/2。

(+=N)

(2)两组比较得秩与检验

基本思想:

若A、B两组等级分布相同,则含量为得样本之实际秩与T与其理论秩与(N+1)/2之差纯系抽样误差所致,因此差值不会很大,差值越大得概率越小。

方法步骤:

P88仔细弄明白

1°建立检验假设:

:

两组分布相同;

:

两组分布不同。

α=0、05

2°编秩

3°求秩与T

4°确定检验统计量T

5°确定P值,作出推断性结论

(3)配对秩与检验:

设n为非0差值得个数,则+=n(n+1)/2。

(4)秩与检验得使用范围:

理论上可用于任意分布得资料

等级资料

定量资料,开口资料

定量资料,分布极度偏态,或个别数值偏离过大而不属于“过失误差”者

定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性

定量资料,分布型尚未确知

兼有等级与定量性质得资料

(5)秩与检验得优缺点:

P95

47.直线相关

(1)概念:

用来描述两个呈正态分布得变量之间得线性共变关系。

(2)应用条件:

双变量正态分布

48、相关系数

(1)概念:

表达两变量间线性相关得程度与方向得一个统计指标。

(2)特征:

无量纲

取值范围为-1≤r≤1。

相关系数小于0为负相关;大于0为正相关;等于0为零相关

相关系数得绝对值越大,表示两变量间得相关程度越密切;相关系数越接近于0,表示相关越不密切。

(3)相关系数得假设检验用t检验

为相关系数得标准误=

r有公式

t==/

建立检验假设:

:

ρ=0,…与…无相关关系;

:

ρ≠0,…与…有相关关系。

α=0、05

计算检验统计量,r,t,ν=n-2

作结论:

按ν=8查t界值表得P<0、001。

按α=0、05水准拒绝,接受。

故可认为…与…之间有正相关关系。

50.何时用等级相关?

51.直线回归

(1)自变量x,应变量y

(2)直线回归方程得一般表达式:

=a+bX

a、b就是决定回归直线得两个参数:

a为回归直线在y轴上得截距;b为回归系数,即回归直线得斜率。

(3)b得意义:

表示自变量增加一个单位时,应变量得平均改变量。

要会解释,例如b=0、2385(/kg),表示体重增加1(kg),则体表面积平均递增0、2385()。

(4)得意义:

表示给定X时Y得平均值得估计。

例如X=12(kg)时,=5、3832(),其意义就是:

所有体重为12(kg)得3岁男童,估计其平均体表面积为5、3832()。

(5)Y-得意义:

称为剩余、残差,就是y得观察值与对应得估计值之差。

在回归图中表示各散点到回归直线得纵向距离。

=0

(6)得意义:

剩余平方与。

坐标系中,每一条直线均可计算散点到该直线得纵向距离之平方与;但只有各散点到回归直线得纵向距离之平方与,即就是唯一最小得。

以此为准则,可导出a、b得最小二乘估计(公式)。

52.回归系数得假设检验用t检验

(1)为剩余标准差,常用于评价啊回归方程得拟合精度。

扣除x得影响后,y本身得变异程度。

==

(2)为样本回归系数得标准误=/

(3)

检验假设:

:

总体回归系数β=0,即…与…无回归关系;

:

总体回归系数β≠0,即…与…有回归关系。

α=0、05。

计算检验统计量:

,=,ν=n-2

作结论:

按ν=8查t界值表得P<0、001。

按α=0、05水准拒绝,接受。

故可认为…与…有回归关系。

(4)=,因为自由度相同,故回归系数就是否为0得假设检验与相关系数就是否为0得假设检验就是等价得。

相关系数得假设检验更简单。

53.应变量总变异得分解

=+

=+

=+;=n-1;=1;=n-2

54.回归方程得方差分析要会填表P125

==,即在直线相关与回归分析中,相关系数得t检验、回归系数得t检验、回归方程得方差分析就是等价得。

55.直线回归与直线相关得区别及联系

(1)区别

对资料得要求:

回归只要求应变量y就是随机变量且服从正态分布,变量x有两种:

精确测量与严格控制得变量(Ⅰ型回归)、随机变量(Ⅱ型回归)。

相关:

x、y均为随机变量且服从双变量正态分布

应用:

回归反映两变量间得依存关系;相关反映两变量间得相互关系。

计量单位:

r没有单位;b得单位就是:

y单位/x单位

(2)联系

正负符号:

在同一资料,r与b得正负符号相同。

假设检验:

在同一资料,r与b得假设检验等价。

换算关系:

P132

56.回归分析应用条件:

线性、独立、正态、等方差

57.研究设计得三要素:

研究因素、受试对象、实验效应

58.研究可分为2种性质:

前瞻性与回顾性;又可分为两类:

试验与调查。

所以,研究设计得形式组合有4种。

59.试验研究与调查研究得区别:

(1)研究条件

(2)观察对象

(3)例数

60、研究设计得基本原则:

对照、随机、重复。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1