医学统计学总结.docx

上传人:b****8 文档编号:11480650 上传时间:2023-03-01 格式:DOCX 页数:15 大小:128.93KB
下载 相关 举报
医学统计学总结.docx_第1页
第1页 / 共15页
医学统计学总结.docx_第2页
第2页 / 共15页
医学统计学总结.docx_第3页
第3页 / 共15页
医学统计学总结.docx_第4页
第4页 / 共15页
医学统计学总结.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

医学统计学总结.docx

《医学统计学总结.docx》由会员分享,可在线阅读,更多相关《医学统计学总结.docx(15页珍藏版)》请在冰豆网上搜索。

医学统计学总结.docx

医学统计学总结

医学统计学总结

(基础部分)

一、医学统计学基础

(一)基本概念

同质与变异总体与样本参数与统计量

变量与数据类型概率误差

1.由变异(variation)衍生出的术语:

变量variable方差variance

方差分析、变异数分析(ANOVAanalysisofvariance)

多反应变量multivariate

2.变量:

数值变量(顺序变量、连续性变量、定量变量)

名义变量(定性变量、无序分类变量)

等级变量(有序分类变量)

3.资料类型:

定量资料/定性资料

计数资料/计量资料

连续型资料/离散型资料。

4.统计步骤:

(1)统计设计;

(2)搜集资料;

(3)整理资料;

(4)分析资料

(二)统计描述:

1.定量资料的统计描述:

平均数(均数,中位数,几何均数)

指标

意义

应用场合

平均数

均数

平均水平

对称分布,特别是正态分布或近似正态分布资料

几何均数

平均增(减)倍数

对数正态分布资料

中位数

排序后位次居中的观察值水平

偏态分布;分布不明;分布末端无确定值

变异度

极差(全距)

个体差异范围

说明传染病,食物中毒等的最短、最长潜伏期等

四分位数间距

个体变异程度

偏态分布、分布不明、分布末端无确定值资料的离散程度

方差/标准差

个体变异程度

描述正态分布或近似正态分布资料的离散程度

变异系数

相对变异程度

比较度量衡单位不同或单位相同但均数相差悬殊的多组资料的变异度

2.理解:

标准差与标准误的区别与联系

3.定性资料的统计描述:

相对数(率,构成比,比),一些常用率的应用:

发病率与患病率死亡率与病死率、因病死亡率等

标准化法

动态数列

4.统计图表:

统计图(线图,半对数线图,直条图,直方图,百分条图,圆图,散点图,统计地图,箱式图)

图形

适用资料

做图方法

条图

组间数量对比

用直条高度表示数量大小

直方图

定量资料的分布

用直条的面积表示各组段的频数或频率

百分条图

构成比

用直条分段的长度表示全体中各部分的构成比

饼图

构成比

用圆饼的扇形面积表示全体中各部分的构成比

线图

定量资料数值变动

线条位于横、纵坐标均为算术尺度的坐标系

半对数线图

定量资料发展速度

线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系

散点图

双变量间的关联

点的密集程度和形成的趋势,表示两现象间的相关关系

箱式图

定量资料取值范围

用箱体、线条标志四分位数间距及中位数、全距的位置

茎叶图

定量资料的分布

用茎表示组段的设置情形,叶片为个体值,叶长为频数

5.

几个分布

正态分布

适用资料

连续性对称分布

表达方式

N(μ,σ)

分布特点

1.以均数为中心,左右对称;

2.两个参数:

总体均数与标准差;

3.正态曲线下面积

估计公式

一般了解

统计应用

应用范围广,如参考值范围、统计推断等

标准正态

适用资料

连续性对称分布

分布

表达方式

N(0,1)

分布特点

1.以0或为中心,左右对称

2.总体均数为0,标准差为1

3.曲线下面积:

u界值表

估计公式

一般了解

统计应用

应用范围广,如参考值范围、统计推断等

二项分布

适用资料

两分类独立重复资料

表达方式

B(n,π)

分布特点

1.概率之和等于1;

2.二项分布的图形;

3.n∞B正态分布;

4.二项分布的均数与标准差

估计公式

了解会用:

最少/最多发生的概率

统计应用

样本率与总体率的比较

两样本率的比较

Poisson分布

适用资料

稀有事件的概率分布

二项分布的特例

表达方式

P(μ)或P(λ)

分布特点

1.分布图形;

2.均数等于标准差;

3.n∞Poisson分布正态分布;

4.Poisson分布可加性

估计公式

了解会用:

最少/最多发生的概率

统计应用

样本与总体均数比较

两样本均数的比较

(三)统计推断:

1.抽样误差、标准误

2.t分布特点:

①以0为中心左右对称的单峰分布;

②自由度越小,曲线越扁平,自由度越大曲线越尖峭;

③自由度∞,t分布曲线趋近与标准正态分布曲线。

3.参数估计:

用样本统计量推断总体参数——均数、率

①区间估计:

置信区间或可信区间

②理解:

参考值范围与可信区间的区别

4.假设检验原理

5.假设检验步骤:

①建立假设确定检验水准;

②计算检验统计量;

③确定P值,作出推断结论。

6.两型错误:

①第一类错误α;

②第二类错误β,1-β为检验效能。

二、比较分析

(一)定量资料

1.数据类型:

(1)单样本均数——t检验

(2)两样本均数(配对设计,完全随机设计)——t检验

(3)多样本均数(完全随机设计,区组设计)——方差分析

(4)两两比较、多重比较、事后检验

——LSD法、Bonferoni法、SNK法……

2.前提条件:

正态分布,方差齐,数据独立

3.不满足前提条件:

变量变换、非参数检验

(二)定性资料

1.二项分布与POISSON分布(见上)

2.列联表的卡方检验

普通四格表

应用范围

两个率的对比;两个二分类变量关联性分析

专用公式

Pearsonχ2(略)

适用条件

⏹n≥40且Tmin≥5

⏹当n≥40,但有1≤T<5时,校正公式

⏹当n<40,或T<1,或P≈α时,用Fisher精确概率法

配对四格表

应用范围

两种方法检出率是否有差别

专用公式

McNemar检验(略)

适用条件

⏹b+c≥40

⏹b+c<40用校正公式

⏹b+c<25确切概率法

行×列表

应用范围

多个率,多个构成的差别,两个多分类变量关联性分析

专用公式

(略)

适用条件

1≤T<5的格子数不宜超过总格子数的1/5,且T>1

⏹增大样本含量;

⏹合理合并;

⏹删除理论频数太小的行或列;

⏹精确概率法

3.注意对于“有序(等级)”行×列表的辨析处理

(三)非参数检验

1.非参数检验的概念

2.非参数检验的优缺点:

①适用范围广;

②受限条件少;

③具有稳健性。

对符合参数检验条件的资料,若采用非参数检验会导致检验效能下降。

3.非参数检验的分析步骤:

(1)编排秩次;

(2)求秩和与统计量;

(3)确定P值,作出推断。

4.秩和检验方法要点及注意事项

检验方法

方法要点

注意事项

配对设计差值比较的符号秩检验

(Wilcoxon配对法)

1.按差值绝对值从小到大编秩;2.任取正的秩和或负的秩和作为检验统计量T;3.T界值表确定P值。

当n>50,可用u(z)检验。

有差值的绝对值相等取其平均秩次。

遇差值为“0”删除或取平均秩次。

成组设计两样本比较的秩和检验

(Wilcoxon两样本法)

1.将两组数据由小到大统一编秩

2.以样本例数较小者为n1,其秩和为T

3.查T界值表确定P值。

2.若n1>10或n2-n1>10时,使用u检验。

编秩中如遇有相同数据应取其平均秩次;.若相同秩次较多时(>25%),尤其等级资料分析,需使用校正公式。

成组设计多个样本比较的秩和检验

(Kruskal-Wallis法)

1.先将k组数据由小到大统一编秩,求出各组秩和,计算检验统计量

;2.若组数k=3,每组例数n≤5,查

界值表;3.若k>3或最小样本例数大于5,则查卡方界值表

编秩时若相同数据取其平均秩次。

若相同秩次较多时,需使用校正公式。

随机区组设计资料的秩和检验

(Friedman法)

1.先在每一区组内将数据从小到大编秩,求出各处理组秩和;2.计算检验统计量

;3.根据区组数

与处理组数

,查M界值表或

编秩时如有相同数据,取平均秩次。

三、关联性分析

(一)回归分析重点

1.直线回归的概念:

回归方程与回归系数

2.回归分析的一般步骤

(1)散点图:

观察是否有线性趋势及是否有异常点;

(2)最小二乘法求解回归系数与截距与回归方程;

⏹回归方程

⏹回归系数及其统计意义

(3)统计推断

⏹参数估计:

⏹回归系数的置信估计

条件均数的容许区间

⏹条件均数的置信区间

⏹假设检验:

⏹回归方程的假设检验——方差分析

⏹回归系数的假设检验——t检验

⏹拟合效果的假设检验——拟合优度检验(R2)

(4)统计应用

⏹统计预测:

XY

⏹统计控制:

YX

3.假设检验

(1)平方和划分——方差分析的基本思想

(2)方差分析:

回归方程的检验

(3)t检验:

回归系数的检验(在简单回归中t2=F)

4.决定系数——反映拟合优度的统计量(R2=SS回归/SS总)

5.了解前提条件:

线性、独立、正态、等方差(LINE)

(二)相关分析重点(Pearson相关与Spearman秩相关)

1.Pearson相关:

适用于双随机变量正态分布资料

2.相关系数概念:

密切程度与相关方向

3.相关系数的取值范围:

-1≤r≤1

4.相关系数的假设检验:

t检验与r检验

5.Spearman秩相关:

⏹数据不服从正态分布;

⏹分布型未知;

⏹等级资料或有不确定值。

6.理解:

回归与相关的区别与联系——四同六不同

●四联系:

①理论基础;②符号;

③假设检验;④回归解释相关

●六不同:

①资料要求;②应用目的;

③指标意义;④计算;

⑤取值范围;⑥单位

(三)多重回归重点

1.多重回归方程与偏回归系数、标准化回归系数的概念

2.假设检验

(1)方差分析:

回归方程的假设检验

(2)t检验:

偏回归系数的假设检验

(3)拟合优度检验:

决定系数与调整的决定系数(假设检验等价于方差分析)

(4)偏回归平方和:

回归系数与模型筛选的假设检验

3.模型筛选方法:

(1)常用评价准则:

调整决定系数、AIC准则、Cp统计量等

(2)模型筛选方法:

全局择优法与局部择优法(前进法、后退法、逐步法)

四、统计设计

(一)调查设计/观察性研究设计

1.观察性研究设计的意义与特点

(1)研究/分析因素是客观存在的;

(2)不能用随机分配方法平衡混杂因素的影响。

2.观察性研究方法

研究范围:

普查和非全面调查

非全面调查指包括:

1重点调查;

2典型调查;

3抽样调查。

据研究时间可分为:

1横断面调查:

也称现况调查;

2纵向研究。

3.观察性研究设计的内容:

1明确具体的调查目的,选择客观、准确的研究指标;

2确定调查对象和观察单位,估计观察单位数;

3明确调查方法,选择调查方式;

4确定调查项目,设计调查表;

5明确调查的组织计划。

整理分析计划主要考虑:

资料核查、数据库设计、录入、检查及资料分组和组织计划等。

4.基本的抽样方法:

⏹单纯随机抽样

⏹系统抽样

⏹整群抽样

⏹分层抽样。

5.估计样本含量时应考虑:

(1)容许误差δ;

(2)Ⅰ型错误α的大小;

⏹(3)变异程度σ。

(二)实验研究设计

1.特点:

1处理因素是由研究者据研究目的设置的;

2受试对象接受何种处理与水平由随机分配决定,是一种高效的研究方法。

2.实验研究按照受试对象不同分为动物实验和临床试验。

3.实验研究的基本要素:

包括处理因素、受试对象和实验效应三部分。

4.实验设计的基本原则:

⏹对照(control)

⏹重复(replication)

⏹随机化(randomization)

5.常见的实验研究设计类型:

完全随机设计(completelyrandomdesign)、随机区组设计(randomizedblockdesign)、交叉设计(crossoverdesign)、析因设计(factorialdesign)、重复测量设计、正交设计(orthogonaldesign)

6.实验研究中估计样本含量应考虑:

①检验水准即I型错误的概率(α);单侧或双侧检验。

②检验效能1-β;

③变异程度(σ)大小;

④容许误差δ;

(三)临床试验设计

1.临床试验以人为受试对象,分治疗型临床试验、预防型临床试验和保健型临床试验。

2.新药临床试验是临床试验中最常见的一种,Ⅰ期、Ⅱ期、Ⅲ期和Ⅳ期临床试验设计。

五、统计分析策略(参考自宇传化主编《SPSS与统计分析》电子工业出版社)

(一)单变量定量资料分析

(二)单变量定性资料分析

(三)双变量资料分析

(张岩波整理)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1