常用医学统计分析方法.ppt
《常用医学统计分析方法.ppt》由会员分享,可在线阅读,更多相关《常用医学统计分析方法.ppt(66页珍藏版)》请在冰豆网上搜索。
常用医学统计学方法胸外四病区叶曼内容提要内容提要为什么要学统计学为什么要学统计学?
统计学统计学(statistics)从数据中提取信息的一门学科从数据中提取信息的一门学科医学统计学(医学统计学(medicalstatistics)用统计学的原理和方法研究医学中的问题用统计学的原理和方法研究医学中的问题什么是医学统计学什么是医学统计学?
4医学统计工作的内容医学统计工作的内容1.1.科研设计:
科研设计:
包括调查设计、实验设计包括调查设计、实验设计2.2.收集资料:
收集资料:
取得准确可靠的原始资料取得准确可靠的原始资料3.3.整理资料:
整理资料:
对资料进行清理、改错,数对资料进行清理、改错,数量化量化4.4.分析资料:
分析资料:
统计描述、统计推断统计描述、统计推断1.1.采用统计学方法,发现不确定现采用统计学方法,发现不确定现象背后隐藏的规律。
象背后隐藏的规律。
为什么要学统计学为什么要学统计学?
2.2.用统计学思维方式考虑有关医学研用统计学思维方式考虑有关医学研究中的问题究中的问题“阳性阳性”结果能否说明干预有效?
结果能否说明干预有效?
某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒,能否说该感冒药十分有效?
药十分有效?
(时间效应)(时间效应)“阴性阴性”结果是否说明干预无效?
结果是否说明干预无效?
样本含量是否足够?
(吸烟与肺癌的相关性)样本含量是否足够?
(吸烟与肺癌的相关性)干预时间是否足够?
(心理护理与心理健康)干预时间是否足够?
(心理护理与心理健康)为什么要学习统计学为什么要学习统计学?
3.3.保证你的论文能通过统计学审查保证你的论文能通过统计学审查中中华华医医学学会会杂杂志志对对来来稿稿都都有有统统计计学学要要求或统计学指导。
求或统计学指导。
科学的科研设计科学的科研设计正确的统计分析正确的统计分析准确的结论推断准确的结论推断为什么要学习统计学为什么要学习统计学?
4.4.获得循证医学证据的主要手段获得循证医学证据的主要手段“以以证证据据为为基基础础的的医医学学”(evidence-basedmedicine,EBM)需需要要运运用用最最好好的的统计学证据统计学证据可靠可靠“证据证据”:
随机对照试验:
随机对照试验为什么要学习统计学为什么要学习统计学?
1.1.了解了解医学统计学的基本概念医学统计学的基本概念2.2.掌握掌握医学统计数据的分类医学统计数据的分类3.3.掌握掌握统计学分析方法的选择统计学分析方法的选择4.4.了解了解SPSSSPSS统计学软件的使用统计学软件的使用10变量及变量值变量及变量值总体与样本总体与样本populationandsample总体总体:
根据研究目的:
根据研究目的确定的确定的同质同质研究对象研究对象的的全体全体(集合)。
(集合)。
样本样本:
从总体中随机:
从总体中随机抽取的部分研究对象抽取的部分研究对象随机抽样随机抽样randomsampling为了保证样本的为了保证样本的可靠可靠性性和和代表性代表性,需要采,需要采用随机的方法抽取样用随机的方法抽取样本(在总体中每个个本(在总体中每个个体具有体具有相同的机会相同的机会被被抽到)。
抽到)。
13随机抽样的方法:
随机抽样的方法:
抽签法:
编号、抽签抽签法:
编号、抽签机械抽样法:
又称等间隔抽样,按比例分配机械抽样法:
又称等间隔抽样,按比例分配分层抽样法:
先分层,每层内按比例抽样分层抽样法:
先分层,每层内按比例抽样随机数字:
随机数字表、软件产生随机数字随机数字:
随机数字表、软件产生随机数字14研究研究目的目的总体总体湘雅二医院湘雅二医院20201111年全体住院年全体住院患者满意度得分值患者满意度得分值观测单位观测单位每个住院患者每个住院患者观测值观测值每个住院患者满意度得分每个住院患者满意度得分了解了解湘雅二医院湘雅二医院20201111年全体年全体住院患者满意度情况住院患者满意度情况样本样本从湘雅二医院从湘雅二医院2011年全体住院患者年全体住院患者中随机抽取中随机抽取1000人测得满意度得分人测得满意度得分样本的实际发生率样本的实际发生率称为称为频率频率。
设在相。
设在相同条件下,独立重复进行同条件下,独立重复进行nn次试验,事件次试验,事件AA出现出现ff次,则事件次,则事件AA出现的频率为出现的频率为ff/nn。
概率概率:
随机事件发生的可能性大小:
随机事件发生的可能性大小,用大写的用大写的PP表示;取值表示;取值00,11。
频率频率与概率与概率frequencyandprobabilityfrequencyandprobability频率与概率间的关系:
频率与概率间的关系:
1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动2.样本含量样本含量n越大,波动幅度越小,越大,波动幅度越小,频率越接近概率。
频率越接近概率。
必然事件必然事件PP=1=1随机事件随机事件00PP11不可能事件不可能事件PP=0=0PP0.050.05(55)或)或PP0.010.01(11)称为称为小小概率事件概率事件(习惯习惯),统计学上认为不大可能发生。
,统计学上认为不大可能发生。
小概率事件小概率事件CertainCertainImpossibleImpossible0.5011.不能以构成比代率不能以构成比代率表表已婚育龄妇女不同情况下放环失败率的比较已婚育龄妇女不同情况下放环失败率的比较表表口腔门诊龋齿患者年龄构成口腔门诊龋齿患者年龄构成例例如如某某医医师师对对口口腔腔门门诊诊不不同同年年龄龄龋龋齿齿患患病病情情况况进进行行了了分分析析,得得出出4049岁岁组组患患病病率率高高,09岁岁组组和和70岁及以上组患病率低的错误结论。
岁及以上组患病率低的错误结论。
如果例数较少会使相对数波动较大。
如某种如果例数较少会使相对数波动较大。
如某种疗法治疗疗法治疗5例病人例病人5例全部治愈,则计算治愈率例全部治愈,则计算治愈率为为5/5100%=100%,若若4例治愈,则治愈率为例治愈,则治愈率为4/5100%=80%,由由100%至至80%波动幅度较波动幅度较大,但实际上只有大,但实际上只有1例的变化。
例的变化。
2.计算相对数分母不宜太小计算相对数分母不宜太小3.正确计算合计率正确计算合计率例如用某疗法治疗肝炎,甲医院治疗例如用某疗法治疗肝炎,甲医院治疗150人,治人,治愈愈30人,治愈率为人,治愈率为20%;乙医院治疗;乙医院治疗100人,治人,治愈愈30人,治愈率为人,治愈率为30%。
两个医院合计治愈率应。
两个医院合计治愈率应该是该是(30+30)/(150+100)100%=24%。
4.注意资料的可比性注意资料的可比性
(1)观观察察对对象象是是否否同同质质,研研究究方方法法是是否否相相同同,观观察察时时间间是是否否相相等等,以以及及地地区区、周周围围环环境境、风风俗俗习惯和经济条件是否一致或相近等。
习惯和经济条件是否一致或相近等。
(2)观观察察对对象象内内部部结结构构是是否否相相同同,若若两两组组资资料料的的年年龄龄、性性别别等等构构成成不不同同,可可以以分分别别进进行行同同年年龄龄别别、同同性性别别的的小小组组率率比比较较或或对对总总率率(合合计计率率)进行标准化后再作比较。
进行标准化后再作比较。
24问:
流脑的预防工作问:
流脑的预防工作1990年不如年不如1985年吗?
年吗?
案例案例25统计资料的类型统计资料的类型根据变量值的性质可将资料分为根据变量值的性质可将资料分为:
计量资料、计数资料、等级资料计量资料、计数资料、等级资料261.1.计量资料计量资料-数值变量资料数值变量资料定义定义:
用用定量定量的方法对观察单位准确测量后的方法对观察单位准确测量后所得的资料所得的资料。
特点特点:
有有度量衡单位度量衡单位,多为,多为连续性资料连续性资料。
连续数据:
连续数据:
例:
身高、体重、年龄、体温、血压离散数据:
离散数据:
例:
心率、白细胞计数、24小时早博次数27定义:
定义:
用用定性定性的方法得到的资料。
将全体的方法得到的资料。
将全体观测单位按照某种性质或特征分组,然观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数后再分别清点各组观察单位的个数。
特点:
特点:
没有度量衡单位没有度量衡单位;多为;多为间断性资料间断性资料。
2.2.计数资料计数资料-分类变量资料分类变量资料28两分类数据两分类数据(binarydata):
例:
男例:
男/女;怀孕女;怀孕/未怀孕;糖尿病未怀孕;糖尿病/非糖尿病非糖尿病;吸烟吸烟/不吸烟;高血压不吸烟;高血压/血压正常血压正常多分类数据多分类数据(polytomousdata):
名义数据名义数据(nominal):
已婚已婚/单身单身/离婚离婚/分居分居/鳏鳏寡;寡;A/B/AB/O有序数据有序数据(ordinalcategories):
轻轻/中中/重;治重;治愈、好转、无效愈、好转、无效;29定义:
定义:
将观察单位按某种属性的不同程度将观察单位按某种属性的不同程度分成分成等级等级后分组计数所得的资料,后分组计数所得的资料,是介于计量资料和计数资料之间的是介于计量资料和计数资料之间的一种资料。
一种资料。
特点:
特点:
其变量值具有其变量值具有半定量半定量性质,表现为性质,表现为等级大小等级大小或或属性程度属性程度。
3.3.等级资料等级资料三类数据间的相互转化三类数据间的相互转化例:
一组例:
一组2040岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常(为界分为正常(00)与异常()与异常(11)两组,)两组,统计每组例数统计每组例数8低血压低血压1188正常血压正常血压221212轻度高血压轻度高血压331515中度高血压中度高血压441717重度高血压重度高血压55计量数据计量数据等等级级数数据据计数数据计数数据31三类数据间的相互转化三类数据间的相互转化住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.555无无中学中学顺产顺产足月足月20256532025653222216016074.074.055无无小学小学助产助产足月足月20258302025830252515815868.068.066管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.055无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.022无无小学小学顺产顺产早产早产20258342025834202015815866.066.044无无中学中学助产助产早产早产20194642019464242415815870.570.533无无中学中学助产助产足月足月20257832025783292915415457.057.077干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitativedataQuantitativedata计量资料计量资料QualitativedataQualitativedata计数资料计数资料怎样选择统计学方法?
三三类数据类数据的统计分析的统计分析1.1.计量数据计量数据:
计算计算均数均数、标准差标准差等(可等(可采用采用tt、FF检验等检验等)2.2.计数数据计数数据:
编码是任意的,不能对编码执行均编码是任意的,不能对编码执行均数标准差等计算,但可计算数标准差等计算,但可计算率或比率或比(可采用卡方可采用卡方检验等检验等)3.等级数据:
允许基于顺序的计算,如计算等级数据:
允许基于顺序的计算,如