临床医学科研中的常用统计方法-.ppt
《临床医学科研中的常用统计方法-.ppt》由会员分享,可在线阅读,更多相关《临床医学科研中的常用统计方法-.ppt(40页珍藏版)》请在冰豆网上搜索。
临床医学科研中的常用统计方法临床医学科研中的常用统计方法南华大学公共卫生学院南华大学公共卫生学院吴成秋吴成秋变量类型及处理变量类型及处理统计统计方法选择的思路方法选择的思路主主要要内内容容科研数据的考察科研数据的考察数据的统计描述方法数据的统计描述方法统计学检验方法的选择统计学检验方法的选择医学统计应用典型错误医学统计应用典型错误统计方法应用实例分析统计方法应用实例分析
(一)判断资料的类型?
(一)判断资料的类型?
(二)判断资料的分布?
(二)判断资料的分布?
(三)计量正态分布资料方差齐性否?
(三)计量正态分布资料方差齐性否?
(四)研究设计的类型?
(四)研究设计的类型?
(五)单变量、多变量?
(五)单变量、多变量?
(六)分析目的?
(六)分析目的?
一、统计分析方法选择的思路一、统计分析方法选择的思路返回目录返回目录vv总体:
总体:
总体:
总体:
任何一种研究都有特定的研究对象,根据研究目任何一种研究都有特定的研究对象,根据研究目任何一种研究都有特定的研究对象,根据研究目任何一种研究都有特定的研究对象,根据研究目的确定的同质全部研究对象称作总体的确定的同质全部研究对象称作总体的确定的同质全部研究对象称作总体的确定的同质全部研究对象称作总体vv样本:
样本:
样本:
样本:
根据随机化的原则从总体中抽出的有代表性的一根据随机化的原则从总体中抽出的有代表性的一根据随机化的原则从总体中抽出的有代表性的一根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集称作样本部分观察单位组成的子集称作样本部分观察单位组成的子集称作样本部分观察单位组成的子集称作样本vv同质与变异:
同质与变异:
同质与变异:
同质与变异:
一个总体中有多个个体,具有一些共同的一个总体中有多个个体,具有一些共同的一个总体中有多个个体,具有一些共同的一个总体中有多个个体,具有一些共同的特征(即同质),同时也具有一定的差异(即变异)特征(即同质),同时也具有一定的差异(即变异)特征(即同质),同时也具有一定的差异(即变异)特征(即同质),同时也具有一定的差异(即变异)vv变量:
变量:
变量:
变量:
表达总体中个体的特性的指标称为变量,变量的表达总体中个体的特性的指标称为变量,变量的表达总体中个体的特性的指标称为变量,变量的表达总体中个体的特性的指标称为变量,变量的取值称为变量值,统计学中的变量通常是指随机变量。
取值称为变量值,统计学中的变量通常是指随机变量。
取值称为变量值,统计学中的变量通常是指随机变量。
取值称为变量值,统计学中的变量通常是指随机变量。
变量可分为定量变量和定性变量两种变量可分为定量变量和定性变量两种变量可分为定量变量和定性变量两种变量可分为定量变量和定性变量两种二、变量类型及处理二、变量类型及处理
(一)定量变量
(一)定量变量
(一)定量变量
(一)定量变量11、定量变量、定量变量、定量变量、定量变量(数值变量数值变量数值变量数值变量):
是对每个观察对象的是对每个观察对象的是对每个观察对象的是对每个观察对象的观察指标用定量方法测定其数值大小,一般有度观察指标用定量方法测定其数值大小,一般有度观察指标用定量方法测定其数值大小,一般有度观察指标用定量方法测定其数值大小,一般有度量衡单位。
由定量变量构成的资料称为量衡单位。
由定量变量构成的资料称为量衡单位。
由定量变量构成的资料称为量衡单位。
由定量变量构成的资料称为计量资料计量资料计量资料计量资料(数值变量资料数值变量资料数值变量资料数值变量资料)22、分类:
、分类:
、分类:
、分类:
分为离散型变量和连续型变量分为离散型变量和连续型变量分为离散型变量和连续型变量分为离散型变量和连续型变量v离散型变量只能取整数值,离散型变量只能取整数值,离散型变量只能取整数值,离散型变量只能取整数值,v连续型变量可以取实数值上任何数值连续型变量可以取实数值上任何数值连续型变量可以取实数值上任何数值连续型变量可以取实数值上任何数值二、变量类型及处理二、变量类型及处理
(二)定性变量
(二)定性变量
(二)定性变量
(二)定性变量定性变量(分类变量资料):
定性变量(分类变量资料):
定性变量(分类变量资料):
定性变量(分类变量资料):
分为无序分类变量和有分为无序分类变量和有分为无序分类变量和有分为无序分类变量和有序分类变量(或等级变量)。
是将观察单位的观察指标序分类变量(或等级变量)。
是将观察单位的观察指标序分类变量(或等级变量)。
是将观察单位的观察指标序分类变量(或等级变量)。
是将观察单位的观察指标按性质或类别分组,然后分组汇总各组观察单位数而得按性质或类别分组,然后分组汇总各组观察单位数而得按性质或类别分组,然后分组汇总各组观察单位数而得按性质或类别分组,然后分组汇总各组观察单位数而得到的资料。
到的资料。
到的资料。
到的资料。
v无序分类变量资料:
无序分类变量资料:
无序分类变量资料:
无序分类变量资料:
若各类别之间无量的差别,汇若各类别之间无量的差别,汇若各类别之间无量的差别,汇若各类别之间无量的差别,汇总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称计数资料计数资料计数资料计数资料v有序分类变量资料:
有序分类变量资料:
有序分类变量资料:
有序分类变量资料:
若各类别之间有量的差别,汇若各类别之间有量的差别,汇若各类别之间有量的差别,汇若各类别之间有量的差别,汇总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称总各类别的观察单位数而得到的资料,则称等级资料等级资料等级资料等级资料二、变量类型及处理二、变量类型及处理(三)变量的处理(三)变量的处理1、变量类型的转化:
、变量类型的转化:
一种类型的变量可转化为一种类型的变量可转化为另一种类型的变量。
但只能由高级向低级转化,另一种类型的变量。
但只能由高级向低级转化,即按照连续型、有序、无序、二分类变量的顺即按照连续型、有序、无序、二分类变量的顺序转化,不能作相反方向的转化。
离散型变量序转化,不能作相反方向的转化。
离散型变量通过适当的变换或连续性校正后借用连续型变通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。
量或有序变量的方法来分析。
二、变量类型及处理二、变量类型及处理(三)变量的处理(三)变量的处理2、分类变量的代码:
、分类变量的代码:
输入计算机进行统输入计算机进行统计分析表示:
如性别(男计分析表示:
如性别(男/女)、疾病女)、疾病(有(有/无)、结局(存活无)、结局(存活/死亡)等二分类死亡)等二分类变量,采用代码变量,采用代码0、1表示,对于多分类变表示,对于多分类变量,可以采用代码量,可以采用代码1、2、3、4、5来表来表示各个类别示各个类别二、变量类型及处理二、变量类型及处理33、哑变量的设置:
、哑变量的设置:
、哑变量的设置:
、哑变量的设置:
进行定量分析时,对于有进行定量分析时,对于有进行定量分析时,对于有进行定量分析时,对于有gg类的多类的多类的多类的多分类变量,需要用分类变量,需要用分类变量,需要用分类变量,需要用gg-1-1个取值为个取值为个取值为个取值为00或或或或11的哑变量来完整地的哑变量来完整地的哑变量来完整地的哑变量来完整地表达这些类别。
表达这些类别。
表达这些类别。
表达这些类别。
如治疗原发性高血压有中医、西医及中西医结合三如治疗原发性高血压有中医、西医及中西医结合三如治疗原发性高血压有中医、西医及中西医结合三如治疗原发性高血压有中医、西医及中西医结合三种不同的治疗方法,可用两个哑变量种不同的治疗方法,可用两个哑变量种不同的治疗方法,可用两个哑变量种不同的治疗方法,可用两个哑变量XX11、XX22表示,赋表示,赋表示,赋表示,赋值方法为:
值方法为:
值方法为:
值方法为:
XX11=(1=(1西医法,西医法,西医法,西医法,00其他其他其他其他),XX22=(1=(1中西医结中西医结中西医结中西医结合法,合法,合法,合法,00其他其他其他其他),即,即,即,即:
(XX11=0=0、XX22=0)=0)表示中医法表示中医法表示中医法表示中医法(XX11=1=1、XX22=0)=0)表示西医法表示西医法表示西医法表示西医法(XX11=0=0、XX22=1)=1)表示中西医结合法表示中西医结合法表示中西医结合法表示中西医结合法二、变量类型及处理二、变量类型及处理返回目录返回目录1、资料类型的考察、资料类型的考察v若每个观察单位都有一个数值,而无若每个观察单位都有一个数值,而无论这个数值是具有度量衡单位,还是没论这个数值是具有度量衡单位,还是没有度量衡单位的资料都是定量资料;有度量衡单位的资料都是定量资料;v若每个观察单位只有属性或类别之若每个观察单位只有属性或类别之分,而没有数值的资料都是定性资料。
分,而没有数值的资料都是定性资料。
三、三、科研数据考察科研数据考察1、资料类型的考察、资料类型的考察如:
中性粒细胞分类计数的百分比,若是以如:
中性粒细胞分类计数的百分比,若是以白细胞为观察单位,则每个白细胞没有相应白细胞为观察单位,则每个白细胞没有相应数值而只有不同的类别,此时应判为定性资数值而只有不同的类别,此时应判为定性资料;若是以人为观察单位,则每个人有一个料;若是以人为观察单位,则每个人有一个相应数值(中性粒细胞的百分比),故此时相应数值(中性粒细胞的百分比),故此时应判为定量资料。
应判为定量资料。
三、三、科研数据考察科研数据考察注意:
注意:
v有些临床科研工作者,常人为地将定量的结果转有些临床科研工作者,常人为地将定量的结果转有些临床科研工作者,常人为地将定量的结果转有些临床科研工作者,常人为地将定量的结果转化为分类变量的临床指标,然后进行统计分析。
化为分类变量的临床指标,然后进行统计分析。
化为分类变量的临床指标,然后进行统计分析。
化为分类变量的临床指标,然后进行统计分析。
v定量资料提供的信息量最为充分,可进行统计分定量资料提供的信息量最为充分,可进行统计分定量资料提供的信息量最为充分,可进行统计分定量资料提供的信息量最为充分,可进行统计分析的手段也较为丰富、经典和可靠;定性资料在这析的手段也较为丰富、经典和可靠;定性资料在这析的手段也较为丰富、经典和可靠;定性资料在这析的手段也较为丰富、经典和可靠;定性资料在这些方面都不如定量资料。
因此,在临床实验中要尽些方面都不如定量资料。
因此,在临床实验中要尽些方面都不如定量资料。
因此,在临床实验中要尽些方面都不如定量资料。
因此,在临床实验中要尽可能选择量化的指标反映实验效应,只有确实无法可能选择量化的指标反映实验效应,只有确实无法可能选择量化的指标反映实验效应,只有确实无法可能选择量化的指标反映实验效应,只有确实无法定量时,才选用分类数据,通常不宜将定量数据转定量时,才选用分类数据,通常不宜将定量数据转定量时,才选用分类数据,通常不宜将定量数据转定量时,才选用分类数据,通常不宜将定量数据转变成分类数据。
变成分类数据。
变成分类数据。
变成分类数据。
三、三、科研数据考察科研数据考察注意:
注意:
如:
研究者将患者的血红蛋白含量用如:
研究者将患者的血红蛋白含量用正常、正常、轻、中、重度贫血来表示,这样虽然照顾了轻、中、重度贫血来表示,这样虽然照顾了临床工作的习惯,却减少了资料所提供的信临床工作的习惯,却减少了资料所提供的信息量。
息量。
三、三、科研数据考察科研数据考察2、离群数据的处理、离群数据的处理v离群数据:
离群数据:
个别数据与群体数据严重偏离时个别数据与群体数据严重偏离时被称为离群数据或极端数据,离群数据可能是被称为离群数据或极端数据,离群数据可能是错误数据错误数据v局外值与局内值:
局外值与局内值:
某些奇异数据与其他数据某些奇异数据与其他数据不是属于同一总体,称为不是属于同一总体,称为局外值局外值;某些数据虽;某些数据虽与其他数据相差较远,若仍属同一总体,这样与其他数据相差较远