医学统计学绪论完整课件Word文件下载.docx
《医学统计学绪论完整课件Word文件下载.docx》由会员分享,可在线阅读,更多相关《医学统计学绪论完整课件Word文件下载.docx(6页珍藏版)》请在冰豆网上搜索。
是收集、整理、分析、推断、判断等认识活动的总称。
统计学(Statistics)的定义Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata(WebsterInternationalDictionary)Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults(ADictionaryofEpidemiology)统计学:
是关于数据收集、整理、表达、分析与推断的普遍原理和方法,是一门处理数据变异性的科学与艺术,其目的是求得可靠的结果。
统计学是工具学科,指导专业学科的学习和应用。
7医学统计学是应用统计学基本原理和方法(概率论和数理统计学为主)研究生物医学领域问题和现象、揭示因果和联系、探索规律的学科。
医学统计思维进化与概念统计思维的进化(发展简史)时期科学家发明与应用1749-1827Pierre-SimonLaplace研究概率(probability)。
1745-1826PhilippePinel应用概率研究疗效1787-1872Louis临床疗效,对照1822-1911FrancisGalton分布与变异时期科学家发明与应用1857-1936KarlPearson现代统计学之父相关分析,2分布1880-1949MajorGreenwood抽样误差1879-1940RaymondPearl医院统计,生物统计(1890-1962RonaldA.Fisher现代统计学奠基误差理论极大似然《实验设计》随机化做实验,F检验1897-1991Hill爵士现代临床试验(clinicaltrial)医学统计思维进化与概念医学统计思维进化与概念一些重要的临床试验★英国临床医学研究理事会(1946年):
链霉素治疗肺结核的临床试验(随机化分组、方法有链霉素加卧床休息或单纯卧床休息。
独立评价X光片子结果,链霉素组病人的生存和两方面的放射学改善都较好)医学统计思维进化与概念★★美国(1954年):
评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎的效果(干预试验、现场试验;
样本:
180万儿童;
花费:
500多万美元。
随机化分组,最后约有1/4参与者得到了随机化。
这项试验最终肯定了索尔克疫苗的效果)医学统计思维进化与概念德国(1960年代初),药物酞胺哌啶酮((Thalidomide,又称反应停)事件(曾引起一次胎儿畸形(四肢体短缺)的暴发,经过病例对照研究和干预研究发现危险因素是反应停)。
美国从这一事件促使有关法律文件的产生,,FDA为临床试验规定了一整套制度,使之成为确定药物疗效验的标准方法。
13统计方法在医学领域研究中的运用主要包括三个方面:
①以正确的方式抽样和收集数据(方法、工具)②描述资料的数量特征和分布规律,进行数据化简、统计指标的选择与计算、统计结果的表达等③分析推断并得出正确结论,对实验和观察结果存在的差异和关联作出统计推断,找出危险因素、评价效果、帮助决策。
统计工作的基本步骤科研设计((Designofstudy)专业设计和统计设计;
观察性研究和实/试性验研究资料收集((Collectionofdata)经常性和一时性;
准确、及时、完整、规范原则资料整理((Classificationofdata)系统化、条理化;
质分组和量分组资料分析((Analysisofdata)统计描述和统计推断15统计资料的类型基本概念:
变量及变量值研究者对每个研究对象的某项特征进行观察和测量,这项特征称为变量,变量的测得值叫变量值(观察值),也称为资料。
按变量的性质可将资料分为计量资料(定量数据、数值变量)和计数资料(定性数据、分类变量)。
。
计数资料包括无序分类资料(二分类、多分类)及有序分类资料(等级变量)。
161.计量资料(定量数据)定义:
通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
特点:
数值大小衡量水平高低;
通常有单位(可没有)分为连续型和离散型例如:
患者的身高(cm)、体重(kg)、血压(mmHg)脉搏(次//分)、红细胞计数(1012/L)17定义:
将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
特点:
互不相容的类别和属性,通常为间断性资料(没有程度和顺序上的差别),没有度量衡单位。
如肤色(黑、白)、血型(ABO)、职业(工、农、医)、性别(男、女)2.计数资料(定性数据)18定义:
介于计量资料和计数资料之间,通过半定量方法测量得到。
各组之间有性质上的差别,程度上的增减关系。
①癌症分期:
早、中、晚。
②药物疗效:
治愈、好转、无效、死亡。
③尿蛋白,幽门螺杆菌:
+,++,+++3.等级资料(有序分类)判断资料类型的标准:
是否按属性分类,每个观察对象是否有一个确切的值有:
计量(定量)无:
计数(定性)住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月Quantitativedata定量资料Qualitativedata定性资料变量观察单位21三类资料间关系例:
一组2040岁成年人血压(100人)以12kPa为界分为正常与异常两组,计算每组例数8低血压88正常血压12轻度高血压15中度高血压17重度高血压计量资料等级资料等级资料计数资料资料的转化(变量类型的转化)例如:
测得55人的白细胞(个/mm33)数如下:
:
300060005000800012019数值变量异常正常正常正常异常分类变量若按正常33人,异常22人分组二分类变量若按过低(11人),正常(33人),过高(11人)分组等级资料资料的转化方向:
高级向低级,高精度向低精度思考:
11、调查某地某年77岁正常男童的身高22、观察某人群脉搏数(次//分)33、观察某人群脉搏数,定义脉搏数在60次//分~100次//分为正常,60次//分或100次//分为异常,按正常与异常分别清点人数得到的资料44、小鼠染毒后细胞转化率分别为24%,63%,51%,70%,36%统计学中的基本概念
(一)同质与变异
(二)总体与样本(三)参数与统计量(四)误差(五)概率与频率
(一)同质与变异homogeneityvariation11、同质:
是指符合研究目的所确定的纳入对象和排除对象的条件组合,观察单位性质大致相同。
如:
研究儿童的生长发育,可规定对象同性别、同年龄、同地区、同民族、健康的儿童,即为同质的儿童。
22、变异:
同质研究对象某种效应指标测量值的波动性。
已知、未知、不可控制的因素造成的同质对象某变量测量结果不同。
这种个体间的差异即为变异。
同质与变异的举例例例1调查2019年重庆7岁男童的生长发育情况同质:
2019年、重庆市、7岁男童变异:
身高和体重各不相同例例2研究某降压药的疗效同质:
高血压患者、用某药治疗变异:
疗效各不相同
(二)总体与样本总体:
根据研究目的确定的同质研究对象全体,其某种变量值的集合。
分有限总体与无限总体样本:
从总体中抽取的部分观察单位,其实测值的集合。
原因:
总体无限大;
条件限制;
有伤害性样本可靠性、代表性的条件随机抽样样本含量:
足够数量构成:
样本的分布与总体的分布一致随机抽样randomsampling随机随便随机抽样方法要保证总体中每个个体具有相同的机会被抽到样本含量充足:
根据科学方法计算样本的结构分布与总体的分布特征一致例如:
欲研究重庆市77岁儿童的生长发育情况总体:
男107:
女100样本:
应该接近或近似男107:
女100RandomSelectionInferenceParameterStatisticPopulationSample(Populationmean)(Samplemean)х(三)参数与统计量parameterstatistic(三)参数与统计量parameterstatistic参数:
描述总体特征的统计指标,如总体均数、标准差,采用希腊字母分别记为、。
固定的常数总体样本抽取部分观察单位统计量参数推断inference统计量:
描述样本特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为。
是参数附近波动的随机变量(四)误差error误差:
实际测量值与客观真实值之间的差别,或者样本统计量与总体参数之间的差别。
实际观测过程中,在相同条件下,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因(4ME)造成的测定值的波动性和对真实值的偏离。
根据性质和来源分为(
(1)系统误差
(2)随机误差(11)系统误差systematicerror特