ImageVerifierCode 换一换
格式:DOCX , 页数:20 ,大小:214.42KB ,
资源ID:28088579      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/28088579.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(医学统计知识点整理.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

医学统计知识点整理.docx

1、医学统计知识点整理医学统计学知识点整理第一节统计学中根本概念一、同质与变异同质:统计研究中,给观察单位规定一些一样的因素情况。如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。变异:同质的根底上个体间的差异。“同质是相对的,是客观事物在特定条件下的相对一致性,而“变异如此是绝对的二、总体与样本1、总体:是根据研究目的所确定的,同质观察对象个体所构成的全体。2、样本:是从总体中随机抽取的局部观察单位变量值的集合。三、参数与统计量总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。. 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S

2、.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验四、误差:实测值与真值之差1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。3.非系统误差:过失误差,可以防止或去除。五、概率是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值01。统计上一般将PP0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。第二节统计资料的类型变量:确定总体之后,研究者应对每个观察单位的某项特征进

3、展观察或测量,这种特征能表现观察单位的变异性,称为变量。一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高cm、体重(kg)、血红蛋白g等。二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进展分组计数,分组汇总各组观察单位后得到的资料。分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为连续性资料【例题单项选择】某地A、B、O、AB血型人数分布的数据资料是( ) 【答案】C【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照

4、变量的血型分类,血型表现为互不相容的属性。所以此题选C。【例题单项选择】测量正常人的脉搏数所得的变量是A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。此题选C。三、有序分类变量资料半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。特点:每一个观察单位没有确切值,各组之间有性质上的差异或程度上的不同举例:- + + +第三节统计工作的根本步骤1.统计设计2.收集资料3.整理资料4.分析资料:统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料

5、的数量特征与分布规律。统计推断:是使用样本信息来推断总体特征。统计推断包括区间估计和假设检验。第四节统计表与统计图一、统计表统计表的根本结构与要求标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。标目:横标目和纵标目。线条:通常采用三线表和四线表的形式。没有竖线或斜线。数字:表内数字一律用阿拉伯数字。同一指标,小数位数应一致,位次对齐。无数字用“表示。暂缺用“表示。“0为确切值。备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*等标出。一X统计表的备注不宜太多。二、制表原如此重点突出,一个表一个中心内容主谓清楚,层次清楚简单明了,一切文字

6、数字线条尽量从简【例题单项选择】统计表内不列的项是( ) 2010.7A.标目 B.线条 C.数字 【答案】D【解析】统计表内备注位于表的下面,不列在统计表内,所以此题选择D。三、统计图1.1标题2标目3刻度4图例:不同颜色或者不同线条表示,需要说明。2.常用统计图的适用条件与要求1条图:适用于比拟、分析独立的或离散变量的多个组或多个类别的统计指标。2圆图和百分比条图:构成比的比拟3线图:描述某统计量随另一连续性数值变量变化而变化的趋势。4直方图:数值变量的频数分布。5散点图:用点的密集程度和趋势描述2个变量间的数量关系6箱式图:多组数据分布的比拟7统计地图:用不同的颜色和花纹表示统计量的在地

7、理分布上的变化,适宜描述研究指标的地理分布。【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_图。【答案】线图数值变量资料的统计分析第一节数值变量资料的统计描述一、频数分布表1.编制步骤(1)计算全距2确定组距3划分组段3统计频数4确定频率与累计频率2.频数分布表的主要用途:1 揭示资料的分布类型 2观察资料的集中趋势和离散趋势3 便于发现某些特大或特小离群值 4便于进一步计算统计指标和作统计处理二、集中趋势指标数值变量资料的集中趋势指标是用平均数来描述的,代表一组同质变量值的平均水平。常用的有算术均数、几何均数和中位数。1.算数均数适用于对称分布正态分布或者近似对称分布的资料。习惯上以

8、表示总体均数,以表示样本均数。2.几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价与抗体滴度,某些传染病的潜伏期、细菌计数等,宜用几何均数G。几何均数常用于等比资料或对数正态分布资料。3.中位数是指将一组变量值从小到大排列,位次居中的观察值就是中位数。适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。4.百分位数是一种位置指标,以Px表示,把一组数据从小到大排列后,理论上有x%的变量比Px小,有100-x% 的变量值比Px大。【例题单项选择】描述正态分布资料集中趋势的指标是A.中位数 B.几何均数C.算术平均数 D.标准差【答案】C【

9、解析】算数均数适用于对称分布或者近似对称分布的资料。几何均数常用于等比资料或对数正态分布资料。中位数适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据的离散趋势指标。所以此题选择C。三、离散趋势指标1.极差和四分位数间距极差:简记为R,亦称全距,即一组变量值中最大值与最小值之差,反响变量值的离散X围。四分位数间距Q:一般和中位数一起描述偏态分布资料的分布离散趋势。3.方差和标准差:方差表示样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。标准差是方差的正平方根。用途:1用于表示正态或近似正态分布资料的离散度; 2反映均

10、数的代表性 标准差越小,数据离散程度越小,均数的代表性越好。 (3)确定医学参考值X围 95%医学参考值X围3.变异系数CV适用条件:观察指标单位不同,如身高、体重同单位资料,但均数相差悬殊四、正态分布与参考值X围的制定一正态分布1.概念:也称高斯分布,是医学和生物学最常见、最重要的一种连续性分布。2.特征:(1)在直角坐标的横轴上方呈钟型曲线,两端与X轴永不相交,且以X=为对称轴左右完全对称(2)在x=处,f(X)取最大值 (3)正态分布有两个参数,即均数和标准差。均数描述了正态分布的集中趋势位置,假如固定,改变值,曲线沿着X轴平行移动,其形状不变,故称为位置参数。标准差描述了正态分布的离散

11、程度,假如固定,越小,曲线越陡峭;反之,越大,曲线越平坦故称为形状参数或离散度参数。(4)正态曲线下的面积分布有一定的规律。4.正态曲线下面积的分布规律二医学参考值X围的制定医学参考值:是指绝大多数正常人的人体形态、功能和代谢产物等各种生理与生化指标常数,也称正常值。第二节数值变量资料的统计推断一、均数的抽样误差与标准误抽样误差:由于个体变异和抽样造成的样本统计量与总体参数和样本统计量之间的差异。均数的抽样误差:由于抽样造成的样本均数与总体均数和样本均数间的差异。标准误:样本均数的标准差,用来表示。未知二、t分布t分布曲线以0为中心,t分布为一簇单峰分布曲线,不同,曲线形状不同t分布与有关,越

12、小, t值越分散,t分布的峰部越低,而两侧尾部翘得越高t界值表中一侧尾部面积称单侧概率 () 两侧尾部面积之和称双侧概率(/2)如:在一样自由度时,t 值增大,减小在一样 时,单尾 对应的t值比双尾 的小三、总体均数的区间估计统计描述统计分析参数估计-用样本指标估计总体指标统计推断假设检验总体均数置信区间可信区间的计算区间估计:是按预先给定的概率(1-)所确定的包含未知总体参数的一个X围。(一)小样本或 未知-按 t 分布二1. - u分布2. 未知,但大样本(n60 )-按u 分布四、假设检验的意义和根本步骤假设检验:先对总体的参数或分布做出某种假设,再用适当的统计方法根据样本对总体提供的信

13、息,推断此假设应当拒绝或不拒绝。根本步骤:1、建立检验假设,确定检验水准(1)H0:无效假设=0(2)H1:备择假设 0 ,0 或 0 (3)确定检验水准2.选定检验方法,计算检验统计量3.确定P值,作出推断结论第三节均数的t检验与u检验t 检验应用条件:样本与总体/两样本均数的比拟当n60时,要求样本取自正态分布的总体,总体标准差未知;两小样本均数比拟时,要求两样本总体方差相等12= 22。n含量较大,u分布一、单样本t检验适用于样本均数代表的未知总体均数和总体均数0的比拟。=n-1二、配对样本t检验适用于配对设计的计量资料,常见的配对设计主要有以下情形:自身比拟:同一受试对象处理前后。同一

14、受试对象分别承受两种不同的处理。将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。前提条件:d变量服从正态分布【例题单项选择】作配对样本t检验的前提条件是( ) 【答案】C【解析】配对样本t检验样本可以是自身配对,也可以异体配对,所以数据可以独立,也可以不独立。它处理的是两样本的差值,所以差值要服从正态分布才可以应用配对样本t检验,所以此题答案选C。三、两样本t检验适用条件:完全随机设计的两样本均数的比拟。比拟两样本所代表的总体均数1和2 是否相等。完全随机设计是将受试对象完全随机分配到两个不同处理组。要求:独立、正态、方差齐性四、两样本u检验完全随机设计的两样本均数的比拟

15、。适用于样本量比拟大的资料n160且n260五、假设检验应注意的问题1、假设检验应有严格的抽样设计-同质2、要注意选用的假设检验方法的应用条件3、正确区分差异有无统计意义与有无专业上的实际意义4、结论不能绝对化5、假设检验的单侧检验与双侧检验的选择假设检验的两类错误第类错误:拒绝实际上成立的H0,犯第类错误的概率大小为。第类错误:不拒绝实际上不成立的H0,犯第类错误的概率为。当样本含量n一定时,越小,越大;假如想同时减少和,只有增大样本含量。1-称为假设检验的成效 当所研究的总体与H0确有差异时,按检验水准能够发现它(拒绝H0)的概率。分类变量资料的统计分析第一节分类变量资料的统计描述一、常用

16、相对数率:说明某现象发生的频率或强度。构成比:说明某一事物内部各组成局部所占的比重或分布。相比照:说明一个指标是另一个指标的几倍或百分之几。【例题单项选择】某医院住院病人中有15的胃癌患者,该15是A.患病率 B.发病率C.构成比 D.相比照【答案】C【解析】15的胃癌患者指的是胃癌患者占住院病人的15%,所以是构成比。【例题填空】构成比是说明_或分布指标。率是说明_或强度的指标。【答案】比重;频率二、应用相对数时应注意的问题简答题1.计算相对数时,观察单位数应足够多2.分析时不能以构成比代替率3.相对数的相互比拟应注意可比性,不具有可比性应进展标准化4.样本率或构成比的比拟应做假设检验第二节

17、分类变量资料的统计推断一、率的抽样误差与标准误二、总体率的区间估计1.查表法:当n较小,如n50,特别是p接近与0或1时小概率事件,按二项分布原如此估计总体率的可信区间。2.区间估计 正态近似法:当样本含量n足够大,样本率p或1-p均不太小时如np和n(1-p)均大于5,样本率的分布近似正态分布,总体率可信区间在1-a可信度下,估计为: Pu/2Sp三、两总体率之差的区间估计条件:当样本含量n足够大,样本率p或1-p均不太小时,即np和n(1-p)均大于5,样本率的分布近似于正态分布(p1-p2 -u/2Sp1-p2, (p1-p2 +u/2Sp1-p2)四、率的u检验一样本率与总体率比拟的u

18、检验二两样本率比拟的u检验第三节2检验一、四格表资料的2检验一四格表资料的2检验的根本思想假设两组资料率的差异来自抽样误差,用2值反映实际频数和理论频数吻合的程度。在H01=2成立的条件下,实际频数与理论频数相差不应该很大,假如实际算出的2值较大,超过了设定的检验水准,如此有理由怀疑H0的真实性,从而拒绝H0,承受H1H1:12应用:推断两个或多个总体率或构成比之间是否有差异和多个样本率间的多重比拟一、四个表资料的卡方检验四个表2检验根本公式:四个表2检验专用公式:适用条件:两样本率比拟时,总例数n40且所有格子T5二四格表资料的2检验的校正公式 或1.当n40且所有的T5时,用2检验的根本公

19、式或四格表资料2检验的专用公式;当Pa时,改用四格表资料的Fisher确切概率法。2.当n40但有1T5时,用四格表资料2检验的校正公式或改用四格表资料的Fisher确切概率法 3.当n40,或Tl时,用四格表资料的Fisher确切概率法。三四格表资料确实切概率法四格表资料的Fisher确切概率法是一种直接计算概率的方法,理论依据是超几何分布,四格表资料确实切概率法不属于2检验的X畴,常作为四格表资料假设检验的补充。二、配对四格表资料的2检验配对设计四个表卡方检验公式:假如b+c40,=1假如b+c40,=1三、行列表资料的2检验用于多个样本率的比拟,两个或多个构成比的比拟理论频数不应小于1,

20、1T5的格子数不应超过总格子数1/5多个样本率比拟,假如所得统计推断为拒绝H0,承受H1时,只能认为各总体率之间总的来说有差异,但不能说明任两个总体率之间均有差异。一般的2检验不适用于有序分类资料等级资料“等级、“程度、“优劣的比拟分析。因为检验只利用了两组构成比提供的信息,损失了有序指标包含的“等级信息。第四节秩和检验秩和检验是将定量数据从小到大、等级从弱到强或从强到弱转换成秩后,求秩和,计算检验统计量秩统计量,做出统计推断。应用:不满足t检验条件的数值变量资料有序分类变量资料等级资料分布类型不明一端或二端无确定数值任何分布类型的资料秩和检验应用中的须知事项(1)秩和检验一方面由于其方法的稳

21、健性而具备不受总体分布限制,适用X围广的优点,但另一方面,在秩转换的过程中损失了原数据的局部信息。如果计量资料满足或近似满足t检验应用条件,这时假如选秩和检验,由于没有充分利用资料提供的信息,会降低检验效能。即当Ho不真时,秩和检验将不如t检验能较灵敏的拒绝Ho,犯第2类错误的概率要比t检验大。(2)对于计量资料,假如满足正态和方差齐性条件,应选t检验对总体均数作假设检验;当资料偏离假定条件时,选用秩和检验才是可靠的。 (3)对于大样本资料,通过把原变量值或等级转换成秩后,可采用t检验方法对平均秩次进展检验。【例题填空】等级资料的比拟宜选用_检验。【答案】秩和【例题简答】秩和检验的优点【答案】

22、秩和检验适合任何分布的资料;具有较好的稳健性。第十八章直线回归和直线相关第一节直线回归用于分析两变量间依存变化的数量关系一、直线回归方程式中的X为自变量;式中的是由自变量X推算应变量Y的估计值。a是回归直线在Y 轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。a 和 b 的估计常用最小二乘法原如此所有的点离回归线的纵向距离最近;回归线必然通过求回归方程的的步骤:在普通坐标系中作散点图,看是否有直线趋势。求X、Y的离均差乘积和lxy与X、Y的离均差平方和lxx、 lyy求a和b列出回归方程: =a+bX【例题填空】直线回归是分析_间

23、数量关系的统计方法。【答案】两个变量二、总体回归系数的假设检验 t检验法判断b是否来自回归系数为0=0 的总体。三、直线回归方程的应用1.描述变量间数量关系2.统计预测3.统计控制第二节直线相关用于描述两变量间线性关联程度与相关方向,适用于双变量正态分布一、相关系数它反映具有直线关系的两个变量之间,相关密切程度与相关方向的指标。样本相关系数用r来表示,总体相关系用来表示其取值X围是-1r1。r为正表示正相关关系,x与y同向变化;r为负表示负相关关系,x与y反向变化。r的绝对值越接近1,线性关系越密切;r的绝对值越接近0,线性关系越不密切;r绝对值=1,为完全相关;r=0,为零相关。二、相关系数

24、的计算三、相关系数的假设检验总体相关系数为=n-2五、直线回归与相关应用的须知事项(1)须知事项:根据分析目的选择变量与统计方法:直线相关:两变量之间直线关系的方向与密切程度,XY无主次之分;直线回归:应变量对自变量在数值上的依存关系,一般把易于测量的作为自变量,另外根据专业知识确定。进展相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。进展相关、回归分析前应绘制散点图相关与回归的应用条件:直线相关分析一般要求X、Y服从二元正态分布,又称为双变量正态分布。结果的解释与正确应用线性关系存在不能直接解释为因果关系;直线回归用于预测时,自变量X围尽量不要外延。(2)关系:直线相关与回归既有区别又有联系。区别主要表现在:反映两个变量间数量关系的目的不同。对变量的分布要求不同。联系主要表现在:同一资料同时作相关与回归分析时,其相关系数r与回归系数b的符号一样。同一资料r和b的假设检验等价。相关与回归可以相互解释。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1