ImageVerifierCode 换一换
格式:DOCX , 页数:17 ,大小:160.96KB ,
资源ID:27241074      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/27241074.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(卫生统计学考前复习材料doc.docx)为本站会员(b****4)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

卫生统计学考前复习材料doc.docx

1、卫生统计学考前复习材料doc基本概念总体(population):根据研究li的确定同质观察单位(亦称个体)的全体。 样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。目的是为了用样 本的信息(或统计量)推断总体的特征(或参数)。同质与变异homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属 性。同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。概率(probability):是描述随机事件发生的可能性大小的数值,常用P表示,范围在0

2、与1之间。P越接近1,标明某事件发生的可能性越大;P越接近0,表明某事件发生的可能性越小;PW0.05 的事件称为小概率事件。统计资料的类型:1定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。一般有度量衡 单位。如身高、体重、浓度。2. 分类资料(enumeration data)将观察单位按某种属性或类别分组所得各组的观察单位数。(1) 二项分类:阳性、阴性。(2) 多项分类:A、B、0、AB血型。3等级资料(ranked data)将观察单位按某种属性的不同程度分组所得各组的观察单位数。如血清反应 分为一,+, + + , + + + , + +

3、 + +五级。资料可以由高级向低级转化个体的血红蛋白(g/dl)正常人数、异常人数(按正常异常分组) 等级资料:0,重度贫血6,中度贫.血 9,輕度贫血12,正常 16,增高(按血红蛋白量的多少分组)统计工作的基本步骤:1 .设计,design2 .资料收集,collection data3 .资料整理,sorting data4 .资料分析 analysis data统计描述、参数估计、假设检验、统计结论。统计表:基本要求:1 .标题概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。2. 标目文字简明,注明单位3. 线条力求间接,上而顶线、下而底线,纵标目下而、合计上而横

4、线,不需要竖线与斜线。4. 数字表内数字一律用阿拉伯数字表示,同i指标的小数位数i致,位次对其,暂缺、无数据的用“一”或“”表示。数字左端对齐C5备注如有备注,用标出,注在表外下面。统计图基本要求:1. 根据资料性质和分析目的,正确选用图形。2. 要有确切的标题,说明资料内容。标题位于图的下方。3. 纵横两轴交点为起点。纵横轴尺度应等距,纵横轴长度比例5: 7。条图、直方图的纵坐标必须从“0” 开始。4. 同一图内比较几种不同事物时,用不同的线条或颜色表示,并附图例说明。(1) 线图:适用于表现连续变量资料的趋势变化(2) 直方图:以面积表示数量,适用于表示连续变量的频数分布。画直方图组距一定

5、要相等。(3) 直条图:用等宽直条的长短来表示相互独立的各指标指数数值的大小。(4) 构成图:圆图:各扇形面积表示全体中各部分所占的比重。百分条图:全长为100%,按构成比分段。定量资料的统计描述频数表:即频数分布表,是对样本量较大的资料进行统计描述的常用方法,通过频数表可以现实数据分 布的范围与形态。编著频数表时组距可等可不等,一般取相等组距;分组数与样本量有关,应适宜,不多也不少。一、集中趋势的指标,平均数是用于描述一组同质计量资料的集中趋势或反应一组观察值的平均水平。 常用的平均数有算术均数、儿何均数及中位数三种。1算术均数,简称均数。X表示变量X的样本均数,u (希腊字母)表示总体均数

6、,均数适用于对称 分布资料,正态或近似正态分布资料。_ X1 + X2+ + X直接法:样本量较小时用: X = 匚二n2几何均数,用G表示,适用于对数正态分部的资料,例如抗体的滴度和平均效价。直接法:样本量较小时用:G = lg1Ig2 + lg4 + lg4 + lg8 + lgl6 + lg 32 6例题:某地6人接种某疫苗后,其抗体滴度如下:1 : 2; 1 : 4; 1 : 4; 1 : 8;1 : 16; 1 : 32,请问其平均= lg-I(0.8529)= 7.13抗体滴度是多少?平均抗体滴度是1 : 7.13例题;某地102名健康人的钩端螺旋体血清抗体滴度如表7-2,计算平均

7、滴度。4.1-2 102珞健人的的逑席絞体抗体滴度滴度IgXflgX(1(2)(4)(5)=(2)(4)1 : 10071002.00014.0001 : 20019200230143.7191 : 400344002.60288.4681 : 8002980020384.1871 : 16001316003.20441.652合计102272.026G = Is1=(272.026)Z/ JI 102 J谕抗悴平均廉发的计算3中位数:将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数,用M表示。屮位数适用于任何一种分布的计量数据,一般多用于描述偏态分布活数据一端无界资料的集屮趋势。

8、4百分位数:是一种位置指标,用玖表示。百分位数是一个有序数列百等分的分割值。第50百分位数(P50)也就是中位数,中位数是一个特定的 百分位数。 I 屮(工町二、离散趋势指标 -描述离散趋势的常用指标有全距、四分位间距、方差和标准差等。 一 1对于描述偏态资料的离散趋势宜用四分位问距,对于正态或近似正态资料宜用标准差。标准差应用:1 表示观察值的变异程度:在两组(或几组)均数相近、单位相同的条件下,标准差大,表示变量值的 变异程度法,均数的代表性较差;反Z,标准差小,表示变量组变异度小,数据多集屮在均数周围,则均数的代表性较好。2计算变异系数:单位不同时,不能用标准差表示变量值的离散趋势,只能

9、用变异系数,单位相同但是 均数相差较大时,用标准差不太合理,用变异系数更好,变异系数用CV表示。变异系数是一种相対的离散程度指标,它无单位:亍100 %3 结合均数描述频数分布的特征和制定医学参考值范围。4计算标准误例题;某地随即抽样调查了 255名成年女性的红细胞数和血红蛋白,红细胞均数为4.18,标准差为0.29:血红蛋口均数为117.6,标准差为10.2,请问女性红细胞数与血红蛋白的变异程度何者为大?红细胞:血红蛋白:V 0 7QCV =X1OO% =2Lrr_xl00% =6.94%X 4.18q in 7CV =xl00%= xl00% = 8.67%X 117 .6血红蛋白的变异程

10、度大于红细胞数。正态分布:正态分布是一种连续型分布。正态分布以均数为中心,左右两侧对称,靠近均数两侧的频数较多,而距离均数两个较远处,频数逐渐减少,形成钟形分布。正态曲线下的面积分布有一定的规律。正态分布的主要特征:以均数卩为中心,左右对称。疋取值范围理论上没有边界。X?离口越远, 函数f(X)值越接近0,但不会等于0o正态分布曲线下的面积分布有一定的规律。正态分布完 全由参数卩和。决定。卩是位置参数(即平均水平),决定分布曲线在横轴的偏移位置。当。一定后, U增大,曲线右移;反之U减小,曲线左移。是变异参数,决定分布曲线的形态。o越大,曲线的 形态越“矮胖”,表示数据分布越分散;。越小,曲线

11、的形态越“瘦高”,表示数据分布越集中。标准正态分布(standard normal distribution)标准正态分布是均数为0、标准差。为1的正态分布,即 (卩,o) = (0, 1),亦称u分布。正态曲线下面积的分布规律:曲线下横轴上的总面积为100%或lo下而是应用较多的三个区间的 面积分布规律:a.正态分布区间(u-o , p + o )下的面积,即口 o范围的面积占总面积为68.27%。b.正态分布区间(11-1.96。,P+1.96。),即11 1. 96 0范围的面积占总面积为95.00%。C.正态分 布区间(U-2.58。,口+2.58。),即11 2. 58 o范围的面积

12、占总面积为99.00%。正态分布的应用(医学参考值范禺的估计)正态分布或样本含量较大的数据资料,95%的医学参考值范 围为:(X-1.96S, X+1.96S)。对于偏太分布的数据资料,宜采用百分位数的方法进行确定。95%的 医学参考范围为:P2.5P97.5;单侧上界:P95;单侧下界:卩5。均数的抽样误差:由于存在变异,样本均数往往不够于总体均数这种由抽样造成的样本均数与总体 均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避 免的。若要减小抽样误差,只有增加样本含量。 二标准误计算:标准误(理论值)是反映抽样误差大小的指标,用J表示。用某一样本标准差S来代替0 ,得到标准误的

13、估计值,(通常也简称为标准误),其计算公式为: t分布的特征:t分布是以0为中心的左右对称分布曲线;曲线形态变化与自由度u的大小有关(u 与n有联系,这里u=n-l)o自由度u越大,t分布越接近于正态分布;自由度u越小,t分布越低平, 两端向外伸展。t分布不是一条曲线,而是一簇曲线,因此,t分布曲线下面积的95%或99%界限不是一个常量,而 是随着自由度大小而变化的。为便于使用,可根据t值表查找。总体均数的可信区间亦称置信区间(CT),即按预先给定的概率(1-0,可信度)估计未知总体均数的 所在范围。习惯上用总体均数的95% (或99%)可信区间,表示该区间包含总体均数的概率为95% (或99

14、%)。用此估计范围估计总体均数,表示100次抽样屮,有95 (99)次包含总体均数。(x 一 1.96 吐,丘 + 1.96s Jo未知,但样本例数n足够大,总体均数95%的可信区间可近似的表达为:例题:测得某地101名3049岁正常成年男子血清总胆固醇(mmol/L)平均值为4. 735,标准差为0. 882, 求:该地健康男子血清总胆固醇的正常理范围?试估计该地健康成年男子血清总胆固醇均数。95 %医学参考值范围为:(元一1.96s, x +1.965)_4.735-1.96x0.882?一二.735 + 1.960. 05,则按0.05 水准不拒绝仏,(即II。存在的可能性是个大概率时间

15、)。差别无统计学意义;当PW0.05,则按0.05水 准拒绝H。,不拒绝出(即H。存在的可能性时个小概率时间),差别具有统计学意义。t检验一、样本均数与总体均数的比较(单样本t检验)总体标准差。未知且n较小,应选用t检验。 建立假设:Ho U = U o ; Hi : P H y()a =0. 05计算统计量t值:X -HoS jf(3)确定临界值(ta):计算自由度查t值表中t。.。55, t0.01(v以统计量(t)与临界值(ta)比较,作出判断结论,按下列规则确定P值:若| t | 0. 05,差别无统计学意义。| t | to.Q5(v), P2. 064,故 P 0.05。按 a =

16、0. 05 水 准,不接受H。,接受出,可以认为此药有效。二、 配对资料的比较一一配对t检验配对设计:同一受试对象试验(或治疗)前后的比较同一样本用两种方法检验结果的比较配对 的两种受试对象分别接受两种处理后的数据比较。三、 完全随即设计的两样本均数的比较目的是推断两样本各自代表的总体均数与是否相等。t检验可用于两样本含量m, m较小吋,同 时要求两样本方差齐性。假设检验的注意事项:严密的抽样设计及资料正态性选用正确的检验方法,且药注意方差齐性。成 组比较的(检验,要求两组资料具有方差齐性结论不能绝对化单侧和双侧检验:选用单侧检验的 条件是在研究开始之前,表明不会出现PUo的情况),才能选用单

17、侧检 验。若没有这方面的依据,一般选用双恻检验差别有无统计意义与有无专业上的实际意义是两个不 同的概念假设检验和可信区间的关系是两个不同的概念。I型错误和II型错误:做建设检验时,有可能发生两种错误,现以样本均数和总体均数的t检验为例说 明:I型错误是指拒绝了实际上成立的Ho,即“弃真”的错误。在H。成立的前提下,由于抽样的偶然 性,得到了较大的t值,若tt0.05u)则PV0.05,按a =0.05水准拒绝Ho,则犯了 I型错误。确定以 t。为临界值时,犯I型错误的概率就是aII型错误是指接受了实际上不成立的几,即“取伪”的错 误。在实际上H】成立的前提下,由于抽样误差的偶然性得到了较小的I

18、值若t则P005,按 a =0.05水准接受出。这就犯了 II型错误。II型错误的概率用13表示样本量确定后,犯两类错误的概率不可能同时减少,a越小,B越大;反之a越大,B越小。方差分析一、 方差分析的目的:方差分析主要用于检验数值变量资料中两个或两个以上均数间差别的显著性。二、 基本思想:将总的变量分析成若干部分,每一部分都与某一种效应相对应;总的自由度也被分为相 应的各个部分。方差分析的统计量为F值。四、方差分析应用条件:各样本是相互独立的随即样本各样本來自正态总体各处理组方差齐性 分类资料的统计描述一、常用相对数1 构成比:又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百

19、分数表示。构成比二某一组成部分的观察单位数 乂 1同一事物各组成部分的观察单位总数X丄2率:又称频率指标,说明某现象发生的频率或强度。K为比例基数,常用百分率()、千分率、万分 率等表示 率=发生某现象的观察单位数 x K一可能发生某现象的观察单位总數死亡事:也叫粗死亡率:死亡率二同期内死亡总数JK 千-某年平均人口数死因构成比;某类死因的死亡数占总死亡数的百分数。按死因构成比由高到低排出位次即死因顺位。用 于观察何种疾病是造成当地居民死亡的主因。某死因构成比=因某类死因死亡人数辺00%总死亡人数 某病发病勢发肆:常用于研究疾病发牛的因果和评价预防措施的效果。研究。这是一个吋点的指标。甘宀*宀

20、 检査时发现的某病现患病例总数 某病患病 该时点受检人口数 xK该期间新发生的某病病例数 一定时期内可能发生某病的平均人口数X)患病率:指在某时点(或短时期内)检查某一定人群中某病现患严重程度。最用于病程较反的疾病统计3相对比:是A、B两个有关联指标之比,说明A为B的若干倍或百分之几,两个指标可以是性质相同,也可以是性质不同的。比=牛(或X100%)二、应用相对数时的注意事项1. 构成比与率是意义不同的两个统计指标,分析时不能以构成比代替率。2. 计算相对数时,分母不宜过小,即应有足够例数。3. 对观察单位数不等的儿个率,不能直接相加求其平均率。4. 资料的对比应注意可比性:即除了研究因素外,

21、其余的重要影响因素应相同或相近。5. 对比不同时期资料时,应注意客观条件是否变化。6. 对样本率(或构成比)的比较应遵循随便抽样,要做假设检验。三、率的标准化法标准化法的意义和基本思想:率的标准化法:就是在一个指点的标准构成条件下进行率的对比的方法 标准化率:用标准化法加以校正后的率称为标准化率,简称标准化率。四、总体概率的置信区间:正态近似法:当n足够大,且样本率p和(1-p)均不太小,如np与n (1-p)均大于等于5时,p的抽样分布逼近正态分布,则总体率的可信区间为:95%: p1.96sp 99%: p258sp3计算X 2值:2 殍4确定p值,作出统计推论:自由度(行-1)(列-1)

22、 =1。 接受乩,差别有统计学意义;数据整理成表:+ - 合计处理组232750对服组104050合计3367100两组阳性反应比较例题:50只经过处理的老鼠中23只出现某种阳性反应。两组的阳性反应率有统计学意义吗?2 _ (ad bc)2n“R c = 50x33 二6 5 a+bc + da+cb + d) n 100 (23x40-27x10)2x100arc = = / 4U =L X 0.05(1)=3. 84o x=764 以0 05 ,P0. 05 50x50x33x67按a =0.05的水准可以认为两组的阳性反应率差别有统计学意义。三、四格表的校正条件:当心40且1WTV5校正

23、公式:0寸或: (-心护乙 T Z (0 + 如 + /)3+恥 + )注意:当n0. 05按a =0.05的水准可以认为两药的疗效差别无统计学意义。四、行X列表的卡方检验:适用于多个(两个组以上)的率或构成比差别的显著性检验。 Ho:兀1=兀2=兀3 ; H1 :三种药物的疗效不同或不全相同。注意事项:1. 不宜有1/5以上的格子的理论数小于5,或有小于1的理论数。处理方法:增加样本含量去除理论数过小的行或列合并理论数过小的性质相近的行或列。2. 如检验结果拒绝检验假设,职能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间有差别或量量之问有差别。秩和检验非参数统计的概念:不

24、知道所研究样木来自总体的分布型或已知总体分布与检验所要求的条件不符,此 时可用非参数统计进行假设检验。使用资料:总体分布为偏态或分布形式未知等级资料个别数据偏大或数据的某一端无确定的数值 各总体方差不齐直线回归: 入直线回归方程的一般表达式为: Y = a + bXa为回归直线在Y轴上的截距a0:直线与纵轴的交点在原点的上方a0:表示直线从左下方走向右上方b0:正相关,r0:负相关,r = 0:零相 关,I =1:完全相关。直线回归与相关的区别和联系1 区别在资料要求上,冋归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量;相关要求两个变量X、Y服从双变量正态分布。在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的 相关关系用相关。2 联系方向一直:对一组数据若同时计算I与b,他们的正负号是一致的。r为正号说明两变量间的相互关系是 同向变化的。b为正,说明X增(减)一个单位,I平均增(或减)b个单位假设检验等价:I和b的假 设检验是等价的,即对同一样本,二者的t值相等。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1