1、非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。7概率(P):描述随机事件发生可能性大小的值,其取值为0P1。其中,P=1为必然事件,P=0为不可能事件,0P60:u/2,X或Xu/2, X*正态分布:u/2,S*偏态分布:PXP100X用途总体均数的区间估计,也可间接进行假设检验绝大多数(如95%)观察对象某项指标的分布范围样本量作用样本量越大,可信区间越小样本量越大,参考值范围越稳定*t/2, 也可用于t, (对应于单尾概率时);* u/2,也可用于u,(对应于单尾概率时)。9假设检验:又称显著性检验,是利用小概率反证法思想,从问题的对立面(H0)出发间
2、接判断要解决的问题(H1)是否成立,然后在H0成立的条件下计算检验统计量,最后获得P值来判断。基本思想:小概率思想:小概率事件在一次试验中认为基本上不发生,其概率是相对的,在进行统计分析时要事先规定,即检验水准。反证法思想:首先提出一个假设,用适当的统计方法确定当假设成立时,获得现在样本的概率大小,如果是小概率事件,则推断假设是假的,拒绝它;如果不是小概率事件,则不能认为假设是假的,不能拒绝它。10假设检验的基本步骤:1)建立检验假设,确定检验水准:=0:即检验假设,常称无效假设或零/原假设,用H0表示;0:即备择假设,常称对立假设,用H1表示;:即检验水准,也称显著性水准,属于型错误的范畴,
3、是预先规定的概率值,确定了小概率事件的标准。2)计算检验统计量:根据变量或资料类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量,所有检验统计量都是在H0成立的前提条件下计算出来的。3)确定P值,做出推断结论:P的:是指从H0规定的总体随机抽样,抽得等于及大于或(和)等于及小于现有样本获得的检验统计量值(如t、u等)的概率。(当样本含量n 较大时,t值近似和u值相等,有人将其称为u检验或Z检验,实际是t检验的特例。)对于检验假设须注意:检验假设是针对总体而言,而不是针对样本;H0和H1是相互联系、对立的假设;H0为无效假设,其假定通常是:某两个总体参数相等,或某两个总体参数之差等于
4、0,或无效,或某一资料服从某一特定分布;H1的内容直接反映了检验的单双侧。11t检验(方差相等):单样本t检验:即已知样本均数与已知总体均数的比较,要求样本取自正态总体(样本均数与已知总体均数不等,原因有二:a.非同一总体即0;b.虽为同一总体即=0,但有抽样误差)。配对样本t检验:简称配对t检验,也称成对t 检验,适用于配对设计的计量资料,要求差值服从正态分布。(配对设计是将受试对象按照某些重要特征配成对子,每对中的两个受试对象随机分配到两处理组。主要有以下情形:a.两同质受试对象配成对子分别接受两种不同的处理;b.同一受试对象分别接受两种不同处理;c. 同一受试对象接受一种处理前后。)两样
5、本t检验:又称成组t检验,适用于完全随机设计两样本均数的比较,要求样本来自正态总体,且两总体方差齐性。当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同检验方法。t检验(方差不等):Cochran&Cox近似t检验对临界值校正;Satterthwaite近似t检验对自由度校正;Welch近似t检验对自由度校正。12型错误:拒绝了实际上成立的H0,即“弃真”,其概率大小用表示,检验水准就是预先规定的允许犯型错误概率的最大值,可取单尾也可取双尾。型错误:“接受”了实际上不成立的H0,即“取伪”,其概率用表示,只取单尾。把握度:又称检验效能,是指1。其意义是当两总体确有差异,按
6、规定检验水准所能发现该差异的能力。13假设检验应注意的问题:1)要有严密的研究设计假设检验前提。2)不同类型的资料应选用不同检验方法。3)正确理解“显著性”一词的含义,一般假设检验结果并不指差异的大小,只能反映两者是否有差异,采用“有无统计学意义”表达。4)因结论具有概率性质,故结论不能绝对化,报告结论时最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围。5)统计“显著性”与医学/临床/生物学“显著性”:若统计结论和专业结论一致,则最终结论就和这两者一致;若统计结论和专业结论不一致,则最终结论需根据实际情况。当统计结论有意义,而专业结论无意义时,可能是由于样本含量过大或设计存在问题,那
7、么结论最终无意义。当统计结论无意义,而专业结论有意义,则应当检查设计是否合理、样本含量是否足够。6)可信区间与假设检验的区别和联系:可信区间用于说明量的大小即判断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不等;可信区间可回答假设检验的问题,算得的可信区间若包含了H0,则按水准不拒绝H0;若不包含H0,则按水准拒绝H0接受H1。可信区间不但能回答差别是否具有统计学意义,而且能比假设检验提供更多的信息,即提示差别有无实际的专业意义。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。验证一个假设时,可选择假设检验,而只是对总体参数做一
8、个估计时,可选用区间估计,两者结合可对问题进行更全面的说明。14正态性检验:图示法:概率图(P-P图)和分位数图(Q-Q图);计算法:a.对峰度和偏度各用一个指标来评定,以矩法效率最高。偏度指分布不对称的程度和方向,样本偏度系数g1,总体偏度系数r1。(r1=0对称,r10正偏态,r10尖峭峰,r10平阔峰)b.仅用一个指标来综合评定。15两样本方差比较的F检验:即方差齐性检验,目的是判断两样本所代表的两总体方差是否不等,资料要求服从正态分布。若方差齐,采用一般的t检验;若方差不齐,则采用近似t检验。16变量变换:是将原始数据作某种函数转换,如转换为对数值等。它可使各组方差齐同、稳定,亦可使偏
9、态资料正态化,以满足t检验或其它统计分析方法对资料的要求。方法:对数变换:适用于a.对数正态分布资料,即原始数据的效应是相乘时;b.各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料。平方根变换:即将原始数据开算术平方根。平方根反正弦变换。倒数变换。第4章 多个样本均数比较的方差分析1方差分析:由fisher首创,又称F检验。(F分布有两个参数:两个自由度)基本思想:根据试验设计的类型,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。方差分析
10、是综合的F检验。实验数据有三个不同的变异:总变异:全部观测值大小不同,这种变异称为总变异,其大小可以用离均差平方和表示SS总;组间变异:各处理组由于接受处理的水平不同,各组的样本均数也大小不等,这种变异称为组间变异,记为SS组间;组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但观测值仍各不相同,这种变异称为组内变异(误差),记为SS组内。SS总=SS组间+SS组内,总=组间+组内。变异程度与离均差平方和和自由度有关。各部分离均差平方和除以相应的自由度,其比值称为均方差,简称均方(MS)。应用条件:各样本是相互独立的随机样本;均来自正态分布总体;相互比较的各样本的总体方差相等,即具有
11、方差齐性。2完全随机设计资料的方差分析:完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,实验结束后比较各组均数间的差别有无统计学意义,推论处理因素的效应。变异分解:分析步骤:略。3随机区组设计资料的方差分析:随机区组设计又称配伍组设计,是配对设计的扩展,先按影响试验结果的非处理因素将受试对象配成区组,再分别将各区组的受试对象随机分配到各处理组或对照组。随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。区组内各试验对象具有较大的差异为好,利用区组控制非处理因素的影响,并在方差分
12、析时将区组间的变异从组内变异中分解出来。误差比完全随机设计小,试验效率高。SS总=SS处理+SS区组+SS误差,总=处理+区组+误差。4拉丁方设计资料的方差分析:拉丁方设计是在随机区组设计的基础上发展的,实验涉及一个处理因素和两个控制因素,将两个控制因素分别安排在拉丁方设计的行和列上,每个因素的类别数或水平数相等,增加了均衡性,减少了误差,提高了效率。SS总=SS处理+SS行+SS列+SS误差,总=处理+行+列+误差。5两阶段交叉设计资料的方差分析:二阶段交叉设计是A、B两种处理先后以同等的机会出现在两个试验阶段中,不仅平衡了处理顺序的影响,而且能把处理方法间的差别、时间先后之间的差别和受试者
13、间的差别分开来分析。但是前一个试验阶段的处理效应不能持续作用到下一个试验阶段,故在两阶段之间设计洗脱阶段以消除残留效应。多用于止痛、镇静、降压等药物或治疗方法间疗效的比较。分析方法:SS总=SS处理间+SS阶段间+SS受试者间+SS误差。6多个样本均数间的多重比较:当方差分析的结果为拒绝H0,接受H1时,只说明g个总体均数不全相等。样本均数间的多重比较不能用两样本均数比较的t检验,否则会加大犯型错误的概率,即假阳性。LSD-t检验,即最小显著差异检验,适用于一对或几对在专业上有特殊意义的样本均数之间的比较;Dunnett-t检验,适用于g1个实验组与一个对照组均数差别的多重比较;SNK-q检验
14、,亦称q检验,适用于多个样本均数两两之间的全面比较,最常用。7多样本方差比较的Bartlett检验和Levene检验:Levene检验法在用于对多总体方差进行齐性检验时,所分析的资料可不具有正态性。第5章 计数资料的统计描述1计数资料的常见数据形式是绝对数,但绝对数不具有可比性,所以需计算相对数,常用的相对数指标包括比,比例,率。根据研究目的不同,比例又分为强度相对数(率)和结构相对数(即构成比)。2率:说明某现象发生的频率或强度,常用百分率,千分率,万分率等表示。某一分率改变不影响其他分率变化。3构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所
15、占的比重或分布。某一部分构成比的改变将影响其他构成比的变化。4相对比:简称比,是两个有关指标之比,说明两指标之间的比例关系。两个指标可以是绝对数、相对数或平均数。5应用相对数的注意事项:结构相对数不能代替强度相对数:构成比用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度计算相对数应有足够数量,否则会使相对数波动较大正确计算合计率:对分组资料计算合计率或称平均律时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算注意资料的可比性:a.观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等;b.观察对象内部结构是否相同;对比不同时期资料应客观条件是否相同;样本率(或构成比)的抽样误差:不能仅凭数字表面相差大小下结论,而应进行样本率(或构成比)差别的假设检验。6率的标准化法:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。标准化法只适用于某因素两组内部构成不同,并有可能影响总率比较的情况(两个率不具有可比性)。标准化率只表示相互比较的资料间的相对水平,不再反映实际水平;此外标
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1