1、 6、 、 参数: 描述 总体 特征的指标 7、 、 统计量: 描述样本特征的指标 8、 、 同质: 是指根据研究目的所确定的 性质大致 相同 的 观察单位。 。 9、 、 变异: 如果观察同一指标,各观察单位之间由于存在个体差异,也会是测量结果不同,这种差异成为变异。 7、 变异系数: :标准差 S 与均数 X 之比用百分数表示。 公式是 CV=S/ X100。 10、 、 概率: 是描述某事件发生可能性大小的度量。 统计符号为 P,P 值的取值范围为 0P1. 11、 、 小概率事件: 医学研究中,习惯上把 P0.05 的事件称为小概率事件,表示某事件发生的可能性很小。 12、 小概率原理
2、: 小概率事件在一次试验中几乎不可能发生。 利用该原理可对科研资料进行假设检验。 13 、 10、P P 值:指由 H 0 所规定的总体中作随机抽样,获得等于及大于( 或等于及小于)现有样本检验统计量的概率,P 的取值范围在 0-1 之间。 14、 、 频率: 在相同条件下,独立重复做 n 次试验,事件 A 出现了 m 次,则比值 m/n 称为随机事件 A 在 n 次试验中出现的频率。 15、 率: 表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度或频率。 率=(某事物或现象发生的实际数某事物或现象发生的所有可能数)比例基数。 16、 、 构成比: 表示某一事
3、物内部各组成部分所占的比重或分布。 常用来表示疾病或死亡的顺位、位次或所占比重。 构成比=(该事物内部某一组成部分的观察单位数某事物内部的所有观察单位之和)100%。 17、 、 比: 又称相对比,是 A、B 两个有关联指标值之比,说明 A 是 B 的若干倍或百分之几。 通常用倍数或百分数表示。 这两个指标可以性质相同,也可以性质不同。 14、 标准化率: 在比较两个或两个以上的总率时,采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成(年龄、性别、工龄、病程长短、病情轻重等)不同对总率产生的影响,使算得的标准化率具有可比性。 只代表相互比较
4、的各组间的相对水平,而不能反映实际情况。 选用的标准不同,得到的标准化率可能不同。 21、 生存率:病人能存活到某时点的生存概率。 19、 参数 统?计: 在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验。 20、 非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验。 二、 简答题 3 3 、频数分布有哪两个重要特征? ? 答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。 将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。 一
5、组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。 另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。 2 2 、频数分布有哪几种类型? 频数分布有以下两种类型: 对称分布和偏态分布。 对称分布: 指频数分布集中的位置居中,左右两侧频数分布大体对称; 偏态分布: 指集中位置偏向一侧,频数分布不对称,根据集中位置和偏向不同,偏态分布又可分为: 正偏态分布和负偏态分布。 正偏态分布是指集中位置偏向观察值小的一侧,长尾向观察值大的一侧延伸;均数大于中位数 负偏态分布是指集中位置偏向观察值大的一侧,长尾向观察值小的一侧延伸。 不同分布类型
6、的资料,要采用不同的统计方法来分析。 1、 、 频数分布表的用途 作为陈述资料的形式,可以代替原始资料,便于进一步分析 揭示资料的分布类型(正态分布还是偏态分布) 揭示变量的分布特征(集中趋势与离散趋势) 便于发现某项离群体的特大或特小值 当样本含量比较大是,可用各组段的频率作为概率的估计值 便于进一步计算统计指标和统计分析 2. 如何编制频数分布表 确定组数,一般分为 8-15 组 确定组距: 将全距(数据中最大值与最小值之差)除以组数可以得到组距的近似值。 确定组限 统计频数 3. 正态分布的用途 确定医学参考值范围 质量控制 正态分布是很多统计方法的理论基础(t 检验,方差分析) 4.
7、t 分布与正态分布曲线的区别与联系 区别: t 分布曲线: 以 0 为中心,左右对称 一簇单峰分布曲线 t 分布与自由度 v 有关,v 越小,t 分布的峰部越低,而两侧的尾部越高 正态分布: 单峰分布,以 x=u 为中心,左右完全对称;正态曲线以 x 轴为渐近线,两端与 x 轴不相交 在 x=u 处有最大值;在 x= u 处有拐点,呈现为钟型 正态分布有两个参数 u , ; u 为位置参数, 为形态参数 联系: 当 v 趋向 时,t 分布趋近标准正态分布,故标准正态分布是 t 分布的特例 18 、 : 检验水准,通常我们会根据研究问题的背景,规定一个小的概率 ,若 P 小于 ,就认为P 值较小
8、,若 P 不小于 ,就认为P 值较大。 一般取 等于 0.05 或 0.01,以保证犯假阳性错误的概率不超过 0.05 或 0.01.这个 称为检验水准。 19、 、准 检验水准:绝 用于判断是否拒绝 H 0 的概率标准 ,用表示,一般取0.05 ,P ,不拒绝H 0 ;P , 拒绝 H 0 。 20 、1-: : 称为检验效能或把握度, 表示当两总体确实有差别时,按 规定的检验水准 发现其 差别 的能力 (概率)。 21 、1-: 置(可)信度,其中 由研究者预先确定,一般取 0.1,0.05,或 0.01,常取 0.05.在医学研究中,最常用的置信度是 95%。 计算得到的区间叫可信区间。
9、 表示总体均数估计的 95%可信区间包括总体均数的概率为 95%。 5. I 类错误与 II 类错误的区别与联系 区别: 定义: 第一类错误: 拒绝了实际上是成立的 H 0 所产生的错误,即 弃真 , 其概率大小为。 第二类错误: 接受了实际上不成立的 H 0 所产生的错误,即 存伪 ,其概率大小为, 一般 为已知,可取单侧或双侧,如 0.05 或 0.01, 一般是未知的,其大小与有关。 只取单侧,如取 0.1 或 0.2。 1-(把握度)不小于 0.75。 把 统计学上把 1- 称为检验效能(把握度) 联系: 一般 增大,则 减小; 减小,则 增大; 若要同时减小、,可以通过增加样本量的方
10、法实现。 6. 使用相对数的注意事项 不要把构成比和率混淆。 计算相对数时分母一般不宜过小,分母过小时相对数不稳定。 注意资料的可比性。 比较的资料应该是同质的, 样本率或构成比存在抽样误差。 不能单凭数字表面相差的大小而下定论,应对各组的样本率或构成比的差别做假设检验。 对观察单位数不等的几个率,不能直接相加求其总率。 应当注意不能用构成比动态分析代替率的动态分析 7. 标准化法使用注意事项 标准划法是采用统一标准人口年龄构成 标准化后的率并不表示某地实际水平,只能表明相对水平 如不计算标准化率,而分别比较各组的率,也可得出正确结论,但不能比较总率的大小 两样本标准化率是样本值,存在抽样误差
11、,应做假设检验 8. 方差分析的用途 进行两个或两个以上样本均数的比较 进行两个或多个样本的方差齐性检验 可以同时分析一个、两个或多个因素对试验结果的作用和影响 分析多个因素间的独立作用及多个因素之间的交互作用 3 3 、 标准差有什么用途? 标准差是描述变量值离散程度常用的指标,主要用途如下: 描述变量值的离散程度。 两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差; 反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。 结合均数描述正态分布或近似正态分布特征; 结合均数计算变异系数 CV; 结合样本含
12、量计算标准误。 8 8 、标准差,标准误有何区别和联系? 答 : 标准差和标准误都是变异指标,但它们之间有区别,也有联系。 区别 : 概念不同; 标准差 是描述 观察值( ( 个体值) ) 之间的 变异程度 ; 标准误 是描述 样本均数 的 抽样误差 ; 用途不同;标准差常用于表示变量值对均数波动的大小, 与均数结合估计参考值范围 ,计算变异系数,计算标准误等 。 标准误常用于表示 样本统计量( ( 样本均数,样本率) ) 对 总体参数( ( 总体均数,总体率) ) 的波动情况, 用于估计参数的可信区间,进行假设检验等。 它们与样本含量的关系不同 : 当样本含量 n 足够大时,标准差趋向稳定;
13、而标准误趋于 0 。 联系 : 标准差,标准误均为变异指标,如果 把样本均数看作一个变量值, 则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。 4 4 、变异系数 (CV) 常用于哪几方面? 变异系数是变异指标之一,它常用于以下两个方面: 比较均数相差悬殊的几组资料的变异度。 如比较儿童的体重与成年人体重的变异度,应使用CV; 比较度量衡单位不同的几组资料的变异度。 如比较同性别,同年龄人群的身高和体重的变异度时,宜用 CV。 8 8 、t t 检验和 u u 检验的应用条件各是什么? (1) t 检验的应用条件是
14、: 样本取自正态总体,作两样本均数比较时还要求两总体方差相等;(2) u 检验的条件是: 样本例数 n 较大(如 n100),或 n 虽小而总体标准差已知。 2 2 、不同类型统计资料之间的关系如何? 根据分析需要,各类统计资料可以互相转化。 如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。 计数资料或等级资料也可经数量化后,转化为计量资料。 如性别,结果为男或女,属于计数资料,如男性用 0(或 1),女性用 1(或 0)表示,则将计数资料转化为计量资料。 14 、参考值范围与可信区间区别是什么? (
15、1)意义不同: 参考值范围是指同质总体中包括一定数量(如 95%或 99%) 个体值的估计范围,如95%参考值范围,意味该数值范围只包括 95%的个体值,有 5%的个体值不在此范围内。 可信区间是指按一定的可信度来估计总体参数所在范围。 如 95%的可信区间,意味着做 100 次抽样,算得 100 个可信区间,平均有 95 个可信区间包括总体参数(估计正确)有 5 个可信区间不包括总体均数(估计错误)。 (2) 计算方法不同: 参考值范围用 Xu S 计算。 可信区间用 Xt 、 S x 或 Xu S x 计算;前者用标准差,后者用标准误。 6 6 、制定参考值范围有几种方法? 各自适用条件是
16、什么? 制定参考值范围常用方法有两种: 正态分布法: 此法是根据正态分布的原理,依据公式: XuS S 计算, 仅适用于正态分布资料或对数 、倒数转换后 正态分布资料。 不适合偏态分布 若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。 优点是结果较稳定,在样本含量不是很大的情况下仍然能够进行处理。 百分位数法。 用 P 2.5 P 97.5 估计 95%双侧参考值范围;P 5 或 P 95 为 95%单侧正常值范围。 百分位数法适用于 各种分布的资料(包括分布未知),计算较简便,快速。 使用条件是样本含量较大,分布趋于稳定。 一般应用于偏态分布资料、分布不
17、明资料或开口资料。 5、制订医学参考值范围的注意事项 确定同质的参照总体 选择足够例数的参照样本 控制检测误差 选择单、双侧界值 选择适当的百分数范围 选择计算参考值范围的方法 5 、计量资料中常用的集中趋势指标及适用条件各是什么? 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。 算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态 分布资料; 几何均数: 用 G 表示,也称倍数均数,反映变量值平均增减的倍数, 适用于等比资料,对数正态分布资料; 中位数: 用 M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。 它可用于任何分布类型的资
18、料,但主要应用于偏态分布资料或两端无确定数值时。 百分位数: 用来描述资料的观察值序列在某百分位置的水平。 适用于任何频数分布资料,单靠近两端的百分位数仅在样本例数较大时才比较稳定。 P x =P x 组的下限+(总例数*x%-P x 组段之前的累计频数)*组距/P x 组的频数 用 P 2.5 和 P 97.5 规定医学 95%的参考值范围。 9 9 、统计推断包括哪几方面内容? 统计推断包括: 参数估计及假设检验两方面。 参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。 点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;
19、区间估计是按一定的可信度来估计总体参数所在的范围,按 Xu X 或 XuS X 来估计。 假设检验是根据样本所提供的信息,推断总体参数是否相等。 13 、如何正确理解差异有无显著性的统计学意义? 在假设检验中,如 P,则结论是: 拒绝 H 0 ,接受 H 1 , 习惯上又称显著, 此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果 P,结论是不拒绝 H 0 。 习惯上称不显著,不应理解为相差不大或一定相等。 有统计学意义( 差异有显著性)不一定有实际意义;如某药平均降低血压 5mmHg, 经检验有统计学意义, 但在实际中并无多大临床意义,不能认为该药有效。 相反,无统计学意
20、义,并不一定无实际意义。 如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。 10 、假设检验的目的和意义是什么? 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。 如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。 样本 统计量之间的差异是由什么原因引起
21、, 可以通过假设检验来确定。 因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。 7 7 、何谓假设检验? 其一般步骤是什么? 假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。 目的是比较总体参数之间有无差别。 实质是判断观察到的差别是由抽样误差引起还 是总体上的不同。 假设检验一般分为五个步骤: 1 1 、建立假设检验 一种是无效假设,符号为 H 0 ;一种是备择假设,符号为 H 1. ,是在 H 0 成立证据不足的情况下而被
22、接受。 H 0 : d =0 H 1 : d 0 2 2 、确定检验水准 检验水准亦称为显著性水准,符号为 。 它是判别差异有无统计意义的概率水准,是预先规定的拒绝域的概率值,其大小应根据分析的要求确定。 通常取 =0.05 或 =0.01。 3 、选定检验方法和计算统计量 根据资料类型,研究设计的方案和统计推断的目的要求选用不同的检验方法和计算公式。 如完全随机设计中,两样本均数的比较可用 t 检验,样本含量较大时(n100),可用 u 检验。 不同的统计方法可得到不同的统计量。 t 检验,z 检验、F 检验、X 2 检验等。 4 、确定概率 P 值 P 值是指在 H 0 所规定的总体中作随
23、机抽样,获得等于及大于(或小于)现有统计量的概率。 /5 、作出推断结论 如 当 P 时,表示在 H 0 成立的条件下,出现等于及小于现有统计量的概率是 小概率,根据小概率事件原理,现有样本信息不支持 H 0 ,因而拒绝 H 0, 结论为按所取检验水准拒绝 H 0, 接受 H 1 ,即差异有统计学意义。 反之,当 P,结论为按所取检验水准不拒绝 H 0 ,即差异无统计意义。 12 、假设检验有何特点? 统计检验的假设是关于总体特征的假设; 用于检验的方法是以检验统计量的抽样分布为理论依据的; 作出的结论是概率性的,不是绝对的肯定或否定。 15 、X X2 2 检验有何用途 ? 推断两个或两个以
24、上总体率(或构成比)之间有无差别; 检验两变量之间有无相关关系; 检验频数分布的拟合优度。 16 、四格表资料的 u u 检验和 X X2 2 检验的应用条件有何异同? (1) 相同点: 四格表资料的 u 检验是根据正态近似原理进行的,凡能用 u 检验对两样本率进行检验的资料,均能使用 X2 检验,两者是等价的,即 u 2 =X 2 ;u 检验和 X 2 检验都存在连续校正的问题。 (2) 不同点: 由于 u 分布可确定单、双侧检验界值,可使用 u 检验进行单侧检验;满足四格表 u 检验的资料,可计算两率之差的 95%可信区间,以分析两率之差有无实际意义;X2 检验可用于 22 列联表资料有无
25、关联的检验。 17 、参数检验与非参数检验有何区别 ? 各有何优缺点? 参数检验是检验总体参数是否有差别, 而非参数检验是检验总体分布的位置是否相同。 参数检验的优点是能充分利用样本资料所提供的信息,因此,检验效率较高。 其缺点是有较严格的使用条件,如要求总体的分布呈态分布,各总体方差要相等,有些资料不满足使用条件,就不能用参数检验。 非参数检验的优点是适用范围广。 它不要求资料分布的形式,另外可用于等级资料或不能确切定量的资料。 缺点是不能充分利用样本所提供的信息,因此检验效率较低,产生 第二类错误较大。 18 、非参数检验适用于哪些情况? 不满足参数检验的资料,如偏态分布资料; 分布不明的资料; 等级资料或开口资料。 19 、 直线回归与相关有何区别和联系? 区别: 在资料要求上 ,回归要求因变量 y 服从 正态 分布,自变量 x x 是可以精确测量和严格 控制的变量 ,一般称为 型回归;相关要求两个变量 x x 、y y 服从 双变量正态分布 。 这种资料若进行回归分析称为 型回归。 在应用上 ,说明两变量间依存变化的 数量关系 用回归,说明变量间 的 相关关系 用相关。 对一组数据若同时计算 r r 与 与 b b ,则它们的 正负号是一致 的; r r 与 与 b b 的假设检验是 等价 的,即对同一样本,二者的 t t 值 相等。 可用 回归解释相关 。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1