医学统计学期末考试名词解释Word文档格式.docx

资源描述

医学统计学期末考试名词解释Word文档格式.docx

《医学统计学期末考试名词解释Word文档格式.docx》由会员分享，可在线阅读，更多相关《医学统计学期末考试名词解释Word文档格式.docx（10页珍藏版）》请在冰豆网上搜索。

医学统计学期末考试名词解释Word文档格式.docx

6、、参数：

描述总体特征的指标7、、统计量：

描述样本特征的指标8、、同质：

是指根据研究目的所确定的性质大致相同的观察单位。

。

9、、变异：

如果观察同一指标，各观察单位之间由于存在个体差异，也会是测量结果不同，这种差异成为变异。

7、变异系数:

标准差S与均数X之比用百分数表示。

公式是CV=S/X100％。

10、、概率：

是描述某事件发生可能性大小的度量。

统计符号为P，P值的取值范围为0P1.11、、小概率事件：

医学研究中，习惯上把P0.05的事件称为小概率事件，表示某事件发生的可能性很小。

12、小概率原理：

小概率事件在一次试验中几乎不可能发生。

利用该原理可对科研资料进行假设检验。

13、10、PP值:

指由H0所规定的总体中作随机抽样，获得等于及大于（或等于及小于）现有样本检验统计量的概率，P的取值范围在0-1之间。

14、、频率：

在相同条件下，独立重复做n次试验，事件A出现了m次，则比值m/n称为随机事件A在n次试验中出现的频率。

15、率：

表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比，说明某现象出现的强度或频率。

率=（某事物或现象发生的实际数／某事物或现象发生的所有可能数）比例基数。

16、、构成比：

表示某一事物内部各组成部分所占的比重或分布。

常用来表示疾病或死亡的顺位、位次或所占比重。

构成比=（该事物内部某一组成部分的观察单位数／某事物内部的所有观察单位之和）100%。

17、、比：

又称相对比，是A、B两个有关联指标值之比，说明A是B的若干倍或百分之几。

通常用倍数或百分数表示。

这两个指标可以性质相同，也可以性质不同。

14、标准化率:

在比较两个或两个以上的总率时，采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准,以消除因内部构成（年龄、性别、工龄、病程长短、病情轻重等）不同对总率产生的影响，使算得的标准化率具有可比性。

只代表相互比较的各组间的相对水平，而不能反映实际情况。

选用的标准不同，得到的标准化率可能不同。

21、生存率:

病人能存活到某时点的生存概率。

19、参数统？

计:

在统计推断中,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知,统计推断的目的就是对这些未知参数进行估计或检验。

20、非参数检验:

在统计推断中,不依赖于总体的分布形式,直接对总体分布位置是否相同进行检验的方法，称非参数检验。

二、简答题33、频数分布有哪两个重要特征?

答:

频数分布有两个重要特征:

集中趋势和离散趋势，是频数分布两个重要方面。

将集中趋势和离散趋势结合起来分析，才能全面地反映事物的特征。

一组同质观察值，其数值有大有小，但大多数观察值集中在某个数值范围，此种倾向称为集中趋势。

另一方面有些观察值较大或较小，偏离观察值集中的位置较远，此种倾向称为离散趋势。

22、频数分布有哪几种类型?

频数分布有以下两种类型:

对称分布和偏态分布。

①对称分布:

指频数分布集中的位置居中，左右两侧频数分布大体对称；

②偏态分布:

指集中位置偏向一侧，频数分布不对称，根据集中位置和偏向不同，偏态分布又可分为:

正偏态分布和负偏态分布。

正偏态分布是指集中位置偏向观察值小的一侧，长尾向观察值大的一侧延伸；

均数大于中位数负偏态分布是指集中位置偏向观察值大的一侧，长尾向观察值小的一侧延伸。

不同分布类型的资料，要采用不同的统计方法来分析。

1、、频数分布表的用途①作为陈述资料的形式，可以代替原始资料，便于进一步分析②揭示资料的分布类型（正态分布还是偏态分布）③揭示变量的分布特征（集中趋势与离散趋势）④便于发现某项离群体的特大或特小值⑤当样本含量比较大是，可用各组段的频率作为概率的估计值⑥便于进一步计算统计指标和统计分析2.如何编制频数分布表①确定组数，一般分为8-15组②确定组距：

将全距（数据中最大值与最小值之差）除以组数可以得到组距的近似值。

③确定组限④统计频数3.正态分布的用途①确定医学参考值范围②质量控制③正态分布是很多统计方法的理论基础（t检验，方差分析）4.t分布与正态分布曲线的区别与联系区别：

t分布曲线:

①以0为中心，左右对称②一簇单峰分布曲线③t分布与自由度v有关，v越小，t分布的峰部越低，而两侧的尾部越高正态分布：

①单峰分布，以x=u为中心，左右完全对称；

正态曲线以x轴为渐近线，两端与x轴不相交②在x=u处有最大值；

在x=u处有拐点，呈现为钟型③正态分布有两个参数u，；

u为位置参数，为形态参数联系：

当v趋向时，t分布趋近标准正态分布，故标准正态分布是t分布的特例18、：

检验水准，通常我们会根据研究问题的背景，规定一个小的概率，若P小于，就认为P值较小，若P不小于，就认为P值较大。

一般取等于0.05或0.01，以保证犯假阳性错误的概率不超过0.05或0.01.这个称为检验水准。

19、、准检验水准:

绝用于判断是否拒绝H0的概率标准＝，用表示，一般取＝0.05，P，不拒绝H0;

P,拒绝H0。

20、1-：

：

称为检验效能或把握度，表示当两总体确实有差别时，按规定的检验水准发现其差别的能力（概率）。

21、1-：

置（可）信度，其中由研究者预先确定，一般取0.1,0.05,或0.01，常取0.05.在医学研究中，最常用的置信度是95%。

计算得到的区间叫可信区间。

表示总体均数估计的95%可信区间包括总体均数的概率为95%。

5.I类错误与II类错误的区别与联系区别：

①定义：

第一类错误:

拒绝了实际上是成立的H0所产生的错误，即弃真，其概率大小为。

第二类错误:

接受了实际上不成立的H0所产生的错误，即存伪，其概率大小为，②②一般ɑ为已知，可取单侧或双侧，如0.05或0.01，一般是未知的，其大小与有关。

只取单侧，如取0.1或0.2。

1-（把握度）不小于0.75。

把统计学上把1-称为检验效能（把握度）联系：

一般ɑ增大，则减小；

ɑ减小，则增大；

若要同时减小、，可以通过增加样本量的方法实现。

6.使用相对数的注意事项①不要把构成比和率混淆。

②计算相对数时分母一般不宜过小，分母过小时相对数不稳定。

③注意资料的可比性。

比较的资料应该是同质的，④样本率或构成比存在抽样误差。

不能单凭数字表面相差的大小而下定论，应对各组的样本率或构成比的差别做假设检验。

⑤对观察单位数不等的几个率，不能直接相加求其总率。

⑥⑥应当注意不能用构成比动态分析代替率的动态分析7.标准化法使用注意事项①标准划法是采用统一标准人口年龄构成②标准化后的率并不表示某地实际水平，只能表明相对水平③如不计算标准化率，而分别比较各组的率，也可得出正确结论，但不能比较总率的大小④④两样本标准化率是样本值，存在抽样误差，应做假设检验8.方差分析的用途①进行两个或两个以上样本均数的比较②进行两个或多个样本的方差齐性检验③可以同时分析一个、两个或多个因素对试验结果的作用和影响④分析多个因素间的独立作用及多个因素之间的交互作用33、标准差有什么用途?

标准差是描述变量值离散程度常用的指标，主要用途如下:

①描述变量值的离散程度。

两组同类资料（总体或样本）均数相近，标准差大，说明变量值的变异度较大，即各变量值较分散，因而均数代表性较差；

反之，标准差较小，说明变量异度较小，各变量值较集中在均数周围，因而均数的代表性较好。

②结合均数描述正态分布或近似正态分布特征；

③结合均数计算变异系数CV；

④结合样本含量计算标准误。

88、标准差，标准误有何区别和联系?

答:

标准差和标准误都是变异指标，但它们之间有区别，也有联系。

区别:

①概念不同；

标准差是描述观察值（（个体值））之间的变异程度；

标准误是描述样本均数的抽样误差；

②用途不同；

标准差常用于表示变量值对均数波动的大小，与均数结合估计参考值范围，计算变异系数，计算标准误等。

标准误常用于表示样本统计量（（样本均数，样本率））对总体参数（（总体均数，总体率））的波动情况，用于估计参数的可信区间，进行假设检验等。

③它们与样本含量的关系不同:

当样本含量n足够大时，标准差趋向稳定；

而标准误趋于0。

联系:

标准差，标准误均为变异指标，如果把样本均数看作一个变量值，则样本均数的标准误可称为样本均数的标准差；

当样本含量不变时，标准误与标准差成正比；

两者均可与均数结合运用，但描述的内容各不相同。

44、变异系数（CV）常用于哪几方面?

变异系数是变异指标之一，它常用于以下两个方面:

①比较均数相差悬殊的几组资料的变异度。

如比较儿童的体重与成年人体重的变异度，应使用CV；

②比较度量衡单位不同的几组资料的变异度。

如比较同性别，同年龄人群的身高和体重的变异度时，宜用CV。

88、tt检验和uu检验的应用条件各是什么?

（1）t检验的应用条件是:

样本取自正态总体，作两样本均数比较时还要求两总体方差相等；

（2）u检验的条件是:

样本例数n较大（如n＞100），或n虽小而总体标准差已知。

22、不同类型统计资料之间的关系如何?

根据分析需要，各类统计资料可以互相转化。

如男孩的出生体重，属于计量资料，如按体重正常与否分两类，则资料转化为计数资料；

如按体重分为:

低体重，正常体重，超体重，则资料转化为等级资料。

计数资料或等级资料也可经数量化后，转化为计量资料。

如性别，结果为男或女，属于计数资料，如男性用0（或1），女性用1（或0）表示，则将计数资料转化为计量资料。

14、参考值范围与可信区间区别是什么?

（1）意义不同:

参考值范围是指同质总体中包括一定数量（如95%或99%）个体值的估计范围，如95%参考值范围，意味该数值范围只包括95%的个体值，有5%的个体值不在此范围内。

可信区间是指按一定的可信度来估计总体参数所在范围。

如95%的可信区间，意味着做100次抽样，算得100个可信区间，平均有95个可信区间包括总体参数（估计正确）有5个可信区间不包括总体均数（估计错误）。

（2）计算方法不同:

参考值范围用XuS计算。

可信区间用Xt、Sx或XuSx计算；

前者用标准差，后者用标准误。

66、制定参考值范围有几种方法?

各自适用条件是什么?

制定参考值范围常用方法有两种:

①正态分布法:

此法是根据正态分布的原理，依据公式:

XuSS计算，仅适用于正态分布资料或对数、倒数转换后正态分布资料。

不适合偏态分布若为对数正态分布资料，先求出对数值的均数及标准差，求得正常值范围的界值后，反对数即可。

优点是结果较稳定，在样本含量不是很大的情况下仍然能够进行处理。

②百分位数法。

用P2.5～P97.5估计95%双侧参考值范围；

P5或P95为95%单侧正常值范围。

百分位数法适用于各种分布的资料（包括分布未知），计算较简便，快速。

使用条件是样本含量较大，分布趋于稳定。

一般应用于偏态分布资料、分布不明资料或开口资料。

5、制订医学参考值范围的注意事项①确定同质的参照总体②选择足够例数的参照样本③控制检测误差④选择单、双侧界值⑤选择适当的百分数范围⑥选择计算参考值范围的方法5、计量资料中常用的集中趋势指标及适用条件各是什么?

常用的描述集中趋势的指标有:

算术均数、几何均数及中位数。

①算术均数，简称均数，反映一组观察值在数量上的平均水平，适用于对称分布，尤其是正态分布资料；

②几何均数:

用G表示，也称倍数均数，反映变量值平均增减的倍数，适用于等比资料，对数正态分布资料；

③中位数:

用M表示，中位数是一组观察值按大小顺序排列后，位置居中的那个观察值。

它可用于任何分布类型的资料，但主要应用于偏态分布资料或两端无确定数值时。

④百分位数：

用来描述资料的观察值序列在某百分位置的水平。

适用于任何频数分布资料，单靠近两端的百分位数仅在样本例数较大时才比较稳定。

Px=Px组的下限+（总例数*x%-Px组段之前的累计频数）*组距/Px组的频数用P2.5和P97.5规定医学95%的参考值范围。

99、统计推断包括哪几方面内容?

统计推断包括:

参数估计及假设检验两方面。

参数估计是指由样本统计量（样本均数，率）来估计总体参数（总体均数及总体率），估计方法包括点值估计及区间估计。

点值估计直接用样本统计量来代表总体参数，忽略了抽样误差；

区间估计是按一定的可信度来估计总体参数所在的范围，按XuX或XuSX来估计。

假设检验是根据样本所提供的信息，推断总体参数是否相等。

13、如何正确理解差异有无显著性的统计学意义?

在假设检验中，如P，则结论是:

拒绝H0，接受H1，习惯上又称显著，此时不应该误解为相差很大，或在医学上有显著的（重要的）价值；

相反，如果P＞,结论是不拒绝H0。

习惯上称不显著，不应理解为相差不大或一定相等。

有统计学意义（差异有显著性）不一定有实际意义；

如某药平均降低血压5mmHg，经检验有统计学意义，但在实际中并无多大临床意义，不能认为该药有效。

相反，无统计学意义，并不一定无实际意义。

如用新疗法治疗某病，有效率与旧疗法无差异，此时无统计学意义，如果新疗法方法简便，省钱，更容易为病人接受，则新疗法还是有实际意义。

10、假设检验的目的和意义是什么?

在实际研究中，一般都是抽样研究，则所得的样本统计量（均数、率）往往不相等，这种差异有两种原因造成:

其一是抽样误差所致，其二是由于样本来自不同总体。

如果是由于抽样误差原因引起的差别，则这种差异没有统计学意义，认为两个或两个以上的样本来自同一总体；

另一方面如果样本是来自不同的总体而引起的差异，则这种差异有统计学意义，说明两个或两个以上样本所代表的总体的参数不相等。

样本统计量之间的差异是由什么原因引起，可以通过假设检验来确定。

因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。

77、何谓假设检验?

其一般步骤是什么?

假设检验:

根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本提供的信息,推断此假设应当拒绝或不拒绝,以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。

目的是比较总体参数之间有无差别。

实质是判断观察到的差别是由抽样误差引起还是总体上的不同。

假设检验一般分为五个步骤:

11、建立假设检验①一种是无效假设，符号为H0；

②一种是备择假设，符号为H1.，是在H0成立证据不足的情况下而被接受。

H0：

d=0H1：

d022、确定检验水准检验水准亦称为显著性水准，符号为ɑ。

它是判别差异有无统计意义的概率水准，是预先规定的拒绝域的概率值，其大小应根据分析的要求确定。

通常取ɑ=0.05或ɑ=0.01。

3、选定检验方法和计算统计量根据资料类型，研究设计的方案和统计推断的目的要求选用不同的检验方法和计算公式。

如完全随机设计中，两样本均数的比较可用t检验，样本含量较大时（n100）,可用u检验。

不同的统计方法可得到不同的统计量。

t检验，z检验、F检验、X2检验等。

4、确定概率P值P值是指在H0所规定的总体中作随机抽样，获得等于及大于（或小于）现有统计量的概率。

/5、作出推断结论如当Pɑ时，表示在H0成立的条件下，出现等于及小于现有统计量的概率是小概率，根据小概率事件原理，现有样本信息不支持H0，因而拒绝H0，结论为按所取检验水准拒绝H0，接受H1，即差异有统计学意义。

反之，当Pɑ，结论为按所取检验水准不拒绝H0，即差异无统计意义。

12、假设检验有何特点?

①统计检验的假设是关于总体特征的假设；

②用于检验的方法是以检验统计量的抽样分布为理论依据的；

③作出的结论是概率性的，不是绝对的肯定或否定。

15、XX22检验有何用途?

①推断两个或两个以上总体率（或构成比）之间有无差别；

②检验两变量之间有无相关关系；

③检验频数分布的拟合优度。

16、四格表资料的uu检验和XX22检验的应用条件有何异同?

（1）相同点：

四格表资料的u检验是根据正态近似原理进行的，凡能用u检验对两样本率进行检验的资料，均能使用X2检验，两者是等价的，即u2=X2；

u检验和X2检验都存在连续校正的问题。

（2）不同点：

由于u分布可确定单、双侧检验界值，可使用u检验进行单侧检验；

满足四格表u检验的资料，可计算两率之差的95%可信区间，以分析两率之差有无实际意义；

X2检验可用于22列联表资料有无关联的检验。

17、参数检验与非参数检验有何区别?

各有何优缺点?

参数检验是检验总体参数是否有差别，而非参数检验是检验总体分布的位置是否相同。

参数检验的优点是能充分利用样本资料所提供的信息，因此，检验效率较高。

其缺点是有较严格的使用条件，如要求总体的分布呈态分布，各总体方差要相等，有些资料不满足使用条件，就不能用参数检验。

非参数检验的优点是适用范围广。

它不要求资料分布的形式，另外可用于等级资料或不能确切定量的资料。

缺点是不能充分利用样本所提供的信息，因此检验效率较低，产生第二类错误较大。

18、非参数检验适用于哪些情况?

①不满足参数检验的资料，如偏态分布资料；

②分布不明的资料；

③等级资料或开口资料。

19、直线回归与相关有何区别和联系?

区别:

①在资料要求上，回归要求因变量y服从正态分布，自变量xx是可以精确测量和严格控制的变量，一般称为Ⅰ型回归；

相关要求两个变量xx、yy服从双变量正态分布。

这种资料若进行回归分析称为Ⅱ型回归。

②在应用上，说明两变量间依存变化的数量关系用回归，说明变量间的相关关系用相关。

①对一组数据若同时计算rr与与bb，则它们的正负号是一致的；

r②r与与bb的假设检验是等价的，即对同一样本，二者的tt值相等。

③可用回归解释相关。

展开阅读全文