医学统计学名词解释及问答题.docx
《医学统计学名词解释及问答题.docx》由会员分享,可在线阅读,更多相关《医学统计学名词解释及问答题.docx(9页珍藏版)》请在冰豆网上搜索。
医学统计学名词解释及问答题
医学统计学名词解释及问答题
1、总体(population):
是根据研究目的确定的同质研究对象的全体。
2、样本(sample):
从总体中抽取的一部分有代表性的个体。
3、同质(homogeneity):
是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):
指同质个体的某项指标之间的差异。
5、参数(parameter):
反映总体特征的指标称为参数。
6、统计量(statistic):
通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(samplingerror):
由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):
某事件发生的可能性大小。
9、正态分布(normaldistribution):
高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
10、平均数(average):
是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):
将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medicalreferencerange):
又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。
13、方差(variance):
是各个数据与平均数之差的平方的平均数。
14、标准差(standarddeviation):
是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standarderror):
样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(samplingerrorofmean):
由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesistesting):
先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
18、统计推断(statisticalinference):
是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。
19、Ⅰ型错误(typeⅠerror):
拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。
20、Ⅱ型错误(typeⅡerror):
不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。
21、检验效能(poweroftest):
又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
22、可信区间(confidenceinterval):
指总体参数可能所在的范围。
23、率(rate):
说明某现象发生的频率或强度。
24、构成比(constituentratio):
表示某事物内部各组成部分所占的比重或分布,常以百分数表示。
25、相对比(relativeratio):
表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
26、标准化率(standardizedrate):
亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
27、参数检验(parametrictest):
一类依赖于总体分布的具体形式的统计推断方法。
28、非参数检验(nonparametrictest):
一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。
29、自变量(independentvariable):
如果没有一个变量依赖于其他变量变化而变化的关系时,一般把测量比较简单的变量作为自变量。
30、因变量(dependentvariable):
测量比较复杂的变量称为因变量或应变量。
31、相关分析(correlationanalysis):
分析两个或多个变量间相互关系的统计分析方法。
32、线性回归分析(linearregressionanalysis):
用直线回归方程或数学模型描述变量间数量关系的统计方法。
33、相关系数(coefficientofcorrelation):
描述两个变量间线性相关关系密切程度与方向的统计指标。
34、回归系数(regressioncoefficient):
即回归直线的斜率,表示自变量x每改变一个单位时,应变量y平均变化b个单位,B为回归系数。
35、决定系数(determinantcoefficient):
r2,表示由x与y的直线关系导致的y的变异SS回,在总变异SS总所占比重,即回归效果的好坏,决定系数越接近1,回归效果越好。
36、最小二乘法(leastsquaremethod):
以各实测点到直线的纵向距离的平方和最小来确定回归直线。
37、统计表(statisticaltable):
将统计分析的事物及其指标用表格的形式列出来,直观地反映事物的数量关系及其趋势的一种表现形式。
38、统计图(statisticalchart):
用点的位置,线段的升降,直条的长短和面积大小等表达统计数据的一种形式。
39、单纯随机抽样(simplerandomsampling):
是从总体中以完全随机的方法抽取一部分观察对象组成样本,是最简单的抽样方法。
40、整群抽样(clustersampling):
先将总体划分为N个群,每个群包含若干个观察对象,再随机抽取n个群(n41、系统抽样(systematicsampling):
又称等距抽样,是按照一定的顺序,机械地每隔若干个观察单位抽取一个观察单位组成样本。
42、分层抽样(stratifiedsampling):
按影响观察值变异较大的某种特征将总体分成若干层,再从每层内随机抽取一定数量的观察单位组成样本。
43、配对设计(paireddesign):
是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况。
44、盲法(blind-method):
在随机对比试验中,为避免出现偏倚,使研究者或研究对象不明确干预措施的分配的方法。
45、对照(control):
处理因素与非处理因素的差异的科学对比,鉴别处理因素与非处理因素的效应差异。
46、随机区组设计(randomizedblockdesign):
又称配伍设计,是将几个条件基本相同的受试对象划成一个区组,区组中观察对象的数量取决于对比组的组数。
将区组中的受试对象采用随机方法,分配到不同的对比组中。
47、随机对照试验(random-controltrail):
又称完全随机设计,属于单因素研究设计,是将受试对象按照随机分配的原则分配到实验组和对照组中,然后给予不同的处理因素,对各组的效应进行同期平行观察,比较各组观察指标有无差异。
48、实验研究(experimentalstudy):
是指研究者根据研究目的人为地对受试对象施加处理因素,控制混杂因素,观察、总结处理因素的效果的一种研究方法。
1、什么是卫生统计学?
应用统计学的基本原理与方法,研究医学卫生及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。
2、统计学的基本步骤有哪些?
①良好的研究设计;②有计划地搜集资料;③合理地整理资料;④正确地分析资料。
3、抽样误差产生的原因有哪些?
可以避免抽样误差吗?
抽样误差的的根源在于个体变异,在抽样研究中是不可避免的。
4、何为概率及小概率事件?
概率P是指某事件发生的可能性大小。
P≤0.05的随机事件称为小概率事件,其原理是在一次实验中不大可能发生的。
5、描述数值变量资料集中趋势的指标有哪些?
其适用范围有何异同?
均数、几何均数、中位数。
均数适用于计量资料正态分布或近似正态分布资料;几何均数适用于对数正态分布或近似对数正态分布资料,也可用于等比资料,但一般不能有观察值为0,也不能同时包含正负观察值。
中位数用于描述极偏态资料,有特大特小值资料,有不确定数据资料和分布不明的资料。
6、描述数值变量资料离散趋势的指标有哪些?
其适用范围有何异同?
极差、四分位数间距、方差和标准差、变异系数。
极差和四分位数间距用于描述偏态分布资料、一端或两端没有确定值的资料。
方差和标准差用于描述正态分布资料的离散程度。
变异系数描述的是相对离散程度,用于单位不同,或虽单位相同但均数相差较大的资料变异程度的比较。
7、中位数与百分位数在意义上,计算和应用上有何区别于联系?
中位数是将一组数据由小到大排列,位于中间位置的观测值。
百分位数也是一种位置指标,样本的第x百分位数记作Px,它表示将全部观察值x1、x2…xn,由小到大排列后位于第x百分位置的数值。
中位数M是一个特殊的百分位数,即第50百分位数P50。
8、标准差与标准误的区别与联系:
1.区别:
①标准差衡量观察值的离散趋势(变异程度),越大表示观察值越分散,样本均数的代表性越差;反之,样本均数的代表性就越好;样本越大,标准差趋于稳定。
标准差主要用于医学参考值范围的估计。
②标准误代表样本均数的变异程度,表示抽样误差的大小,标准误越大,抽样误差越大,样本均数越离散,用样本均数估计总体均数的可靠性越差,反之样本均数的可靠性就好。
标准误主要用于总体均数可信区间的估计和假设检验。
2.联系:
都是变异指标,反应离散趋势;标准误的大小可以由标准差的大小来估计,
=
/
,
与
成正比,与
成反比;对于同一份资料,标准差越大,标准误也越大。
9、可信区间与参考值范围有何不同?
从意义上:
①可信区间按是预先给定的概率1-α确定总体均数μ的可能范围,95%可信区间是按95%可信度估计总体均数所在的范围,此时估计正确率为95%,即有95%可能性包含了总体均数,说明总体均数的可能范围。
②参考值范围是绝大多数正常人的某项指标的波动范围,95%参考值范围指同质总体中包含95%个体值的估计范围,说明个体值的波动范围。
从计算上:
①可信区间:
正态分布,σ未知,n<100时,双侧
;σ未知,n≥100时,双侧
;σ已知,双侧
。
②参考值范围:
正态分布,双侧
,单侧
或
;偏态分布,双侧
~
单侧
或
。
从应用上:
①可信区间用于总体均数区间估计,评价未知总体均数所在范围;②参考值范围可判断某项指标是否正常,评价个体指标是否正常。
10、假设检验与区间估计有何区别与联系?
①可信区间用于推断总体参数所在范围,假设检验用于推断总体参数是否不同;②可信区间也可回答假设检验的问题,但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计学意义;③可信区间还可提示差别有无实际意义,假设检验有统计意义但无实际意义的资料,实际工作中可能不重要;④验证假设时,可选择假设检验,只对总体参数做估计时,可选用区间估计,两者结合可对问题进行更全面的说明。
11、假设检验的注意事项:
①要有严密的抽样研究设计;②选择假设检验方法应符合相应条件;③有统计学意义不等于有实际意义;④结论不能绝对化。
12、常用相对数指标有哪些,意义和计算有何不同,为什么不能以比代率?
有率、构成比和相对比。
率是说明某现象发生的频率与强度,为频率指标,率=(某现象实际发生的观察单位数∕可能发生该现象的观察单位总数)×比例基数。
构成比表示事物内部各组成部分所占的比重或分布,常以百分数表示,构成比=(事物内部某一组成部分的观察单位数∕该事物各构成部分的观察单位总数)×100%。
相对比表示两个有关事物指标之比,常以百分数和倍数表示,相对比=(甲指标∕乙指标)(或×100%)。
13、应用相对数时应注意哪些问题?
①计算相对数时分母应该有足够数量即例数不能太少;②计算合计率或平均率时不能把n个率相加除以n,应将绝对数相加后再计算相对数;③正确区分构成比与率,分析时不能以构成比代替率;④相对数的比较时应注意可比性;⑤样本率或构成比在比较时应做假设检验。
14、率的标准化应注意哪些问题?
①标准化法只适用于内部构成不同影响到总率比较的情况;②由于选择的标准不同,算出的标准化率也不同,但比较的结论一致;③标准化后的标准化率,已经不再反映当时当地的实际水平,它只表示两组相互比较的资料间的相对水平;④样本标准化率也存在抽样误差,也需要进行假设检验。
15、统计表的制表原则与基本要求是什么?
原则:
重点突出,简单明了;主谓分明,层次清楚;结构完整,有自明性。
5项基本要求:
标题、标目、线条、数字、备注。
16、常用统计图有哪些,它们的适用条件是什么?
常用的统计图有:
条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图和统计地图。
①条图主要用于多个组别和多个类别的统计指标的比较,其纵轴必须从0开始;②圆图和百分条图用于描述或比较单个或多个构成比,圆图以圆的面积为100%,而条图以直条的面积为100%;③直方图描述连续性数值变量的频数分布;④箱式图描述不同类别之间某个连续型数值变量分布特征的比较,也用于发现异常值;⑤统计地图描述某现象的数量在地域上的分布;⑥普通线图描述某指标随某个连续型数值变量变化而变化的幅度(绝对变化趋势);⑦半对数线图描述某指标随某个连续型数值变量变化而变化的幅度(相对变化趋势);⑧散点图描述两个连续型数值变量之间的相互关系。
17、行×列表χ2检验注意事项有哪些?
1.行×列表χ2检验允许有1/5的基本格子理论频数小于5大于1,但不能有理论频数小于1;2.如果有1/5以上的基本格子理论频数小于5大于1,或有1个格子理论频数小于1,采用以下方法:
①增加样本含量;②将理论频数太小的行和列与性质相近的邻行和邻列实际频数合并;③删除理论频数太小的格子对应的行或列;④Fisher精确概率。
18、秩和检验的适用条件?
①非正态,方差不齐的资料;②有特大、特小值的资料;③有不确定数据的资料;④分布不明的资料;⑤等级资料。
19、应用相关分析与直线回归时应注意哪些问题?
①要有实际意义,不能把毫不相关的事物进行分析;②相关关系不一定是因果关系,可能是伴随关系;③相关和回归分析都必须进行假设检验;④回归方程一般只适用于自变量x的实测值范围内,不能随意外推;⑤一般先绘制散点图,有线性趋势时再进行。
20、直线相关与回归的区别与联系有哪些?
区别:
①相关关系说明两变量间的相互关系,回归说明两变量的从属关系;②相关表明两变量的方向和密切程度,回归则用函数方程表达应变量随自变量变化的数量关系;③相关分析要求两变量均是随机变量,并服从双变量正态分布,回归分析只要求应变量y服从正态分布;④单位不同,相关系数无单位,回归系数b有单位;⑤范围不同。
相关系数-1≤r≤1,回归系数-∞﹤b﹤+∞。
联系:
①对于同一组数据,相关系数与回归系数的正负号一致;②同一资料r与b的假设检验等价,且有
=
=
,可以用r的假设检验代替b的假设检验;③可以用回归解释相关,
,
为决定系数,表示y的变化中由x变化所引起的比重。