c.X=Md.X≥M或X≤M
3、反映一组血清学滴度资料或效价资料平均水平采用____。
a.Xb.M
c.Gd.R
4、在σ未知且n较大时,估计μ95%可信区间可用____表示。
a.X±1.96Sb.X±2.58S
c.X±2.58Sxd.X±1.96Sx
5、来自同一总体中的两个样本,其中__小的那个样本均数估计μ时更可靠。
a.Sxb.S
c.S2d.CV
6、在假设检验中,由于抽样的偶然性,拒绝了实际上成立的H0假设,则__。
a.犯第I类错误b.犯第II类错误
c.推断正确d.a,b都有可能
7、在假设检验中,由于抽样偶然性,接受了实际上不成立的H0假设,则__。
a.犯第I类错误b.犯第II类错误
c.推断正确d.a,b都有可能
8、在假设检验中,接受了实际上成立的H0假设,则____。
a.犯第I类错误b.犯第II类错误
c.推断正确d.a,b都有可能
9、α=0.05,t>t0.05,ν,统计上可认为___。
a.两总体均数差别无显著意义b.两样本均数差别无显著意义
c.两总体均数差别有显著意义d.两样本均数差别有显著意义
10、在均数为μ,方差为σ2的正态总体中随机抽样,每组样本含量n相等,
u=(X-μ)/σx,则u≥1.96的概率是___。
a.P>0.05b.P≤0.05
c.P≥0.025d.P≤0.025
11、在均数为μ,标准差为σ的正态总体中随机抽样,得|X-μ|≥______的概率为0.05。
a.1.96σb.1.96σx
c.t0.05Sd.1.96Sx
12、四个百分率作比较,有1个理论值小于5,大于1,其余都大于5,则__。
a.只能作校正X2检验b.不能作X2检验
c.作X2检验,不必校正d.先进行合理的合并
13、某病发病率和患病率中,理论上可能超过100%的是___。
a.发病率b.患病率
c.发病率和患病率都会d.发病率和患病率都不会
14、计算两县宫颈癌标化死亡率,目的是_____。
a.消除两县妇女人口年龄构成不同的影响
b.消除两县总人口不同的影响
c.消除两县妇女总人口不同的影响
d.为了能与其他地区比较
15、两个四格表资料,-个X2>X20.01 ,另一个X2>X20.05,可认为____。
a.前者两个率相差较大b.后者两个率相差较大
c.前者结论更可靠d.后者结论更可靠
16、假设检验时,是否拒绝H。
,取决于___________。
a.被研究总体有无本质差别b.选用α的大小
c.抽样误差的大小d.以上都是
17、用A、B两药分别观察治疗某病疗效,各观察15人,欲比较两药疗效,宜采用_____。
a.四格表x2检验b.四格表确切概率法
c.四格表校正x2检验d.配对x2检验
18、比较某地10年间麻疹、百日咳、结核病发病率的下降速度宜采用_______图。
a.普通线图b.半对数线图
c.直条图d.构成比条图
19、要减少抽样误差的办法是________。
a.增加样本含量b.遵循随机化的原则
c.选择最好的抽样方法d.a,b,c,都是
20、标化后的总率,反映_____________。
a.实际水平b.相对水平
c.更准确d.以上都不是
21、计算婴儿死亡率分母应是____________。
a.当年活产数b.当年活产数+死产数
b.当年活产数+死产数+死胎数d.当年孕妇数
22、计算某地某年某病年发病率时,分母应为___________。
a.该年年中人口数b.该年年平均人口数
c.该年年末人口数d.a、b都可以
23、u检验可用于_____________。
a.两样本均数比较b.两样本率的比较
c.多个均数或多个率的比较d.a、b均可
24、反映某地三种病的发病率的变动趋势,宜采用__________。
a.普通线图b.半对数线图
c.直条图d.直方图
25、比较男童体重和成年男性体重变异何者为大,宜用__________。
a.标准差b.标准误
c.变异系数d.四分位数间距
26、已知n1=150,阳性30;n2=200,阳性50,则两组合并率为__________。
a.22.9%b.22.5%
c.22%d.23.1%
27、作单侧检验的前提是____________。
a.已知新药优于旧药b.不知新药好还是旧药好
c.已知新药不比旧药差d.已知新旧药差不多好
28、在假设检验中,拒绝实际上不成立的H0假设是___________。
a.犯第Ⅰ类错误b.犯第Ⅱ类错误
c.推断正确d.与α大小有关
29、直条图可用于______________。
a.表示某现象的频数分布b.某事物的内部构成
c.比较相互独立事物的大小c.某现象的变化速度
30、在比较两组样本均数时,要求样本_________。
a.来自正态总体且方差相等b.只要求两总体方差相等
c.只要求来自正态总体d.不能大于30例
31、需要用四格表校正公式计算X2值的条件是_________。
a.1<T<5且n>40b.1<T<5且n<40
c.1<T<5或n<40d.T<1或n<40
32、反映样本均数代表性的指标是_________。
a.Sb.SX
c.CVd.Q
33、在制定尿铅95%参考值范围时,宜采用_________。
a.X±1.96Sb.X±1.96Sx
c.≤P95d.≥P95
34、欲反映100名老年人血糖的分布,宜采用_________。
a.直方图b.直条图
c.线图d.构成比图
35、在假设检验中,若要减少β,则_________。
a.α↑b.1-β↑
c.α↓d.a.b.同时存在
36、确定正常人某项指标的正常参考值范围时,调查对象是_________。
a.从未患过病的人b.只患过小病的人
c.自觉健康的人d.排除影响被研究指标的疾病和因素的人
37、描述一组偏态分布资料的变异度指标,宜选用_________。
a.标准差b.变异系数
c.四分位数间距d.方差
38、对两组大样本率的比较,可选用_________。
a.u检验b.x2检验
c.四格表确切计算概率法d.以上都可以
39、死因顺位的排列是依据_________。
a.死因构成b.死因别死亡率
c.总死亡率d.死因标化死亡率
40、统计中的抽样是指_________。
a.在总体中随意抽取部分观察单位b.有意识的选择部分观察单位
c.按照随机的原则抽取部分观察单位d.抽取有典型意义的观察单位
41、调查某地高血压患病情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,990名非患者,整理后的资料是_________。
a.计量资料b.计数资料
c.等级资料d.以上都不是
42、调查某地1000人的血糖值,这是_________。
a.计量资料b.计数资料
c.等级资料d.以上都不是
43、频数表资料计算中位数时,要求_________。
a.组距一定相等b.组距不相等
c.组距可等可不等d.频数分布对称
44、表示一组对称分布资料变量值的平均水平,用_________。
a.算术均数(X)b.中位数(M)
c.几何均数(G)d.a、b都可以
45、应用免疫酶法分别测定鼻咽癌患者与非患者各10人的血清某病毒抗体滴度,欲比较患者与非患者抗体滴度有无差别宜采用_________。
a.配对设计差值均数与总体差值均数0的比较t
b.成组设计两样本均数比较的t检验
c.成组设计两样本几何均数比较t检验
d.两样本均数比较u检验
46、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用_________。
a.配对设计差值均数与总体差值均数0的比较t检验
b.成组设计两样本均数比较的t检验
c.成组设计两样本几何均数比较t检验
d.两样本均数比较u检验
47、有52例可疑宫颈癌患者,分别用甲、乙两法进行诊断,其中甲法阳性28例,乙法阳性25例,两法均为阳性20例,欲比较两法阳性率有无差别,宜用_________。
a.四格表x2检验b.配对设计x2检验
c.行×列表x2检验d.t检验
二、是非题(对者打“+”,错者打“-”)
()1.在假设检验中,无论是否拒绝H0,都有可能犯错误。
()2.当V=∞时,t=u
()3.成组设计的两样本几何均数的比较;当n足够大时,也可以用u检验。
()4.同类研究的两组资料,n1=n2,则标准差大的那一组,μ的95%可信区间范围也一定大。
()5.任何正态分布资料,都可以变换成均数为0,标准差为1的标准正态分布资料。
()6.变异系数只能比较不同计量单位资料的变异度。
()7.百分位数法确定医学参考值范围适用于任何分布型的资料。
()8.正态分布资料或对称分布资料,理论上X=M。
()9.标准差越小,表示均数的代表性越好。
()10.标准误越小,表示用样本均数估计总体均数的可靠性越大。
()11.X2检验的自由度=(行数-1)(列数-1)
()12.两个同类资料的t检验,其中P1<0.01,P2<0.05,说明前者两样本均数之差大于后者。
()13.以活产总数为分母的统计指标,不同地区间可直接进行比较。
()14.普查由于没有抽样误差,其结果总比抽样研究结果准确。
()15.当资料分布的末端无确切数据时不能计算平均数。
()16.抽样误差是不可避免的,但其大小是可以控制的。
()17.任何一种计量资料都可根据需要转换成计数资料或等级资料。
()18.统计的假设是对总体特征的假设,其结论是概率性的,不是绝对的肯定或否定。
()19.四格表X2检验中,若某一格子实际数为0,也可以X2检验。
()20.同一受试对象分别接受两种处理,目的是推断两种处理有无效果,这是配对设计。
()21.同一受试对象处理前后的比较,目的是推断该处理有无效果,这是配对设计。
()22.均数比较的u检验的应用条件是n较大或n虽小但σ已知。
三、填空题:
1、统计工作可分为四个步骤:
统计设计、搜集资料、整理资料、和分析资料。
2、统计分析包括:
统计描述和统计推断。
3、统计资料的类型可分为:
计数资料、计量资料和等级资料。
4、总体是指:
根据研究目的而确定的所有同质观察单位某项变量值的集合。
分为有限总体和无限总体。
5、随机事件的概率在0~1之间;P越接近于1,表明某事件发生的可能性越大,P越接近0,表示某事件发生的可能性越小,习惯上当P≤0.05或P≤0.01称为小概率事件。
6、频数分布有两个重要特征:
集中趋势和离散趋势。
7、资料的分布形式可分为正态分布和偏态分布两种类型。
8、偏态分布为分为正偏态和负偏态两种情况。
如果分布高峰偏向观察值较小的一侧,则该分布为正偏态;而分布高峰偏向观察值较大的一侧,则该分布为负偏态。
医学上的偏态分布资料以正偏态为多见。
9、应用百分位数法计算参考值范围时,若要计算肺活量的95%参考值范围,应计算P5;求尿铅的95%参考值范围,应计算P95;而白细胞数95%参考值范围,应计算P2.5和P97.5。
10、测定某地107名正常人尿铅含量(μmol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。
──────────────────────────────────
尿铅含量 0- 0.19-0.39-0.58-0.77-0.97-1.16-1.35
──────────────────────────────────
例 数14 22291815612
──────────────────────────────────
11、血清抗体滴度或效价资料常用几何均数来表示其平均水平。
12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。
13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。
14、常用的离散程度的指标有极差、四分位数间距、方差、标准差和变异系数。
15、几何均数常用于呈等比级的资料或呈对数正态分布的资料。
16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。
17、比较两组或多组数值变量资料的变异程度,在度量衡单位不同或均数相差悬殊时,应采用变异系数进行比较。
18、正态分布有两个参数,一是位置参数μ,另一个是变异度参数σ。
19、正态分布是以μ为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。
20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。
21、正态曲线下从μ到μ+1.96σ范围外的面积占总面积52.5%。
22、计算正态分布资料95%正常值范围的公式是X±1.96S;估计总体均数95%可信区间的公式是
X±1.96Sx。
23、一组数据呈正态分布,其中大于X-1.96S的变量值占97.5%。
24、参数估计可分为点值估计和区间估计。
25、正态分布的形态由σ决定,t分布的形态由自由度决定。
26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于μ,Sx趋向于0,t(0.05,v)趋向于1.96。
27、t检验的应用条件是样本取自正态总体和两样本均数比较要求方差齐性而u检验的应用条件是样本例数n较大或样本例数虽小但总体标准差已知。
28、做t检验时,若计算得t>t(0.05,v),则推算的概率为P<0.05。
29、同时减少第一类错误和第二类错误的唯一方法是增加样本例数。
30、对率进行标准化的方法有:
直接法、间接法;由于间接法未对内部构成进行调整,因此用该法计算所得的标化率不能直接比较。
31、对率进行标准化时,选择标准组有三种方法:
①选有代表性的、较稳定的、数量较大的人群做标准;②将相互比较的各组数据合并作标准;③选择相互比较的各组中的一组作为标准。
32、率的标准化法的目的是消除因内部构成不同对总率产生的影响,使标化率具有可比性。
33、四格表X2检验需要校正的条件是n>40,1≤T<5,而当n<40或T<1时,必须采用
四格表确切概率法。
34、配对资料的X2检验,当b+c≤40时,需计算校正X2值。
35、欲反映120名20岁女大学生体重的频数分布资料,应绘制直方图。
四、名词解释
1、变异:
即同质的观察单位之间某项特征所存在的差异。
2、总体:
根据研究目的确定的同质观察单位某项变量值的集合。
3、样本:
从总体中随机抽取的部分观察单位某项变量值的集合组成样本。
4、概率:
描述随机事件发生可能性大小的数值,用P表示,0≤P≤1。
5、中位数:
将一组观察值按从小到大的顺序排列后,位次居中的观察值。
6、百分位数:
将顺序排列的一组观察值分为一百等分,位于某百分位置上的数值,以Px表示,它是一种位置指标,理论上有x%的观察值比它小,有(100-X)%的观察值比它大。
7、变异系数:
标准差S与均数X之比用百分数表示。
公式是CV=S/X×100%。
8、可信区间:
在参数估计时,按一定可信度估计所得的总体参数所在的范围。
9、抽样误差:
由于总体中存在个体变异,随机抽样所得样本仅仅是总体的一部分,从而造成样本统计量与总体参数之间的差异,称抽样误差。
10、P值:
指由H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本检验统计量的概率,P的取值范围在0-1之间。
11、假设检验:
根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本提供的信息,推断此假设应当拒绝或不拒绝,以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析。
12、构成比:
又称构成指标。
它说明一事物内部各组成部分所占的比重或分布。
构成比=(某一组成部分的观察单位数/同一事物各组成的观察单位总数)×100%。
13、率:
又称频率指标,它说明某现象发生的频率或强度。
率=(发生某现象的观察单位数/可能发生该现象的观察单位总数)×K。
14、率的标准化法:
在比较两个或两个以上的总率时,采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准,以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。
15、婴儿死亡率:
指某地某年每1000名活产缨儿中,不满一周岁的婴儿死亡数。
16、死因构成:
又称相对死亡比。
是某类死因的死亡数占总死亡数的百分数。
17、死因顺位:
各种死因死亡数按其占总死亡数的比重由高到低排出的位次。
18、某病发病率:
(某病发病率=该期间所发生的某病新病例数/一定时期内可能发生某病的平均人口数)×k。
19、某病患病率:
(检查时所发现的某病现患病例总数/该时点受检人口数)×K。
20、某病病死率:
(观察期间因某病死亡人数/同期某病病人数)×100%。
21、生存率:
病人能存活到某时点的生存概率。
22、年龄别死亡率:
某年龄组死亡率=(同年该年龄组的死亡人数/某年某年龄组平均人口数)×1000%。
23、总和生育率:
一定时期内每岁一组的年龄别生育率的总和。
总和生育率=5×(各年龄别生育率之和)。
24、年龄别生育率:
某年龄组生育率=(同年该年龄组妇女的活产数/某年某年龄组妇女数)×1000%。
25、计量资料:
用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料。
26、计数资料:
先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得资料,称为计数资料。
27、等级资料:
将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
五、简答题
1、统计资料可以分成几类?
答:
根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。
用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。
2、频数分布有哪几种类型?
答:
频数分布有以下两种类型:
对称分布和偏态分布。
①对称分布:
指频数分布集中的位置居中,左右两侧频数分布大体对称;②偏态分布:
指集中位置偏向一侧,频数分布不对称,根据集中位置和偏向不同,偏态分布又可分为:
正偏态分布和负偏态分布。
正偏态分布是指集中位置偏向观察值小的一侧,长尾向观察值大的一侧延伸;负偏态分布是指集中位置偏向观察值大的一侧,长尾向观察值小的一侧延伸。
不同分布类型的资料,要采用不同的统计方法来分析。
3、标准差有什么用途?
答:
标准差是描述变量值离散程度常用的指标,主要用途如下:
①描述变量值的离散程度。
两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。
②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。
4、变异系数(CV)常用于哪几方面?
答:
变异系数是变异指标之一,它常用于以下两个方面:
①比较均数相差悬殊的几组资料的变异度。
如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。
如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。
5、计量资料中常用的集中趋势指标及适用条件各是什么?
答:
常用的描述集中趋势的指标有:
算术均数、几何均数及中位数。
①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数:
用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数:
用M表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。
它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。
6、标准差,标准误有何区别和联系?
答:
标准差和标准误都是变异指标,但它们之间有区别,也有联系。
区别:
①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:
当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:
标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。
7、何谓假设检验?
其一般步骤是什么?
答:
所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本所提供的信息,对所提出的假设作出拒绝或不拒绝的结论的过程。
假设检验一般分为五个步骤:
①建立假设:
包括:
H0,称无效假设;H1:
称备择假设;②确定检验水准:
检验水准用α表示,α一般取0.05;③计算检验统计量:
根据不同的检验方法,使用特定的公式计算;④确定P值:
通过统计量及相应的界