统计复习题a答案.docx
《统计复习题a答案.docx》由会员分享,可在线阅读,更多相关《统计复习题a答案.docx(56页珍藏版)》请在冰豆网上搜索。
统计复习题a答案
单选题:
1D2B3E4C5.B6C7E8C9B10A
11C12E13C14C15E16C17B18B19A20E
21D22C23B24D25D26C27B28D29B30C
31C32D33B34A35D36B37D38C39A40B
41D42A43D44A45A46A47A48D49C50E
51C52A53E54C55B56C57C58B59C60A
61A62E63C64C65C66D67E68C69B70B
71D72C73E74B75D76C77E78B79D80E
81D82D83D84C85C86D87C88C89C90C
91A92D93C94E95D96D97D98A99C100A
101B102D103B104A105B106C107A108C109B110A
111D112D113D114D115D116E117D118D119C120B
121C122E123D124A125C126C127A128B129A130E
131E132A133E134C135C136D137C138D139B140E
141A142A143D144C145A146E147D148E149D150C
151C152E153D154B155B156C157B158A159D160D
多选题
1ABCD2BCD3ACD4ABCD5ABCD6ACE7ACD
8ACD9ADE10AC11BE12ABDE13DE14BDCE
15AB16ABCD17ABCE18E19AD20BE21ABCD
22ABCD23BD24CD25CE26ABCE27ABE28ADE
29BCD30CDE31AE32ABDE33CD
简答题
1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。
答:
同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。
总体是指所有广东省6岁儿童,样本为200名6岁儿童。
2.卫生统计工作中的统计资料主要的来源有哪些?
答:
①统计报表。
②经常性工作记录。
③专题调查或实验。
3.简述统计工作全过程的四个步骤。
答:
研究设计、收集资料、整理资料、统计分析。
4.试举例说明常见的三种资料类型。
答:
(1).计量或测量或数值资料,如身高、体重等。
(2).计数或分类资料,如性别、血型等。
(3).等级资料,如尿蛋白含量-、+、++、+++、…。
5.统计学上的变异、变量、变量值是指什么?
答:
变异:
每个观察个体之间的测量指标的差异称为变异。
变量:
表示个体某种变异特征的量为变量。
变量值:
对变量的测得值为变量值。
6.简述编制频数表的步骤与要点。
答:
(1)找出最大和最小值,计算极差。
(2)确定组距和列出分组计划:
第一组应包括最小值;最末组应包括最大值,并闭口。
(3)将原始数据整理后,得到各组频数。
7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?
答:
常用描述平均水平的平均数有算术均数、几何均数和中位数。
算术均数适合:
对称资料,最好是近似正态分布资料。
几何均数适合:
经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。
中位数适合:
数据非对称分布、分布不清楚或开口资料的情形。
8.描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?
答:
常见的几种描述离散程度的指标:
极差或全距,四分位数差距,方差与标准差,变异系数。
极差适合:
数据分布非对称的情形。
四分位数差距适合:
数据分布非对称的情形。
方差与标准差适合:
对称分布或近似正态分布资料,能充分利用全部个体的信息。
变异系数适用:
当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
9.统计描述的基本方法有哪些,各自有何特点?
答:
统计描述的基本方法:
用表、图和数字的形式概括原始资料的主要信息。
表:
详细、精确。
图:
直观。
指标:
综合性好。
10.简述变异系数的实用时机。
答:
变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
11.怎样正确描述一组计量资料?
答:
(1).根据分布类型选择指标。
(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料
选用中位数与四分位数间距。
12.正态分布的主要特征有哪些?
答:
(1)正态曲线在横轴上方均数处最高。
(2)正态分布以均数为中心,左右对称。
(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。
(4)正态曲线下的面积分布有一定规律。
13.参考值范围是指什么?
答:
参考值范围又称正常值范围,即大多数正常人某指标值的范围。
“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。
14.简述估计参考值范围的步骤与要点。
答:
设计:
①样本:
“正常人”,大样本n≥100。
②单侧或双侧。
③指标分布类型。
计算:
①若直方图看来像正态分布,用正态分布法。
②若直方图看来不像正态分布,用百分位数法。
15.简述正态分布的用途。
答:
(1)估计频数分布。
(2)制定参考值范围。
(3)质量控制。
(4)统计检验的理论基础。
16.简述可信区间在假设检验问题中的作用。
答:
可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。
可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。
故将二者结合起来,才是对假设检验问题的完整分析。
17.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么?
答:
P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。
当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。
下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。
18.假设检验中
与P的区别何在?
答:
以t检验为例,
与P都可用t分布尾部面积大小表示,所不同的是:
值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。
P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验统计量的概率。
19.什么叫两型错误?
作统计学假设检验为什么要加以考虑?
答:
如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α;
如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。
一般情况下,α越大,β越小;α越小,β越大。
如果要同时减少两类错误,则需最大样本
含量。
因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。
20.配对比较是不是就比成组比较好?
什么情况下用配对比较比较好?
答:
配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。
但这并不是说凡是配对试验就一定比成组比较好。
实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。
21.t检验有几种?
各适用于哪些情况?
答:
t检验以t分布为理论基础。
小样本时要求假定条件:
资料服从正态分布,方差齐同。
一般分为三种:
一是样本均数与总体均数比较的t检验。
即将一个样本均数X与一已知的总体均数作比较;
二是配对资料的t检验。
例如治疗前后的比较,或配成对子的实验动物之间的比较。
三是两个样本均数比较的t检验;两组的样本量可以不相同。
此外尚有相关系数、回归系数的t检验。
22.什么叫假设检验?
医学研究中常用的假设检验有哪些?
答:
判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:
①提出检验假设0H,确定单双侧与检验水准α;②计算检验统计量;③确定概率P值;④判断结果。
在医学研究中常用的显著性检验有u检验、t检验、F检验、2检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。
23.通过实例说明为什么假设检验的结论不能绝对化?
答:
统计的结论为概率性的结论。
拒绝H0时,可能犯Ⅰ型错误。
不拒绝H0时,可能犯Ⅱ型错误。
24.方差分析的检验假设(H0)是什么?
答:
各总体均数相等
25.方差分析中,各离均差平方和之间有何联系?
各自由度之间又有何联系?
完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?
答:
总的离均差平方和等于各部分离均差平方和之和.总的自由度等于各部分自由度之和.完全随机设计:
SS总=SS组内+SS组间V总=V组内+V组间
随机区组设计:
SS总=SS组内+SS处理组间+SS区组间
V总=V组内+V处理组间+V区组间
26.三组均数比较时,为什么不能直接作一般的两两均数比较的t检验?
答:
增大犯第一类错误的可能性.
27.两组均数差别的假设检验能否作方差分析,为什么?
答:
可以.方差分析与t检验关系:
k=2时,F=t2,P值相等,即两检验等价。
28.方差分析中,组间变异是来源于那些方面的变异?
答:
该变异除随机原因的影响外,有可能存在处理因素的作用。
29.对多组均数作方差分析的主要步骤和结果有那些?
答:
(1)建立检验假设和检验水准
(2)计算统计量F值(列出方差分析表)
(3)确定P值和作出推断结论
(4)作两两均数之间的比较(若P>0.05则可省略此步骤)
30.方差分析的基本思想是什么?
答:
方差分析的基本思想:
就是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。
31.为什么不能以构成比代率?
答:
二者说明的问题不同。
构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。
32.简述相对数标准化的基本思想。
答:
基本思想:
采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。
33解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?
答:
率的直接标化法:
已知各组的年龄别死亡率pi。
间接标化法:
已知各组的死亡总数和各年龄组人口数.
34.率的直接标化法,与间接标化法有何不同?
答:
(1)适用条件不同(见第上题);
(2)“标准”不同:
前者选定一个“标准人口”或“标准人口构成”。
后者选定一套“标准年龄别死亡率”。
35.应用相对数时应注意哪些问题?
答:
应用相对数指标的时候要注意:
分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。
36.常用相对数指标有哪些?
它们的意义上有何不同?
答:
常用相对数指标:
率、构成比、比。
率又称频率指标或强度相对数。
说明某现象发生的频率或强度。
常用来表示某一事物发展的趋势或水平及特征。
构成比又称构成指标或结构相对数。
部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。
常用来表示疾病或死亡的顺位、位次或所占比重。
比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。
37.统计学上资料是否“具有可比性”指的是什么?
你能举出一些不可比的例子吗?
答:
除研究因素外,其余重要影响因素应相同或相近。
一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。
例如内科和外科的治愈率就无可比性。
38.二项分布、Poisson分布各有哪些特征?
答:
二项分布和Poisson分布都是离散型分布。
二项分布的形状取决于
与n的大小:
=0.5时,不论n大小,分布对称。
≠0.5时,图形呈偏态,随n的增大,逐渐对称。
当n足够大,
或1-
不太小,二项分布B(n,
)近似于正态分布N(n
n
(1-
))。
Poisson分布:
值愈小分布愈偏,
愈大分布趋于对称,当
足够大时,分布接近正态分布N(
)。
39.简述二项分布、Poisson分布、正态分布的关系。
答:
当n足够大,
或1-
不太小时,二项分布近似于正态分布。
当n足够大,
或1-
很小时,二项分布近似于Poisson分布。
较大时,Poisson分布近似于正态分布。
40.二项分布的应用条件是什么?
答:
⑴每次试验有且仅有两个互相排斥的结果(A或非A)。
⑵每次试验中,发生A的概率相同,均为π。
⑶各次试验独立,即n次观察结果相互独立。
41.
检验的用途有哪些?
答:
主要适用于计数资料,
(1)两个及两个以上的率或构成比的比较
(2)交叉分类资料两属性间的关联性检验(3)频数分布的拟合优度。
42.以下表资料说明χ2检验的基本思想。
(不用计算)
答:
基本思想:
假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑H0是否成立。
完全符合则为0或特别小,x2值越小,越支持H0。
43.四格表资料
检验的条件有哪些?
答:
T<1或n<40确切概率法
n≥40但有1£T<5要校正
n≥40并且T>5不必校正
44.某病的发病率对全国人口来说是8.72%,现在某县回顾一年,抽样调查了120人,有16人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作
检验,你认为应该用什么方法?
答:
不能,用单样本率比较的u检验。
45.请指出非参数检验与参数检验相比的优、缺点。
答:
非参数检验适用范围广,收集资料、统计分析也比较方便。
但检验效率没有参数检验高,犯第二类错误的概率较大。
46.简述参数检验与非参数检验的定义及两者的区别。
答:
参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。
特点:
依赖于特定的分布类型,比较的是参数。
非参数统计是不依赖于总体分布具体形式的统计方法。
特点:
不受总体参数的影响,比较的是分布或分布位置,而不是参数。
47.简述配对比较秩和检验的编秩方法。
答:
求差值,差值编秩;差值0删去,相同值取平均秩
48.配对设计差值的符号秩和检验步骤。
答:
(1)H0:
差值的总体中位数Md=0;H1:
Md≠0;
=0.05
(2)求差值
(3)编秩:
依差值的绝对值从小到大秩次。
绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。
(4)求秩和确定检验统计量:
分别求正、负秩次之和,任取T+或T—作检验统计量T,
(5)确定P值,作推断结论。
49.两组比较的秩和检验的编秩方法。
答:
将两样本混合编秩次。
若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。
50.对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?
答:
当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。
51.非参数检验的适用范围。
答:
①各种资料的初步分析;
②等级资料:
某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先后或综合判断等方式定出次序;
③资料分布类型不能确定或偏态分布;
④综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;
⑤组内个别数据偏离过大,或各组内相差悬殊。
52.两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系?
答:
0相关不等于无关,因为可能无直线关系但有曲线关系
53.直线回归及其回归方程有何用途?
答:
(一)描述Y对X的依存关系。
(二)预测(forecast):
由自变量X估算应变量Y。
Y波动范围可按求个体Y值容许
区间方法计算。
(三)统计控制:
控制Y估算X,逆估计。
通过控制自变量X的取值,满足应变量Y在
一定范围内波动。
54.简述作直线相关与回归分析时应注意的事项。
答:
(1)回归方程要有实际意义。
(2).分析前绘制散点图,考察是否有直线趋势或异常点。
(3).
直线回归的适用范围一般以自变量的取值范围为限。
没有充分理由X的取值不要外延。
55.简述直线回归与直线相关的区别与联系。
答:
(一)、区别
(1)资料要求不同:
回归可以有两种情况:
①Y正态随机,X为选定变量----Ⅰ型回归;
②X、Y服从双变量正态分布----Ⅱ型回归。
相关:
X、Y服从双变量正态分布。
(2)应用不同:
回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。
相关是只说明两个变量间是否有关联。
(3)意义不同:
b表示X每增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度和方向。
(4)取值范围不同:
-∞<b<+∞;-1<a<+1。
(5)回归系数有单位,相关系数无单位。
(二)、关系
(1)方向一致:
对一组数据若同时计算r与b,其正负号一致。
(2)假设检验等价:
对同一样本,tr=tb,P值相等。
(3)用回归解释相关:
决定系数反映Y的总变异中有多大可能可由X来解释。
越接近1,回归的效果越好。
56.简述直线相关系数意义。
答:
相关系数描述线性相关的密切程度与方向。
相关系数没有单位,-1≤r≤1。
r>0表示正相关;r<0表示负相关;|r|=1表示完全相关;r=0表示零相关。
57.经检验认为回归方程有意义,表明两变量间存在因果关系,对否?
答:
不一定。
应联系专业知识考察变量间关系。
58.用什么方法考察回归直线图示是否正确?
答:
直线经过(X,Y)点。
直线与纵轴交点的纵坐标为截距a。
直线应在自变量X的实测范围内。
59.依次写出箱式图中涉及到的各个取值。
由大到小的次序为:
极大值、75P、中位数、25P和极小值。
60.直方图中各矩形的高度等于频数(或频率),对吗?
答:
对于各组距相等的情形,该说法是对的。
若某些组段的组距与多数组段所取组距不同时,例如前者是后者的k倍,则该不等距组段的高度为频数(或频率)除以k。
确切地说,组段对应的面积等于频数(或频率)。
61.统计表的列表原则是什么?
答:
一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。
62.线图和半对数线图的主要区别是什么?
答:
线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;
半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。
63.某医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三个基本要素是什么?
答:
降压药物为处理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。
64.样本含量估计的要素有哪些?
答:
(1)根据研究目的,建立检验假设
(2)定出检验水准,常取0.05
=(3)提出所期望的检验效能
(4)必须知道由样本推断总体的一些信息,例如,对于两总体均数的比较,需知道两均数间的差值和总体标准差
s
65.什么是盲法?
举例说明盲法在临床试验中的重要性。
答:
为了有效减少实验观察过程中的偏倚,使患者(甚至包括研究者及其他参与者)不知道处理措施的内容,称为盲法。
可有单盲法、双盲法和三盲法。
例如研究某抗神经衰弱药物的疗效,当患者知晓自己所接受的处理措施时,对疗效的评价往往会受心理因素作用而不够客观。
采用盲法,则可以避免疗效测量中可能产生的偏倚。
66.实验设计应当遵循哪些基本的原则?
随机化原则、对照的原则及重复的原则。
67.各举一个配对设计和成组设计的例子。
在评价某降压药物的降压作用时,可以采用以下两种方案。
配对设计:
按体重和舒张压相近、性别和窝别相同将40只大鼠分为20对,每对中随机地取其一接受A药,另一只接受B药。
服用一个疗程后,比较两组血压改变量的区别,从而考察药物A和B的疗效。
成组设计:
将体重和舒张压相近、性别相同的40只大鼠随机地分为两组,取其中一组接受A药,另一组接受B药。
服用一个疗程后,比较两组血压改变量的平均水平的区别,从而考察药物A和B的疗效。
68.按实验设计的要求和原则,对下列设计加以分析:
某医师研究一种新药对慢性支气管炎的近期疗效,以门诊30名病人作为观察对象,以30名住院病人服用传统药物作为对照,经过3周治疗后,统计结果发现新药症状近控率高于传统药物近控率。
答:
门诊病人和住院病人的病情轻重不均衡。
假设门诊病人的病情较轻,则近控率较高可能是由于此原因,从而夸大了新药的作用。
建议门诊病人中随机抽取一半接受新药,另一半接受传统药物。
住院病人也随机分为两组接受这两种处理。
然后分别考察两种药物对不同组别的疗效。
69.某研究者欲将15只大白鼠随机分配到甲、乙、丙三组,每组5例。
试由查出的随机数字写出分组结果,并简述分组方法。
答:
动物号:
123456789101112131415
随机数字:
40910145162123111378
随机数字对应为0~4,5~9,10~14的个体分别分入甲、乙、丙三组,结果动物号1、2、7、9、11者分入甲组;动物号3、6、8、14、15者分入乙组;动物号4、5、10、12、13者分入丙组
70.调查研究的基本抽样方法有那些?
按抽样误差由大到小的顺序写出。
答:
整群抽样、单纯随机抽样、系统抽样和分层抽样。
71.举例说明开放式问题和封闭式问题的特点。
答:
开放式问题未加任何限制,封闭式问题则提供了若干备选项。
例如在调查首次妊娠年龄时,可以采用开放式问题:
请填写您首次妊娠的具体年龄;也可以采用封闭式问题:
您首次妊娠的年龄是:
①<20岁②<25岁③<30岁④3