沈阳医学院预防医学专业学年卫生统计学.docx
《沈阳医学院预防医学专业学年卫生统计学.docx》由会员分享,可在线阅读,更多相关《沈阳医学院预防医学专业学年卫生统计学.docx(89页珍藏版)》请在冰豆网上搜索。
![沈阳医学院预防医学专业学年卫生统计学.docx](https://file1.bdocx.com/fileroot1/2023-6/20/f303267f-9b4c-4ceb-a54d-abfd90cfca89/f303267f-9b4c-4ceb-a54d-abfd90cfca891.gif)
沈阳医学院预防医学专业学年卫生统计学
沈阳医学院预防医学专业2020-2021学年卫生统计学
一、统计学的几个基本概念
一、A1
1、统计推断的两个方面为[单选题]*
A、点估计与区间估计
B、参数估计与假设检验(正确答案)
C、统计图表与假设检验
D、统计图表与参数估计
E、统计预测与统计控制
总体的定义是指根据研究目的确定的[单选题]*
总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种观察值变量值的集合。
A、所有样本的全体
B、观察单位的全体
C、根据研究目的确定的同质观察单位的全体(正确答案)
D、观察单位某种变量值的集合
E、样本中同质观察单位某种变量值的集合
计量资料的正确定义是指[单选题]*
计量资料又称数值变量,其变量值是定量的,表现为数值大小,一般有度量衡单位。
A、每个观察单位的观测值都是绝对数的资料
B、每个观察单位的观测值都是相对数的资料
C、每个观察单位的观测值都是平均数的资料
D、每个观察单位都有1个数值,无论该观测值是绝对数、相对数还是平均数的资料(正确答案)
E、将每个观察单位按某种属性或类别分组,然后清点各组的观测单位数得到的资料
下列关于总体和样本说法正确的是[单选题]*
总体:
根据研究的目的所划定范围内的同质的个体构成的全体,所有同质观察单位某种观察值(即变量值)的集合。
样本:
总体中随机抽取的一部分观察单位的观测值的集合。
A、总体的指标称为参数,用拉丁字母表示
B、样本的指标称为统计量,用希腊字母表示
C、总体中随机抽取的部分观察单位组成了样本
D、总体中随机抽取的部分观察单位的变量值组成了样本(正确答案)
E、总体中随意抽取的部分观察单位的变量值组成了样本
欲测量某地2002年正常成年男子的血糖值,其总体为[单选题]*
A、该地所有成年男子
B、该地所有成年男子血糖值
C、2002年该地所有正常成年男子血糖值(正确答案)
D、2002年所有成年男子
E、2002年所有成年男子的血糖值
答案解析:
欲测量某地2002年正常成年男子的血糖值,其总体为2002年该地所有正常成年男子的血糖值,所以答案选C。
用样本的信息推断总体,样本应该是[单选题]*
A、总体中的典型部分
B、总体中有意义的一部分
C、从总体中随便抽取的一部分
D、总体中有价值的一部分
E、从总体中随机抽取的一部分(正确答案)
下列关于概率的说法,错误的是[单选题]*
在现实中,随机事件发生的概率往往是未知的,因此常用样本中事件的实际发生率来估计概率,这种实际发生率称为频率。
由于抽样误差的存在,频率只是概率的估计值。
当观测单位较少时,用频率估计概率是不可靠的。
故选项C的说法错误。
A、通常用P表示
B、用于描述随机事件发生的可能性大小
C、某事件发生的频率即概率(正确答案)
D、在实际工作中,概率常难以直接获得
E、某事件发生的概率P≤0.05时,称为小概率事件
二、A2
1、检查9个人的血型,其中A型2人,B型3人,O型3人,AB型1人。
其对应的变量类型是[单选题]*
血型为分类资料,包括A型、B型、O型、AB型四种类别,且为无序分类资料。
A、数值变量
B、4项无序分类资料(正确答案)
C、4项有序分类资料
D、9项无序分类资料
E、9项有序分类资料
若以成年男性血红蛋白低于120g/L为贫血的判断标准,调查某地成年男性1000人,记录每人是否患有贫血,结果有19名贫血患者,981名非贫血患者,则该资料的类型为[单选题]*
该资料将该地成年男性分为“贫血”和“非贫血”两类,表现为两种互不相容的属性,为二项分类资料,故选项B正确
A、定量资料
B、二项分类资料(正确答案)
C、有序多分类资料
D、无序多分类资料
E、可看作定性资料,也可看作定量资料
【例题】下面的变量中,属于分类变量的是()[单选题]*
A.脉搏
B.血型(正确答案)
C.肺活量
D.红细胞计数
E.血压
【例题】小概率事件在统计学上的含义是()[单选题]*
A.指发生概率的随机事件
B.指一次实验或观察中绝对不发生的事件
C.指一次实验或观察中发生的可能性很小的事件,一般指(正确答案)
D.指发生概率的随机事件
E.以上都不正确
【例题】正态分布资料宜用( )来描述其集中趋势。
()[单选题]*
A.算术平均数(正确答案)
B.标准差
C.几何均数
D.变异系数
E.四分位数间距
【例题】变异系数越大说明()[单选题]*
A.标准差越大
B.标准差越小
C.均数越大
D.均数越小
E.以均数为准变异程度大(正确答案)
【例题】数列8,-3,5,0,1,4,-1的中位数是()[单选题]*
A.2
B.0
C.2.5
D.0.5
E.1(正确答案)
【例题】原始数据呈倍数关系的资料,宜用()描述其分布的集中趋势。
[单选题]*
A.算数均数
B.几何均数(正确答案)
C.极差
D.中位数
E.百分位数
【例题】离散程度指标中,最容易受极端值影响的是()[单选题]*
A.极差(正确答案)
B.标准差
C.变异系数
D.方差
E.四分位数间距
【例题】以下关于偏态分布资料的说法,不正确的是()[单选题]*
A.正偏态分布的频数分布集中位置偏向数值大的一侧(正确答案)
B.负偏态分布的频数分布集中位置偏向数值大的一侧
C.不宜用均数描述其集中趋势
D.偏态分布资料频数分布左右不对称
E.不宜用变异系数来描述其离散程度
变异系数应用条件:
反映资料的相对变异程度。
常用于比较度量衡单位不同或均数相差悬殊的两组(或多组)资料的变异度。
[判断题]*
对(正确答案)
错
医学参考值(medicalreferencevalue):
是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。
[判断题]*
对(正确答案)
错
【例题】下列关于正态分布描述错误的是()[单选题]*
A.是医学和生物学中常见的一种连续型分布
B.正态分布曲线的对称轴是x=μ这条直线
C.正态分布曲线有两个参数,μ为形态参数,σ为位置参数(正确答案)
D.正态分布曲线是一簇曲线
E.正态分布曲线下的总面积为1
【例题】在正态曲线下,区间+1.96 +2.58所包含的面积为()[单选题]*
A.1%
B.1.5%
C.97%
D.2%(正确答案)
E.95%
【例题】下列关于标准正态分布的说法中错误的是()[单选题]*
A.标准正态分布曲线下总面积为1
B.标准正态分布是总体均数为0,总体标准差为1的正态分布
C.标准正态分布的曲线是一簇曲线(正确答案)
D.标准正态分布是对称分布
E.不同的正态分布都可以通过变换转化为标准正态分布
二、定量资料的统计描述
一、A1
1、下列关于t分布与正态分布的关系,正确的是[单选题]*
A、均以0为中心,左右对称
B、总体均数增大,曲线变得瘦长
C、曲线下两端5%的面积对应的分位点为±1.96
D、随样本含量增大,t分布逼近标准正态分布(正确答案)
E、样本含量无限增大,两者分布完全一致
宜用均数和标准差进行统计描述的资料是[单选题]*
均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中位置,标准差是描述其变异程度的常用指标,故选项A正确。
【该题针对“正态分布★”知识点进行
A、正态分布资料(正确答案)
B、对数正态分布资料
C、正偏态分布资料
D、负偏态分布资料
E、两端无确切值的资料
正态分布线下,横轴上从均数μ到μ-1.96σ的面积为[单选题]*
A、45%
B、47.5%(正确答案)
C、90%
D、95%
E、97.5%
标准正态分布曲线下90%所对应的横轴尺度Z的范围是[单选题]*
正态分布曲线下,在(μ—σ,μ+σ)范围内曲线下面积为68.27%,在(μ—1.645σ,μ+1.645σ)范围内曲线下面积为90%,在(μ—1.96σ,μ+1.96σ)范围内曲线下面积为95%,在(μ—2.58σ,μ+2.58σ)范围内曲线下面积为99%。
标准正态分布的μ为0,σ=1,所以本题答案选择A。
A、—1.645到1.645(正确答案)
B、—∞到1.645
C、—∞到2.58
D、—1.96到1.96
E、一2.58到+∞
正态分布[单选题]*
正态分布由均数和方差决定,均数决定曲线位置,方差决定曲线形态;正态分布是以均数为中心,左右对称;方差大小与变量的离散度有关,数值可大可小,与均数无关。
A、都是以0为中心的对称分布
B、变量的取值范围是-3到+3
C、由均数与方差共同确定(正确答案)
D、方差大于1
E、均数小于方差
正态分布的特点有[单选题]*
正态分布资料属于单峰分布,左右对称,其中位数等于均数。
A、算术均数=几何均数
B、算术均数=中位数(正确答案)
C、几何均数=中位数
D、算术均数=几何均数=中位数
E、以上都没有
为制定血铅的参考值范围,测定了一批正常人的血铅含量,下列说法正确的是[单选题]*
由于血铅含量过高为异常,因此应确定参考值范围的单侧上限。
所以本题正确答案选择B。
A、可以制定双侧95%的参考值范围
B、可以制定,应是单侧上限(正确答案)
C、可以制定,应是单侧下限
D、可以制定,但无法确定是上侧还是下侧范围
E、无法制定,要制定参考值范围必须测定健康人的尿铅含量
下列关于医学参考值范围的叙述,不正确的是[单选题]*
学参考值范围是指大多数“正常人”的人体形态、功能和代谢产物等各种生理、生化指标的波动范围,所谓“正常人”不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。
故A选项不正确,本题应选A。
A、无疾病者的解剖、生理、生化等数据的波动范围(正确答案)
B、习惯以包含95%或99%的观察值为界值
C、根据专业知识确定单侧范围或双侧范围
D、资料为正态分布时,可用正态分布法计算
E、资料为偏态分布时,可用百分位数法计算
频数分布集中位置偏向数值较小的一侧称为[单选题]*
对称分布是指集中位置在中间,左右两侧的频数基本对称。
偏态分布,又称不对称型分布,指频数分布不对称,集中位置偏向一侧。
若集中位置偏向数值较小的一侧,称为正偏态;若集中位置偏向数值较大的一侧,称为负偏态
A、偏态分布
B、不对称型分布
C、对称分布
D、正偏态分布(正确答案)
E、负偏态分布
下列关于频数表说法错误的是[单选题]*
从频数表便于观察离群值和异常值,还可以看出频数分布的两个重要特征:
集中趋势和离散趋势。
平均值不能通过观察得出,需要进行计算,所以C选项的说法是错误的。
A、便于观察离群值
B、便于观察异常值
C、便于观察平均值(正确答案)
D、可以看出频数分布的集中趋势
E、可以看出频数分布的离散趋势
变异系数越大,说明[单选题]*
变异系数大,说明单位均数的变异越大。
变异系数的定义是标准差与算术均数之比,描述了数值的相对离散程度,本题正确答案为E。
A、标准差越大
B、平均数越小
C、平均数越大
D、标准差和均数都大
E、单位均数的变异越大(正确答案)
某人算得某资料的标准差为-3.4,可认为[单选题]*
标准差一定大于或等于0,不可能为负数,故答案为C
A、变量值都是负数
B、变量值负的比正的多
C、计算有错(正确答案)
D、变量值多数为0
E、变量值一个比一个小
下列关于方差和标准差的叙述,不正确的是[单选题]*
方差的单位是观察值单位的平方,在实际工作中使用不便,因此将方差开算术平方根得到标准差,故选项A不正确,选项B正确;方差和标准差均是描述对称分布,特别是正态分布或近似正态分布资料变异程度的常用指标,值越大,说明资料的变异程度越大,选项C、D、E正确,故本题应选A
A、方差的单位与标准差的单位相同(正确答案)
B、方差的单位是标准差单位的平方
C、都用于描述定量资料频数分布的变异程度
D、二者值越大,说明资料的变异程度越大
E、均适用于对称分布,特别是正态分布或近似正态分布资料
关于标准差,错误的一项是[单选题]*
标准差是描述对称分布资料变异程度的指标,离散度越大其数值越大,它的大小与算术平均数无关。
A、反映全部观察值的离散程度
B、最适用于对称分布资料
C、反映了均数代表性的好坏
D、一定大于或等于零
E、不会小于算术均数(正确答案)
变异系数是[单选题]*
异系数简记为CV,为标准差与均数之比,是描述计量资料相对离散程度的指标。
故C选项正确。
相对,离散。
关键词。
A、描述计量资料平均水平的指标
B、描述计量资料绝对离散程度的指标
C、描述计量资料相对离散程度的指标(正确答案)
D、描述计数资料各部分构成的指标
E、描述计数资料平均水平的指标
一组观察值如果每个值都同时增加或减少一个不为0的常数,则[单选题]*
一组观察值如果每个值都同时增加或减少一个不为0的常数,则均数、几何均数、中位数都改变。
本题选C。
A、均数改变,几何均数不变
B、均数改变,中位数不变
C、均数,几何均数和中位数都改变(正确答案)
D、均数不变,几何均数和中位数改变
E、均数,几何均数和中位数都不变
描述血清抗体滴度资料的平均水平宜选用[单选题]*
几何均数适用于原始观察值呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度资料等,故选项C正确。
A、均数
B、中位数
C、几何均数(正确答案)
D、标准差
E、四分位数间距
表示儿童体重资料的平均水平最常用的指标是[单选题]*
算术平均数简称均数,均数适用于描述单峰对称分布资料,特别是正态分布或近似正态分布资料的集中位置
A、算术平均数(正确答案)
B、中位数
C、几何均数
D、变异系数
E、百分位数
二、A2
1、一个大样本成年男性舒张压测量资料的均数与中位数均是83mmHg,标准差是12.25mmHg,则[单选题]*
A、理论上有95%男子的舒张压在59~107mmHg之间(正确答案)
B、30~69岁男子的舒张压总体均数95%的可信区间为59~107mmHg
C、理论上有5%男子的舒张压超过107mmHg
D、理论上有5%男子的舒张压低于59mmHg
E、理论上有5%男子的舒张压≤83mmHg
某项计量指标仅以过高为异常,且资料呈偏态分布,则其95%参考值范围为[单选题]*
若资料呈偏态分布,当某指标过高异常时,其95%参考值范围单侧上限为P95,所以答案选A。
A、<P95(正确答案)
B、<P97.5
C、>P5
D、P2.5~P97.5
E、P5~P95
测360名对象的某指标,算得均数等于87,中位数等于73,标准差等于65,第5百分位数等于7,第95百分位数等于233,则估计该指标值90%的对象在范围[单选题]*
该指标值90%的对象在范围7~233,此方法是基于百分位数法估计90%参考值范围,所以答案选E。
A、87±1.96×65
B、87±1.64×65
C、73±1.96×65
D、73±1.64×65
E、7~233(正确答案)
随机抽查某年某市市区1000名男孩出生体重(kg),得均数等于3.3kg,标准差等于0.5kg,则估计这1000名男孩中出生体重不超过3.3kg-1.64×0.5kg的人数约为[单选题]*
根据X-1.64S左侧面积为5%,计算1000名男孩中出生体重不超过3.3kg-1.64×0.5kg的人数为1000×5%=50人,所以答案为A。
A、50(正确答案)
B、100
C、200
D、250
E、300
抽样调查了某地103名10岁男孩的生长发育情况,得身高均数为142.82cm,标准差为5.63cm;体重均数为28.24kg,标准差为5.62kg。
比较身高和体重的变异程度,下列结论正确的是[单选题]*
身高和体重量纲不同,宜用变异系数来比较其变异程度的大小,而不能仅凭标准差来判断。
根据变异系数的公式,可得身高的变异系数小于体重,故选项B正确。
S/V
A、身高变异程度大
B、体重变异程度大(正确答案)
C、身高与体重的变异程度相同
D、由于单位不同,无法比较两者的变异程度
E、题中所给条件不足,无法判断
若X值的均数等于7,标准差等于2,则X+3的均数[单选题]*
若X值的均数等于7,则x+3的均数等于10,所以答案选C。
A、也等于7
B、等于9
C、等于10(正确答案)
D、界于7-3与7+3之间
E、界于7-1.96×2与7+1.96×2之间
由变量的6个值6,12,14,9,15,20计算中位数可得[单选题]*
中位数是将一组观察值按大小顺序排列后位次居中的数值。
当n为奇数时,M=X(n+1)/2,当n为偶数时,M=(Xn/2+Xn/2+1)/2。
本题共6个数值,为偶数,所以中位数M=(X6/2+X6/2+1)/2=(X3+X4)/2=(12+14)/2=13。
A、3
B、4
C、12
D、13(正确答案)
E、14
一份考卷有3个问题,每个问题1分,班级中20%得3分,60%得2分,10%得1分,10%得0分,则学生的平均得分X是[单选题]*
虽然不知道具体有多少人,但是在计算过程中,班级人数被约分掉了,设本班共有n个人,则其平均得分为:
X=(3×20%n+2×60%n+1×10%n+0×10%n)/n=1.9。
所以本题答案选择B。
A、1.5
B、1.9(正确答案)
C、2.1
D、2.2
E、不知道班级中有多少人,所以不能算出平均得分
三、总体均数的估计和假设检验
一、A1
1、关于t界值表错误的一项是[单选题]*
在同一自由度下,双侧概率为单侧概率的2倍时,所对应的t界值相等。
A、双侧t0.10,20=单侧t0.05,20
B、单侧t0.05,20<双侧t0.05,20
C、双侧t0.05,20<双侧t0.01,20
D、单侧t0.05,20>单侧t0.05,15(正确答案)
E、单侧t0.05,20<单侧t0.05,15
同类定量资料下列指标,反映样本均数对总体均数代表性的是[单选题]*
样本均数的标准差即均数的标准误,简称标准误。
可用来描述样本均数的抽样误差,标准误越小,则说明样本均数的抽样误差越小,样本均数对总体均数的代表性越好。
A、四分位数间距
B、标准误(正确答案)
C、变异系数
D、百分位数
E、中位数
关于可信区间,正确的说法是[单选题]*
按一定的概率估计总体参数的可能范围,该范围称为可信区间,可以用来估计总体均数的可能所在范围,常按95%可信度估计总体参数的可能范围。
A、可信区间是总体中大多数个体值的估计范围
B、95%可信区间比99%可信区间更好
C、不管资料呈什么分布,总体均数的95%的可信区间计算公式是一致的
D、可信区间也可用于回答假设检验的问题(正确答案)
E、可信区间仅有双侧估计
下列关于均数的标准误的叙述,错误的是[单选题]*
样本均数的标准差称为均数的标准误,是描述样本均数抽样误差大小的指标,其大小与总体标准差成正比,与根号n成反比。
标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越好。
故选项E叙述错误,本题选E。
A、是样本均数的标准差
B、反映样本均数抽样误差大小
C、与总体标准差成正比,与根号n成反比
D、增加样本含量可以减少标准误
E、其值越大,用样本均数估计总体均数的可靠性越好(正确答案)
假设检验中,P与α的关系是[单选题]*
P值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P值,显著性水平是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。
计算出P值后,将给定的显著性水平α与P值比较,就可作出检验的结论。
A、P越大,α越大
B、P越小,α越大
C、二者均需事先确定
D、二者均需通过计算确定
E、P的大小与α无直接关系(正确答案)
有关假设检验,下列说法正确的是[单选题]*
检验假设针对总体,而不是样本。
进行假设检验时,应同时写出H0和H1,H1为备择假设,它的内容反映了检验的单、双侧。
假设检验有时可直接计算P值(如Fisher精确概率法)。
所以本题正确答案选择A。
A、检验假设针对的是总体,而不是样本(正确答案)
B、进行假设检验时,既可只写出H0或H1,也可同时写出H0和H1
C、H0为对立假设
D、H0的内容反映了检验的单双侧
E、都需先计算出检验统计量后再获得P值
下列关于t分布特征的叙述,错误的是[单选题]*
t分布的特征为:
①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态与自由度ν的大小有关。
自由度越小,曲线的峰部越低,尾部越高;随着自由度的增大,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。
故选项D叙述错误,本题选D。
A、t分布为单峰分布
B、t分布曲线是一簇曲线
C、以0为中心,左右对称
D、自由度越大,t分布曲线的峰部越低,尾部越高(正确答案)
E、自由度为无穷大时,t分布就是标准正态分布
在对两个样本均数作假设检验时,若P>0.1,则统计推断为[单选题]*
P>0.1,按α=0.05水准,不能拒绝H0,所以两总体均数的差别无显著性。
A、两总体均数的差别有统计学意义(正确答案)
B、两样本均数的差别有统计学意义
C、有0.9的把握度认为两总体均数无差别
D、犯第Ⅱ类错误的概率为0.1
E、两总体均数的差别无显著性
比较两药疗效时,下列可作单侧检验的是[单选题]*
已知A药不会优于B药,只有低于B药的一种可能,所以可作单侧检验。
A、己知A药与B药均有效
B、不知A药好还是B药好
C、己知A药与B药差不多好
D、己知A药不会优于B药(正确答案)
E、不知A药与B药是否有效
假设检验中,犯第Ⅰ类、第Ⅱ类错误的概率α、β间的关系有[单选题]*
A、α+β=1
B、α>β
C、α<β
D、增加样本量是同时减少α及β的唯一方法(正确答案)
E、若α确定,β也能确定
两个样本均数比较作t检验,其他条件不变,犯第Ⅱ类错误的概率最小的是[单选题]*
A、α=0.05
B、α=0.01
C、α=0.1
D、α=0.2(正确答案)
E、该问题提法不对
二、A2
1、为研究A、B两种试剂盒测量人体血液中氧化低密度脂蛋白含量(mmol/L)的差异,分别用两种试剂盒测量同一批检品(200例),假设检验方法应选用[单选题]*
配对资料比较的t检验——配对资料(三种情况)
①配对的两个受试对象分别接受两种处理之后的数据;
②同一样品用两种方法(或仪器等)检验的结果;
③同一受试对象两个部位的数据。
目的:
判断不同的处理间是否有差别?
即:
差值的总体均数为0
A、成组t检验
B、成组u检验
C、两样本χ2检验
D、配对t检验(正确答案)