统计简答题.docx
《统计简答题.docx》由会员分享,可在线阅读,更多相关《统计简答题.docx(33页珍藏版)》请在冰豆网上搜索。
统计简答题
统计简答题
1.请写出三种常用的描绘统计资料失散趋向的统计量,以及分别在什么状况下,使用这些统计量。
1、以预计整体均数为例,回答以下问题:
(1)什么是抽样偏差?
(2)惹起抽样误
差的原由?
(3)如何预计抽样偏差的水平?
①抽样偏差是由抽样造成的样本统计量与整体参数之间,样本统计量之间的差异
(2分)②造成抽样偏差的原由是个体差异的存在(2分)③样本均数的标准差也就是标准误常用来预计抽样偏差的大小(2分)
3请回答对于两组独立样本的非参数查验的问题:
(1)什么时候用非参数查验?
(2)为何无论原始数据的散布情
况而直接采纳非参数查验对我们是不利的?
(3)在两独立样本的秩和查验中H0的内容?
①当整体散布未知或许资料为等级资料不知足参数查验的条件时,可用非参数检
验。
(2分)②因为非参数查验抛弃了察看值的详细数值而只保存了其大小序次的信息,
而当资料知足参数查验时用非参数查验就损失了数据信息,也降低了查验效能,所以
无论数据的散布直接使用非参数查验对我们是不利的。
(2分)③非参数查验的H0内容
是假定两样本所在整体中位数相同或假定两样本总在的整体散布相同。
4简述针对数值变量资料制作频数表的过程?
答:
(1)计算极差2分
(2)确立组数、组段和组距2分
(3)列表划记2分
5两个样本均数或多个样本均数比较时为何要作假定查验?
答:
两个样本均数或多个样本均数比较时之所以要作假定查验,是因为均数之间的差
异有两种可能,一是因为抽样偏差惹起,解说一下抽样偏差(3分)二是均数之间确实
实存在差异,特别是多个样本均数之间存在差异时,有必需进行两两之间的比较(3分)。
假定查验能够判断惹起这种差异的原由。
6参数查验和非参数查验的差异是什么?
答
(1)参数查验、非参数查验的定义2分
(2)无严格的条件限制,合用范围广,计算简易2分
(3)秩次取代变量值2分
样题2
1以整体均数的预计为例,试说明何为点预计,何为区间预计?
点预计:
以样本均数作为整体均数的点(值)预计
区间预计:
以早先给定的概率(或可信度)预计整体参数在哪个范围内的预计方法
3系统抽样的详细做法是什么?
有何优、弊端?
系统抽样也称为间隔抽样或机械抽样。
方法是依照必定次序机械地间隔若干个察看单位抽取一个察看单位构成样本。
长处:
易于理解、简单易行,简单获取一个按比率分派的样本。
一般状况下,其抽样偏差小于简单随机抽样。
弊端:
当整体的察看单位按次序有周期或单一增(或减)趋向时,则系统抽样将产生明显的偏性。
4请举一个医学领域中观察结果为泊松散布的例子。
假如是泊松散布,则察看结果的均值和方差有什么关系?
比如:
每毫升饮用水中细菌数。
对于泊松散布,均值=方差。
5非参数统计查验的长处和弊端。
对资料的散布种类没有特别的要求,只利用秩次(损失期息),不受散布限制,计算简
单、方便,查验效能低。
2
6以t查验或χ查验为例,说明假定查验的基本逻辑。
以两独立样本t查验为例:
1)成立假定,确立查验水平
H0:
两整体均数相等
H1:
两整体均数不等
α
2)选择查验方法,计算查验统计量t值
3)确立P值,做出统计推测
当P<0.05时,拒绝H1,接受H0,两整体均数相等。
当P>0.05时,接受H1,拒绝H0,两整体均数不等
3
答
1.欲研究广省6小孩的身高状况,在广省随机抽取了200名6小孩行,以此
例明同、异、体与本几个观点。
答:
同体在同广省、同6小孩,异体在200名小孩的身高不一样。
体是指所有广省6小孩,本200名6小孩。
2.生工作中的料主要的根源有哪些?
答:
①表。
②常性工作。
③或。
3.述工作全程的四个步。
答:
研究、采集料、整理料、剖析。
4.例明常的三种料型。
答:
(1).量或量或数料,如身高、体重等。
(2).数或分料,如性、血型等。
(3).等料,如尿蛋白含量-、+、++、+++、⋯。
5.学上的异、量、量是指什么?
答:
异:
每个察个体之的量指的差异称异。
量:
表示个体某种异特色的量量。
量:
量的得量。
6.述制数表的步与重点。
答:
(1)找出最大和最小,算极差。
(2)确立距和列出分划:
第一包含最小;最末包含最大,并口。
(3)将原始数据整理后,获取各组频数。
7.描绘计量资料集中趋向(一般水平)的指标有哪些,各合用于什么状况?
答:
常用描绘均匀水平的均匀数有算术均数、几何均数和中位数。
算术均数合适:
对称资料,最好是近似正态散布资料。
几何均数合适:
经对数变换后近似对称散布的原始变量,常用于微生物学和免疫学指标。
中位数合适:
数据非对称散布、散布不清楚或张口资料的情况。
8.描绘计量资料失散程度(差异大小)的指标有哪些,各合用于什么状况?
答:
常有的几种描绘失散程度的指标:
极差或全距,四分位数差距,方差与标准差,变异系数。
极差合适:
数据散布非对称的情况。
四分位数差距合适:
数据散布非对称的情况。
方差与标准差合适:
对称散布或近似正态散布资料,能充足利用所有个体的信息。
变异系数合用:
当比较两资料的变异程度大小时,假如变量单位不一样或均数差异较大时,直接比较无可比性,合用变异系数比较。
9.统计描绘的基本方法有哪些,各自有何特色?
答:
统计描绘的基本方法:
用表、图和数字的形式归纳原始资料的主要信息。
表:
详尽、精准。
图:
直观。
指标:
综合性好。
10.简述变异系数的适用机遇。
答:
变异系数合用于变量单位不一样或均数差异较大时,直接比较无可比性,合用变异系数比较。
11.如何正确描绘一组计量资料?
答:
(1).依据散布种类选择指标。
(2).正态散布资料采纳均数与标准差,对数正态散布资料采纳几何均数,一般偏态散布资料采纳中位数与四分位数间距。
12.正态散布的主要特色有哪些?
答:
(1)正态曲线在横轴上方均数处最高。
(2)正态散布以均数为中心,左右对称。
(3)正态散布有两个参数,即均数(地点参数)和标准差(变异度参数)。
(4)正态曲线下的面积散布有必定规律。
13.参照值范围是指什么?
答:
参照值范围又称正常值范围,即大部分正常人某指标值的范围。
“正常人”是指清除了影响研究指标的疾病和有关因素的同质人群。
14.简述预计参照值范围的步骤与重点。
答:
设计:
①样本:
“正常人”,大样本n≥100。
②单侧或两侧。
③指标散布种类。
计算:
①若直方图看来像正态散布,用正态散布法。
②若直方图看来不像正态散布,用百分位数法。
15.简述正态散布的用途。
答:
(1)预计频数散布。
(2)拟订参照值范围。
(3)质量控制。
(4)统计查验的理论基础。
16.简述可信区间在假定查验问题中的作用。
答:
可信区间不单能回答差异有无统计学意义,并且还可以提示差异有无实质意义。
可信区间只好在
早先规定的概率即查验水平的前提下进行计算,而假定查验能够获取一个较为切实的概率P值。
故将二者联合起来,才是对假定查验问题的完好剖析。
17.假定查验时,当P≤,则拒绝H0,理论依照是什么?
答:
P值为H0成立的条件下,比查验统计量更极端的概率,即大于等于查验统计量的概率。
当P
≤0.05时,说明在H0成立的条件下,获取现有查验结果的概率小于,因为小概率事件几乎不
可能在一次试验中发生,所以拒绝H0。
下差异“有统计学”意义的结论的同时,我们能够知道可
能犯错误的概率不会大于,也就是说,有了概率保证。
18.假定查验中与P的差异安在?
答:
以t查验为例,与P都可用t散布尾部面积大小表示,所不一样的是:
值是指在统计推断
时早先设定的一个小概率值,就是说假如H0是真的,同意它错误的被拒绝的概率。
P值是由实质
样本获取的,是指在H0成立的前提下,出现大于或等于现有查验统计量的概率。
19.什么叫两型错误?
作统计学假定查验为何要加以考虑?
答:
假如
H0正确,查验结果却拒绝
H0,而接受
H1,则犯
I型错误,记为α;
假如H0
错误,查验结果却不拒绝
H0,未能接受
H1,则犯
II型错误,记为β。
一般状况下,α越大,β越小;α越小,β越大。
假如要同时减少两类错误,则需最大样本
含量。
因为假定查验的结论都有出错误的可能性,
所以实验者在下假定查验有无统计学意义的结论
时,都要考虑到两型错误。
20.配对照较能否是就比成组比较好?
什么状况下用配对照较比较好?
答:
配对照较能够控制实验单位个体间的变异,进而减少实验偏差,提升查验性能。
但这其实不是
说凡是配对试验就必定比成组比较好。
实验能否应做配对照较,第一应依据业务知识判断,看配
成对子的个体间能否比不配对的个体间相像程度更高。
21.t查验有几种?
各合用于哪些状况?
答:
t查验以t散布为理论基础。
小样本时要求假定条件:
资料听从正态散布,方差齐同。
一般分为三种:
一是样本均数与整体均数比较的t查验。
马上一个样本均数X与一已知的整体均数作比较;
二是配对资料的t查验。
比如治疗前后的比较,或配成对子的实验动物之间的比较。
三是两个样本均数比较的t查验;两组的样本量能够不相同。
其余另有有关系数、回归系数的t查验。
22.什么叫假定查验?
医学研究中常用的假定查验有哪些?
答:
判断整体与样本之间、样本与样本之间的差异有无统计学意义的统计剖析方法,一般步骤是:
①提出查验假定0H,确立单两侧与查验水平α;②计算查验统计量;③确立概率P值;④判断
结果。
在医学研究中常用的明显性查验有u查验、t查验、F查验、2查验及非参数秩和检
验等多种,不论那种查验均以假定成即刻获取的统计量的概率来判断。
23.经过实例说明为何假定查验的结论不可以绝对化?
答:
统计的结论为概任性的结论。
拒绝
H0
时,可能犯Ⅰ型错误。
不拒绝
H0
时,可能犯Ⅱ型错
误。
24.方差剖析的查验假定(H0)是什么?
答:
各整体均数相等
25.方差剖析中,各离均差平方和之间有何联系?
各自由度之间又有何联系?
完好随机设计、随机
区组设计的方差剖析的离均差平方和与自由度分别如何分解?
答:
总的离均差平方和等于各部分别均差平方和之和.总的自由度等于各部分自由度之和
机设计:
SS总=SS组内+SS组间V总=V组内+V组间
随机区组设计:
SS总=SS组内+SS办理组间+SS区组间
.
完好随
V总=V
组内+
V
办理组间
+V
区组间
26.三组均数比较时,为何不可以直接作一般的两两均数比较的t查验?
答:
增大犯第一类错误的可能性.
27.两组均数差其余假定查验可否作方差剖析,为何?
答:
能够.方差剖析与t查验关系:
k=2时,F=t2,P值相等,即两查验等价。
28.方差剖析中,组间变异是根源于那些方面的变异?
答:
该变异除随机原由的影响外,有可能存在办理因素的作用。
29.对多组均数作方差剖析的主要步骤和结果有那些?
答:
(1)成立查验假定和查验水平
(2)计算统计量F值(列出方差剖析表)
(3)确立P值和作出推测结论
(4)作两两均数之间的比较(若P0.05则可省略此步骤)
30.方差剖析的基本思想是什么?
答:
方差剖析的基本思想:
就是依据资料设计的种类及研究目的,可将总变异分解为两个或多个部分,经过比较各部分均匀变异与随机偏差均匀变异,即可认识该因素对测定结果有无影响。
31.为何不可以以构成比代率?
答:
二者说明的问题不一样。
构成比只好说明某事物内部各构成部分在全体中所占的比重或散布,不可以说明某现象发生的频次或强度。
32.简述相对数标准化的基本思想。
答:
基本思想:
采纳一致的标准人口年纪构成,以除去不一样人口构成对两地死亡率的影响,使获取的标准化死亡率拥有可比性。
33解说在何种状况下应采纳率的直接标化法,何种状况采纳间接标化法?
答:
率的直接标化法:
已知各组的年纪别死亡率pi。
间接标化法:
已知各组的死亡总数和各年纪组人口数.
34.率的直接标化法,与间接标化法有何不一样?
答:
(1)合用条件不一样(见第上题);
(2)“标准”不一样:
前者选定一个“标准人口”或“标准人口构成”。
后者选定一套“标准年纪别死亡率”。
35.应用相对数时应注意哪些问题?
答:
应用相对数指标的时候要注意:
分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假定查验。
36.常用相对数指标有哪些?
它们的意义上有何不一样?
答:
常用相对数指标:
率、构成比、比。
率又称频次指标或强度相对数。
说明某现象发生的频次或强度。
常用来表示某一事物发展的趋向或水平及特色。
构成比又称构成指标或构造相对数。
部分与
所有之比,说明某事物内部各构成部分在全体中所占的比重或散布。
常用来表示疾病或死亡的顺位、位次或所占比重。
比(又称相对照)表示同类的或有联系的两个现象间的对照关系,常用倍数或百
分数表示。
37.统计学上资料能否“拥有可比性”指的是什么?
你能举出一些不行比的例子吗?
答:
除研究因素外,其余重要影响因素应相同或邻近。
一般察看单位同质,研究方法相同,察看时间相等,以及地域、民族等客观条件一致。
比如内科和外科的治愈率就无可比性。
38.二项散布、Poisson散布各有哪些特色?
答:
二项散布和Poisson散布都是失散型散布。
二项散布的形状取决于与n的大小:
=0.5偏态,随n的增大,渐渐对称。
当n足够大,
时,无论
或1-
n大小,散布对称。
不太小,二项散布
B(n,
≠0.5时,图形呈)近似于正态分
布N(n,n(1-))。
Poisson
N(,
散布:
)。
值愈小散布愈偏,
愈大散布趋于对称,当
足够大时,散布靠近正态散布
39.简述二项散布、Poisson散布、正态散布的关系。
答:
当n足够大,
或1-不太小时,二项散布近似于正态散布。
当
n足够大,
或1-
很小
时,二项散布近似于
Poisson散布。
较大时,Poisson散布近似于正态散布。
40.二项散布的应用条件是什么?
答:
⑴每次试验有且仅有两个相互排挤的结果(
⑵每次试验中,发生A的概率相同,均为π。
⑶各次试验独立,即n次察看结果相互独立。
A或非
A)。
41.2查验的用途有哪些?
答:
主要合用于计数资料,
(1)两个及两个以上的率或构成比的比较
(2)交错分类资料两属性间的关系性查验(3)频数散布的拟合优度。
42.以下表资料说明χ2查验的基本思想。
(不用计算)
答:
基本思想:
假定察看值来自理论散布,则察看值与理论值就不会差异太大,假如差距太大,则
思疑H0能否成立。
完好切合则为0或特别小,x2值越小,越支持H0。
43.四格表资料
2查验的条件有哪些?
答:
T<1或n<40切实概率法
n≥40但有1T<5要校订
n≥40并且T>5不用校订
44.某病的发病率对全国人口来说是
8.72%,此刻某县回首一年,抽样检查了
120人,有
16人
发病,假如要观察该县的发病率能否高于全国,请问可不可以够对该份资料作
2查验,你以为应当
用什么方法?
答:
不可以,用单样本率比较的
u查验。
45.请指出非参数查验与参数查验对比的优、弊端。
答:
非参数查验合用范围广,采集资料、统计剖析也比较方便。
但查验效率没有参数查验高,犯第二类错误的概率较大。
46.简述参数查验与非参数查验的定义及二者的差异。
答:
参数统计是整体的散布种类是已知的,对此中某些未知的参数进行预计和查验的统计方法。
特
点:
依靠于特定的散布种类,比较的是参数。
非参数统计是不依靠于整体散布详细形式的统计方法。
特色:
不受整体参数的影响,比较的是散布或散布地点,而不是参数。
47.简述配对照较秩和查验的编秩方法。
答:
求差值,差值编秩;差值0删去,相同值取均匀秩
48.配对设计差值的符号秩和查验步骤。
答:
(1)H0:
差值的整体中位数Md=0;H1:
Md≠0;
(2)求差值
(3)编秩:
依差值的绝对值从小到大秩次。
绝对值相等者,若符号不一样取均匀秩次;零差值不参加编秩,同时样本数-1;将差值的正负标在秩次以前。
(4)求秩和确立查验统计量:
分别求正、负秩次之和,任取T+或T—作查验统计量T,
(5)确立P值,作推测结论。
48.两组比较的秩和查验的编秩方法。
答:
将两样本混淆编秩次。
如有“相同数据”,处于不一样组,便取均匀秩次;处于同一组,不用取均匀秩次。
50.对同一资料,又出自同一研究目的,用参数查验和非参查验结果不一致时,宜以何为准?
答:
当资料知足参数查验方法的条件时,应使用参数查验方法;当资料不知足参数查验方法的件时,一定采纳非参数查验方法。
条
51.非参数查验的合用范围。
答:
①各样资料的初步剖析;
②等级资料:
某种标记不便正确测定,只好以严重程度、优低等级、收效大小、名次先后或综
合判断等方式定出序次;
③资料散布种类不可以确立或偏态散布;
④综合剖析同质性较差的资料,如不一样地址、不一样年份的某种实验结果;
⑤组内个别数据偏离过大,或各组内相差悬殊。
52.两个变量之间的有关系数等于0,能否说明这两个变量之间没有关系?
答:
0有关不等于没关,因为可能无直线关系但有曲线关系
53.直线回归及其回归方程有何用途?
答:
(一)描绘Y对X的依存关系。
(二)展望(forecast):
由自变量
X估量应变量
Y。
Y颠簸范围可按求个体
Y值允许
区间方法计算。
(三)统计控制:
控制
Y估量
X,逆预计。
经过控制自变量
X的取值,知足应变量
Y在
必定范围内颠簸。
54.简述作直线有关与回归剖析时应注意的事项。
答:
(1)回归方程要有实质意义。
(2).剖析前绘制散点图,观察能否有直线趋向或异样点。
直线回归的合用范围一般以自变量的取值范围为限。
没有充足原由X的取值不要外延。
(3).
55.简述直线回归与直线有关的差异与联系。
答:
(一)、差异
(1)资料要求不一样:
回归能够有两种状况:
①Y正态随机,X为选定变量----Ⅰ型回归;
②X、Y听从双变量正态散布----Ⅱ型回归。
有关:
X、Y听从双变量正态散布。
(2)应用不一样:
回归是由一个变量值计算另一个变量的数值,
说明依存变化的数目关系。
有关是只
说明两个变量间能否有关系。
(3)意义不一样:
b表示X每增(减)一个单位,Y均匀改变b个单位;r说明拥有直线关系的两个变量间关系的亲密程度和方向。
(4)取值范围不一样:
-∞<b<+∞;-1<a<+1。
(5)回归系数有单位,有关系数无单位。
(二)、关系
(1)
方向一致:
对一组数据若同时计算
r与b,其正负号一致。
(2)
假定查验等价:
对同相同本,
tr=tb,P值相等。
(3)
用回归解说有关:
决定系数
反应Y的总变异中有多大可能可由
X来解说。
越靠近
1,回归的
成效越好。
56.简述直线有关系数意义。
答:
有关系数描绘线性有关的亲密程度与方向。
有关系数没有单位,
-1≤r≤1。
r>0
表示正有关
;r<
0表示负有关;
|r|=1
表示完好有关
;
r=0
表示零有关。
57.经查验以为回归方程存心义,表示两变量间存在因果关系,对否
?
答:
不必定。
应联系专业知识观察变量间关系。
58.用什么方法观察回归直线图示能否正确?
答:
直线经过(X,Y)点。
直线与纵轴交点的纵坐标为截距a。
直线应在自变量X的实测范围内。
59.挨次写出箱式图中波及到的各个取值。
由大到小的序次为:
极大值、75P、中位数、
25P
和极小值。
60.直方图中各矩形的高度等于频数(或频次)
答:
对于各组距相等的情况,该说法是对的。
如前者是后者的k倍,则该不等距组段的高度为
面积等于频数(或频次)。
,对吗?
若某些组段的组距与多半组段所取组距不一样时,例
频数(或频次)除以k。
切实地说,组段对应的
61.统计表的列表原则是什么?
答:
一是重点突出,简单了然;二是主谓分明,层次清楚,切合逻辑。
62.线图和半对数线图的主要差异是什么?
答:
线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋向;
半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增添或减少速度。
63.某医院拟研究某新药治疗高血压的疗效,试确立该研究设计中的三个基本因素是什么?
答:
降压药物为办理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。
64.样本含量预计的因素有哪些?
答:
(1)依据研究目的,成立查验假定
(2)定出查验水平,常取
(3)提出所希望的查验效能
(4)一定知道由样本推测整体的一些信息,比如,对于两整体均数的比较,需知道两均数间
的差值和整体标准差
65.什么是盲法?
举例说明盲法在临床试验中的重要性。
答:
为了有效减少实验察看过程中的偏倚,使患者(甚至包含研究者及其余参加者)不知道办理举措的内容,称为盲法。
可有单盲法、双盲法和三盲法。
比如研究某抗神经虚弱药物的疗效,当患者了解自己所接受的办理举措时,对疗效的评论常常会受心理因素作用而不够客观。
采纳盲法,则能够防止疗效丈量中可能产生的偏倚。
66.实验设计应当依照哪