医学统计学问答题.docx

资源描述

医学统计学问答题.docx

《医学统计学问答题.docx》由会员分享，可在线阅读，更多相关《医学统计学问答题.docx（26页珍藏版）》请在冰豆网上搜索。

医学统计学问答题.docx

医学统计学问答题

1、标准正态分布（u分布）与t分布有何异同？

相同点：

集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例（自由度是无限大时）

不同点：

t分布是一簇分布曲线，t分布的曲线的形状是随自由度的变化而变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同：

直线回归分析适用于应变量是服从正态分布的随机变量，自变量是选定变量；直线相关分析适用于服从双变量正态分布的资料。

2两种系数的意义不同：

回归系数是表明两个变量之间数量上的依存关系，回归系数越大回归直线越陡峭，表示应变量随自变量变化越快；相关系数是表明两个变量之间相关的方向和紧密程度的，相关系数越大，两个变量的关联程度越大。

第一章医学统计中的基本概念

2、抽样中要求每一个样本应该具有哪三性？

从总体中抽取样本，其样本应具有“代表性”、“随机性”和“可靠性”。

（1）代表性:

就是要求样本中的每一个个体必须符合总体的规定。

（2）随机性:

就是要保证总体中的每个个体均有相同的几率被抽作样本。

（3）可靠性:

即实验的结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。

由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。

每个样本的含量越多，可靠性会越大，但是例数增加，人力、物力都会发生困难，所以应以“足够”为准。

需要作“样本例数估计”。

3、什么是两个样本之间的可比性？

可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。

实习一统计研究工作的基本步骤

1、什么叫医学统计学？

医学统计学与统计学、卫生统计学、生物统计学有何联系与区别？

医学统计学：

是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科

统计学：

是研究数据的收集、整理、分析与推断的科学。

卫生统计学：

是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

生物统计学：

是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。

2、医学统计的资料主要来源于那些方面？

有何要求？

医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。

实验数据是指在试验过程中活的的数据；现场调查资料主要来源于大规模的流行病调查获取的资料；医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等；报表有卫生工作基本情况年报表、传染年（月、日）报表、疫情旬（年、月、日）报表等；报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料的手机过程中，必须进行质量抗旨，包括它的统一性、确切性、可重复性。

这些原始数据的精读和偏性应有明确的范围。

3、医学统计学的资料类型有哪些？

（1）计量资料：

对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurementdata）。

计量资料亦称定量资料、测量资料。

.其变量值是定量的，表现为数值大小，一般有度量衡单位。

如某一患者的身高（cm）、体重（kg）、红细胞计数（1012/L）、脉搏（次/分）、血压（KPa）等。

（2）计数资料：

将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（countdata）。

计数资料亦称定性资料或分类资料。

其观察值是定性的，表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O四种血型的人数等。

（3）等级资料：

将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinaldata）。

等级资料又称有序变量。

如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。

等级资料与计数资料不同：

属性分组有程度差别，各组按大小顺序排列。

等级资料与计量资料不同：

每个观察单位未确切定量，故亦称为半计量资料。

4、常见的三类误差是什么？

应采取什么措施和方法加以控制？

常见的三类误差是：

（1）系统误差：

在收集资料过程中，由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因，可造成观察结果倾向性的偏大或偏小，这叫系统误差。

要尽量查明其原因，必须克服。

（2）随机测量误差：

在收集原始资料过程中，即使仪器初始状态及标准试剂已经校正，但是，由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。

譬如，实验操作员操作技术不稳定，不同实验操作员之间的操作差异，电压不稳及环境温度差异等因素造成测量结果的误差。

对于这种误差应采取相应的措施加以控制，至少应控制在一定的允许范围内。

一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施，从而达到控制的目的。

（3）抽样误差：

即使在消除了系统误差，并把随机测量误差控制在允许范围内，样本均数（或其它统计量）与总体均数（或其它参数）之间仍可能有差异。

这种差异是由抽样引起的，故这种误差叫做抽样误差，要用统计方法进行正确分析。

实习二单变量资料的统计描述

1、试述频数表的要素及用途。

要素：

组段，频距。

用途：

①描述资料的分布特征和分布类型。

频数分布有两个重要特征：

集中趋势和离散趋势。

大部分观察值向某一数值集中的趋势称为集中趋势，常用平均数指标来表示，各观察值之间大小参差不齐。

频数由中央位置向两侧逐渐减少，称离散趋势，是个体差异所致，可用一系列的变异指标来反映。

②便于进一步计算有关指标或进行统计分析。

当数据较多且需手工计算时，常先编制频数表，再进行统计计算。

③发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后，又出现少数几个特大值或特小值，使人怀疑其是否准确，需进一步检查和核对并做相应处理。

④当样本含量比较大时，可用各组段的平率作为概率的估计值。

2、描述单变量资料的统计指标分哪两大类，分别是什么指标？

分类：

①描述数据分布集中趋势的指标：

算术均数、几何均数、中位数。

②描述数据分布离散程度的指标：

极差、四分位数间距、方差、标准差、变异系数。

3、试述平均数、标准差、变异系数的含义及用途？

4、标准正态分布曲线下面积有何分布规律？

所有的正态分布曲线，在υ左右的相同倍数的标准差范围内的面积相同。

并且，在υ±σ范围内的面积约为68.3%；在υ±1.96σ范围内的面积约为95%；在υ±2.58σ范围内面积约为99%。

5、同一资料的标准差是否一定小于均数？

均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。

实习三单变量资料的统计推断

1、标准差与标准误有何区别和联系？

•区别：

1.含义不同:

⑴s描述个体变量值（x）之间的变异度大小，s越大，变量值（x）越分散；反之变量值越集中，均数的代表性越强。

⑵标准误是描述样本均数之间的变异度大小，标准误越大，样本均数与总体均数间差异越大，抽样误差越大；反之，样本均数越接近总体均数，抽样误差越小。

2.与n的关系不同：

n增大时，⑴sσ（恒定）。

⑵标准误减少并趋于0（不存在抽样误差）。

3.用途不同:

⑴s:

表示x的变异度大小，计算cv，估计正常值范围，计算标准误等⑵:

参数估计和假设检验。

•联系：

二者均为变异度指标，样本均数的标准差即为标准误，标准差与标准误成正比。

2、简述Ⅰ型错误和Ⅱ型错误的区别和联系。

·区别：

Ⅰ型错误（弃真）：

拒绝实际成立的H0，型错误的概率记为α。

（1－a）即置信度:

重复抽样时，样本区间包含总体参数（μ）的百分数。

当p≤α而拒绝H0时，只能犯Ⅰ型错误，不可能犯Ⅱ型错误。

Ⅱ型错误（存伪）：

不拒绝实际不成立的H0，Ⅱ型错误的概率记为β。

（1－β）即把握度（或检验效能：

两总体确有差别，被检出有差别的能力。

当p≥α而拒绝H0时，只能犯Ⅱ型错误，不可能犯Ⅰ型错误。

·联系：

对同一资料，α与β反方向变化，若要同时减小α与β，唯一的办法是增加样本含量。

3、可信区间与参考值范围的不同点。

应注意：

可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95％参考值范围是指同质总体内包括95％个体值的估计范围，而总体均数95％可信区间是指按95％可信度估计的总体均数的所在范围。

可信区间用于估计总体参数，总体参数只有一个。

参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。

2.从计算公式看：

若指标服从正态分布，95％参考值范围的公式是：

±1.96s。

总体均数95％可信区间的公式是：

。

前者用标准差，后者用标准误。

前者用1.96，后者用α为0.05，自由度为v的t界值。

4、在统计推断中，如何区别单侧检验和双侧检验？

如果将拒绝性概率平分于理论抽样分布的两侧，称为双侧检验。

例如选定显著性水平α=0.05，双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边，每边占有=0.025。

双侧检验只强调差异是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布的一侧（左侧或右侧），称为单侧检验（右侧检验或左侧检验）。

单侧检验强调差异的方向性。

在具体的假设检验中，选择双侧检验或单侧检验可分为以下三种情况：

第一种：

H0：

μ=μ0：

μ≠μ0双侧

第二种：

H0：

μ≥μ0：

μ＜μ0单侧（左侧）

第三种：

H0：

μ≤μ0：

μ＞μ0单侧（右侧）

5、t检验、z检验的公式有那些类型，在应用上有何异同？

t检验：

当样本例数n较小时，要求样本取自正态总体。

t检验的类型：

单样本t检验，独立t检验，配对t检验

z检验：

样本例数较大，或n虽小而总体标准差已知。

6、假设检验和总体均数区间估计有何联系？

假设检验：

是对总体做出某种假定，然后根据样本信息推断总体是否成立的一类统计学方法总称。

假设检验有三个基本步骤：

①建立假设和确定检验水准；②选择检验方法和计算检验统计量；③确定P值和做出统计推断结论。

总体均数的估计：

1、点估计：

样本统计量直接作为总体指标的估计值。

它未考虑抽样误差的大小。

2、区间估计：

按预先给定的概率（1-α）确定的包含未知总体参数的可能范围。

实习四方差分析

1、方差分析的基本思想是什么？

方差分析（analysisofvariance，ANOVA）的基本思想就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和（sumofsquaresofdeviationsfrommean，SS）和自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释，如各组均数的变异SS组间可由处理因素的作用加以解释。

通过各变异来源的均方与误差均方比值的大小，借助F分布作出统计推断，判断各因素对各组均数有无影响。

2、t检验和F检验的使用条件和应用范围有何异同？

t检验适用于两个样本均数的比较，F检验适用于多个样本的比较。

t检验的应用条件：

要求各样本来自相互独立的正态总体且各总体方差齐。

方差分析的应用条件

（1）各样本是相互独立的随机样本，且来自正态分布总体。

（2）各样本的总体方差相等，即方差齐性。

实习五计数资料的统计推断与描述

1、率的标准化的意义及基本思想。

当比较的两组资料内部各小组率明显不同，且各小组观测例数的构成比也明显不同时，直接比较两个合计率是不合理的。

因为期内部构成比不同，往往影响合计率的大小，需要统一的内部构成进行调整后计算标准化率，使其具有可比性，这种方法称为率的标准化。

率的标准化的基本思想：

要比较两个总率时，发现两组资料的内部构成（如年龄、性别构成等）存在明显不同，而且影响到了总率的结果，这时就不宜再直接比较总率，而应考虑采用标准化法。

标准化法的基本思想，就是采用统一的标准（统一的内部构成）计算出消除内部构成不同影响后的标准化率（调整率），然后再进行比较。

2、常用相对数指标有哪些？

它们在计算和意义上有何不同？

率（强度相对数，频率相对数）、构成比、相对比

应用相对数时应注意的问题：

⑴计算相对数的分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比的动态分析代替率的动态分析。

⑷对观察单位数不等的几个率，不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率（或构成比）的比较应随机抽样，并做假设检验。

3、卡方检验的使用范围和各个公式的适用条件是什么？

卡方检验用于：

推断两个及两个以上总体率或构成比是否有差别，两个分类变量间有无相关关系，多个率的趋势检验，以及两个率的等效检验等。

此外，也用于频数分布的拟合优度检验。

对不同的设计类型的资料，检验的应用条件不同：

（1）完全随机设计两样本率的比较

1）当n＞40，且T≥5时，用非连续性校正值；

若所得P≈α，则改用四格表的确切概率法。

2）当n≥40，且有1≤T＜5时，用连续性校正值。

3）n＜40，或有T＜1时，不能用检验，应当用四格表的确切概率法。

（2）配对设计四格表

1）当b+c≥40，

2）当b+c<40，需作连续性校正，　　　　　

（3）行列表资料

1）不宜有1/5以上格子的理论频数小于5，或有1个格子的理论频数小于1；

2）单向有序行列表，在比较各处理组的效应有无差别时，应该用秩和检验或Ridit检验；

3）多个样本率（或构成比）比较的检验时，结论为拒绝无效假设时，只能认为各总体率（或总体构成比）之间总的说来有差别，但不能说明它们彼此之间都有差别，或某两者间有差别。

若想进一步了解哪两者的差别有统计学意义，可用分割法。

4、率的标准误的意义和用途。

意义：

由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差。

率的抽样误差的大小是用率的标准误来表示。

用途：

①表示抽样误差的大小，说明样本率的代表性、可靠性。

②对总体率的可信区间进行估计。

实习六非参数资料的统计分析

1、非参数统计方法的概念及适用范围。

概念：

样本所来自的总体分布难以用某种函数式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题的一种不依赖总体分布的具体形式的统计方法。

由于这类方法不受总体参数的限制，故称非参数统计法，或称为不拘分布的统计分析方法，又称为无分布型式假定的统计分析方法。

它检验的是分布，而不是参数。

非参数统计不需对总体分布（总体参数）作出特殊假设。

适用范围：

（1）等级资料。

（2）偏态分布资料。

当观察资料呈偏态或极度偏态分布而又未作变量变换，或虽经变量变换仍未达到正态或近似正态分布时，宜用非参数检验。

（3）各组离散程度相差悬殊，即方差明显不齐，且不能变换达到齐性。

（4）个别数据偏离过大，或资料为单侧或双侧没有上限或下限值。

（5）分布类型不明。

（6）初步分析。

有些医学资料由于统计工作量大，可采用非参数统计方法进行初步分析，挑选其中有意义者再进一步分析（包括参数统计内容）。

（7）对于一些特殊情况，如从几个总体所获得的数据，往往难以对其原有总体分布作出估计，在这种情况下可用非参数统计方法。

2、非参数检验的优缺点。

优点：

①非参数统计方法要求的假定条件比较少，因而它的适用范围比较广泛。

②多数非参数统计方法要求的运算比较简单，可以迅速完成计算取得结果，因而比较节约时间。

③大多数非参数统计方法在直观上比较容易理解，不需要太多的数学基础知识和统计学知识。

④大多数非参数统计方法可用来分析如象由等级构成的数据资料，而对计量水准较低的数据资料，参数统计方法却不适用。

⑤当推论多达3个以上时，非参数统计方法尤具优越性。

缺点：

①由于方法简单，用的计量水准较低，因此，如果能与参数统计方法同时使用时，就不如参数统计方法敏感。

若为追求简单而使用非参数统计方法，其检验功效就要差些。

这就是说，在给定的显著性水平下进行检验时，非参数统计方法与参数统计方法相比，第Ⅱ类错误的概率β要大些。

②对于大样本，如不采用适当的近似，计算可能变得十分复杂。

注意:

凡符合或经过变换后符合参数检验条件的资料，最好用参数检验。

当资料不具备参数检验的条件时，非参数检验是一种有效的分析方法。

实习七直线相关与回归分析

1、相关与回归的联系和区别。

区别：

意义：

相关反映两变量的相互关系，即在两个变量中，任何一个的变化都会引起另一个的变化，是一种双向变化的关系。

回归是反映两个变量的依存关系，一个变量的改变会引起另一个变量的变化，是一种单向的关系。

应用：

研究两个变量的相互关系用相关分析。

研究两个变量的依存关系用回归分析。

研究性质：

相关是对两个变量之间的关系进行描述，看两个变量是否有关，关系是否密切，关系的性质是什么，是正相关还是负相关。

回归是对两个变量做定量描述，研究两个变量的数量关系，已知一个变量值可以预测出另一个变量值，可以得到定量结果。