1、 思考与练习参考答案第1章 绪论一、选择题1. 研究中的基本单位是指 ( D )。A样本 B. 全部对象 C影响因素D. 个体 E. 总体2. 从总体中抽取样本的目的是( B )。A研究样本统计量 B. 由样本统计量推断总体参数C研究典型案例 D. 研究总体统计量 . 计算统计指标3. 参数是指( B )。A参与个体数 B. 描述总体特征的统计指标C描述样本特征的统计指标 D. 样本的总和 E. 参与变量数 4. 下列资料属名义变量的是( E )。A白细胞计数 B住院天数C门急诊就诊人数 D患者的病情分级 E. ABO血型5关于随机误差下列不正确的是( C )。A受测量精密度限制 B无方向性
2、C. 也称为偏倚不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量 2. 同质与变异 3. 总体与样本4. 参数与统计量 5. 误差 6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系? 答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统
3、计学原理与方法。2. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。3. 某地区有10万个7岁发育正常的男孩,为了研究这些7岁发育正常男孩的身高和体重
4、,在该人群中随机抽取200个7岁发育正常的男孩,测量他们的身高和体重,请回答下列问题。(1)该研究中的总体是什么?答:某地区10万个7岁发育正常的男孩。(2)该研究中的身高总体均数的意义是什么? 答:身高总体均数的意义是: 10万个7岁发育正常的男孩的平均身高。(3)该研究中的体重总体均数的意义是什么? 答:体重总体均数的意义是: 10万个7岁发育正常的男孩的平均体重(4) 该研究中的总体均数与总体是什么关系? 答:总体均数是反映总体的统计学特征的指标。(5)该研究中的样本是什么? 答:该研究中的样本是:随机抽取的200个7岁发育正常的男孩。 (宇传华 方积乾) 第2章 统计描述 思考与练习参
5、考答案一、最佳选择题1. 编制频数表时错误的作法是( E )。A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为1015组C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值E. 写组段,如“1.53,35, 56.5,”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是( A )。A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用( A )。A. 变异系数 B. 全距 C. 标准差D. 四分位数间距 E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是( A )。A. S越小
6、,对样本中其他个体的代表性越好 B. S越大,对样本中其他个体的代表性越好C. 越小,S越大D. 越大,S越小E. 必小于5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为( B )。A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数D. 乙肝病毒携带者数 E. 易感人数6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于( C )。A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数7. 纵坐标可以不从0开始的图形为( D )。A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可二、简答题1. 对定量资料进行统计描述时,如何选择适宜的
7、指标? 答:详见教材表2-18。教材表2-18 定量资料统计描述常用的统计指标及其适用场合描述内容指 标意 义适 用 场 合平均水平均 数个体的平均值对称分布几何均数平均倍数取对数后对称分布中 位 数位次居中的观察值非对称分布;半定量资料;末端开口资料;分布不明众 数频数最多的观察值不拘分布形式,概略分析调和均数基于倒数变换的平均值正偏峰分布资料变 异 度全 距观察值取值范围不拘分布形式,概略分析标 准 差(方 差)观察值平均离开均数的程度对称分布,特别是正态分布资料四分位数间距居中半数观察值的全距非对称分布;半定量资料;末端开口资料;分布不明变异系数标准差与均数的相对比不同量纲的变量间比较;
8、量纲相同但数量级相差悬殊的变量间比较2. 举例说明频率和频率分布的区别和联系。 答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。两者均为“阳性率”,都是基于样本信息对总体特征进行估计的指标。不同的是:频率只是一种结局发生的频率,计算公式的分子是某一具体结局的发生数;频率分布则
9、由诸结局发生的频率组合而成,计算公式的分子分别是各种可能结局的发生数,而分母则与频率的计算公式中分母相同,是样本中被观察的单位数之和。3. 应用相对数时应注意哪些问题?答:(1)防止概念混淆 相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。(2)计算相对数时分母不宜过小 样本量较小时以直接报告绝对数为宜。(3)观察单位数不等的几个相对数,不能直接相加求其平均水平。(4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。4. 常用统计图有哪些?分别适用于什么分析目的? 答:详见教材表2-20。教材表2-20 常用统计图的适用资料及
10、实施方法图 形适 用 资 料实 施 方 法条 图组间数量对比用直条高度表示数量大小直 方 图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼 图构成比用圆饼的扇形面积表示全体中各部分的构成比线 图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散 点 图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱 式 图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎 叶 图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数
11、三、计算题1. 某内科医生调查得到100名4050岁健康男子总胆固醇(mg/dl),结果如下22719022425922523818019321419521319320917224419915520820319925318119622421022025525721624923522019020319714917523620220917418417418516723516721017124820126618922219919721419919823024620920218621720620020319716124713818615619516327317819020725918619424617
12、2234232189172235207208231234226174199278277181(1)编制频数表,绘制直方图,讨论其分布特征。答:频数表见练习表2-1。根据直方图(练习图2-1),可认为资料为基本对称分布,其包络线见练习图2-2。练习表2-1 某地100名4050岁健康男子总胆因醇/(mgdl-1)FrequencyPercentValid PercentCumulative PercentValid 130145160175190205220235250265280Total1 3 11 12 25 15 13 11 5 4 100 1.0 3.011.012.025.015.0
13、13.011.05.04.0100.0 1.0 3.011.012.025.015.013.011.05.04.0100.0 1.04.015.027.052.067.080.091.096.0100.0 练习图2-1 直方图练习图2-2 包络线图(2)根据(1)的讨论结果,计算恰当的统计指标描述资料的平均水平和变异度。答:利用原始数据,求出算术均数 mg/dl 和标准差mg/dl。(3)计算P25,P75和P95。答:利用原始数据,求出P25=186.8 mg/dl,P75=229.3 mg/dl,P95=259.0 mg/dl。2. 某地对120名微丝蚴血症患者治疗3个疗程后,用IFA间接
14、荧光抗体试验测得抗体滴度如下,求抗体滴度的平均水平。抗体滴度1:51:101:201:401:801:1601:320例 数516273422133利用上述频数表,得平均滴度为1:36.3。3. 某地19751980年出血热发病和死亡资料如教材表2-21,设该地人口数在此6年间基本保持不变。教材表2-21 某地6年间出血热的发病与死亡情况年 份发病数病死数1975324197656519771621219782411319793301019802745试分析:(1)粗略判断发病率的变化情况怎样。答:该地人口数在此6年间基本保持不变,发病人数在1979年前逐年上升,1980年略有下降。可以认为发
15、病率大致呈上升趋势,1980年略有下降。(2)病死率的变化情况怎样? 答: 病死率由各年度病死数除以发病数获得,病死率依次为12.5%、8.9%、7.4%、5.4%、3.0%和1.8%,呈逐年下降趋势。(3)上述分析内容可用什么统计图绘制出来? 答:由于没有给出该地人口数,故不能计算发病率,可用普通线图表示发病数变化情况。病死率的下降情况可以用普通线图表示,下降速度则可以用半对数线图表示。(4)评述该地区出血热防治工作的效果。答:随着时间的推移,预防工作做得不好,治疗水平则逐年提高(体现在病死率下降)。 (张晋昕)第3章 概率分布思考与练习参考答案一、最佳选择题1. 某资料的观察值呈正态分布,
16、理论上有( C )的观察值落在范围内。A. 68.27% B. 90% C. 95% D. 99% E. 45%2. 正态曲线下,从均数到的面积为( A )。A. 45% B. 90% C. 95% D. 47.5% E. 99%3. 若正常人的血铅含量X近似服从对数正态分布,则制定X的95%参考值范围,最好采用(其中 , 为Y的标准差)( C )。A. B. C. D. E.4. 在样本例数不变的情况下,若( D ),则二项分布越接近对称分布。 A. 总体率越大 B. 样本率p越大 C. 总体率越小 D. 总体率越接近0.5 E. 总体率接近0.1或0.55. 铅作业工人周围血象点彩红细胞在
17、血片上的出现数近似服从( D )。A. 二项分布 B. 正态分布 C. 偏态分布 D. Poisson分布 E. 对称分布6. Poisson分布的均数与标准差的关系是( E )。A. B. C. D. E. 二、思考题1. 服从二项分布及Poisson分布的条件分别是什么?简答:二项分布成立的条件:每次试验只能是互斥的两个结果之一;每次试验的条件不变;各次试验独立。Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数很大,而所关心的事件发生的概率很小。2. 二项分布、Poisson分布分别在何种条件下近似正态分布?简答: 二项分布的正态近似:当n较大,不接近0也不接近1时
18、,二项分布B(,)近似正态分布N(, )。Poisson分布的正态近似:Poisson分布,当相当大时(20),其分布近似于正态分布。三、计算题1. 已知某种非传染性疾病常规疗法的有效率为80%,现对10名该疾病患者用常规疗法治疗,问至少有9人治愈的概率是多少?解:对10名该疾病患者用常规疗法治疗,各人间对药物的反应具有独立性,且每人服药后治愈的概率均可视为0.80,这相当于作10次独立重复试验,即=0.80,n=10的贝努利试验,因而治愈的人数X服从二项分布。至少有9人治愈的概率为: 至少有9人治愈的概率是37.58%。或者2. 据以往的统计资料,某地新生儿染色体异常率为1%,问100名新生
19、儿中染色体异常不少于2名的概率是多少?解:=3. 调查某市2000年110名20岁男性青年的身高(cm)资料如下:173.1 166.8 172.9 175.9 172.8 170.5 174.1 174.2 175.7 173.5168.2 173.7 184.4 174.8 172.5 174.9 174.9 174.2 173.8 176.2170.9 165.0 176.3 174.2 179.8 174.5 180.5 171.5 178.9 171.5166.7 170.8 168.8 177.5 174.5 183.5 182.0 170.9 173.5 177.5181.2 1
20、77.1 172.3 176.5 174.0 174.3 174.6 172.6 171.3 173.1176.9 170.5 174.2 177.5 176.6 182.3 172.1 169.9 179.5 175.8178.6 180.6 175.6 173.3 168.7 174.5 178.5 171.3 172.0 173.2168.8 176.0 182.6 169.5 177.5 180.6 181.5 175.1 165.2 168.0175.4 169.2 170.0 171.9 176.6 178.8 177.2 173.4 168.5 177.6175.8 164.8
21、175.6 180.0 176.6 176.5 177.7 174.1 180.8 170.6173.8 180.7 176.3 177.5 178.3 176.0 174.8 180.8 176.5 179.2(1)试估计当年该市20岁男性青年中,身高在175.0178.0(cm)内的占多大比例?(2)估计当年该市95%以及99%的20岁男青年身高范围。(3)若当年由该市随机抽查1名20岁男青年,试估计其身高超过180 cm的概率。解:用SPSS计算本题。数据文件:data3-n.sav。数据格式:数据库2列110行,变量n为男性青年序号,x表示身高。操作步骤:操作说明Analyze Des
22、criptive StatisticsDescriptives Options Mean Std. Deviation Continue Variables: x OK调用Descriptives过程计算得均数=174.766,标准差=4.150 9TransformCompute调用“变量计算(Compute Variable)”对话框Target Variable P 定义目标变量“P”Numeric Expression:CDF.NORMAL(178.0,174.766,4.1509)-CDF.NORMAL(175.0,174.766,4.1509) OK当年该市20岁男性青年中,身高在
23、175.0178.0 cm内的比例Target Variable x1 该市95%以及99%的20岁男青年身高范围间的比例Numeric Expression:174.766-1.96*4.1509OKTarget Variable x2 Numeric Expression:174.766+1.96*4.1509OKTarget Variable x3 Numeric Expression:174.766-2.58*4.1509OKTarget Variable x4 Numeric Expression:174.766+2.58*4.1509OKTarget Variable p1 Num
24、eric Expression:1-CDF.NORMAL(180.0,174.766,4.1509)OK由该市随机抽查1名20岁男青年,其身高超过180 cm的概率计算结果(练习图3-1):Descriptive StatisticsNMeanStd. Deviationx110174.7664.1509Valid N (listwise)110练习图3-1 SPSS输出结果以上是SPSS输出结果,得到均数(Mean)为174.766 cm,标准差(Std. Deviation)为4.150 9 cm。估计当年该市20岁男性青年中,身高在175.0178.0 cm内的比例为25.956%,身高
25、在175.0178.0 cm内的约有29人。 估计当年该市95%的20岁男青年身高范围为166.63182.90 cm,99% 的20岁男青年身高范围为164.06185.48 cm。 由该市随机抽查1名20岁男青年,估计其身高超过180 cm的概率约为10%。 (祁爱琴 高 永 石德文)第4章 参数估计思考与练习参考答案 一、最佳选择题1.关于以0为中心的t分布,错误的是()A. t分布的概率密度图是一簇曲线B. t分布的概率密度图是单峰分布C. 当n时,t分布Z分布 D. t分布的概率密度图以0为中心,左右对称E. n相同时,值越大,P值越大2.某指标的均数为,标准差为S,由公式计算出来的区间常称为()。A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间D. 95%置信区间 E. 90%置信区间3.样本频率与总体概率均已知时,计算样本频率p的抽样误差的公式为()。A. B. C. D. E. 4在已知均数为, 标准差为 的正态总体中随机抽样, ()
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1