南医医学统计学重点总结.ppt

上传人:b****2 文档编号:2640513 上传时间:2022-11-04 格式:PPT 页数:65 大小:788.50KB
下载 相关 举报
南医医学统计学重点总结.ppt_第1页
第1页 / 共65页
南医医学统计学重点总结.ppt_第2页
第2页 / 共65页
南医医学统计学重点总结.ppt_第3页
第3页 / 共65页
南医医学统计学重点总结.ppt_第4页
第4页 / 共65页
南医医学统计学重点总结.ppt_第5页
第5页 / 共65页
点击查看更多>>
下载资源
资源描述

南医医学统计学重点总结.ppt

《南医医学统计学重点总结.ppt》由会员分享,可在线阅读,更多相关《南医医学统计学重点总结.ppt(65页珍藏版)》请在冰豆网上搜索。

南医医学统计学重点总结.ppt

医学统计学综合练习三类资料

(1)定量资料(quantitativedata)以定量值表达每个观察单位的某项观察指标,如血脂、心率等。

特点:

各观察单位间只有量的差别;数据间有连续性。

三类资料

(2)定性资料(qualitativedata)以定性方式表达每个观察单位的某项观察指标,如血型、性别等。

特点:

各观察单位间或者相同,或者存在质的差别;有质的差别者之间无连续性。

三类资料(3)等级资料(rankeddata,ordinaldata)以等级表达每个观察单位的某项观察指标,如疗效分级、心功能分级等。

特点:

各观察单位间或者相同,或者存在质的差别;各等级间只有顺序,而无数值大小,故等级之间不可度量。

定量资料的描述集中趋势:

算术均数几何均数中位数百分位数离散趋势:

极差四分位数间距标准差、方差变异系数集中趋势指标应用注意事项o算数均数:

适用于单峰对称分布资料;o几何均数:

适合于作对数变换后单峰对称分布资料;o中位数和百分位数:

适用于任何分布的资料;o中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;o中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。

o因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。

o不同质的资料应考虑分别计算平均数。

6离散趋势指标应用注意事项全距:

反映资料的分布范围,全距大说明数据的变异度大,适用于任何资料;四分位间距:

两个特定的百分位数,常用于描述不对称资料的特征;方差和标准差:

常用来描述正态分布的资料;变异系数:

常用于比较度量衡单位不同的两组或多组资料的变异度;比较均数相差悬殊的两组或多组资料的变异度。

7正态分布oNormaldistributiono德国数学家Gauss发现o最早用于物理学、天文学oGaussiandistribution正态分布的特征正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。

高峰在均数处;均数两侧完全对称。

正态曲线下的面积分布有一定的规律。

正态分布和标准正态分布曲线下面积分布规律总结正态分布标准正态分布面积(或概率)-1.64+1.64-1.64+1.6490.00%-1.96+1.96-1.96+1.9695.00%-2.58+2.58-2.58+2.5899.00%正态分布的应用估计频数分布质量控制确定临床参考值范围参考值范围的估计方法方法双侧单侧下限单侧上限正态分布法参考值范围(referenceinterval)(referenceinterval)参考值范围又称正常值范围(normalrange)。

什么是参考值范围:

是绝大多数正常人的某观察指标所在的范围。

绝大多数:

90%,95%,99%等等。

确定参考值范围的意义:

用于判断正常与异常。

“正常人”的定义:

排除了影响所研究的指标的疾病和有关因素的同质的人群。

由抽样引起的样本统计量与总体参数间的差别。

原因:

个体变异抽样表现:

样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是有规律的!

抽样误差(samplingerror)中心极限定理p从正态总体中随机抽样,样本均数服从正态分布;p从偏态分布的总体中随机抽样,当样本含量足够大时,样本均数也近似服从正态分布。

从任意分布的总体从任意分布的总体(均数均数,标准差,标准差)中随机抽样,当样本含量逐渐增大时,中随机抽样,当样本含量逐渐增大时,样本均数的分布趋向正态分布,样本均数的分布趋向正态分布,此分布的均数为此分布的均数为,标准差为,标准差为标准误(standarderror)(standarderror)样本统计量的标准差称为标准误。

样本均数的标准差称为均数的标准误。

均数的标准误表示样本均数的变异度。

当总体标准差未知时,用样本方差代替,前者称为理论标准误,后者称为样本标准误。

标准误与标准差

(1)联系:

都表示变异的大小;样本含量一定时,标准差越大,标准误越大。

标准误与标准差

(2)标准差含义:

一组变量值离散程度;标准差越小,均数的代表性越好;应用:

估计参考值范围;与n的关系:

样本含量越大,标准差越稳定,n很大时,标准差趋向于总体标准差。

标准误与标准差(3)标准误含义:

样本统计量的离散程度;标准误越小,用样本均数来反映总体均数越可靠;应用:

计算可信区间;与n的关系:

样本含量越大,均数的标准误越小,n很大时,标准误趋向于0。

统计推断(statisticalinference)根据样本所提供的信息,以一定的概率推断总体的性质。

u总体参数的估计(parameterestimation)u假设检验(hypothesistest)区间估计(intervalestimation)o按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间。

o这种估计方法称为区间估计。

o理论基础:

抽样分布规律假设检验的步骤:

u建立假设(在假设的前提下有规律可循);u确定检验水准(确定最大允许误差);u计算检验统计量(样本与总体有多大的偏离);u计算概率P(该样本是否支持零假设);u结论(根据小概率原理)。

均数的假设检验p样本均数与总体均数的比较p配对设计样本均数的比较p两样本均数的比较均数的假设检验应用条件p独立性、正态性、方差齐性独立性、正态性、方差齐性o方差齐性检验o方差不齐时的近似t检验o大样本时,均数比较的u检验I型错误和II型错误实际情况假设检验的结果拒绝H0不拒绝H0H0成立I型错误()H0不成立把握度(1-)II型错误()P值的意义o从H0总体中随机获得等于或大于现有统计量值的概率。

o拒绝H0时所冒的风险。

界值界值tt定性资料o定性资料的特点n离散性,变量仅取有限的几个值;n资料不含有次序的信息;o举例n血型(A、B、O、AB)n人群中某病发生与否(发生、不发生)o描述指标:

率相对数构成比相对比常用相对数

(1)o率(rate),又称频率指标,说明某现象发生的频率和强度。

(强度相对数)常用相对数

(2)o构成比(proportion),又称构成指标,说明一种事物内部各组成部分所占的比重或分布。

各部分构成比之和为1或100%常用相对数(3)o比(ratio),又称相对比,是A,B两个有关指标之比,说明A为B的若干倍或百分之几。

两个指标可以性质相同,也可以不同。

四格表(fourfoldtable)的概念这四个格子的频数是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,这种资料称为四格表资料。

abcd2检验的基本思想o如果H0假设成立,则实际频数(actualfrequency)与理论频数应该比较接近。

o如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等。

理论频数的计算4310534016568326109实际数理论频数40.3612.6442.6411.36T11=5383/109=40.36T12=5326/109=12.64T21=5683/109=42.64T22=5626/109=13.36等级资料的特点o既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;o比“定量”粗,而比一般的“定性”细;o等级间既非等距,亦不能度量。

秩次与秩和o秩次(rank),秩统计量是指全部观察值按某种顺序排列的位序;o秩和(ranksum)同组秩次之和。

o两样本比较的秩和检验(基本原理)oWilcoxon符号秩和检验(基本原理)秩和检验的正确应用秩和检验可用于任意分布的资料;

(1)等级资料;

(2)计量资料中:

n极度偏态资料,或个别数值偏离过大n各组离散度相差悬殊n资料中含有不确定值大于5年、0.001、1:

1024以上n分布类型尚未确知(3)兼有等级和定量性质的资料相关与回归o线性相关o等级相关o列联相关o线性回归相关系数的性质-1r1r0为正相关r0为负相关r0为零相关或无相关相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。

3.回归系数和回归方程的意义及性质回归系数和回归方程的意义及性质ob的意义oa的意义o的意义o的意义o意义直线回归与直线相关的区别与联系o联系o均表示线性关系;o符号相同:

共变方向一致;o假设检验结果相同:

是否存在共变关系;直线回归与直线相关的区别与联系o区别nr没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关;n相关表示相互关系;回归表示依存关系;n对资料的要求不同:

o当X和Y都是随机的,可以进行相关和回归分析;o当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析;实验研究的基本要素o处理因素:

作用于受试对象,要求在实验过程中观察其处理的因素o受试对象:

处理因素作用的对象o实验效应:

受试对象接受试验处理后所出现的实验结果实验设计的基本原则o基本原则之一:

对照排除“非处理因素”的影响,从而衬托处理因素的作用o基本原则之二:

随机不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素。

是保证非处理因素在各对照组之间均衡一致的重要条件抽样随机;分组随机;试验顺序随机o基本原则之三:

重复以提高实验的可靠性研究设计的常见类型o完全随机分组设计n成组设计o配对设计(目的?

)o正确选择分析方法考试题型o选择o名词解释o简答题o资料分析题习题1关于正态分布的特征,下面说法错误的是:

A高峰位置在均数=处B为位置参数,越大,则曲线沿横轴向右移动;越小,曲线沿横轴向左移动C为形态参数,表示数据的离散程度,若小,则曲线形态“矮胖”;大,则曲线形态“瘦高”D正态分布以均数为中心,左右完全对称2.各观察值均加上同一数后,()(A)均数不变,标准差改变(B)均数改变,标准差不变(C)两者均改变(D)两者均不变3.某地5人接种某疫苗后抗体滴度为1:

20、1:

40、1:

80、1:

160、1:

320。

为求平均抗体滴度,最好选用()(A)中位数(B)几何均数(C)算术平均数(D)标准差4正态分布曲线下,横轴上从均数到(+1.96)的面积为:

A95%B45%C47.5%D90%5.某人群血糖的正常值范围是指()(A)该指标在所有人中的波动范围(B)该指标在所有正常人中的波动范围(C)该指标在绝大部分正常人中的波动范围(D)该指标在一个人不同时间的波动范围6假设检验中的第一类错误是指A拒绝了实际上成立的H0B不拒绝实际上成立的H0C拒绝了实际上不成立的H0D不拒绝实际上不成立的H07.X2.58s包括变量值的A.68.3%B.90.0%C.95.0%D.99.0%8.均数与标准差之间的关系是A.标准差越小,均数代表性越好B.标准差越小,均数代表性越差C.均数越大,标准差越小D.均数越大,标准差越大9.分析定性资料时,最常用的显著性检验方法是A.t检验B.正态检验C.U检验D.2检验10.四格表如有一个实际数为0A.就不能做2检验;B.就不能用校正2检验;C.还不能决定是否可做2检验;D.肯定可做校正2检验。

名词解释总体和样本参数和样本统计量抽样误差标准误小概率原理小概率事件P值的含义检验效能一类错误与二类错误可信区间相关系数简答题o1.简述中心极限定理的涵义?

o2.描述定量资料的集中位置和离散趋势各有哪些指标?

o3.标准差与标准误区别与联系?

适用于何种情况?

o4.参考值范围和区间估计的区别与联系?

o5.假设检验的步骤有哪些?

o6.ANOVA的应用条件是什么?

当资料不符合方差齐性条件时,需对资料进行变换,常见的变换形式有?

o7.秩和检验的条件?

o8.直线回归与直线相关的区别与联系o9.简述实验设计的基本要素,基本原则。

资料分析题-1为了考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校(UCBerkley)的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:

磅)男婴x17.37.97.98.09.37.86.57.66.68.46.77.5女婴

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 城乡园林规划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1