医学统计学重点CHFWord文件下载.docx-资源下载

医学统计学重点CHFWord文件下载.docx

1、2）等级资料：将观察单位按某种属性的不同程度、档次或等级顺序分组，清点各组观察单位的个数所得的资料。统计指标率、构成比；统计方法为非参数分析法；三、统计工作基本步骤：统计设计、资料收集、资料整理、统计分析。（统计研究设计分为调查研究设计和实验研究设计，统计分析主要包括统计描述和统计推断）（1）实验设计1.实验设计三要素：处理因素、受试对象、实验效应2.误差分类：随机误差（抽样误差、随机测量误差）、系统误差、过失误差。3.实验设计的三个基本原则：对照原则control、随机化原则random、重复原则replication。4.实验设计方法有析因设计正交试验设计均匀试验设计交互作用

2、两组：异体配对设计同体配对设计交叉设计无随机同期对照实验设计（单因素两水平）扩展多组：单因素多水平配伍组设计拉丁方设计（两因素多水平）（三因素多水平）配伍组设计：也称随机区组设计，将条件相近的受试对象配伍，每个配伍组中的对象随机分配到各处理组中。析因设计：考察两个或两个以上的处理因素，将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。拉丁方设计：用于三因素等水平无交互。（2）统计分析1. 统计描述：2. 统计推断：用样本信息推断总体特征分分析方法，包括参数估计estimation of parameter和假设检验hypothesis test

3、ing。3. 参数估计（1）参数估计：可分为点估计point estimation和区间估计interval estimation。点估计：选择一个适当的样本统计量作为总体参数的估计值称为点估计。区间估计：根据一定的正确度和精确度要求确定一个概率水平,由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围，称为区间估计。称此概率水平为置信度,也可称为置信水平confidence level。所估计的区间称为置信区间confidence interval,区间的端点称为置信限confidence limit，有上下限之分。可信区间的大小与样本含量及可信度的大小有关，一般地说，随着

4、可信度的加大，可信区间也加大，随着样本含量的加大，可信区间缩小。可信区间的两个要素：准确度与精确度1可信区间的准确度：表现为可信度（1-）的大小，即区间包含总体均数的概率大。2可信区间的精确度：表现为区间的长度。 399%置信区间准确度高于95%置信区间。95%置信区间精确度更高。4在可信度确定的情况下，增加样本例数可减少区间长度，提高精确度。公式：单个正态总体均数的区间估计已知：双侧：即 z分布单侧：4. 假设检验（1）假设检验：用样本差别或样本与总体差别推断总体之间是否可能存在差别，称为假设检验，又称显著性检验significance testing。基本思想：反证法、小概率事

5、件原理（2）基本步骤：1）建立假设，确定检验水准 H0：检验假设或无效假设null hypothesis，差异存在但不显著或差异无统计学意义 H1：对立假设或备择假设alternative hypothesis，差异显著或差异有统计学意义2）在原假设成立条件下，选择统计方法并计算检验统计量。（认为误差由抽样产生）参数检验统计量要求满足： i）在H0成立的条件下，服从特定的抽样分布； ii）必须包含要检验的总体参数；iii）对于给定的样本数据，能计算出该检验统计量的数值。3）对于给定的值做出检验结论，并给以专业解释，判断P值：（与界值比较，反查界值表于计算出的统计量的概率。若P，则接受

6、 H0，拒绝H1，结论为差异无统计学意义 ;若P时，接受H0，可能犯类错误（）。此时，虽然未知，但P值越大，犯类错误的概率越小，结论越可靠。D. 减少（增加）I型错误，将会增加（减少）II型错误E. 增大n，可以同时降低两类错误。（5）检验效能:H0不成立时拒绝H0的概率,用1-表示，称为检验效能影响检验效能的四要素：a. 客观上组间效应差异越大，效能越大b. 个体间变异（标准差）越小，效能越大。c. I类错错误的概率越大，效能越大。d. 样本量越大,效能越大。（6）单侧检验和双侧检验当H0:1=2；H1:12时，就是双侧检验；12或H1:12时，就是单侧检验。其主要区别在备择假设H1上面

7、。如果H1:1时就用到二侧（即12或12）；如果12就只用到一侧。如t值表中由于t分布左右对称，同一个t界值所对应双侧概率P等于单侧概率P的二倍。故若同一个t检验的所得t值，对应的单侧概率P较小，为双侧概率的二分之一,单侧检验更容易出现p，故易于产生拒绝H0之统计推断。故若单侧检验误选用双侧检验，就不易拒绝H0；反之，若双侧检验误选用单侧就容易拒绝H0。（7）写法：正确写法：H0:两总体均数相等；两总体均数不相等。错误写法：两样本均数相等；两样本均数不相等。两样本均数无显著差异；两样本均数有显著差异。两总体均数无显著差异；两总体均数有显著差异。4、标准误1. 标准误standard erro

8、r，SE：每次样本计算出的样本均数不同，这些的标准差称为均数的标准误。样本统计量的标准差：表示抽样误差的大小。2. 标准差：反应数值之间的离散程度，反应数据与总体均数之间的差异。3. 标准误意义：是衡量样本统计量抽样误差大小的统计指标。标准误越小，表示抽样误差越小，统计量越稳定与所估计的参数越接近。与标准差的区别：二者都是描述变异程度的指标，标准差描述个体值的变异，标准误描述统计量的变异。4. 特别注意的是，统计量包括均数、率、回归系数，均有对应的标准误，如样本均数标准误，样本率标准误，回归系数标准误等。5. 样本均数的标准误standard error of mean：从同一总体中随机抽取样

9、本含量相等的若干个样本，得到若干个样本均数，这些样本均数不完全相等，并且与总体均数也存在差异。由于抽样而产生的样本均数和总体均数间的差异称为均数的抽样误差。反映来自同一总体的样本均数的离散程度以及样本均数和总体均数的差异程度，即均数的抽样误差大小。均数标准误的用途：（1）衡量样本均数推断总体均数的可靠性（2）估计总体均数的可信区间（3）用于均数的假设检验（统计推断）通过增加样本例数来减少标准误，降低抽样误差。5、正态分布与标准正态分布1. 概念：正态分布又称高斯分布，是一种最重要的连续型分布。简记为 N（，2）；其中，2分别是二个参数，为总体的均数，2为总体的方差。特别地，当=0，2=1

10、时的正态分布称为标准正态分布，记为 N（0，1）。2. 标准化变换：若X服从正态分布，可进行如下的标准化变换：u=（X-）/；经此变换后，u服从均数为0、标准差为1的正态分布，我们将此正态分布称为标准正态分布，用 N（0，1）表示。3. 正态分布的特点：（1）正态分布是单峰分布，曲线在横轴上方均数处最高。（2）正态分布以均数为中心，左右对称。（3）在x=处为拐点，且以 x 轴为水平渐近线（4）正态曲线下面积分布具有一定的规律。1横轴上正态曲线下的总面积为100%或1；2正态曲线的对称轴为直线X=，对称轴两侧曲线下的面积相等，各占50%；3曲线下对称于的区间，面积相等；4曲线下区间（，

11、）的面积为68.27%；5区间（1.64，1.64）的面积为89.90%；6区间（1.96，1.96）的面积为95.00%；7区间（2.58，2.58）的面积为99.00%。4. 和两个参数，即位置参数和变异度参数（形态参数）。1均数：位置参数，当固定时，增大，曲线沿横轴向右移动；减小，曲线沿横轴向左移动。2标准差：形状参数，增大，。当固定时，越大，曲线越矮胖低平，数据分散，低平；越小，曲线越高瘦。5. 总体均数区间估计：当u等于1.96时，表示该区间包含的可能性为95%。6. 标准正态分布界值双侧检验时，u0.05/2=1.96；u0.01/2=2.58；单侧检验时，u0.05=1.64；u

12、0.01=2.32 规定：界值右侧曲线下方面积等于它的下角标。下角标一致，x轴上方中间面积一致。双侧界值： P（|z|/2）=1- P（zz/2）= 单侧界值：上限：下限： P（zz）= P（zz1-）=1- P（zz）=1- P（zx2）=）=1- P（x2x21-）=1-x2）=1- P（x2x21-）=8、t检验1. t分布（t distribution）是一种连续型分布，来自正态总体的一组样本，t=t分布；为样本均数，n为样本含量，s为样本标准差。为总体均数,自由度 df=n-1。2. 自由度为n-1的t分布是一个关于纵轴对称的分布，t分布主要用于t检验，包括样本均数与总体均数的

13、比较，两样本均数的比较，回归系数及相关系数检验等。以0为中心，左右对称的单峰分布。自由度越大越高瘦，自由度越小越分散。随着自由度逐渐增大，t分布逼近正态分布，极限分布是标准正态分布。4. t分布界值： P（|t|t）=1- P（t P（tt）=1- P（tt）= P（tt1-）=1- 双侧概率P为单侧概率的两倍，因此单侧检验时是更容易出现P，需谨慎9、F检验1. 如果分别从两个正态总体N（1，1）和N（1，1）中随机抽取样本含量n1、n2的两个样本，算出样本均数和方差分别为，和，则服从df1=n1-1，df2=n2-1的F分布。2. F= F检验有二个自由度1 和2 ，它们分别为分子的自

14、由度与分母的自由度。3. 用途：多个均数比较的方差分析，也用于回归分析中假设检验，以及方差齐性检验等。4. 图形分布特征：曲线偏向左边，df1、df2同时增大，曲线趋向于对称5. 倒数性质： =6. F分布界值： P（FF P（FF1-）=1-F）=1- P（FF1-）=第三章定量资料的统计描述1. 频数表编制过程（了解）（1）找出样本数据的最大值和最小值，计算极差 R；（2）分组：确定分组的组距 d 和组数 k和组段上下限；一般n100，10-15组（3）求频率密度：统计频数，算出频率、频率密度和累积频率；（4）画出直方图。2. 频数表和直方图的作用：用于观察个数较多资料的统计描述，可以

15、直观提示资料的分布特征和分布类型。频数分布特征：集中趋势central tendency、离散程度dispersion；频数分布类型：对称分步、偏态分布。3. 集中趋势、离散趋势的指标及适用范围（1）集中趋势：，G，M，Px，M01算术均数arithmetic mean ：总体均数；样本均数；适用于对称分布；不适用于偏态分布和资料中出现极值的资料；各观察值与均数之差的总和为0，离均差平方和最小。2几何均数geometric mean：适用于等比级资料或对数正态分布的资料；不适用与观察值中有0或正负数值同时出现的资料。或3中位数median M：适用于大样本偏态分布或分布情况不明的资料或资料中有

16、不确定数值的资料。4百分位数pencentile Px：中位数即P50；多个百分位数结合使用，全面描述数据分布的特征；用于确定医学参考值范围（偏态或分布不明的资料）。5众数mode M0：适用于大样本，较粗糙。（2）离散趋势：1极差range R：优点：简单明了、容易使用。缺点：只反映最大值和最小值间的差异，不能反映其他观察值的变异程度。样本容量越大，极差可能越大。极差的抽样误差大，不稳定。2四分位数quartile Q：与中位数一起描述偏态分布资料变异程度。QL=P25/QU=P75；四分位间距QU-QL缺点：类似于极差，利用度低。3方差variance与标准差standard dev

17、iation：与均数一起描述正态分布的分布特征。总体方差用2表示：样本方差估计总计方差：离均差平方和反应离散程度；方差越大，离散程度越大；标准差、S；方差开平方4变异系数coefficient of variation:适用于比较度量衡单位不同资料的变异度。比较均数相差悬殊的资料的变异度。衡量实验精密度和稳定性的常用指标。（3）频数分布特征高峰在中间，左右大致对称，称为对称分布。平均数=中位数=众数高峰偏向小值的一侧（左侧），称正偏态分布（亦称右偏态）。平均数中位数众数高峰偏向大值的一侧（左侧），称负偏态分布（亦称左偏态）。平均数中位数t/F,V时，P，拒绝H02v1=n1-

18、1；v2=n2-1；7. t检验：小样本团体t检验如方差不齐时8. 正态性检验：直方图,P-P图，Q-Q图。W检验（3n50）；D检验（50n1000）；9. 两均数的的等效性检验；1-2，不等效，事先规定样本与总体均数等效：t（n-1）=-两样本均数的的等效：t（n1+n2-2）=第5章方差分析ANOVA1. 术语1）反应变量（dependent variable）:反应变量也被称为因变量、结果变量，它是欲分析的主要观测指标2）自变量（independentvariable）:自变量是自由取值的变量。自变量影响因变量的取值。3）因素和水平（factor and lever）:因素就是

19、指对反应变量有影响的分类变量。分类变量的不同取值就是水平。4）处理单位（treatment unit）:各因素的各种水平的组合为处理,每个组合就形成一个单元格，每个单元格就是一个处理单位。5）元素（element）:元素是用于观测反应变量最小的观测单位6）均衡（balance）:在一个实验设计中如果每个单元格中的出现的试验次数相等，则称这个设计是均衡的，反之，则是不均衡的。7）协变量（covariate）:对反应变量有影响的数值型变量就是协变量8）交互作用（interaction）:当一个因素的作用随另外一个因素水平的改变而改变，则这两个因素之间存在交互作用.9）固定因素和随机因素

20、（fixed factor and random factor）:在一个研究设计中，如果所选择的因素水平是此因素的所有水平，则这个因素就是固定因素，如果所涉及到因素的水平只是在此因素所有水平中随机抽取的一部分，如果重复此研究，则这个因素所抽取的水平和前一次研究是不同的。则这个因素就是随机因素。2. 方差分析的要求：1可加性2反差齐性：各处理组总体方差相等3正态性：各样本来自正态总体4独立性：各样本是相互独立的随机样本5数值型变量3. 方差分析基本思想1）目的：根据各个总体的样本观测值，检验各个总体均值间和两两总体均值间是否存在显著性差异。2）要求各样本都来自正态总体，且有一个相同的方差2，仅仅均数可以不相同；还需假定每一个观察值都由若干部分累加而成，也即总的效果可分成若干部分，而每一部分都有一个特定的含义，称之谓效应的可加性根据离差来源的不同，将总离差平方和分解为两部分。3）基本思想：根据效应的可加性,

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？